1、导入Excel:
- 注意这种方法可以导入xlsx和xls两种类型的数据
- 读入的数据会以DataFrame的格式显示
- 举例:df = pd.read_excel(‘./data/demo_03.xlsx’)
- 还可以导入excel文件中具体的某一个表格:pd.read_excel(‘./data/demo_03.xlsx’, sheet_name=‘工作表1’)
- 导入时要看字段名在excel表的哪一行(以第二行为例):pd.read_excel(‘./data/demo_03.xlsx’, sheet_name=‘工作表3’, header=1)
- 通过指定的列索引来导入第1列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[0])
- 通过指定的列索引来导入第1列、第4列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[0, 3])
- 通过指定的列名来导入指定列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[‘name’, ‘sex’])
2、导入csv文件:
- 导入csv,并指定编码格式:pd.read_csv(‘./data/demo_03.csv’, encoding=‘utf-8’)
3、导入txt文件:
- pd.read_csv(‘./data/demo_03.txt’, encoding=‘utf-8’, sep=‘\t’) # sep是指定分隔符
4、导入json,并指定数据结构:
- json是一种轻量级的数据交换格式,它使用文本进行格式化和编码,通常用于Web服务之间的数据传输。
- json:非表单结构,读取无意义
- json:表单结构(split, records, index, table, values),读取有意义
- 举例:pd.read_json(‘./data/records.json’, orient=‘records’) # orient参数具体给什么就看要导入的数据是类型的json的
- 在 pd.read_json 函数中,还可以设置其它的 orient 值(类似于第一个参数),以便按照不同的数据结构将 JSON 文件读入到 Pandas 数据库中来供进一步操作。常见的除了 “records” 还包括 “index”、“columns”、“values” 和 “table” 等,具体格式如下: