读取excel,读取结果是dataframe形式。
excelFile = r'analyze_search_category.xlsx' df = pd.DataFrame(pd.read_excel(excelFile)) print(df)
详情:(21条消息) 在Python中使用Pandas.DataFrame对Excel操作笔记一 - 从Excel里面获取说需要的信息_fengqiaoxian的博客-CSDN博客_dataframe读取excel
读取txt
df_exposure = pd.read_csv('haah.txt', sep='\t', header=None) # df_exposure.columns = ['y%s'%i for i in range(1, df_exposure.shape[1]+1)] df_exposure.columns=['qq','ss1','ss2','ss3','ss4','aa']
上述.txt文件在代码同一目录,所以不用写路径。
在python上新建一个dataframe
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age']) # 将第一维度数据转为为行,第二维度数据转化为列,即 3 行 2 列,并设置列标签
print(df)
结果:
Name Age
0 Alex 10.0
1 Bob 12.0
2 Clarke 13.0
(42条消息) Python Pandas 创建 DataFrame 的四种方法_AItrust的博客-CSDN博客_python创建dataframe
dataframe按列合并
(69条消息) Python - pandas DataFrame数据的合并与拼接(merge、join、concat)_hellosc01的博客-CSDN博客_dataframe两列合并成一列
dataframe取出两列,成为新的dataframe
Fre_df_search_count_plt = Fre_df_search_count[['level_0','search_num']]
注意是两个方括号。
对列进行筛选
pandas行筛选/列筛选(条件筛选/范围筛选)/计算 - chengjon - 博客园 (cnblogs.com)
将数据进行分区
(64条消息) python——numpy——数据分区(digitize,cut,qcut,quantile函数)_xia ge tou lia的博客-CSDN博客_numpy的digitize
分组求和,保留原来结构
在pandas中如何每隔n行分组并求和但保持原始结构 - 问答 - 腾讯云开发者社区-腾讯云 (tencent.com)
去重
python 去重和保留重复值方法 duplicated 和 drop_duplicates - 遗忘之前 - 博客园 (cnblogs.com)
pandas 根据索引值 取dataframe(值)
(64条消息) pandas 根据索引值 取dataframe(值)_进击的铁甲小宝的博客-CSDN博客_dataframe按索引取值
pycharm如何看到全部的dataframe列
【P】python基础 Pycharm显示DataFrame全部列数据 - 代码先锋网 (codeleading.com)
绘制帕累托图
效果:
(61条消息) 【python科研绘图】绘制帕累托图(Pareto)步骤解析,并封装后直接调用_百木从森的博客-CSDN博客_python绘制帕累托图
获取行数列数
返回列数:
df.shape[1]
返回行数:
df.shape[0]
(69条消息) 如何获取Dataframe的行数和列数_lwgkzl的博客-CSDN博客_dataframe列数
导出成excel
#定义导出的路径,并定义好文件名
resultPath = 'D:\我的文件\桌面内容\使用python读取Excel的路径\表格3.xlsx'
#导出文件
df3.to_excel(resultPath,sheet_name = "汇总",index = False,na_rep = 0,inf_rep = 0)
如何将python处理好的DataFrame格式数据导出为xlsx格式的Excel文件? - 知乎 (zhihu.com)
未完待续。。。