首页 > 编程学习 > pandas笔记

pandas笔记

发布时间:2022/8/22 11:57:24

导入pandas

import pandas as pd

读取excel文件

df = pd.read_excel(r'windows系统文件路径', 'sheet名')

如果是linux系统则不用在文件路径前添加 r

限定某列数据出现次数大于等于2

name = df.列名.value_counts().loc[lambda x: x>=2].index

最后将返回所有符合条件的数据

获取列表中出现的数据

list2 = []
for i in name:
  list2.append(i)
list2

df = df[df['列名'].isin(list2)]

以上将输出存在于列表中的数据

切片索引获取数据

df = df.iloc[:, 3:]

以上获取所有行,以及第4行往后的数据

删除多列数据

df = df.drop( df.iloc[:, [1,2,4,5,6]], axis=1 )

对列数据进行排序

df = df.sort_values(by='列名', ascending=False)

将数据保存为excel文件

df.to_excel(r'文件路径',sheet_name = "sheet名",index = False,na_rep = 0,inf_rep = 0)
Copyright © 2010-2022 mfbz.cn 版权所有 |关于我们| 联系方式|豫ICP备15888888号