DataFrame如何分组统计?Python数据结构DF怎么分组统计

在python中要将Excel或者是csv这种表格文件里面的数据取出来进行操作时 , 一般都会选择第三方库Pandas里面的数据结构Dataframe来接收保存数据 。而这一篇文章要来讲解的内容就是Dataframe进行分组统计的方法教程 , 想要了解和学习的就往下继续阅读吧 。
【DataFrame如何分组统计?Python数据结构DF怎么分组统计】

DataFrame如何分组统计?Python数据结构DF怎么分组统计

文章插图
1.导入pandas库后定义三个变量 , 变量data中保存的就是需要去进行操作的数据 , 直接使用列表对象来保存即可 。变量index需要接收一个列表 , 而在列表里面是df表格的行号 , 元素数量需要和data中的列表数量一致 。
而最后columns变量也是用列表赋值 , 不过该列表内的元素是声明df对象列名的 , 它里面元素数量需要和data内单个列表里面的元素数量相同 , 详细代码示例如下所示:
import pandas as pddata = [['a', 'A', 109], ['b', 'B', 112], ['c', 'A', 125], ['d', 'C', 120]]index = [0, 1, 2, 3]columns = ['name', 'class', 'num']2.第二步的话只需要一行代码 , 那就是调用DataFrame()方法并且将以上三个变量作为参数传递进行 。这样就能够创建出来一个有数据并且有行名和列名的Dataframe对象了 , 代码如下:
df = pd.DataFrame(data=https://www.ycpai.cn/python/data, index=index, columns=columns)3.这一步就是本篇文章的关键 , 在Dataframe上进行分组统计需要用到groupby方法() 。这个方法里面需要传入的参数为列名 , 也就是将重复数据统计为一个 , 然后将后面的值加起来进行求和操作即可 , 示例如下:
df1 = df.groupby('class').sum()print(df1)
DataFrame如何分组统计?Python数据结构DF怎么分组统计

文章插图
以上就是关于“DataFrame如何分组统计?Python数据结构DF怎么分组统计”的全部内容了 , 希望对你有所帮助 。

    推荐阅读