在python中要将Excel或者是csv这种表格文件里面的数据取出来进行操作时 , 一般都会选择第三方库Pandas里面的数据结构Dataframe来接收保存数据 。而这一篇文章要来讲解的内容就是Dataframe进行分组统计的方法教程 , 想要了解和学习的就往下继续阅读吧 。
【DataFrame如何分组统计?Python数据结构DF怎么分组统计】
文章插图
1.导入pandas库后定义三个变量 , 变量data中保存的就是需要去进行操作的数据 , 直接使用列表对象来保存即可 。变量index需要接收一个列表 , 而在列表里面是df表格的行号 , 元素数量需要和data中的列表数量一致 。
而最后columns变量也是用列表赋值 , 不过该列表内的元素是声明df对象列名的 , 它里面元素数量需要和data内单个列表里面的元素数量相同 , 详细代码示例如下所示:
import pandas as pddata = [['a', 'A', 109], ['b', 'B', 112], ['c', 'A', 125], ['d', 'C', 120]]index = [0, 1, 2, 3]columns = ['name', 'class', 'num']2.第二步的话只需要一行代码 , 那就是调用DataFrame()方法并且将以上三个变量作为参数传递进行 。这样就能够创建出来一个有数据并且有行名和列名的Dataframe对象了 , 代码如下:
df = pd.DataFrame(data=https://www.ycpai.cn/python/data, index=index, columns=columns)3.这一步就是本篇文章的关键 , 在Dataframe上进行分组统计需要用到groupby方法() 。这个方法里面需要传入的参数为列名 , 也就是将重复数据统计为一个 , 然后将后面的值加起来进行求和操作即可 , 示例如下:
df1 = df.groupby('class').sum()print(df1)
文章插图
以上就是关于“DataFrame如何分组统计?Python数据结构DF怎么分组统计”的全部内容了 , 希望对你有所帮助 。
推荐阅读
- 如何利用Python函数求导数?Python函数求导数的方法
- Python集合如何添加元素?Python给集合添加元素的方法是什么
- Python怎么删除多个集合元素?Python集合如何一次性移除多个值
- Fireworks如何设计网页导航栏按钮?Fireworks导航栏按钮制作教程
- Fireworks如何调整图形上下层关系?Fireworks图层顺序调整技巧
- cdr如何制作蚊香图案效果?cdr燃烧中的蚊香图形制作方法
- cdr如何把文本段落格式化处理?cdr段落格式化处理教程
- cdr明暗面填充教程 cdr如何利用明暗填充效果制作立体图形?
- cdr如何跳转到指定页码?如何在cdr页面中跳转到指定页码?
- Fireworks如何给图片添加边框效果?Fireworks图片边框效果添加教程