pandas数据分组后的处理(详解pandas如何去掉、过滤数据集中的某些值或者某些行?)
pandas数据分组后的处理
详解pandas如何去掉、过滤数据集中的某些值或者某些行?摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。
0.导入我们需要使用的包
import pandas as pd
pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。
1.去掉某些具体值
数据集df中,对于属性appplatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。
import pandas as pd
|
df[(true - df[ 'appplatform' ].isin([ 2 ]))] |
当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appid这个属性,我们想去掉appid=278和appid=382的样本。
|
df[(true - df[ 'appid' ].isin([ 278 , 382 ]))] |
另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appplatform=2而且appid=278和appid=382的样本呢?非常简单。
|
df[(true - df[ 'appid' ].isin([ 278 , 382 ]))&(true - df[ 'appplatform' ].isin([ 2 ]))] |
其实,在这里我们看到,就是由两部分组成的,第一部分就是appid中等于278和382的,另外一部分就是appplatform中等于2的。两者取逻辑关系 与(&)
2.过滤掉某个范围的值
上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeid(第一列)中id值大于10000的样本。
|
df[df[ 'creativeid' ]< = 10000 ] |
另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。
以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!
原文链接:https://blog.csdn.net/qq_22238533/article/details/76127966
- python怎么提取微信数据(使用Python+wxpy 找出微信里把你删除的好友实例)
- mysql快速导入1亿数据(mysql批量新增和存储的方法实例)
- SQL Server与Oracle数据类型的对应关系
- sql数据库有几种数据类型(SQL的常用数据类型列表详解)
- redis数据超过可用内存
- 一个sql查询数据多表连接查询(一条SQL语句查询多个数据库)
- 怎么用docker中的mysql连接数据库(连接docker里面的mysql失败解决方法)
- SQL Server数据库备份的几种方式
- 织梦源码安装数据库怎么填(Mysql修改端口号 织梦DedeCMS设置教程)
- 数据库mysql基本知识(深入理解r2dbc在mysql中的使用)
- 数据库操作题(数据库日常练习题,每天进步一点点2)
- sqlserver删除表的第一行数据(sql server删除前1000行数据的方法实例)
- docker镜像配置的挂载路径(docker挂载本地目录和数据卷容器操作)
- python群聊提示(python-itchat 统计微信群、好友数量,及原始消息数据的实例)
- sqlserver数据库备份怎么还原(SQL Server2012数据库备份和还原的教程)
- mysql大量数据怎么处理(MySQL删除和插入数据很慢的问题解决)
- 粗盐是什么 粗盐的功效与作用(粗盐的功效与作用)
- 会 吃人 的客机 从天堂到地狱只需5分钟,图-104如何做到(会吃人的客机)
- 男人犯的错,为什么要女人来承担(为什么要女人来承担)
- 心理学 四个金蟾,哪个最招财 测你今生的运势有多棒(心理学四个金蟾)
- 吉善缘《聚宝金蟾》金蟾招财摆件 三足全铜蟾蜍客厅店铺开业礼品(吉善缘聚宝金蟾金蟾招财摆件)
- 招财化煞神兽,金蟾变了(招财化煞神兽金蟾变了)
热门推荐
- SQL Server ltrimrtrim函数的用法(SQL Server ltrimrtrim 去不掉空格的原因分析)
- linux双网卡热备配置超详细(linux 使用bond实现双网卡绑定单个IP的示例代码)
- css3基础入门(详解使用CSS3的@media来编写响应式的页面)
- sqlserver 锁表原因(SQL Server学习笔记之事务、锁定、阻塞、死锁用法详解)
- 百度网速买的五分钟加速在哪里(为何用了百度云加速 服务器负载还很大)
- python中for语句的无限循环(python使用for循环计算0-100的整数的和方法)
- laravel框架配置(Laravel框架实现多数据库连接操作详解)
- dede栏目标签怎么调用(dedecms首页导航菜单二级栏目调用标签实例)
- mysql数据库简单优化(MySQL数据类型优化原则)
- SQL Server将数据导出到SQL脚本文件
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9