pandas列设置随机值(Pandas统计重复的列里面的值方法)
类别:脚本大全 浏览量:1668
时间:2022-04-02 02:10:17 pandas列设置随机值
Pandas统计重复的列里面的值方法pandas
代码如下:
|
import pandas as pd import numpy as np salaries = pd.DataFrame({ 'name' : [ 'BOSS' , 'Lilei' , 'Lilei' , 'Han' , 'BOSS' , 'BOSS' , 'Han' , 'BOSS' ], 'Year' : [ 2016 , 2016 , 2016 , 2016 , 2017 , 2017 , 2017 , 2017 ], 'Salary' : [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 ], 'Bonus' : [ 2 , 2 , 2 , 2 , 3 , 4 , 5 , 6 ] }) print (salaries) print (salaries[ 'Bonus' ].duplicated(keep = 'first' )) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'first' )].index) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'first' )]) print (salaries[ 'Bonus' ].duplicated(keep = 'last' )) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'last' )].index) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'last' )]) |
输出如下:
|
Bonus Salary Year name 0 2 1 2016 BOSS 1 2 2 2016 Lilei 2 2 3 2016 Lilei 3 2 4 2016 Han 4 3 5 2017 BOSS 5 4 6 2017 BOSS 6 5 7 2017 Han 7 6 8 2017 BOSS 0 False 1 True 2 True 3 True 4 False 5 False 6 False 7 False Name: Bonus, dtype: bool Int64Index([ 1 , 2 , 3 ], dtype = 'int64' ) Bonus Salary Year name 1 2 2 2016 Lilei 2 2 3 2016 Lilei 3 2 4 2016 Han 0 True 1 True 2 True 3 False 4 False 5 False 6 False 7 False Name: Bonus, dtype: bool Int64Index([ 0 , 1 , 2 ], dtype = 'int64' ) Bonus Salary Year name 0 2 1 2016 BOSS 1 2 2 2016 Lilei 2 2 3 2016 Lilei |
非pandas
对于如nunpy中的这些操作主要如下:
假设有数组
a = np.array([1, 2, 1, 3, 3, 3, 0])
想找出 [1 3]
则有
|
方法 1 m = np.zeros_like(a, dtype = bool ) m[np.unique(a, return_index = True )[ 1 ]] = True a[~m] |
|
方法 2 a[~np.in1d(np.arange( len (a)), np.unique(a, return_index = True )[ 1 ], assume_unique = True )] |
|
方法 3 np.setxor1d(a, np.unique(a), assume_unique = True ) |
|
方法 4 u, i = np.unique(a, return_inverse = True ) u[np.bincount(i) > 1 ] |
|
方法 5 s = np.sort(a, axis = None ) s[: - 1 ][s[ 1 :] = = s[: - 1 ]] |
参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array
以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持开心学习网。
原文链接:https://blog.csdn.net/hguo11/article/details/82556171
您可能感兴趣
- php怎么弄不重复字符串(PHP中将一个字符串部分字符用星号*替代隐藏的实现代码)
- mysql数据库如何删除重复记录(mysql数据库删除重复数据只保留一条方法实例)
- sql语句groupby分组后怎么显示(SQL group by去重复且按照其他字段排序的操作)
- python实现列表删除重复元素(Python代码实现删除一个list里面重复元素的方法)
- pandas怎么抽出重复数据(pandas去除重复列的实现方法)
- axios如何跨域请求(axios取消请求与避免重复请求)
- css中background image重复平铺(解决CSS 中box-sizing与background-clip解决背景显示范围的问题)
- pandas统计多行数据(pandas去重复行并分类汇总的实现方法)
- .net中生成不重复的随机数
- dede模板栏目调用(织梦DEDECMS5.7栏目列表页分页URL优化列表页重复的解决方案)
- dataframe模糊匹配合并数据(对DataFrame数据中的重复行,利用groupby累加合并的方法详解)
- python删除数据框重复变量(Python3删除排序数组中重复项的方法分析)
- sql重复记录怎么删除(SQL去除重复记录七种)
- js数组去重复
- pandas列设置随机值(Pandas统计重复的列里面的值方法)
- jspromise原理(JavaScript使用promise处理多重复请求)
- 《傲骨之战》剧终 律政女魔头Diane,为什么是大女主天花板(傲骨之战剧终律政女魔头Diane)
- 汉族(汉族的祖先是谁)
- 中国有几个名族(中国有几个民族没列入56个民族)
- 数学语文题目(语文的数学题)
- 香蕉(香蕉三种人不宜吃)
- 没钱可以快乐吗(没钱也能快乐吗)
热门推荐
- vue移动端项目用什么打包工具(浅谈使用Vue完成移动端apk项目)
- python strip用法(Python3.5内置模块之shelve模块、xml模块、configparser模块、hashlib、hmac模块用法分析)
- linuxmongodb安装路径(Linux安装MongoDB启动及常见问题解决)
- python数据分割教程(python3对拉勾数据进行可视化分析的方法详解)
- djangorestfulframework教程(Django restframework 源码分析之认证详解)
- laravel提交数据时间(laravel实现查询最后执行的一条sql语句的方法)
- vue3兼容的插件多吗(关于vue3编写挂载DOM的插件问题)
- docker配置文件详解(Docker中搭建FastDFS文件系统多图教程)
- iisweb服务器的启动与配置(win7 iis配置怎么配置 Win7配置IIS服务器图文教程)
- centos搭建sftp服务器(Linux云服务器搭建SFTP服务器图片服务器的操作)