分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - 利用Pandas求两个dataframe差集的过程详解

利用Pandas求两个dataframe差集的过程详解

2022-08-29 12:01元神の助手 Python

在Pandas中求差集没有专门的函数,处理办法就是将两个DataFrame追加合并,然后去重,下面这篇文章主要给大家介绍了关于利用Pandas求两个dataframe差集的相关资料,需要的朋友可以参考下

1、交集

intersected=pd.merge(df1,df2,how='inner')

延伸（针对列求交集）intersected=pd.merge(df1,df2,on['name'],how='inner')

2、差集（df1-df2为例）

diff=pd.concat([df1,df2,df2]).drop_duplicates(keep=False)

差集函数的详解：

1、Pandas 通过 concat() 函数能够轻松地将 Series 与 DataFrame 对象组合在一起，函数的语法格式如下： pd.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False)

利用Pandas求两个dataframe差集的过程详解

2、需要对dataframe中的一列值有重复的，应用drop_duplicates解决了此问题。

比如：

				?

									ata={"a":[1,1,2,4,3,9],"b":[2,2,3,5,5,10],"c":[3,4,5,6,6,11],"d":[4,5,6,7,8,12]}

									pd_data=pd.DataFrame(data=data)

									print(pd_data)

									t=pd_data.drop_duplicates(subset=['c','b'],keep='last',inplace=False)

									print(t)

说明：

keep='first'表示保留第一次出现的重复行，是默认值。keep另外两个取值为"last"和False，分别表示保留最后一次出现的重复行和去除所有重复行。

inplace=True表示直接在原来的DataFrame上删除重复项，而默认值False表示生成一个副本。如果要生成新的DataFrame:,inplace=False

subset要去重的列。subset=['c','b']，表示行中的记录：c和b列都重复的。

3、将concat和drop_duplicates结合起来就解决了求差集的问题。

利用Pandas求两个dataframe差集的过程详解

另外，还有一种方法也可以达到同样的目的：

利用Pandas求两个dataframe差集的过程详解

总结

到此这篇关于利用Pandas求两个dataframe差集的文章就介绍到这了,更多相关Pandas求dataframe差集内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家！

原文链接：https://blog.csdn.net/guoyc439/article/details/124165334

延伸 · 阅读

2022-08-29Pandas搭配lambda组合使用详解
2022-08-27十个经典的Pandas数据查询案例(整理)
2022-08-27对比三款 Pandas 可视化 GUI 界面工具（再见Excel！
2022-08-27Pandas实现groupby分组统计的实践
2022-08-26Python Pandas数据合并pd.merge用法详解
2022-08-23Pandas如何对Categorical类型字段数据统计实战案例

精彩推荐

Python

python numpy函数中的linspace创建等差数列详解

numpy.linspace是用于创建一个一维数组，并且是等差数列构成的一维数组,下面这篇文章主要给大家介绍了关于python numpy函数中的linspace创建等差数列的相关资...

ifreeky5022020-12-11
Python

python和shell获取文本内容的方法

今天小编就为大家分享一篇python和shell获取文本内容的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

KingNotJustAName6672021-03-01
Python

使用jupyter notebook运行python和R的步骤

这篇文章主要介绍了使用jupyter notebook运行python和R的步骤，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋...

weixin_435694785732020-08-13
Python

Django将项目移动到新环境的操作步骤

本文分步骤给大家介绍Django将项目移动到新环境的方法，通过图文示例代码相结合给大家介绍的非常详细，需要的朋友参考下吧...

Lion King10402021-12-23
Python

Python3实现英文字母转换哥特式字体实例代码

这篇文章主要给大家介绍了关于Python3实现英文字母转换哥特式字体的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考...

GalacticRepublic4722020-09-02
Python

pyqt5 QProgressBar清空进度条的实例

今天小编就为大家分享一篇pyqt5 QProgressBar清空进度条的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

coding上下求索4272021-07-17
Python

python email smtplib模块发送邮件代码实例

本篇文章给大家分享了python email smtplib模块发送邮件的相关代码分享，有需要的朋友参考学习下。...

脚本之家5252021-02-05
Python

Python多进程分块读取超大文件的方法

这篇文章主要介绍了Python多进程分块读取超大文件的方法,涉及Python多进程操作与文件分块读取的相关技巧,需要的朋友可以参考下...

asdfsx4672020-08-19