脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Pandas中的unique()和nunique()区别详解

Pandas中的unique()和nunique()区别详解

2022-08-08 16:26追风少年? Python

Pandas中Series和DataFrame的两种数据类型中都有nunique()和unique()方法,本文详细的介绍了两者的区别,具有一定的参考价值,感兴趣的可以了解一下

Pandas中Series和DataFrame的两种数据类型中都有nunique()和unique()方法。这两个方法作用很简单,都是求Series或Pandas中的不同值。而unique()方法返回的是去重之后的不同值,而nunique()方法则直接放回不同值的个数。

具体如下:

Pandas中的unique()和nunique()区别详解

如果Series或DataFrame中没有None值,则unique()方法返回的序列数据的长度等于nunique()方法的返回值(如上述代码中所展示的)。则当Series或DataFrame中有None值时,这两个就不一定相等了。具体如下:

Pandas中的unique()和nunique()区别详解

从上述结果可知, nunique()可以通过参数dropna来自定义设置在统计不同值过程中是否需要包含None值,而unique()方法中没有可设置的参数,该方法在统计时无法排除None值。 

1 unique()

统计list中的不同值时,返回的是array.它有三个参数,可分别统计不同的量,返回的都是array.

当list中的元素也是list时,尽量不要用这种方法.

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
import numpy as np
a = [1,5,4,2,3,3,5]
# 返回一个array
print(np.unique(a))
# [1 2 3 4 5]
 
# 返回该元素在list中第一次出现的索引
print(np.unique(a,return_index=True))
# (array([1, 2, 3, 4, 5]), array([0, 3, 4, 2, 1]))
 
# 返回原list中每个元素在新的list中对应的索引
print(np.unique(a,return_inverse=True))
# (array([1, 2, 3, 4, 5]), array([0, 4, 3, 1, 2, 2, 4]))
 
# 返回该元素在list中出现的次数
print(np.unique(a,return_counts=True))
# (array([1, 2, 3, 4, 5]), array([1, 1, 2, 1, 2]))
 
# 当加参数时,unique()返回的是一个tuple,这里利用了tuple的性质,即有多少个元素即可赋值给对应的多少个变量
p,q,m,n = np.unique(a,return_index=True,return_inverse=True,return_counts=True)
print(p,q,m,n)
# [1 2 3 4 5] [0 3 4 2 1] [0 4 3 1 2 2 4] [1 1 2 1 2]
 
# 注意当list中的元素不是数字而是list的时候,输出的数据类型与list中元素的长度有关
# 利用这种方法对list中元素去重或求里面元素的个数都不是好方法,很容易出错 

统计series中的不同值时,返回的是array,它没有其它参数

?
1
2
3
4
import pandas as pd
se = pd.Series([1,3,4,5,2,2,3])
print(se.unique())
# [1 3 4 5 2]

2.nunique()

可直接统计dataframe中每列的不同值的个数,也可用于series,但不能用于list.返回的是不同值的个数.

?
1
2
3
4
5
6
7
8
9
10
df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]})
print(df)
print(df.nunique())
#    A  B
# 0  0  0
# 1  1  5
# 2  1  6
# A    2
# B    3
# dtype: int64

也可与groupby结合使用,统计每个块的不同值的个数.

?
1
2
3
4
5
6
7
all_user_repay = all_user_repay.groupby(['user_id'])['listing_id'].agg(['nunique']).reset_index()
#    user_id  nunique
# 0       40        1
# 1       56        1
# 2       98        1
# 3      103        1
# 4      122        1

 到此这篇关于Pandas中的unique()和nunique()区别详解的文章就介绍到这了,更多相关Pandas unique()和nunique()内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/Ghjkku/article/details/125773412

延伸 · 阅读

精彩推荐
  • PythonPython列表推导式详情

    Python列表推导式详情

    这篇文章主要介绍了Python列表推导式,列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式,下面来看看详细内容吧...

    一碗周8272022-02-22
  • Pythonpython实现简单socket程序在两台电脑之间传输消息的方法

    python实现简单socket程序在两台电脑之间传输消息的方法

    这篇文章主要介绍了python实现简单socket程序在两台电脑之间传输消息的方法,涉及Python操作socket的技巧,具有一定参考借鉴价值,需要的朋友可以参考下 ...

    niuniu11572019-11-28
  • Python详解supervisor使用教程

    详解supervisor使用教程

    supervisor是用python写的一个进程管理工具,用来控制进程,本文为大家介绍一下supervisor使用教程,希望能够帮助到你。...

    loveyouyou6168902020-12-19
  • Python使用wxPython获取系统剪贴板中的数据的教程

    使用wxPython获取系统剪贴板中的数据的教程

    这篇文章主要介绍了使用wxPython获取系统剪贴板中的数据的教程,wxPython是一个非常受欢迎的Python图形库,需要的朋友可以参考下 ...

    脚本之家2492020-06-23
  • PythonPython中import机制详解

    Python中import机制详解

    在刚刚接触python时,我们会被其优美的格式、简洁的语法和无穷无尽的类库所震撼。在真正的将python应用到实际的项目中,你会遇到一些无法避免的问题。...

    Python学习者2272020-12-17
  • Pythonpython 显示数组全部元素的方法

    python 显示数组全部元素的方法

    下面小编就为大家分享一篇python 显示数组全部元素的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    fanyiwei_00713362021-02-02
  • Pythonpython生成n个元素的全组合方法

    python生成n个元素的全组合方法

    今天小编就为大家分享一篇python生成n个元素的全组合方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    那时的风儿9422021-04-19
  • Pythonpython进阶从青铜到王者一定会用上的Python技巧

    python进阶从青铜到王者一定会用上的Python技巧

    这篇文章主要介绍了python进阶从青铜到王者一定会用上的Python技巧,本文通过几个Python的小案例,让大家体会其中蕴含的技巧一起来围观吧...

    Dragon少年5282022-01-12