I16-python中的Counter类

news2024/11/18 2:27:13

在很多场景中经常会用到统计计数的需求,比如在实现 KNN算法时统计 k 个标签值的个数,进而找出标签个数最多的标签值作为最终 kNN 算法的预测结果。Python内建的 collections 集合模块中的 Counter 类能够简洁、高效的实现统计计数。

Counter 是 dict 字典的子类,Counter 拥有类似字典的 key 键和 value 值,只不过 Counter 中的键为待计数的元素,而 value 值为对应元素出现的次数 count,为了方便介绍统一使用元素和 count 计数来表示。虽然 Counter 中的 count 表示的是计数,但是 Counter 允许 count 的值为 0 或者负值。

1.实例化Counter类

如果要使用 Counter,必须要进行实例化,在实例化的同时可以为构造函数传入参数来指定不同类型的元素来源。

from collections import Counter

#实例化元素为空的Counter对象
a=Counter()
#从可迭代对象中实例化 Counter 对象
b=Counter('andhajs')
#从mapping中实例化Counter对象,字典也属于mapping类对象
c=Counter({'a':2,'b':9,'c':1})
#从关键词参数中实例化 Counter 对象
d=Counter(a=2,b=4,c=1)
  • 实例化元素为空的 Counter 对象,之后可以通过为字典添加元素的方式为 Counter 对象添加元素。

from collections import Counter

#实例化元素为空的Counter对象
a=Counter()
#为 Counter 添加元素以及对应的 count 计数
a['a']=1
a['b']=a.get('b',10)
print(a)

运行结果:

  • 从 string(字符为list列表的元素)、list 和 tuple 这些可迭代对象中获取元素。

from collections import Counter

# 从可迭代对象中实例化 Counter
b = Counter("chenkc")  # string
b2 = Counter(['c', 'h', 'e', 'n', 'k', 'c'])  # list
b3 = Counter(('c', 'h', 'e', 'n', 'k', 'c')) # tuple
print('b:',b)
print('b2:',b2)
print('b3:',b3)

运行结果:

  • 从 mapping 中实例化 Counter 对象,mapping 类型的数据就是元素为(x, y)的列表,字典也属于 mapping 类型的数据。

from collections import Counter

# 从 mapping 中实例化 Counter 对象
c = Counter([('a', 1), ('b', 2), ('a', 3), ('c', 3)])
c2 = Counter({'a': 1, 'b': 2, 'a': 3, 'c': 3})  # 字典
print('c:',c)
print('c2:',c2)

运行结果:

虽然传入的 mapping 类型的数据是一样的,但是由于字典中的键是唯一的,因此如果字典中的键重复会保留最后一个。

dic = {'a':1, 'b':2, 'a':3, 'c':3}
 
>>> print(dic)
{'a': 3, 'b': 2, 'c': 3}
  • 从关键词参数中实例化 Counter 对象,关键词参数中指定的关键词必须是唯一的,但是不同于字典,如果指定的关键词重复,程序会抛出SyntaxError异常。

from collections import Counter
 
# 从关键词参数中实例化 Counter 对象
d = Counter(a = 1, b = 2, c = 3)
# d2 = Counter(a = 1, b = 2, a = 3, c = 3) # SyntaxError
 
>>> print(d)
Counter({'c': 3, 'b': 2, 'a': 1})

我们都知道在字典中查找不存在的键,程序会抛出 KyeError的异常,但是由于 Counter 用于统计计数,因此 Counter 不同于字典,如果在 Counter 中查找一个不存在的元素,不会产生异常,而是会返回 0,这其实很好理解,Counter 计数将不存在元素的 count 值设置为 0 。

from collections import Counter
 
c = Counter({'a':1, 'b':2, 'c':3})
 
>>> print(c['d']) # 查找键值为'd'对应的计数
0
>>> print(c)
Counter({'c': 3, 'b': 2, 'a': 1})

c['d']表示的查找返回元素值为d的 count 计数,而如果使用c['d'] = 0则表示的是为 Counter 添加元素。

from collections import Counter
 
c = Counter({'a':1, 'b':2, 'c':3})
c['d'] = 4 # 为 Counter 添加元素
 
>>> print(c['d'])
4
>>> print(c)
Counter({'d': 4, 'c': 3, 'b': 2, 'a': 1})

2.Counter 中的方法

实例化 Counter 类对象之后,就可以使用 Counter 对象中的方法。由于 Counter 类继承自 dict 类,所以 Counter 类可以使用 dict 类的方法。下面分别从 Counter 所特有的方法和一些字典的常规方法来介绍。

2.1 Counter中特有的方法

Counter 额外支持字典中没有的三个方法:elements()、most_common([m])以及subtract([iterable-or-mapping])。

  • elements 方法

elements()方法返回一个迭代器,可以通过 list 或者其它方法将迭代器中的元素输出,输出的结果为对应出现次数的元素。

from collections import Counter
 
c = Counter({'a':1, 'b':2, 'c':3})
c2 = Counter({'a':0, 'b':-1, 'c':3}) # 将出现次数设置为 0 和负值
 
>>> print(c.elements())
<itertools.chain object at 0x0000022A57509B70> 
>>> print(list(c.elements()))
['a', 'b', 'b', 'c', 'c', 'c'] 
 
>>> print(c2.elements())
<itertools.chain object at 0x0000022A57509B70> 
>>> print(list(c2.elements()))#只输出正的value对应的key
['c', 'c', 'c']

在 Counter 中是允许计数为 0 或者负值的,不过通过上面代码可以看出 elements 函数没有将 0 和负值对应的元素值打印出来

  • most_common 方法

most_common([n])是 Counter 最常用的方法,返回一个出现次数从大到小的前 n 个元素的列表。

from collections import Counter
 
c = Counter({'a':1, 'b':2, 'c':3})
 
>>> print(c.most_common()) # 默认参数
[('c', 3), ('b', 2), ('a', 1)]
>>> print(c.most_common(2)) # n = 2
 [('c', 3), ('b', 2)] 
>>> print(c.most_common(3)) # n = 3
[('c', 3), ('b', 2), ('a', 1)] 
>>> print(c.most_common(-1)) # n = -1
[]

n为可选参数,通过上面的代码可以总结出:

  1. 不输入n,默认返回所有;

  1. 输入n小于最长长度,则返回前n个数;

  1. 输入n等于最长长度,则返回所有;

  1. 输入n = -1,则返回空;

  • subtract 方法

subtract([iterable_or_mapping])方法其实就是将两个 Counter 对象中的元素对应的计数相减。

from collections import Counter
 
c = Counter({'a':1, 'b':2, 'c':3})
d = Counter({'a':1, 'b':3, 'c':2, 'd':2})
c.subtract(d)
 
>>> print(c)
Counter({'c': 1, 'a': 0, 'b': -1, 'd': -2})

其实就是两个 Counter 中的对应的元素的计数相减。当其中某个 Counter 中对应的元素不存在的时候,默认将其计数设置为 0,这也是为什么'd'的计数为-2的原因。

2.2 Counter 支持的字典方法

一般常规的字典方法对 Counter 对象都是有效的,将这些字典方法作用到下面的 Counter 对象c中,并绘制到下面的表格中。

from collections import Counter
 
c = Counter({'a':1, 'b':2, 'c':3, 'd':0, 'e':-1})

但是在 Counter 中有两个方法和字典中的使用有些区别:

from collections import Counter
 
c = Counter({'a':1, 'b':2, 'c':3, 'd':0, 'e':-1})
 
c.update({'a':2, 'd':2, 'e':1})
 
>>> print(c)
Counter({'a': 3, 'c': 3, 'b': 2, 'd': 2, 'e': 0})

对于 Counter 中的update函数简单来说,就是增加对应元素的计数。

2.3 集合运算符

这里直接贴出集合运算符的代码示例。

>>> c = Counter(a=3, b=1)
>>> d = Counter(a=1, b=2)
>>> c + d                           # add two counters together:  c[x] + d[x]
Counter({'a': 4, 'b': 3})
>>> c - d                           # subtract (keeping only positive counts)
Counter({'a': 2})
>>> c & d                           # intersection:  min(c[x], d[x])
Counter({'a': 1, 'b': 1})
>>> c | d                           # union:  max(c[x], d[x])
Counter({'a': 3, 'b': 2})

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/160198.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity 3D 三维模型简介||

Unity 3D 三维模型简介 三维模型是用三维建模软件建造的立体模型&#xff0c;也是构成 Unity 3D 场景的基础元素。 Unity 3D 几乎支持所有主流格式的三维模型&#xff0c;如 FBX 文件和 OBJ 文件等。 开发者可以将三维建模软件导出的模型文件添加到项目资源文件夹中&#xf…

【服务器数据恢复】意外断电导致linux服务器故障的数据恢复案例

服务器数据恢复环境&故障&#xff1a; 某品牌730服务器&#xff0c;linux操作系统。 机房意外断电导致服务器部分文件丢失。 服务器数据备份&故障分析&#xff1a; 1、将linux服务器连接到准备好的数据恢复服务器上&#xff0c;以只读模式对服务器数据做镜像备份&#…

geoserver 图层访问权限控制

目录 一、环境 二、问题 三、设置登录才能访问图层 ①、创建身份验证过滤器 ②、创建过滤器 ③、校验 ④、过滤后的问题 一、环境 geoserver2.17.0 二、问题 1、geoserver图层不需要登录就能访问&#xff0c;是否存在安全隐患&#xff1f; 答&#xff1a;会有一定的安全隐…

【Linux操作系统】计算机体系结构和操作系统与进程概念深入理解

文章目录一.现代计算机体系结构1.和冯诺依曼体系结构的异同2.计算机的五大核心部件3.举例子:“我爱你”4.CPU,内存,磁盘的联系a.三者读写速度对比b.规定:CPU不直接和外设打交道二.操作系统1.操作系统三段论2.系统调用接口3.用户操作接口三.进程1.什么是进程?2.PCB3.查看进程4.…

222.完全二叉树的节点个数 |递归优化思路 + 复杂度分析

完全二叉树的节点个数 leetcode : https://leetcode.cn/problems/count-complete-tree-nodes/ 递归思路 递归的思路很简单, 假设们要统计一棵树的节点数, 那么 只要统计根节点的左子树的节点数, 和右子树的节点数加上根节点即可 那么, 假设我们要统计左子树的节点数, 其实就…

Centos7 Minimal 版本基本配置记录

每次搭测试环境之前都需要先装一台干净的虚拟机&#xff0c;然而 Centos7 Minimal 版本快速装完之后还需要配置&#xff1a;网络、国内源、一些基础工具&#xff08;net-tools、vim&#xff09;等才能远程连接和使用。记录一下&#xff0c;方便下次快速配置使用。 目录 1、网…

Docker镜像加载原理

文章目录什么是镜像 &#xff1f;Docker镜像加载原理UnionFS &#xff08;联合文件系统&#xff09;Docker镜像加载原理分层理解镜像Commit什么是镜像 &#xff1f; 镜像是一种轻量级、可执行的独立软件包&#xff0c;用来打包软件运行环境和基于运行环境开发的软件&#xff0…

C语言-自定义类型-枚举和联合(11.3)

目录 思维导图&#xff1a; 1.枚举 1.1 枚举类型的定义 1.2 枚举的优点 1.3 枚举的使用 2. 联合&#xff08;共用体&#xff09; 2.1 联合类型的定义 2.2 联合的特点 2.3 联合大小的计算 写在最后&#xff1a; 思维导图&#xff1a; 1.枚举 1.1 枚举类型的定义 例&…

Spring复习(三)

AOP AOP(Aspect Oriented Programming)面向切面编程&#xff0c;aop是一种设计思想&#xff0c;是oop面向对象编程的一种补充和完善&#xff0c;它通过预编译方式和运行期间动态代理的方式达成在不修改源代码的情况下&#xff0c;实现对业务逻辑的增强。 相关术语 横切关注点…

论文投稿指南——中文核心期刊推荐(农业基础科学)

【前言】 &#x1f680; 想发论文怎么办&#xff1f;手把手教你论文如何投稿&#xff01;那么&#xff0c;首先要搞懂投稿目标——论文期刊 &#x1f384; 在期刊论文的分布中&#xff0c;存在一种普遍现象&#xff1a;即对于某一特定的学科或专业来说&#xff0c;少数期刊所含…

【计组】存储器层次结构全景和局部性原理--《深入浅出计算机组成原理》(八)

课程链接&#xff1a;深入浅出计算机组成原理_组成原理_计算机基础-极客时间 目录 一、存储器层次结构全景 &#xff08;一&#xff09;SRAM &#xff08;二&#xff09;DRAM &#xff08;三&#xff09;存储器的层级结构 二、局部性原理 一、存储器层次结构全景 &…

Eureka读时加写锁,写时加读锁,到底是故意为之还是一个bug?

在对于读写锁的认识当中&#xff0c;我们都认为读时加读锁&#xff0c;写时加写锁来保证读写和写写互斥&#xff0c;从而达到读写安全的目的。但是就在我翻Eureka源码的时候&#xff0c;发现Eureka在使用读写锁时竟然是在读时加写锁&#xff0c;写时加读锁&#xff0c;这波操作…

uni-app | 从零创建一个新项目以及关于网络请求配置和分包

一、uni-app简介uni-app 是一个使用 Vue.js 开发所有前端应用的框架。开发者编写一套代码&#xff0c;可发布到 iOS、Android、H5、以及各种小程序&#xff08;微信/支付宝/百度/头条/QQ/钉钉/淘宝&#xff09;、快应用等多个平台。二、开发工具uni-app官方推荐使用HBuilderX来…

【JS 逆向百例】X-Bogus 逆向分析,JSVMP 纯算法还原

声明 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;不提供完整代码&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 本文章未…

72小时灵感冲刺,创意就该这么玩 | LigaAI Hackathon特别策划

2023 年 1 月 9 日至 12 日&#xff0c;LigaAI 团队全员出逃&#xff1a;放下迭代&#xff0c;暂缓需求&#xff0c;处处充斥着「可以摸鱼➕卷死他们」的矛盾又欢乐的气息。职场和远程的伙伴们无一不在热烈讨论、积极组队、抢占会议室、搜刮零食饮料…… 是什么让矜持内敛的技…

微信小程序的启动和渲染过程(加组件分类和组件的基本使用以及API分类)

小程序的启动过程 把小程序的代码包下载到本地解析app.json全局配置文件执行app.js小程序入口文件,调用App()创建小程序实例渲染小程序首页小程序启动完成 小程序页面渲染的过程 加载解析页面的.json配置文件加载页面的.wxml模板和.wxss样式执行页面的.js文件,调用page(创建…

网站建设的具体流程

有网站制作需求的朋友想了解一下网站建设的具体流程&#xff0c;防止不良的网站制作公司的业务人员用虚假的工作量欺骗自己报出高价&#xff0c;米贸搜详细给你整理一下一个网站的建设有哪些流程:1.在线或当面沟通网站制作需求&#xff0c;详细沟通网站的功能需求、设计风格以及…

功率放大模块的作用是什么(功率放大器模块的应用范围)

功率放大模块是一种能够把开关电源、数字功放集成到一起的放大模块。很多人对于功率放大模块的作用是什么以及功率放大模的应用范围都不清楚&#xff0c;下面就来详细的为大家介绍下什么是功率放大模块以及功率放大模块的基础知识。 一、什么是功率放大模块 功率放大模块是一种…

谷歌AR应用挑战赛上那些富有创意的AR项目集锦

前不久&#xff0c;谷歌面向全球100多个国家和地区的开发者们推出ARCore Geospatial API挑战赛&#xff0c;获奖的AR应用可得到1000美元到1.2万美元的奖金&#xff0c;支持多种不同的内容类别&#xff0c;比如AR导航、AR游戏、AR娱乐等等。据悉&#xff0c;Geospatial API是谷歌…

贵阳某小区一次HC小区管理系统自研道闸故障解决记录

一次HC小区管理系统自研道闸故障解决记录&#xff0c;方便其他小伙伴出现问题的时候提供解决思路 早上九点钟 客户说道闸用不了&#xff0c;这个客户不是物业&#xff0c;而是科技公司&#xff0c;他们给物业安装的道闸。 问题描述是&#xff0c;mqtt 也重启了&#xff0c;物…