软件测试|使用Python提取出语句中的人名

软件测试|使用Python提取出语句中的人名

news2026/2/13 23:28:15

简介

在自然语言处理（NLP）中，提取文本中的人名是一项常见的任务。Python作为一种流行的编程语言，拥有强大的NLP库和工具，使我们能够轻松地进行这项任务。在本文中，我们将使用Python示例来演示如何提取文本中的人名。

环境准备

我们将使用以下Python库来执行人名提取任务：

spaCy：一个流行的NLP库，它提供了命名实体识别（NER）功能，可以帮助我们识别文本中的人名。
re：Python的正则表达式库，用于进行文本模式匹配。

re是Python自带的库，所以我们不需要额外进行安装，但是spaCy是第三方库，需要我们安装，安装命令如下：

pip install spacy

注：当我们安装spaCy库之后，还需要安装其语言模型，安装命令如下：

# 英文模型
python -m spacy download en_core_web_sm
# 中文模型
python -m spacy download zh_core_web_sm

示例代码

下面是一个Python示例，演示如何使用spaCy库来提取文本中的人名：

import spacy

# 加载spaCy的英文模型
nlp = spacy.load("zh_core_web_sm")

# 输入文本
text = "欢迎大家参加本次活动。张三、李四和王五将会发表演讲。"

# 使用spaCy处理文本
doc = nlp(text)

# 提取人名
people_names = []
for ent in doc.ents:
    if ent.label_ == "PERSON":
        people_names.append(ent.text)

# 打印提取到的人名
for name in people_names:
    print(name)

在上面的示例中，我们首先加载了spaCy的英文模型，并指定了文本。然后，我们使用spaCy对文本进行处理，识别其中的命名实体。最后，我们筛选出标记为"PERSON"（人名）的实体，并将它们存储在people_names列表中。

运行代码，输出结果如下：

张三
李四
王五

总结

spaCy是一个高性能、易于使用的自然语言处理库，可以处理多种语言，提供了许多预训练模型和可扩展功能。本文主要介绍了提取人名的功能，后续我们还将介绍spaCy的其他强大功能。

最后感谢每一个认真阅读我文章的人，礼尚往来总是要有的，虽然不是什么很值钱的东西，如果你用得到的话可以直接拿走：

这些资料，对于【软件测试】的朋友来说应该是最全面最完整的备战仓库，这个仓库也陪伴上万个测试工程师们走过最艰难的路程，希望也能帮助到你！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1389923.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Linux第23步_安装windows下的STM32CubeProgrammer软件和安装 DFU驱动程序

Linux第23步_安装windows下的STM32CubeProgrammer软件和安装 DFU驱动程序

STM32CubeProgrammer软件是通过USB3.0接口烧写系统软件。 STM32CubeProgrammer需要java运行环境，因此需要安装JAVA软件。 Java 运行环境版本必须是 V1.7 及以上，一定要用 64位的，和win系统一致，否则使用 STM32CubeProgrammer烧…

阅读更多...

深入解析JavaScript中的函数绑定和命名函数表达式

深入解析JavaScript中的函数绑定和命名函数表达式

🧑‍🎓 个人主页：《爱蹦跶的大A阿》 🔥当前正在更新专栏：《VUE》、《JavaScript保姆级教程》、《krpano》、《krpano中文文档》 ✨ 前言函数是JavaScript中最重要的组成部分之一。但是函数的this绑定和作用…

阅读更多...

Power Query 中常用的数据清洗、转换操作

Power Query 中常用的数据清洗、转换操作

（一）数据筛选、保留、删除、去重 1、数据筛选操作步骤选中列——点击列名右侧箭头——进行筛选可选操作勾选文本筛选器：等于/不等于、开头是/开头不是、结尾是/结尾不是、包含/不包含数字筛选器：等于/不等于、大于/大于等于…

阅读更多...

harbor https

harbor https

harbor https部署准备docker-compose安装https 证书harbor安装访问harbor推镜像到harbor 准备 192.168.112.99，harbor，centos7 192.168.112.3，测试机，centos7 docker版本：docker-ce 20.10.16（部署参考&a…

阅读更多...

主流浏览器设置代理IP之搜狗浏览器

主流浏览器设置代理IP之搜狗浏览器

给浏览器设置代理IP是目前代理IP的主流使用场景之一，接下来小编就手把手教你如何对搜狗浏览器进行代理IP设置注：本次使用IP来源于携趣代理平台搜狗浏览器内设置IP代理 1、首先需要进入浏览器【设置】 2.点击【代理设置】选择【代理服务器设置】然后进…

阅读更多...

ITE IT6801FNBX HDMI接收器芯片

ITE IT6801FNBX HDMI接收器芯片

一、物料概述 IT6801FN是一款单端口HDMI接收器，可在HDMI1.4和MHL2.1双模式下工作，完全兼容MHL2.1、HDMI 1.4a、HDMI 1.4a3D和HDCP1.4，还可向后兼容DVI 1.0规格。IT6801FN具有深彩色功能（高达36位），可确保接…

阅读更多...

腾讯开源AI工具PhotoMaker，无需训练模型就能保持脸部一致随意换装。

腾讯开源AI工具PhotoMaker，无需训练模型就能保持脸部一致随意换装。

腾讯开源AI工具PhotoMaker，无需训练模型就能保持脸部一致随意换装。最近，AI文本到图像生成领域取得了显著进展，然而，现有的个性化生成方法已经无法同时满足用户的需求，这次腾讯发布了PhotoMaker框架，可以在…

阅读更多...

IaC基础设施即代码：Terraform 通过后端使用 alicloud的OSS 实现资源管理

IaC基础设施即代码：Terraform 通过后端使用 alicloud的OSS 实现资源管理

目录一、实验 1.环境 2.Windows创建Terraform后端项目 3.Windows实例化Terraform后端项目 3.Windows给Terraform项目添加alicloud阿里云OSS （实现代码与资源分离） 4.Windows给Terraform项目添加封装的模块 5.Terraform通过后端使用 alicloud阿里…

阅读更多...

价值7500的在线授权网站源码支持IP+域名+双向授权全开源

价值7500的在线授权网站源码支持IP+域名+双向授权全开源

PHP授权验证更新系统完整版，一键更新系统，一键卡密生成自助授权功能，域名ip双重验证功能等等修复盗版检测，确保实时查看盗版修复在线加密系统，一键加密授权系统几乎所有的程序都能整合使用,包括您的app和计算机程序…

阅读更多...

el-table右固定最后一列显示不全或者是倒数第二列无边框线

el-table右固定最后一列显示不全或者是倒数第二列无边框线

问题图片： 解决方式1： >>>.el-table__row td:not(.is-hidden):last-child { border-left:1px solid #EBEEF5; } >>>.el-table__header th:not(.is-hidden):last-child{ border-left:1px solid #EBEEF5; } >>>.el-table__head…

阅读更多...

文件压缩完还是过大怎么办？这些参数你设置了吗？

文件压缩完还是过大怎么办？这些参数你设置了吗？

不同的压缩算法对不同类型的文件可能有不同的效果。尝试使用不同的压缩算法、压缩模式、调整压缩工具的参数或者设置输出的文件格式等方法解决问题。下面以嗨格式压缩大师作为操作示范。方法一：对文件进行分类压缩将文件按照视频、图片、pdf、word、PPT分类压缩…

阅读更多...

uni-app的项目创建和环境搭建

uni-app的项目创建和环境搭建

uni-app 是一个使用 Vue.js 开发所有前端应用的框架，开发者编写一套代码，可发布到iOS、Android、Web（响应式）、以及各种小程序（微信/支付宝/百度/头条/飞书/QQ/快手/钉钉/淘宝）、快应用等多个平台。第一步…

阅读更多...

Linux内核架构和工作原理详解（二）

Linux内核架构和工作原理详解（二）

Linux内核体系结构简析简析图1 Linux系统层次结构最上面是用户（或应用程序）空间。这是用户应用程序执行的地方。用户空间之下是内核空间，Linux 内核正是位于这里。GNU C Library （glibc）也在这里。它提供了连接内核…

阅读更多...

游戏素材永不缺，免费在线AI工具Scenario功能齐全，简单易用

游戏素材永不缺，免费在线AI工具Scenario功能齐全，简单易用

Scenario是一个在线的AI驱动的工具，主要用于游戏艺术创作。它提供了一套全面的功能，旨在帮助游戏开发者创建与其独特风格和艺术方向相符的独特、高质量的游戏艺术。Scenario的突出特点之一是它的微调能力，允许用户根据独特的风格和艺术方向训…

阅读更多...

Linux 内核被冬季风暴 “封印“

Linux 内核被冬季风暴 “封印“

Linus Torvalds在内核邮件列表上宣布，由于他所在的美国俄勒冈州波特兰地区受到严重冬季风暴的影响，导致网络和电力中断。波特兰及其周边地区气温急降至零下 -10C，因此他不得不临时中断对Linux 6.8内核的合并窗口操作。 Linus于1月7日发布了Li…

阅读更多...

最优订单执行算法相关论文介绍

最优订单执行算法相关论文介绍

数量技术宅团队在CSDN学院推出了量化投资系列课程欢迎有兴趣系统学习量化投资的同学，点击下方链接报名： 量化投资速成营（入门课程） Python股票量化投资 Python期货量化投资 Python数字货币量化投资 C语言CTP期货交易系统开…

阅读更多...

Resemble Enhance音频失真损坏修复AI工具：一个开源语音超分辨率AI模型

Resemble Enhance音频失真损坏修复AI工具：一个开源语音超分辨率AI模型

Resemble Enhance是一款强大的音频处理工具，可以将嘈杂的录音转化为清晰而有力的声音，为用户提供更优质的听觉体验。这个工具不仅可以有效去除录音中的各种噪声和杂音，还能够恢复音频失真并扩展音频带宽，使原本的声音听起来更加清…

阅读更多...

迈向未来的求职征程：广州大学全职特聘讲师入职经历

迈向未来的求职征程：广州大学全职特聘讲师入职经历

迈向未来的求职征程：我的广州大学全职特聘讲师入职经历 2023博士毕业求职经验贴在人生的职业旅程中，每一次求职都是一个新的冒险，而我最近的一次求职经历，是迈向教育领域的激动人心的一步。成为广州大学全职特聘讲师的入职之路…

阅读更多...

QT 绘图与重绘事件

QT 绘图与重绘事件

代码实现仪表盘 .cpp #include "widget.h" #include "ui_widget.h"#include <QPainter> #include <QPen> #include <QBrush>#include <QDebug> Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->…

阅读更多...

[ PyQt入门教程 ] Qt Designer工具的使用

[ PyQt入门教程 ] Qt Designer工具的使用

Qt Designer是PyQt程序UI界面的实现工具，使用Qt Designer可以拖拽、点击完成GUI界面设计，并且设计完成的.ui程序可以转换成.py文件供python程序调用。本文主要通过用户登录需求描述Qt Designer工具开发界面的使用方法。主要内容 1、Qt Designer程序主界…

阅读更多...

推荐文章

最新文章