Python 对中文名称逐字按字母表进行排序并输出

news2024/11/26 0:53:05

使用场景

代码适用于需要对中文名称进行排序并规范化输出的情景,具体为处理一个包含中文姓名的文本文件,按姓名的拼音首字母进行排序,并以规范的格式输出。

排序规则:
将名称按照姓氏首字母A-Z的次序,进行排序;
若同姓氏,则比较下一名称在A-Z中的次序再重新排列。


操作步骤

  1. 准备输入: 将包含中文姓名的文本文件(例如 names.txt)放在指定的文件路径下。

  2. 替换文件路径: 在代码中,将 file_path 变量替换为实际的文件路径,确保代码能够正确读取文件。

  3. 运行代码: 运行代码,它将读取文件中的中文姓名列表,按照拼音首字母进行排序,然后输出排序后的中文姓名。


实现思路

  • 拼音获取: 使用 pypinyin 库获取每个中文名称的拼音,并保存为元组列表,其中元组包含原名称和拼音。

  • 排序规则: 利用 Python 的 sorted 函数,通过 lambda 函数对拼音进行排序,同时考虑下一个字的拼音,以确保正确的中文排序。

  • 下一个字拼音获取: 使用 get_next_pinyin 函数获取每个姓名中下一个字的拼音首字母。

  • 格式化输出: 使用 format_list 函数将排序后的中文姓名列表格式化为一个以 分隔的字符串。


代码实现

# -*- coding: utf-8 -*-
from pypinyin import pinyin, Style

def sort_chinese_names(names):
    # 获取每个名称的拼音
    pinyin_names = [(name, ''.join([p[0] for p in pinyin(name, style=Style.NORMAL)])) for name in names]

    # 根据拼音进行排序,同时考虑下一个字的拼音
    sorted_names = sorted(pinyin_names, key=lambda x: (x[1], get_next_pinyin(x[0])))

    # 返回排序后的名称列表
    return [name[0] for name in sorted_names]

def get_next_pinyin(name):
    if len(name) > 1:
        next_pinyin = pinyin(name[1], style=Style.NORMAL)[0][0]
        return next_pinyin
    else:
        return ''

def format_list(input_list):
    formatted_str = '、'.join(map(str, input_list))
    return formatted_str

if __name__ == "__main__":
    # 输入中文名称列表txt文件
    file_path = './names.txt'  # 替换为实际的文件路径

    # 读取文件内容并去除回车符
    with open(file_path, 'r', encoding='utf-8') as file:
        content_list = [line.strip() for line in file]

    input_names = content_list

    # 排序中文名称
    sorted_names = sort_chinese_names(input_names)

    # 输出排序并规范化的中文名称
    result = format_list(sorted_names)
    print(result)

计算机术语和函数解释表格

术语/函数解释
pypinyin用于将中文转换为拼音的 Python 库
lambda()匿名函数,用于排序中文姓名
get_next_pinyin获取中文姓名中下一个字的拼音首字母
format_list()将列表格式化为以 ‘、’ 分隔的字符串

如果这对您有所帮助,希望点赞支持一下作者! 😊

点击查看原文

file

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1288537.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

15+铁死亡超高分推荐,快来码思路

今天给同学们分享一篇生信文章“Polydopamine Nanoparticles Targeting Ferroptosis Mitigate Intervertebral Disc Degeneration Via Reactive Oxygen Species Depletion, Iron Ions Chelation, and GPX4 Ubiquitination Suppression”,这篇文章发表在Adv Sci (Wei…

【漏洞复现】狮子鱼任意文件上传漏洞

漏洞描述 狮子鱼CMS(Content Management System)是一种网站管理系统,旨在帮助用户更轻松地创建和管理网站。它具有用户友好的界面和丰富的功能,包括页面管理、博客、新闻、产品展示等。 狮子鱼CMS使用简单直观的管理界面,使得网站所有者可以方便地进行内容的发布、管理和…

Python插件 - 动态 简单账表 通过SQL存储过程输出列实现动态展示

第一步 新建一个简单账表加上表头标签 第二步 新建一个过滤框 第三步 修改过滤窗口标识 第四步 注册插件 python代码实现 import clr clr.AddReference("System") clr.AddReference("System.Core") clr.AddReference("Kingdee.BOS") clr.AddRe…

思腾云计算中心 | 5千平米超大空间,基础设施完善,提供裸金属GPU算力租赁业务

2021年,思腾合力全资收购包头市易慧信息科技有限公司,正式开启云计算业务。思腾云计算中心占地2400平米,位于包头市稀土高新区,毗邻多家知名企业,地理位置优越,交通便利,是区内重要的信息化产业…

数据结构实验—宿舍管理系统(C,Python,Java三种代码版本)

目录 实验课程 实验内容 数据结构类型定义 模块划分 (C语言)详细代码设计 (python)详细代码设计 (Java)详细代码设计 测试数据及结果 实验总结 实验课程 课程名称:数据结构 实验名称&…

C-11练习题

一、单项选择题(本大题共20小题,每小题2分,共40分。在每小题给出的四个备选项中选出一个正确的答案,并将所选项前的字母填写在答题纸的相应位置上。) 1,在C语言中,合法的长整型常数是() A. OxOL B. 4962710M C. 324562& D. 216D 2,设有定义: int a[10],*pa6,*q…

封装PoiExcelUtils

作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO 联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬 为什么要封装PoiExcelU…

Python实现FA萤火虫优化算法优化卷积神经网络回归模型(CNN回归算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 萤火虫算法(Fire-fly algorithm,FA)由剑桥大学Yang于2009年提出 , …

基于c++版本的数据结构改-python栈和队列思维总结

##栈部分-(叠猫猫) ##抽象数据类型栈的定义:是一种遵循先入后出的逻辑的线性数据结构。 换种方式去理解这种数据结构如果我们在一摞盘子中取到下面的盘子,我们首先要把最上面的盘子依次拿走,才可以继续拿下面的盘子&…

python+django企业物流配送管理系统a3t2w

本物流管理系统采用python技术,Mysql数据库开发,充分保证了系统稳定性、完整性。 物流管理系统的设计与实现的设计思想如下: 1、操作简单方便、系统界面安全良、简单明了的页面布局、方便查询物流管理系统相关信息。 2、即时可见&#xff1…

Ubuntu18.04 本地安装CVAT标注工具

写在前面: 1、如果直接clone最新版本的cvat,python版本最好安装3.8的,因为其中部分代码的语法只有高版本的python才可以支持。 2、安装完成以后本地登陆可能出现"cannot connect to cvat server"的错误,可以从Cannot …

全面解决Error: Uncaught SyntaxError: Invalid Unicode escape sequence

是因为.js文件中的路径转义(\)错误,可能是windows内的相对路径放到linux中有问题 直接看图: (上面是修改后的,下面的则是原来的) 解决方式: 先在报错浏览器按f12打开调试,选择console窗口查看…

c++函数模板STL详解

函数模板 函数模板语法 所谓函数模板,实际上是建立一个通用函数,其函数类型和形参类型不具体指定,用一个虚拟的类型来代表。这个通用函数就称为函数模板。 凡是函数体相同的函数都可以用这个模板来代替,不必定义多个函数&#xf…

pre标签展示代码块

pre样式 添加背景色、边框、以及调整了字体大小。 pre { border: 1px solid #999; page-break-inside: avoid; display: block; padding: 3px 3px 2px; margin: 0 0 10px; font-size: 13px; line-height: 20px; word-break: break-all; word-wrap: break-word; /* white-space:…

​HTML代码混淆技术:原理、应用和实现方法详解

​HTML代码混淆技术:原理、应用和实现方法详解 HTML代码混淆是一种常用的反爬虫技术,它可以有效地防止爬虫对网站数据的抓取。本文将详细介绍HTML代码混淆技术的原理、应用以及实现方法,帮助大家更好地了解和运用这一技术。 一、HTML代码混淆…

C++ 指针进阶

目录 一、字符指针 二、指针数组 三、数组指针 数组指针的定义 &数组名 与 数组名 数组指针的使用 四、数组参数 一维数组传参 二维数组传参 五、指针参数 一级指针传参 二级指针传参 六、函数指针 七、函数指针数组 八、指向函数指针数组的指针 九、回调函…

stm32项目(11)——基于stm32的俄罗斯方块游戏机

1.功能设计 使用stm32f103zet6平台,以及一块LCD屏幕,实现了一个俄罗斯方块游戏机。可以用按键调整方块的位置、还可以控制方块下降的速度! 2.视频演示 俄罗斯方块 3.俄罗斯方块发展史 俄罗斯方块是一种经典的拼图游戏,由苏联俄罗…

隧道施工废水工艺设备需要哪些

隧道施工废水工艺设备是保障隧道施工过程中废水处理的关键装备。它们能够有效处理施工废水中的悬浮物、悬浮油、重金属等污染物,确保废水排放符合相关环保标准。以下是隧道施工废水工艺设备常见的几种类型: 1. 隧道施工废水沉淀池:沉淀池是废…

销售经理应该具备哪些能力?

销售经理应该具备哪些能力? 俗话说火车跑的快,全靠车头带,这句话虽然有些片面,但是也说明作为团队直接领导的销售经理担当者重要的角色,他们不仅要学会管理自我,更重要的是要管理团队,激发他人…

【开源】基于Vue和SpringBoot的衣物搭配系统

项目编号: S 016 ,文末获取源码。 \color{red}{项目编号:S016,文末获取源码。} 项目编号:S016,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、研究内容2.1 衣物档案模块2.2 衣物搭配模块2.3 衣…