Python高阶函数-sorted(深度解析从原理到实战)

news2025/7/13 9:36:46

在这里插入图片描述

一、sorted()函数概述

sorted()是Python内置的高阶函数,用于对可迭代对象进行排序操作。与列表的sort()方法不同,sorted()会返回一个新的已排序列表,而不改变原数据。

基本语法

sorted(iterable, *, key=None, reverse=False)

二、核心参数详解

1. iterable(必需参数)

任何可迭代对象(列表、元组、字符串、字典等)

2. key(关键参数)

  • 接受一个函数作为参数
  • 该函数会被应用到每个元素上,根据函数返回值进行排序
  • 默认值为None,表示直接比较元素本身

3. reverse(排序方向)

  • 布尔值参数
  • False表示升序(默认)
  • True表示降序

三、底层实现原理

sorted()内部使用TimSort算法(一种混合了归并排序和插入排序的稳定算法):

  • 时间复杂度:O(n log n)
  • 空间复杂度:O(n)
  • 稳定性:保持相等元素的原始顺序
# 伪代码展示基本逻辑
def sorted(iterable, key=None, reverse=False):
    # 1. 获取可迭代对象的元素列表
    elements = list(iterable)
    
    # 2. 如果有key函数,应用转换
    if key is not None:
        decorated = [(key(x), i, x) for i, x in enumerate(elements)]
    else:
        decorated = elements
    
    # 3. 执行TimSort排序
    decorated.sort()
    
    # 4. 还原原始数据(保持稳定性)
    if key is not None:
        result = [x for (k, i, x) in decorated]
    else:
        result = decorated
    
    # 5. 处理排序方向
    if reverse:
        result.reverse()
    
    return result

四、高级使用技巧

1. 复杂对象排序

students = [
    {'name': 'Alice', 'age': 20, 'score': 85},
    {'name': 'Bob', 'age': 19, 'score': 92},
    {'name': 'Charlie', 'age': 21, 'score': 78}
]

# 按分数降序排序
sorted_students = sorted(students, key=lambda x: x['score'], reverse=True)

2. 多条件排序

# 先按年龄升序,年龄相同按分数降序
sorted_students = sorted(students,
                        key=lambda x: (x['age'], -x['score']))

3. 使用operator模块

from operator import itemgetter, attrgetter

# 等价于 lambda x: x['score']
sorted_students = sorted(students, key=itemgetter('score'))

# 类对象排序
class Student: ...
sorted_students = sorted(students, key=attrgetter('age'))

4. 自定义排序规则

def custom_sort(x):
    # 奇偶数优先排序:奇数在前,数值小的在前
    return (x % 2 == 0, x)

nums = [3, 1, 4, 2]
sorted_nums = sorted(nums, key=custom_sort)  # [1, 3, 2, 4]

五、性能优化建议

  1. 避免在key函数中进行复杂计算:key函数会被频繁调用,应保持简单高效
  2. 考虑使用生成器:对于大数据集,可以先用生成器预处理
  3. 预编译key函数:对于重复使用的key函数,可以预编译或缓存结果
  4. 考虑稳定性需求:当需要保持相等元素的原始顺序时,sorted()是更好的选择

六、与sort()方法的对比

特性sorted()list.sort()
返回值新列表None(原地修改)
原始数据不改变直接修改
适用对象任何可迭代对象仅列表
链式操作支持不支持
内存使用更高(需要副本)更低

七、实际应用案例

1. 日志文件按时间排序

log_lines = [
    "2023-01-15 ERROR: Disk full",
    "2023-01-10 INFO: System started",
    "2023-01-12 WARNING: Memory low"
]

sorted_logs = sorted(log_lines, key=lambda x: x.split()[0])

2. 文件名自然排序

import re

files = ["file1.txt", "file10.txt", "file2.txt"]
sorted_files = sorted(files, key=lambda x: int(re.search(r'\d+', x).group()))

3. 多语言字符串排序

import locale
locale.setlocale(locale.LC_COLLATE, 'fr_FR.UTF-8')

words = ['été', 'hôtel', 'arbre']
sorted_words = sorted(words, key=locale.strxfrm)

八、常见问题解答

Q1: sorted()如何处理None值?
A: 在Python中,None不能与其他值比较。解决方案:

sorted_list = sorted(mixed_list, key=lambda x: (x is None, x))

Q2: 如何实现自定义排序类?

class CustomOrder:
    _order = ['high', 'medium', 'low']
    
    def __init__(self, value):
        self.value = value
    
    def __lt__(self, other):
        return self._order.index(self.value) < self._order.index(other.value)

sorted_items = sorted([CustomOrder(x) for x in ['low', 'high', 'medium']])

Q3: 超大文件如何高效排序?
使用外部排序(分块读取+归并):

def external_sort(file_path):
    # 分块读取并排序
    chunks = []
    with open(file_path) as f:
        while True:
            chunk = list(itertools.islice(f, 10000))  # 每次读1万行
            if not chunk:
                break
            chunk.sort()
            chunks.append(chunk)
    
    # 多路归并
    return list(heapq.merge(*chunks))

九、总结

sorted()作为Python的核心高阶函数,其强大之处在于:

  • 灵活的参数设计(特别是key函数)
  • 稳定的排序算法
  • 广泛的应用场景
  • 优秀的性能表现

掌握sorted()的高级用法,可以让你写出更Pythonic、更高效的排序代码。建议在实际项目中多实践各种排序场景,深入理解其底层原理。

扩展阅读:Python官方文档中关于排序指南的详细说明

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2330416.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue3实战三、Axios封装结合mock数据、Vite跨域及环境变量配置

目录 Axios封装、调用mock接口、Vite跨域及环境变量配置封装Axios对象调用mock接口数据第一步、安装axios&#xff0c;处理一部请求第二步、创建request.ts文件第三步、本地模拟mock数据接口第四步、测试axiosmock接口是否可以调用第五步、自行扩展 axios 返回的数据类型 axios…

机器学习(神经网络基础篇)——个人理解篇5(梯度下降中遇到的问题)

在神经网络训练中&#xff0c;计算参数的梯度是关键步骤。numerical_gradient 方法旨在通过数值微分&#xff08;中心差分法&#xff09;计算损失函数对网络参数的梯度。然而&#xff0c;该方法的实现存在一个关键问题&#xff0c;导致梯度计算错误。 1、错误代码示例&#xf…

【Linux】虚拟机设置静态IP

主播我今天下午学了几节微服务课&#xff0c;上课的时候&#xff0c;直接把手机拿走了去上课&#xff08;电脑连的我手机的热点&#xff09;&#xff0c;虚拟机没关&#xff0c;晚上主播我回来继续学&#xff0c;电脑连上热点之后&#xff0c;发现虚拟机连接不上了&#xff0c;…

职坐标解析自动驾驶技术发展新趋势

内容概要 作为智能交通革命的核心驱动力&#xff0c;自动驾驶技术正以惊人的速度重塑出行生态。2023年&#xff0c;行业在多传感器融合与AI算法优化两大领域实现突破性进展&#xff1a;激光雷达、摄像头与毫米波雷达的协同精度提升至厘米级&#xff0c;而深度学习模型的实时决…

局域网:电脑或移动设备作为主机实现局域网访问

电脑作为主机 1. 启用电脑的网络发现、SMB功能 2. 将访问设备开启WIFI或热点&#xff0c;用此电脑连接&#xff1b;或多台设备连接到同一WIFI 3. 此电脑打开命令行窗口&#xff0c;查看电脑本地的IP地址 Win系统&#xff1a;输入"ipconfig"&#xff0c;回车后如图 4.…

小型园区组网图

1. 在小型园区中&#xff0c;S5735-L-V2通常部署在网络的接入层&#xff0c;S8700-4通常部署在网络的核心&#xff0c;出口路由器一般选用AR系列路由器。 2. 接入交换机与核心交换机通过Eth-Trunk组网保证可靠性。 3. 每个部门业务划分到一个VLAN中&#xff0c;部门间的业务在C…

数据分享:汽车测评数据

说明&#xff1a;如需数据可以直接到文章最后关注获取。 1.数据背景 Car Evaluation汽车测评数据集是一个经典的机器学习数据集&#xff0c;最初由 Marko Bohanec 和 Blaz Zupan 创建&#xff0c;并在 1997 年发表于论文 "Classifier learning from examples: Common …

批量将 txt/html/json/xml/csv 等文本拆分成多个文件

我们的文本文件太大的时候&#xff0c;我们通常需要对文本文件进行拆分&#xff0c;比如按多少行一个文件将一个大的文本文件拆分成多个小的文本文件。这样我们在打开或者传输的时候都比较方便。今天就给大家介绍一种同时对多个文本文件进行批量拆分的方法&#xff0c;可以快速…

Vue3 路由权限管理:基于角色的路由生成与访问控制

Vue3 路由权限管理&#xff1a;基于角色的路由生成与访问控制 一、核心概念 1.1 大致流程思路&#xff1a; 用户在登录完成的时候&#xff0c;后端给出一个此登录用户对应的角色名字&#xff0c;此时可以将这个用户的角色存起来(vuex/pinia)中&#xff0c;在设置路由时的met…

忘记mysql的root用户密码(已解决)

1、打开数据库可视化界面&#xff08;比如MySQL workbench&#xff09; 2、执行select host,user,authentication_string from mysql.user; 3、把‘authentication_string’下面的字段 复制到MD5在线解密网页中&#xff08;比如md5在线解密&#xff09;

ubuntu 20.04 编译和运行SC-LeGo-LOAM

1.搭建文件目录和clone代码 mkdir -p SC-LeGo-LOAM/src cd SC-LeGo-LOAM/src git clone https://github.com/AbangLZU/SC-LeGO-LOAM.git cd .. 2.修改代码 需要注意的是原作者使用的是Ouster OS-64雷达&#xff0c;需要更改utility.h文件中适配自己的雷达类型&#xff0c;而…

CentOS 7安装hyperscan

0x00 前言 HyperScan是一款由Intel开发的高性能正则表达式匹配库&#xff0c;专为需要快速处理大量数据流的应用场景而设计。它支持多平台运行&#xff0c;包括Linux、Windows和macOS等操作系统&#xff0c;并针对x86架构进行了优化&#xff0c;以提供卓越的性能表现。HyperSc…

UE5 Simulation Stage

首先将Grid2D创建出来&#xff0c;然后设置值&#xff0c;Grid2D类似于在Niagara系统中的RenderTarget2D&#xff0c;可以进行绘制&#xff0c;那么设置大小为512 * 512 开启Niagara粒子中的Simulation Stage 然后开始编写我们的自定义模块 模块很简单&#xff0c;TS就是Textur…

Swift 解 LeetCode 250:搞懂同值子树,用递归写出权限系统检查器

文章目录 前言问题描述简单说&#xff1a;痛点分析&#xff1a;到底难在哪&#xff1f;1. 子树的概念搞不清楚2. 要不要“递归”&#xff1f;递归从哪开始&#xff1f;3. 怎么“边遍历边判断”&#xff1f;这套路不熟 后序遍历 全局计数器遍历过程解释一下&#xff1a;和实际场…

增益调度控制 —— 理论、案例与交互式 GUI 实现

目录 增益调度控制 —— 理论、案例与交互式 GUI 实现一、引言二、增益调度控制的基本原理三、数学模型与公式推导四、增益调度控制的优势与局限4.1 优势4.2 局限五、典型案例分析5.1 案例一:航空飞行控制中的增益调度5.2 案例二:发动机推力控制中的增益调度5.3 案例三:化工…

关于OEC/OEC-turbo刷机问题的一些解决方法(2)——可能是终极解决方法了

前面写了两篇关于OEC/OEC-turbo刷机问题的文章了&#xff0c;从刷机过程、刷机中遇到的问题&#xff0c;以及遇到最多但始终无法有效解决的下载boot失败的问题的剖析&#xff0c;最近确实也做了一些工作&#xff0c;虽然没有最终解决&#xff0c;但也算是这系列文章里面阶段性的…

瓦片数据合并方法

影像数据 假如有两份影像数据 1.全球底层影像0-5级别如下&#xff1a; 2.局部高清影像数据级别9-14如下&#xff1a; 合并方法 将9-14文件夹复制到全球底层0-5的目录下 如下&#xff1a; 然后合并xml文件 使得Tileset设置到最高级&#xff08;包含所有级别&#xff09;&…

第16届蓝桥杯单片机模拟试题Ⅰ

试题 代码 sys.h #ifndef __SYS_H__ #define __SYS_H__#include <STC15F2K60S2.H> //onewire.c float getT(); //sys.c extern unsigned char UI; extern bit touch_mode; extern float jiaozhun; extern float canshu; extern float temper; void init74hc138(unsigned…

mac 卸载流氓软件安全助手

之前个人电脑在公司使用过一段时间&#xff0c;为了使用网线联网安装了公司指定的 联软上网助手&#xff0c;谁知安装容易卸载难&#xff0c;后来找运维来卸载&#xff0c;输入管理员密码后&#xff0c;也无反应&#xff0c;最后不了了之了&#xff0c;这个毒瘤软件长期在后台驻…

⭐算法OJ⭐滑动窗口最大值【双端队列(deque)】Sliding Window Maximum

文章目录 双端队列(deque)详解基本特性常用操作1. 构造和初始化2. 元素访问3. 修改操作4. 容量操作 性能特点时间复杂度&#xff1a;空间复杂度&#xff1a; 滑动窗口最大值题目描述方法思路解决代码 双端队列(deque)详解 双端队列(deque&#xff0c;全称double-ended queue)是…