sort和sorted的区别
虽然python3中sort()和sorted()都可以用来排序,但二者有以下两个最主要的区别:
sort只能应用在列表list上,而sorted可以对所有可迭代的对象进行排序的操作
sort方法会在原list上直接进行排序,不会创建新的list。而sorted方法不会对原来的数据做任何改动,排序后的结果是新生成的。如果我们不需要原来的数据而且数据是list类型,可以用sort方法,能够节省空间。否则要用sorted方法。
sort
在python2中,sort方法可以有3个参数:key、cmp和reverse。但在python3中取消了cmp这个参数,只有key和reverse两个可选参数。参数reverse指定排序是正序还是倒序,默认是正序FALSE,不在多说。参数key指定了只含一个参数的方法,这个方法用来从列表的每个元素中提取比较键。可以看看下面几个例子:
1.通过元素长度排序
strlist = ["bbb","ccc","bac","ab","ba"] strlist.sort(key=len) print(strlist)
打印结果如下:
['ab', 'ba', 'bbb', 'ccc', 'bac']
2.通过元素的字符顺序
strlist = ["bbb","BBB","bAc","ab","bac"] strlist.sort()print(strlist) strlist.sort(key=str.lower)print(strlist)
打印结果如下:
['BBB', 'ab', 'bAc', 'bac', 'bbb'] ['ab', 'bAc', 'bac', 'BBB', 'bbb']
3.更复杂一点的排序:list里的元素是一个字典,通过字典的某个属性值排序。下面是通过学生的年龄排序
student = [{"name": "小C", "age": 12, "score": 90}, {"name": "小D", "age": 13, "score": 84}, {"name": "小A", "age": 14, "score": 85}, {"name": "小E", "age": 15, "score": 89}, {"name": "小F", "age": 12, "score": 88}] student.sort(key=lambda a: a["age"]) print(student)
打印结果如下(换行是我自己处理的):
[{'name': '小C', 'age': 12, 'score': 90}, {'name': '小F', 'age': 12, 'score': 88}, {'name': '小D', 'age': 13, 'score': 84}, {'name': '小A', 'age': 14, 'score': 85}, {'name': '小E', 'age': 15, 'score': 89}]
那么原来的cmp参数有的功能实现不了了吗?当然能,可以通过从functools库里引入cmp_to_key来解决,看下面几个例子:
1.数组的倒序
from functools import cmp_to_key list = [5,4,3,2,1] list.sort(key=cmp_to_key(lambda a,b: b-a)) print(list)
打印结果如下:
[5, 4, 3, 2, 1]
2.把数组排成最小的数里python的解法可以通过如下方式解答(注意倒数第3行,把map类型转成了list类型):
from functools import cmp_to_key class Solution: def PrintMinNumber(self, numbers): numbers = list(map(str, numbers)) numbers.sort(key=cmp_to_key(lambda s1, s2: int(s1+s2) - int(s2+s1))) return "".join(numbers)
由于sort只有list类型才可以用,所以用的更普遍的是sorted方法,下面来说下sorted方法
sorted
所有可以迭代的对象都可以用sorted来进行排序,排序不会改变原来的对象。sorted接收3个参数:
sorted(iterable, *, key=None, reverse=False)
iterable是可迭代的对象,key和reverse与sort里的相同。
看下面一个小例子:
student_tuples = [('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10)] new_tuples = sorted(student_tuples, key=lambda student: student[2]) print(student_tuples) print(new_tuples)
打印结果如下:
[('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10)] [('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
新列表是通过年龄排序的,从打印结果可以看出没有改变原数据
由于这种含有key参数的方法很普遍,所以python中提供了一些方法使得访问器函数更加方便。比如operator模块中的itemgetter(), attrgetter()方法。
看下下面的例子:
from operator import itemgetter, attrgetter class Student: def __init__(self, name, grade, age): self.name = name self.grade = grade self.age = age student_objects = [Student('john', 'A', 15), Student('jane', 'B', 12), Student('dave', 'B', 10)] student_tuples = [('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10) ] result1 = sorted(student_tuples, key=itemgetter(2)) # 通过元素的第三个值排序 result2 = sorted(student_objects, key=attrgetter('age')) # 通过对象的age属性排序 result3 = sorted(student_tuples, key=itemgetter(1,2)) # 首先通过元素的第一个值排序,然后通过第二个值排序 result4 = sorted(student_objects, key=attrgetter('grade', 'age')) # 通过对象的grade属性排序,后通过age属性排序
排序后的结果如下(非打印):
result1与result2:
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]result3与result4:
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]
排序是保证稳定可靠的,当排序的key对应的值相同时,会保持它们在原数据中的顺序,比sort里的第3个例子如以下代码运行结果:
from operator import itemgetter data = [('red', 1), ('blue', 1), ('red', 2), ('blue', 2)] print(sorted(data, key=itemgetter(0)))
打印结果
[('blue', 1), ('blue', 2), ('red', 1), ('red', 2)]