任务
想将一组人名写入一个地址簿,同时还希望地址簿能够根据姓的首字母进行分组,且按照字母顺序表排序。
解决方案
Python 2.4 的新 itertools.groupby 函数使得这个任务很简单:
import itertools
def qroupnames(name_iterable):
sorted_names = sorted(name_iterable,key=_sortkeyfunc)
name_dict = {}
for key,group in itertools.groupby(sorted_names,_groupkeyfunc):
name_dict[key] = tuple(group)
return name_dict
pieces_order = {2:(-1,0),3:(-1,0,1)}
def _sortkeyfunc(name):
'''name是带有名和姓以及可选的中名或首字母的字符串,
这些部分之间用空格隔开;返回的字符串的顺序是
姓-名-中名,以满足排序的需要'''
name_parts = name.split()
return ''.join((name_parts[n] for n in
pieces_order[len(name_parts)]])
def _groupkeyfunc(name):
'''返回的键(即姓的首字母)被用于分组'''
return name.split()[-1][0]
讨论
本节解决方案中的 name_iterable 必须是一个可迭代对象,它的元素是遵循名-中名-姓格式的人名字符串,其中中名是可选的且各部分以空格隔开。对这个可选代对象调用groupnames 得到的结果是一个字典,它的键是姓的首字母,而对应的值则是完整的名中名和姓的构成的元组。
不管是“名姓”还是“名 中名 姓”的格式,辅助的_sortkeyfnc 函数都能将人名字符串切割开,并将各部分记录到一个列表中,其顺序是先姓后名,如果有中名,还要加上中名或首字母,最后将这个列表拼接成一个字符串并返回。根据任务的描述,这个字符串是用来排序的关键。Python2.4的内建函数sorted用这个函数(它将被应用到每个元素上用于获取排序的键)作为可选的名为 key的参数。
辅助函数_groupkeyfunc 也接受同样格式的人名,并返回姓的首字母–根据问题的描述,这是我们用来将人名分组的关键。
方案中的主函数 groupnames使用了两个辅助函数和Python2.4的sorted 和 itertools.groupby 来解决问题,创建并返回了我们要求的字典。
如果想在Python2.3中完成这个任务,仍然可以使用这两个支持函数并重新编写groupnames。由于Python 2.3的标准库中并没有提供 groupby函数,先分组再分别对各个组排序会更方便一些:
def groupnames(name_iterable):
name_dict = {}
for name in name_iterable:
key = _groupkeyfunc(name)
name_dict.setdefault(key,[]).append(name)
for k,v in name dict.iteritems():
aux = [(_sortkeyfunc(name),name) for name in v]
aux.sort()
name_dict[k] = tuple([n for __, n in aux])
return name_dict