文章目录
- 1. 海量数据排序
1. 海量数据排序
如果我们想在文件中海量数据排序,我们比较适合选用归并排序。
首先,我们要看要排序的文件的大小,比如说这个文件是10G,而我们的内存是1G,那么我们可以把文件切成10份。这样每个小文件都可以加载到内存中,使用快排进行排序,排序后再写回小文件。这时就达到了文件归并的先决条件。
我们在这里用100个数据来为例。
我们把这100个数据分成10份,分别为1到10。
既然每个小文件有序了,那么我们该如何归并呢?
我们先让文件1和文件2归并成文件12,然后让文件12和文件3归并合成文件123,依次下去。
下面就是归并的过程了。
这样就完成了归并外排序,这里主要考察对C语言的文件操作需要熟悉。