一个小程序的Python和Bash版本比较 - linux编程基础

最近有一个小需求：在一个目录下有很多文件，每个文件的第一行是BEGIN开头的，最后一行是END开头的，中间每一行有多列，数量不等，第一列称为"DN", 第二列称为"CV"，DN和CV的联合作为主键，现在需要检测文件中是否有重复的DN-CV。

于是写了个简单的python程序

对于250个文件，共60万行的数据，过滤一遍约1.67秒

有点不甘心这个效率，于是又写了一个同样功能的shell脚本

为了进一步比较，重复了10次实验。

可读性上看，python更简洁优雅一些。不过执行效率略有出乎意料。shell貌似更快一些……