gerpとかsortの実行速度が遅い
これを
$ time grep -o -e '[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+' *.txt|sort |uniq -c|sort -nr |head -1
こんなのにしたら
$ time LC_ALL=C grep -o -e '[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+' *.txt|sort |uniq -c|sort -nr |head -1
8倍はやくなったっ!
原因は環境変数だった
What's "LANG=C" ?
http://mstssk.blogspot.jp/2009/04/whats-langc.html
$ env ... LANG=C ... LC_CTYPE=en_US.UTF-8 ...
LANG=Cと指定してあるが、
LC_CTYPEにより上書きされていたらしい。