ぬけラボ

φ(..)メモメモ

gerpとかsortの実行速度が遅い

これを

$ time grep -o -e '[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+' *.txt|sort |uniq -c|sort -nr |head -1

こんなのにしたら

$ time LC_ALL=C grep -o -e '[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+' *.txt|sort |uniq -c|sort -nr |head -1

8倍はやくなったっ!


原因は環境変数だった

What's "LANG=C" ?
http://mstssk.blogspot.jp/2009/04/whats-langc.html

$ env
...
LANG=C
...
LC_CTYPE=en_US.UTF-8
...

LANG=Cと指定してあるが、
LC_CTYPEにより上書きされていたらしい。