2010年から2015年まではてなダイアリーで更新ししていたブログです。
現在は「パンクはいつも突然に」に統合して更新しています。

辞書コンバートとgrepの\t

 かれこれ20年育てていたWXの辞書の登録単語をmoxcにコンバート。辞書テキストファイルをエディタでいじって、grepで品詞ごとに抜き出して修正して登録。

 ずいぶん登録したと思っていたが、700ちょっとしかなかった。

grepでの\tとか

 mozc辞書のテキストファイルの形式は「よみ漢字品詞」で1行、1データ。「\t名詞\t」とかで探そうとしても引っかかってこない。調べたらgrepではこの形式では指定できないらしい。

grepでタブを検索