2009-03-09から1日間の記事一覧
QMACloneの新類似問題検索エンジンの単語分割の部分にJavaによる日本語形態素解析エンジンsenを使っているのだが、どうも固有名詞の認識が甘い。というか、甘すぎる。国名や地名はある程度認識してくれるのだが有名な作品名(坊ちゃん等)を認識してくれないな…
手順を詳細に書いてみます。 下記URLよりWikipedia項目名一覧を落としてくる(jawiki-latest-all-titles-in-ns0.gz) http://download.wikimedia.org/jawiki/latest/ 文字コードをUTF-8からEUC-JPに変換する 以下のプログラムでipadicの辞書の形式に変換する i…
進級試験前の昨日の授業で先生から「男性は全員一定のレベルに達していない」と言われた。いわゆる死亡フラグである。養成所の方は駄目だったようだ。 一応木曜日に進級試験なので、楽しんでこようと思います。