2009-03-09から1日間の記事一覧

senにWikipediaの項目名を追加する

QMACloneの新類似問題検索エンジンの単語分割の部分にJavaによる日本語形態素解析エンジンsenを使っているのだが、どうも固有名詞の認識が甘い。というか、甘すぎる。国名や地名はある程度認識してくれるのだが有名な作品名(坊ちゃん等)を認識してくれないな…

senの辞書にWikipediaの項目名を追加した(詳細版)

手順を詳細に書いてみます。 下記URLよりWikipedia項目名一覧を落としてくる(jawiki-latest-all-titles-in-ns0.gz) http://download.wikimedia.org/jawiki/latest/ 文字コードをUTF-8からEUC-JPに変換する 以下のプログラムでipadicの辞書の形式に変換する i…

養成所のほうは駄目っぽい

進級試験前の昨日の授業で先生から「男性は全員一定のレベルに達していない」と言われた。いわゆる死亡フラグである。養成所の方は駄目だったようだ。 一応木曜日に進級試験なので、楽しんでこようと思います。