第1739話 ■Google日本語入力
コンピュータの日本語入力処理で最も難しい部分は固有名詞刺のところではないかと思う。基本的に辞書を持ち合わせてそれと照合させていけば良いのだろうが、ただ辞書の容量を増やせば良いという話ではなかろう。候補の文字がより多く表示されるだけだろうから。
そんなわけで、日本語かな漢変換モジュールの話題であるが、Googleが提供している「Google日本語入力」の変換が、実に気持ち良い。流石はGoogle。検索エンジンで利用者が入力する検索用語をベースに辞書を作っているらしく、人名などの固有名詞にめっぽう強い。
たとえば、古今亭志ん生、古今亭志ん朝、三遊亭圓朝、金原亭馬生、金原亭馬治、春風亭一之輔、三遊亭時松(噺家の名前ばかりだが)なんて名前が一発で出てくる。ただ、噺家の場合、ごく一部の有名な人を除いて、下の名前だけで名前が正しく変換されることは珍しい。しかし、苗字の部分にあたる亭号から入力していけば、ほぼ正しく変換される。もちろん、例外もあるが。落語のブログなんてやっていると、このあたりが正しく変換されるのはストレスが無くて良い。
とりあえず、会社で支給されているパソコンも含めて、このGoogle日本語入力をインストールして使っている。これまでMS IMEでユーザ辞書登録していた内容をエクスポートし、Google日本語入力側で取り込み、複数台のパソコンに同じ環境と、快適にキーを叩いている。
ただ固有名詞も有名人がいる姓ならば、例えば「温水(ぬくみず)」のようなケースは良いが、有名人がいない珍しい苗字、例えるならば、ハンコ売り場の見本ケースに並んでいないような名前は辞書に候補がないことが多く、単漢字で入力しないといけないときがある。それとやや文節長の判断が甘い感じがあるのが、やや残念。まあ、これからの改良に期待したい。
(秀)
-
前の記事
第1738話 ■活動写真弁士 2010.02.17
-
次の記事
第1740話 ■週末の始まり 2010.03.11