2007/06/26

はてな × ジャストシステム

07/06/20 の CNET の話題。「読了、スレタイ…:日本語辞書ATOKに、はてなのキーワード5万語を採用」(その日にこの記事を書きはじめたんだけど、なんかバタバタしちゃって……)。

曰く、

ジャストシステムはてなは6月19日、ジャストシステムの日本語入力システム「ATOK 2007」で、はてなのブログサービス「はてなダイアリー」のユーザーが作成し共有するキーワード群「はてなダイアリーキーワード」のコンテンツを活用できるサービスで連携し、提供を開始した。(CNET の記事より引用)

……とのこと。

ジャストシステムの ATOK にアドオンで追加できる辞書ができましたよ……というプレスリリースなわけです。ジャストシステムの当該プロダクトの紹介ページ曰く、
はてなダイアリーキーワードのうち、アクセス数上位5万キーワード(2007年5月31日時点)を、ジャストシステムが辞書・省入力データ・電子辞典として登録したものです。ネットで生まれた流行語や日常語など、現在の世相を映し出すこれらキーワードをATOK 2007上において、スムーズに入力でき、そのキーワードの説明を参照することができます。(ジャストシステムのダウンロードページより引用)

……とのこと。過去をひもといてみると、「ATOK の機能を利用した「goo」の新検索サービス開始 〜ATOKがかしこくなると「goo」がかしこくなり、「goo」がたくさん利用されるとATOKがかしこくなる〜 」という 2005/10/27 のプレスリリースに行きついた。そういえばこの頃から、ジャストシステムは、こうしたいろんな試みに挑戦している。ジョルダンとの駅名変換辞書、東洋経済新報社との企業名変換辞書。そして、このはてなキーワードの採用。

この動きを進めていったところで、ATOK が爆発的に売れるようになるとか、一太郎が Microsoft Word のシェアを奪還する……なんてことはないだろうけど、顧客のニーズにあった製品開発をしていこうという姿勢がいい。駅名や企業名なんていうのは、よく「あ〜、なんでこんな簡単な変換ができないの?」って苛つくポイントになりやすい部分。まあ、これまでのかな漢字変換装置からしてみれば、コロケーション(語連接)とか語彙の区切りの精度なんての(ずいぶん前に TV CM で話題になった「入れた手のお茶」みたいなの)が注力ポイントだったんだろうけど(もちろん固有名詞の収集も手抜きはしてなかったと思うけど)。

ただ、こうした単一企業による努力には、限度がある。駅なんていうのはそんなに数が大規模に増減するようなものではないけれども、駅名の変更をジャストシステムが常にモニターしているわけにはいかない。企業名なんてのは駅名以上にダイナミックに変化が観測されるものだ。ダイナミズムで言えば、その頂点に立つのが、やはり検索サービスのクエリなんだろう。人が興味のある事象について検索する。その興味の範囲は、anonymous(匿名)なユーザの diversity(幅広さ)に直結する。さらに、ここに量による重要度の推定が可能になるというありがたい状況(そんなによく検索される言葉なんだったら、きっと意味がある言葉なんだろう……という推測)が成り立つ。このあたりが、はてなキーワードのアドオン辞書で言えば、「アクセス数上位5万キーワード」というあたりに反映されている。

伝統的な紙の辞書や百科事典の場合には、物理的な制限もあって、無限に収録語数を増やしていくことはできない。あっという間に使われなくなってしまう一過性の言葉を記録しておくだけのモティベーションも発生しにくい。しかし、こういうアドオンの辞書であれば、それをインストールすることによって占有されるディスクスペースのことなんか考えるまでもなく小さいわけだ。自分で入力しなければ、邪魔にもならない(とも言い切れないかもしれないけど……)わけだ。さらに、デフォルトでこれらの辞書が組み込まれるわけではなく、ユーザのニーズに応じて、必要な人だけがインストールすればいい。

ハードウェアよりソフトウェア、ソフトウェアよりデータ……という流れをこの業界にいると感じることが多々ある。いまや、そのデータすらも一元管理の純粋培養ではなく、「餅は餅屋」なフレッシュかつ専門的なものが望まれる、ないしは必要だと提供者側が考える……そんなトレンドを感じるできごと。いまちょうど『ウィキノミクス マスコラボレーションによる開発・生産の世紀へ』を読んでるんだけど、これにも通じるところがある。間接的なマスコラボレーションの成果の利用としてね。

0 件のコメント: