BLOGTIMES
2008/01/12

Mecabを形態素解析以外に使う方法

 
このエントリーをはてなブックマークに追加

Mecabといえば形態素解析ツールですが、辞書ファイルを工夫することでちょっと変わった使い方が紹介されています。

ウノウラボ Unoh Labs: PHPとMecabでキーワード自動リンクを実装する

Webサービスを開発していると、特定のキーワードを自動でURLリンクにする処理が必要になることがあると思います。今回は、このキーワード自動リンク機能を形態素解析ツールMecabを使ってPHPで実装する方法を紹介したいと思います。

実はこれを違う方法でやろうとしてかなり苦労したことがあったので、こんな簡単な方法があったというのはちょっとショック。もともとMecabのプロジェクトにはMeCab の辞書構造と汎用テキスト変換ツールとしての利用というドキュメントがあったようで、さらにショック

この例で1つだけ気になるのは、たとえば単語の一部に文字列の重複がある場合にはどうなるのかということですかね。たとえば「京都」と「東京都」みたいな感じのもの。とりあえず一度は試してみておいて損はなさそうですね。


    トラックバックについて
    Trackback URL:
    お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
    このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/2368
    Trackbacks
    このエントリにトラックバックはありません
    Comments
    愛のあるツッコミをお気軽にどうぞ。[policy]
    古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
    コメントはありません
    Comments Form

    コメントは承認後の表示となります。
    OpenIDでログインすると、即時に公開されます。

    OpenID を使ってログインすることができます。

    Identity URL: Yahoo! JAPAN IDでログイン