BLOGTIMES
2018/01/27

IBM Watson の Speech to Text を試してみる

  deeplearning  ibm 
このエントリーをはてなブックマークに追加

IBM Watson Speech to Text Demo - IBM Watson の Speech to Text を試してみる

ふと「最近の音声認識技術を使ったら、留守電から文字起こしはどれくらの精度でできるんだろうか?」思ったので、ウェブから試すことができる IBM Watson の Speech to Text にかけてけてみました。

IBM - Speech to Text | IBM Watson Developer Cloud - Japan

Speech to TextはWatsonの音声認識機能です。ディープ・ラーニングを活用し、音響的な特徴と言語知識から正確にテキストを書き起こします。クラウド上でAPIとして提供する音声認識システムであり、長い時間のストリーム音声や幅広い入力フォーマットをサポートしています。日本語のほかにもアメリカ英語やイギリス英語、フランス語、中国語など複数の言語に対応し、帯域制限された電話音声専用のモデルも提供します。

実際のデモページへは「Speech to Text Demo」から飛ぶことができ、ここから音声ファイルをアップロードすることができます。

試しに Asterisk に残っていた wav ファイル(16bit, 8kHz)をかけてみたら画像のような感じでした。実際の音声を聞くと 「落ちます」→「打ちます」 なのですが、これでも十分要件は分かりそうです。


    トラックバックについて
    Trackback URL:
    お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
    このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/9934
    Trackbacks
    このエントリにトラックバックはありません
    Comments
    愛のあるツッコミをお気軽にどうぞ。[policy]
    古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
    コメントはありません
    Comments Form

    コメントは承認後の表示となります。
    OpenIDでログインすると、即時に公開されます。

    OpenID を使ってログインすることができます。

    Identity URL: Yahoo! JAPAN IDでログイン