- blogs:
- cles::blog
2018/01/27

IBM Watson の Speech to Text を試してみる


ふと「最近の音声認識技術を使ったら、留守電から文字起こしはどれくらの精度でできるんだろうか?」思ったので、ウェブから試すことができる IBM Watson の Speech to Text にかけてけてみました。
IBM - Speech to Text | IBM Watson Developer Cloud - Japan
Speech to TextはWatsonの音声認識機能です。ディープ・ラーニングを活用し、音響的な特徴と言語知識から正確にテキストを書き起こします。クラウド上でAPIとして提供する音声認識システムであり、長い時間のストリーム音声や幅広い入力フォーマットをサポートしています。日本語のほかにもアメリカ英語やイギリス英語、フランス語、中国語など複数の言語に対応し、帯域制限された電話音声専用のモデルも提供します。
実際のデモページへは「Speech to Text Demo」から飛ぶことができ、ここから音声ファイルをアップロードすることができます。
試しに Asterisk に残っていた wav ファイル(16bit, 8kHz)をかけてみたら画像のような感じでした。実際の音声を聞くと 「落ちます」→「打ちます」 なのですが、これでも十分要件は分かりそうです。
トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/9934
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form
コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。
OpenID を使ってログインすることができます。
サイト内検索
検索ワードランキング
へぇが多いエントリ
- nmcli で NIC が所属するゾー... (2)
- 居酒屋 八(ひらく) (1)
- びっくりドンキー 大宮公園店 (1)
- Windows 10 で勝手にログアウ... (1)
閲覧数が多いエントリ
1 . Solr-rubyで複数のドキュメントを一括Post(32971)
2 . Windows 10 で勝手にログアウトされないようにする(30855)
3 . Word で数式がグレーアウトされていて挿入できないときは(26457)
4 . リモートデスクトップで Alt + PrtSc と同じことをするには(21961)
5 . Visual Studio 2017/2019 で scanf() がエラー(C4996)になるときは(21305)
2 . Windows 10 で勝手にログアウトされないようにする(30855)
3 . Word で数式がグレーアウトされていて挿入できないときは(26457)
4 . リモートデスクトップで Alt + PrtSc と同じことをするには(21961)
5 . Visual Studio 2017/2019 で scanf() がエラー(C4996)になるときは(21305)
cles::blogについて
Referrers