blogs:
cles::blog
NP_cles()

« 充電器を PowerPort Speed 5 Quick Charge 3.0 に :: Asterisk のボイスメールを Google に文字起こしさ... »

2018/01/27

IBM Watson の Speech to Text を試してみる

ibm

IBM Watson Speech to Text Demo - IBM Watson の Speech to Text を試してみる

ふと「最近の音声認識技術を使ったら、留守電から文字起こしはどれくらの精度でできるんだろうか？」思ったので、ウェブから試すことができる IBM Watson の Speech to Text にかけてけてみました。

IBM - Speech to Text | IBM Watson Developer Cloud - Japan

Speech to TextはWatsonの音声認識機能です。ディープ・ラーニングを活用し、音響的な特徴と言語知識から正確にテキストを書き起こします。クラウド上でAPIとして提供する音声認識システムであり、長い時間のストリーム音声や幅広い入力フォーマットをサポートしています。日本語のほかにもアメリカ英語やイギリス英語、フランス語、中国語など複数の言語に対応し、帯域制限された電話音声専用のモデルも提供します。

実際のデモページへは「Speech to Text Demo」から飛ぶことができ、ここから音声ファイルをアップロードすることができます。

試しに Asterisk に残っていた wav ファイル（16bit, 8kHz）をかけてみたら画像のような感じでした。実際の音声を聞くと 「落ちます」→「打ちます」 なのですが、これでも十分要件は分かりそうです。

by hsur at 12:48 [5年前][4年前][3年前][2年前][1年前][1年後][2年後][3年後][4年後][5年後] |

こんな記事もあります「音声認識留守電 IBM」

・FFmpeg で mp3 を wav に変換
・PR-500KI と Grandstream の電話機の相性問題は Asterisk で解決できる
・Apple が iPhone の修理マニュアルを公開してた
・ソフトウェア開発のレビュープロセスに関する JIS 規格
・IBM がデータ侵害のコストに関するレポートを公開
・IBM Plex Sans JP
・IT 各社がテレワークに関するノウハウを公開
・ThinkPad TrackPoint Keyboard II
・IBM が Red Hat を買収
・Asterisk のボイスメールを Google に文字起こしさせてメールで送る

トラックバックについて

Trackback URL:

お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]

このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/9934

Trackbacks

このエントリにトラックバックはありません

Comments

愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。

コメントはありません

Comments Form

コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。

OpenID を使ってログインすることができます。

« 充電器を PowerPort Speed 5 Quick Charge 3.0 に :: Asterisk のボイスメールを Google に文字起こしさ... »

Copyright © 2004-2023 by CLES All Rights Reserved.

サイト内検索

検索ワードランキング

へぇが多いエントリ

閲覧数が多いエントリ

1 . アーロンチェアのポスチャーフィットを修理(114478)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(112990)
3 . 年次の人間ドックへ(112414)
4 . 2023 年分の確定申告完了！（１つめ）(111982)
5 . 三菱鉛筆がラミーを買収(111853)

最新のエントリ

・2024 年の人気エントリ Top 100

・アーロンチェアのポスチャーフィットを修理

・福岡銀がデマの投稿者への刑事告訴を検討中

・年次の人間ドックへ

・GitHub が全ての公開リポジトリへのシークレットスキャンを有効に

cles::blogについて

誰が書いてる？
最近行った場所
サイトポリシー
タグ一覧
検索ワードランキング

Referrers

Nucleus CMS v3.31SP3/w memcached

22050595 (W:13733 Y:2557 T:1363)