トップページへ

産総研が声で動画や音声ファイルを検索するサービス『Voiser』公開へ

Podcast journal - ポッドキャストジャーナル » NEWS » business » 2008-10 » 産総研が声で動画や音声ファイルを検索するサービス『Voiser』公開へ

 独立行政法人 産業技術総合研究所(略して産総研)より実証用としてマルチメディアコンテンツを音声で直接検索するサイトが公開されました。

Voiser Web
voice_search_voiser.png

 ”プレスリリース”によると概要は以下の通り。

本システムは、インターネット上の動画サイト、音声サイトといったマルチメディアコンテンツに含まれる音声を直接検索対象とし、コンテンツ中のキーワードの検索を実現したもので、辞書を用いる必要がなく、どのような単語も無制限にキーワードとして使えるという特長を持つ。

 この研究の注目点は何と言っても”辞書・文法・言語の制約のない音声検索が可能に”なる事が出来るように点である。それはどう言う事かと言うと以下の通り。

これを可能としたのが音声認識用に研究を進めてきた独自のユニバーサル符号化技術である。本システムでは音声を「音素片(SPS: Sub-Phonetic Segment)」と呼ぶ精細な単位に分解・符号化する。この符号化した音素片に対して独自の高速検索処理を行うことで、実用に耐える検索性能を達成した。これにより、新たな固有名詞や新語を含むインターネット上の大量のマルチメディアコンテンツを、メンテナンスなしにリアルタイムで検索対象にできる。本技術の実用化により、ユーザーが必要なマルチメディア情報を効率よく取り出すことが可能になり、これまで十分に利活用されてこなかった膨大なマルチメディアコンテンツに新たな価値を創出する可能性が拡がる。

 産総研の「PodCastle(ポッドキャッスル)」は”音声認識の際の誤認識や、認識用単語辞書に含まれない新語・未知語・固有名詞等”への対処方法としてのアプローチの一つであり、今回のこの研究はユニバーサル符号という音を符号化した上でマッチングを行う手法を採用しております。

 この研究が進む事でシステム面や利用者からの視点で得られるメリットは以下の通り。

# 辞書を必要とせず未登録語問題を解決 # 容易に多言語に対応可能 # 方言・非母国語話者に対応可能 # 大語彙の辞書が不要であるため、システムがコンパクト # 高齢者や障害者などの情報弱者でもアクセスしやすい # 一般的なブラウザーから利用可能

 ビジネスの面では今後以下の点などで活かされる事が期待されている。

本技術により、インターネットや家庭での応用以外にも、コールセンターでの通話録音システムにおける音声検索機能や、大量のマルチメディアコンテンツを保有し、販売・配信する放送、教育など広範囲の応用が期待される。

 今後こういう研究結果が活かされてあらゆる分野で活用されてくる事でしょう。

 あとは出来るだけ沢山の人に利用してもらう事が大事ですね。
 是非皆さんも使ってみましょう!

« 前の記事へ

次の記事へ »

トップページへ