SpeechRecのポイント
- 電話やマイク入力など、幅広い自由発話を認識可能
- 速度重視、精度重視、性別特化などの音響モデルを用意
- 地名や製品名などの固有名詞や専門用語を辞書に登録可能
SpeechRecの製品解説
NTTテクノクロスの「SpeechRec」は、多様な環境で利用できる自由発話対応の音声認識システムだ。電話やマイク入力など、広い範囲の音声を認識可能で、文章読み上げや会話などをテキスト化する。
発声される可能性のある表現を実例(発話例文)として大量に収集し、そこに含まれる単語の並び方(文法規則)を確率的にモデル化した言語モデルを採用。これにより、人手による文法規則の決定や記述が不要になり、多様な表現にも柔軟に対応する。そのほか発話理解技術、対話制御技術なども駆使することで、従来の音声認識では難しかった自由発話についても、一語一句を高い精度で認識できるようになっている。
音声認識に利用する音響モデルとしては、認識処理速度を重視したモデル、認識精度重視のモデル、男女性別に特化したモデルなど、具体的な利用シーンに対応できる音響モデルをそろえ、必要に応じて選択することが可能だ。また、地名や製品名などの固有名詞や専門用語を辞書に登録でき、適用先の実音声に合わせてエンジンのカスタマイズも可能になっており、こうしたチューニングによってさらに認識精度を向上させることができる。
オンプレミスで利用でき、サーバ/クライアント方式による負荷分散が可能なサーバ版「SpeechRec Server」のほか、短期間、低コストで利用できるクラウド型の「SpeechRec Cloud」、ブラウザで利用できる「SpeechRec for Browser」がラインアップされており、いずれも日本語と英語に対応する。
用途と機能 | 自由発話対応の音声認識システム |
---|---|
特徴 | 電話やマイク入力など多様な音声入力に対応し、高精度の認識エンジンにより自由発話に対応。認識精度を向上させるチューニングも可能。サーバ版、クラウド版、ブラウザ版の3製品があり、それぞれ日本語と英語に対応する |
税別価格 | 初期登録料:15万円、月額利用料:10万円から(SpeechRec Clouod、SpeechRec for Browserの場合。オンプレミス版は問い合わせ) |
導入企業 | NTTコミュニケーションズ、など |