OCR NTTテクノクロス

SpeechRec:自由発話をテキスト化できる音声認識システム--日本語と英語に対応

音声認識システムの「SpeechRec」は、電話やマイク入力などに対応して、文章読み上げや会話などをテキスト化する。日本語と英語に対応する。

SpeechRecのポイント

  • 電話やマイク入力など、幅広い自由発話を認識可能
  • 速度重視、精度重視、性別特化などの音響モデルを用意
  • 地名や製品名などの固有名詞や専門用語を辞書に登録可能

SpeechRecの製品解説

 NTTテクノクロスの「SpeechRec」は、多様な環境で利用できる自由発話対応の音声認識システムだ。電話やマイク入力など、広い範囲の音声を認識可能で、文章読み上げや会話などをテキスト化する。

編集部おすすめの関連記事

 発声される可能性のある表現を実例(発話例文)として大量に収集し、そこに含まれる単語の並び方(文法規則)を確率的にモデル化した言語モデルを採用。これにより、人手による文法規則の決定や記述が不要になり、多様な表現にも柔軟に対応する。そのほか発話理解技術、対話制御技術なども駆使することで、従来の音声認識では難しかった自由発話についても、一語一句を高い精度で認識できるようになっている。

 音声認識に利用する音響モデルとしては、認識処理速度を重視したモデル、認識精度重視のモデル、男女性別に特化したモデルなど、具体的な利用シーンに対応できる音響モデルをそろえ、必要に応じて選択することが可能だ。また、地名や製品名などの固有名詞や専門用語を辞書に登録でき、適用先の実音声に合わせてエンジンのカスタマイズも可能になっており、こうしたチューニングによってさらに認識精度を向上させることができる。

 オンプレミスで利用でき、サーバ/クライアント方式による負荷分散が可能なサーバ版「SpeechRec Server」のほか、短期間、低コストで利用できるクラウド型の「SpeechRec Cloud」、ブラウザで利用できる「SpeechRec for Browser」がラインアップされており、いずれも日本語と英語に対応する。

SpeechRecのまとめ
用途と機能自由発話対応の音声認識システム
特徴電話やマイク入力など多様な音声入力に対応し、高精度の認識エンジンにより自由発話に対応。認識精度を向上させるチューニングも可能。サーバ版、クラウド版、ブラウザ版の3製品があり、それぞれ日本語と英語に対応する
税別価格初期登録料:15万円、月額利用料:10万円から(SpeechRec Clouod、SpeechRec for Browserの場合。オンプレミス版は問い合わせ)
導入企業NTTコミュニケーションズ、など

「OCR」で読まれている記事

TechRepublic Japanで人気の記事

編集部オススメ

トレンドまるわかり![PR]

財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
PC・モバイル
PC
スマートフォン
タブレット
ウェアラブル
オフィスソフト
OCR
RPA
PCソフト
周辺機器
新興技術
ITインフラ
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ

ホワイトペーパーランキング

  1. AWS、Microsoft、Googleがリード!パブリッククラウドコンテナプラットフォーム市場分析
  2. ウィズコロナ時代はあと2年は続く?!アフターデジタル時代の4つの重要ポイント
  3. 2021年のサイバー脅威予測が明らかに─将来の攻撃に企業はいかに備えるべきか
  4. “テレワークだからこそ”デスクトップPCを利用すべき?!ノートPCにはない魅力の数々に迫る
  5. 7つの視点で解説するデータベース構築・運用ー誰でもわかるSQL Serverストレージガイド

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]