OCR NTTテクノクロス

SpeechRec:自由発話をテキスト化できる音声認識システム--日本語と英語に対応

音声認識システムの「SpeechRec」は、電話やマイク入力などに対応して、文章読み上げや会話などをテキスト化する。日本語と英語に対応する。

SpeechRecのポイント

  • 電話やマイク入力など、幅広い自由発話を認識可能
  • 速度重視、精度重視、性別特化などの音響モデルを用意
  • 地名や製品名などの固有名詞や専門用語を辞書に登録可能

SpeechRecの製品解説

 NTTテクノクロスの「SpeechRec」は、多様な環境で利用できる自由発話対応の音声認識システムだ。電話やマイク入力など、広い範囲の音声を認識可能で、文章読み上げや会話などをテキスト化する。

編集部おすすめの関連記事

 発声される可能性のある表現を実例(発話例文)として大量に収集し、そこに含まれる単語の並び方(文法規則)を確率的にモデル化した言語モデルを採用。これにより、人手による文法規則の決定や記述が不要になり、多様な表現にも柔軟に対応する。そのほか発話理解技術、対話制御技術なども駆使することで、従来の音声認識では難しかった自由発話についても、一語一句を高い精度で認識できるようになっている。

 音声認識に利用する音響モデルとしては、認識処理速度を重視したモデル、認識精度重視のモデル、男女性別に特化したモデルなど、具体的な利用シーンに対応できる音響モデルをそろえ、必要に応じて選択することが可能だ。また、地名や製品名などの固有名詞や専門用語を辞書に登録でき、適用先の実音声に合わせてエンジンのカスタマイズも可能になっており、こうしたチューニングによってさらに認識精度を向上させることができる。

 オンプレミスで利用でき、サーバ/クライアント方式による負荷分散が可能なサーバ版「SpeechRec Server」のほか、短期間、低コストで利用できるクラウド型の「SpeechRec Cloud」、ブラウザで利用できる「SpeechRec for Browser」がラインアップされており、いずれも日本語と英語に対応する。

SpeechRecのまとめ
用途と機能自由発話対応の音声認識システム
特徴電話やマイク入力など多様な音声入力に対応し、高精度の認識エンジンにより自由発話に対応。認識精度を向上させるチューニングも可能。サーバ版、クラウド版、ブラウザ版の3製品があり、それぞれ日本語と英語に対応する
税別価格初期登録料:15万円、月額利用料:10万円から(SpeechRec Clouod、SpeechRec for Browserの場合。オンプレミス版は問い合わせ)
導入企業NTTコミュニケーションズ、など

関連記事

ホワイトペーパーランキング

  1. SQL Server 2017 AI Appliance で実現するビジネスの破壊的変革
  2. 【楽天・富士通 座談会抄録】ビジネスはデータドリブンの時代--DBの性能に限界を感じていませんか?
  3. 「情報通信白書」でわかった、テレワークの効果と課題
  4. 今後増加しそうな「名ばかり機械学習 セキュリティ」を見極める3条件--どれが欠けてもダメ
  5. 爆発的な量のデータを活かすには、AIのチカラが不可欠

編集部おすすめ

ピックアップ製品

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ
新興技術
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
オフィスソフト
OCR
学習

ベンダー座談会

Follow TechRepublic Japan