OCR NTTテクノクロス

SpeechRec:自由発話をテキスト化できる音声認識システム--日本語と英語に対応

音声認識システムの「SpeechRec」は、電話やマイク入力などに対応して、文章読み上げや会話などをテキスト化する。日本語と英語に対応する。

SpeechRecのポイント

  • 電話やマイク入力など、幅広い自由発話を認識可能
  • 速度重視、精度重視、性別特化などの音響モデルを用意
  • 地名や製品名などの固有名詞や専門用語を辞書に登録可能

SpeechRecの製品解説

 NTTテクノクロスの「SpeechRec」は、多様な環境で利用できる自由発話対応の音声認識システムだ。電話やマイク入力など、広い範囲の音声を認識可能で、文章読み上げや会話などをテキスト化する。

編集部おすすめの関連記事

 発声される可能性のある表現を実例(発話例文)として大量に収集し、そこに含まれる単語の並び方(文法規則)を確率的にモデル化した言語モデルを採用。これにより、人手による文法規則の決定や記述が不要になり、多様な表現にも柔軟に対応する。そのほか発話理解技術、対話制御技術なども駆使することで、従来の音声認識では難しかった自由発話についても、一語一句を高い精度で認識できるようになっている。

 音声認識に利用する音響モデルとしては、認識処理速度を重視したモデル、認識精度重視のモデル、男女性別に特化したモデルなど、具体的な利用シーンに対応できる音響モデルをそろえ、必要に応じて選択することが可能だ。また、地名や製品名などの固有名詞や専門用語を辞書に登録でき、適用先の実音声に合わせてエンジンのカスタマイズも可能になっており、こうしたチューニングによってさらに認識精度を向上させることができる。

 オンプレミスで利用でき、サーバ/クライアント方式による負荷分散が可能なサーバ版「SpeechRec Server」のほか、短期間、低コストで利用できるクラウド型の「SpeechRec Cloud」、ブラウザで利用できる「SpeechRec for Browser」がラインアップされており、いずれも日本語と英語に対応する。

SpeechRecのまとめ
用途と機能自由発話対応の音声認識システム
特徴電話やマイク入力など多様な音声入力に対応し、高精度の認識エンジンにより自由発話に対応。認識精度を向上させるチューニングも可能。サーバ版、クラウド版、ブラウザ版の3製品があり、それぞれ日本語と英語に対応する
税別価格初期登録料:15万円、月額利用料:10万円から(SpeechRec Clouod、SpeechRec for Browserの場合。オンプレミス版は問い合わせ)
導入企業NTTコミュニケーションズ、など

CNET_IDを登録して全ての記事を読む
(登録3分、無料)

CNET_IDはTechRepublic Japan/CNET Japan/ZDNet Japanでご利用いただける共通IDです。CNET_IDを登録することで、TechRepublic Japanの全ての記事を読むことができます。人気の記事にはこのようなものがあります。

あなたにおすすめの記事

関連記事

ホワイトペーパーランキング

  1. 調査結果で“はっきり”と差が出た!業績好調企業と不振企業の課題設定と取り組み
  2. マネージャーに知ってもらいたい。社員の貢献意欲を向上させる魔法のような7つのヒント
  3. AWSユーザーはいかにしてAIと機械学習の活用で新しいビジネスモデルを構築したのか
  4. バグ発見にかける時間、ムダですよね? IT現場の働き方改革を推進する5つのヒント
  5. 顧客の「快」を最大化し、「不快」を最小化する

編集部おすすめ

カテゴリ・テーマ特集ページ[PR]

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ
新興技術
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
オフィスソフト
OCR
学習

ベンダー座談会

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]