AI・機械学習

グーグル「Cloud Text-to-Speech」--アップデート版「WaveNet」で音声波形の生成を高速化

グーグルは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Googleは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Cloud Text-to-Speechは、コールセンターの音声応答システムに活用したり、リアルタイムで自然言語に変換したりといった多くの使い方ができると、Googleのブログ投稿に記されている。また、テレビや自動車、ロボットを含むモノのインターネット(IoT)機器でユーザーの質問に音声で応答することが可能になるほか、ニュース記事や本といったテキストベースのメディアをポッドキャストやオーディオブックなどの音声形式に変換することも可能だ。

 Cloud Text-to-Speechでは、12種類の言語や派生言語にわたる32種類の音声から選択できると、同ブログ投稿に記されている。また、名前や日付、時刻、住所といった複雑なテキストも正しく発音することができ、音声のピッチや発話速度、ボリュームゲインのカスタマイズも可能だという。さらに、MP3、WAVなど複数のオーディオフォーマットに対応する。

編集部おすすめの関連記事

残り本文:約739文字 ログインして続きを読んでください。

あなたにおすすめの記事

関連記事

ホワイトペーパーランキング

  1. 医療業界が直面する4つの課題と、医療機関の業務効率を高めるためのITプラットフォーム
  2. 製造業をモダナイズ! アジャイルでデータ中心型のインフラストラクチャーを実現する要件とは
  3. どうなる製造業! 変革期に求められるサブスクリプション対応
  4. アナリティクスのPDCAサイクルを自動化!マツモトキヨシのマーケティング戦略を支える分析基盤
  5. 【調査】軽減税率への対応、御社の会計処理はいかがですか--「対処済は2割ほど」が現実!?

編集部おすすめ

トレンドまるわかり![PR]

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ
新興技術
IoT
ドローン
ロボット
VR・AR
AI・機械学習
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
学習

ベンダー座談会

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]