AI・機械学習

グーグル「Cloud Text-to-Speech」--アップデート版「WaveNet」で音声波形の生成を高速化

グーグルは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Googleは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Cloud Text-to-Speechは、コールセンターの音声応答システムに活用したり、リアルタイムで自然言語に変換したりといった多くの使い方ができると、Googleのブログ投稿に記されている。また、テレビや自動車、ロボットを含むモノのインターネット(IoT)機器でユーザーの質問に音声で応答することが可能になるほか、ニュース記事や本といったテキストベースのメディアをポッドキャストやオーディオブックなどの音声形式に変換することも可能だ。

 Cloud Text-to-Speechでは、12種類の言語や派生言語にわたる32種類の音声から選択できると、同ブログ投稿に記されている。また、名前や日付、時刻、住所といった複雑なテキストも正しく発音することができ、音声のピッチや発話速度、ボリュームゲインのカスタマイズも可能だという。さらに、MP3、WAVなど複数のオーディオフォーマットに対応する。

編集部おすすめの関連記事

残り本文:約739文字 ログインして続きを読んでください。

「AI・機械学習」で読まれている記事

TechRepublic Japanで人気の記事

編集部オススメ

トレンドまるわかり![PR]

財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
PC・モバイル
新興技術
IoT
ドローン
ロボット
VR・AR
AI・機械学習
ITインフラ
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ

ホワイトペーパーランキング

  1. AWS、Microsoft、Googleがリード!パブリッククラウドコンテナプラットフォーム市場分析
  2. ウィズコロナ時代はあと2年は続く?!アフターデジタル時代の4つの重要ポイント
  3. 2021年のサイバー脅威予測が明らかに─将来の攻撃に企業はいかに備えるべきか
  4. “テレワークだからこそ”デスクトップPCを利用すべき?!ノートPCにはない魅力の数々に迫る
  5. 7つの視点で解説するデータベース構築・運用ー誰でもわかるSQL Serverストレージガイド

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]