AI・機械学習

グーグル「Cloud Text-to-Speech」--アップデート版「WaveNet」で音声波形の生成を高速化

グーグルは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Googleは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Cloud Text-to-Speechは、コールセンターの音声応答システムに活用したり、リアルタイムで自然言語に変換したりといった多くの使い方ができると、Googleのブログ投稿に記されている。また、テレビや自動車、ロボットを含むモノのインターネット(IoT)機器でユーザーの質問に音声で応答することが可能になるほか、ニュース記事や本といったテキストベースのメディアをポッドキャストやオーディオブックなどの音声形式に変換することも可能だ。

 Cloud Text-to-Speechでは、12種類の言語や派生言語にわたる32種類の音声から選択できると、同ブログ投稿に記されている。また、名前や日付、時刻、住所といった複雑なテキストも正しく発音することができ、音声のピッチや発話速度、ボリュームゲインのカスタマイズも可能だという。さらに、MP3、WAVなど複数のオーディオフォーマットに対応する。

編集部おすすめの関連記事

残り本文:約739文字 ログインして続きを読んでください。

「AI・機械学習」で読まれている記事

TechRepublic Japanで人気の記事

編集部オススメ

トレンドまるわかり![PR]

財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
PC・モバイル
新興技術
IoT
ドローン
ロボット
VR・AR
AI・機械学習
ITインフラ
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ

ホワイトペーパーランキング

  1. AWSが提唱する、モダン分析プラットフォームのアーキテクチャと構築手法
  2. AWS資料、ジョブに特化した目的別データベースを選定するためのガイド
  3. Zero Trust Workbook--ゼロ トラストの先にある世界を知るためのガイダンス
  4. 「ゼロトラスト」時代のネットワークセキュリティの思わぬ落とし穴に注意せよ
  5. データ駆動型の組織でビジネスの俊敏性を実現するには?戦略的な意思決定とイノベーションを両立へ

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]