生成AI/変換AI一覧

 

  1. テキスト生成AIシステム – text to text
  2.  

  3. 音声生成AIシステム ー text to speech
    1. Google Cloud: Text-to-Speech AI
      https://cloud.google.com/text-to-speech?hl=ja

    2. コエステーション
      https://coestation.jp/

    3. VOICEVOX
      https://voicevox.hiroshiba.jp/
      OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築された日本語音声合成用ソフトウェア

  4. 音声・テキスト変換AIシステム
    1. facebook SeamlessM4T
      SeamlessM4Tは、スピーチ(speech)およびテキストを多言語間で相互に変換するサービスである。下記の変換サービスをWEBページで対話的に実行することができる。

      1. Speech-to-Speech (S2ST)
      2. Speech-to-Text(S2TT)
      3. Text-to-Speech (T2ST)
      4. Text-to-Text(T2ST)

  5. 画像生成AIシステム – text to image
  6. 動画変換生成AIシステム – video to video
    1. シームレスな多言語への音声翻訳を実現するMetaのSeamlessM4T v2のデモ。英語、スペイン語、フランス語、ドイツ語間での音声翻訳が可能である。

       

      SeamlessM4Tは、https://github.com/facebookresearch/seamless_communicationによれば、下記のようなサービスである。

      SeamlessM4T is our foundational all-in-one Massively Multilingual and Multimodal Machine Translation model delivering high-quality translation for speech and text in nearly 100 languages.

      同サービスは、下記の5つの機能を組み合わせることで実現されている。

      Speech-to-speech translation (S2ST)
      Speech-to-text translation (S2TT)
      Text-to-speech translation (T2ST)
      Text-to-text translation (T2TT)
      Automatic speech recognition (ASR)
     

  7. 音声認識テキスト生成AIシステム ー speech to text (video to text)
  8. 自分の「声」による合成音声生成AI
    1. コエステーション[個人向けサービス:「合成音声を手軽に楽しめる」スマホアプリ]
      https://coestation.jp/consumer/coestationapp/

      スマートフォンアプリを使って指定の文章をいくつか読み上げることで、自分の声の分身である「コエ」を生成し、テキストを入力するだけでその「コエ」でしゃべらせることができるサービス
     

    クラウドで機械学習アプリケーションを構築、デプロイ、実行するためのサービスと無料利用枠ご紹介
    AWS は、幅広い機械学習サービスとサポートクラウドインフラストラクチャを提供し、すべてのデベロッパー、データサイエンティスト、およびエキスパートに機械学習を提供している。AWS は、Gartner クラウド人工知能デベロッパーサービスのマジッククアドラントリーダーに選ばれ、何万人もの顧客が機械学習の導入を加速するよう支援している。

    1. テキストから音声へ
    2. 音声からテキストへ
    3. 機械学習 — 機械学習モデルを迅速に構築、トレーニング、デプロイします。
    4. 機械翻訳

  9. 生成AIシステム・チェッカー
  10.