Barkは、AIを使った音声合成ですが、笑い声などにも対応している点が面白いです。
Barkとは?
Barkは、AI音声合成で、Suno(www.suno.ai)によって作成されたユニバーサルテキスト-オーディオモデルとなります。
非常にリアルな多言語音声のほか、音楽、バックグラウンドノイズ、簡単な効果音などの音声を生成することができます。
ハギングフェイスにデモサイトが公開されています。
Barkを試すには?
ソースが公開されています。
suno-ai/bark: 🔊 Text-Prompted Generative Audio Model (github.com)
またハギングフェイスでデモを試すことができます。
Bark - a Hugging Face Space by suno
デモ
テキストを入れて、「RUN」で実行すると音声ファイルが生成されます。
テキストは、しゃべるための原稿に加え、[laugh]のように記述すれば笑い声を発してくれます。
[sighs]:ためいき
[gasps]:息を弾ませる
日本語
日本語も可能。
下からスピーカーを「ja=日本語」にします。
音楽
「♪the lion barks tonight ♪」のように音符をつけると、音符に囲まれた言語のイメージで音楽?を生成します。
商用利用できる?
ハギングフェイスのページではBarkはあくまで研究用のみとされていて、商業利用はNGと記されています。
しかしギットハブのページによれば2023/5/1よりMITライセンスへ移行。商用利用も可能となったようです。
「Bark is now licensed under the MIT License, meaning it's now available for commercial use!」
suno-ai/bark: 🔊 Text-Prompted Generative Audio Model (github.com)