クリエイターの教科書

ChatGPT, Stable Diffusion, Visual Studio, Excelなど教科書

【ハギングフェイス】Barkとは?試すには?商用利用できる?

Barkは、AIを使った音声合成ですが、笑い声などにも対応している点が面白いです。

Barkとは?

Barkは、AI音声合成で、Suno(www.suno.ai)によって作成されたユニバーサルテキスト-オーディオモデルとなります。

 

非常にリアルな多言語音声のほか、音楽、バックグラウンドノイズ、簡単な効果音などの音声を生成することができます。

 

ハギングフェイスにデモサイトが公開されています。

 

 

Barkを試すには?

ソースが公開されています。

suno-ai/bark: 🔊 Text-Prompted Generative Audio Model (github.com)

 

またハギングフェイスでデモを試すことができます。

Bark - a Hugging Face Space by suno

 

デモ

テキストを入れて、「RUN」で実行すると音声ファイルが生成されます。

 

テキストは、しゃべるための原稿に加え、[laugh]のように記述すれば笑い声を発してくれます。

 [sighs]:ためいき

[gasps]:息を弾ませる

 

日本語

日本語も可能。

下からスピーカーを「ja=日本語」にします。

 

 

音楽

「♪the lion barks tonight ♪」のように音符をつけると、音符に囲まれた言語のイメージで音楽?を生成します。

 

 

商用利用できる?

ハギングフェイスのページではBarkはあくまで研究用のみとされていて、商業利用はNGと記されています。

 

しかしギットハブのページによれば2023/5/1よりMITライセンスへ移行。商用利用も可能となったようです。

「Bark is now licensed under the MIT License, meaning it's now available for commercial use!」

suno-ai/bark: 🔊 Text-Prompted Generative Audio Model (github.com)

 

このブログは、ネットや書籍上の情報、個人の体験や感想を中心にまとめたものです。 正確性を期していはいますが、間違い・誤訳等あるかもしれません。 当サイトの情報によって生じたいかなる損失について一切の責任を負わないものとします. あらかじめご了承ください。

プライバシーポリシー |〇利用規約 |〇問い合わせ