【初心者向け】音声生成AI Stable Audio2.0とは

an artist s illustration of artificial intelligence ai this illustration depicts language models which generate text it was created by wes cockx as part of the visualising ai project l AI
Photo by Google DeepMind on Pexels.com

 暫くの間、音楽系AIは不勉強でしたが、4月4日にCNET Japan様の記事で、Stable Audio2.0の記事が紹介されました。

 以前からV1.0でリリースされていた旧バージョンに比して、テキスト以外の情報から曲やサウンドを生成する機能や、3分までの曲(44.1kHZ ステレオ音声)の生成が可能になったとのことです。

 早速、サイトにアクセスしてみました。

 そもそも、Stable Audioとは画像生成AIで有名なかのStability.AI社が提供しているサービスで、テキスト(プロンプト)で高品質な音楽が生成できるというサービスです。

 早速、無料利用をすべくIDを登録して使ってみたので、素人なりのファーストインプレッションをお届けしようと思います。

無料版は3分の長さの20曲まで生成可能(24年4月15日現在)

 のようです。生成するにはプロンプトを英語で入力していきます。わからなければ、iボタンでサンプルがあるので参考にしながら、作成したい曲のジャンルやムード、楽器や速さなどを入力していきます。最初は要領がわからないので、試しながらの感じになると思います。ただ、一応プロンプトライブラリなるものがあるので、ジャンルを選択するとサンプルのプロンプトを確認することができます。

なんとAudio to Audioが可能

 自分が無知なだけだと思いますが、なんとAudio to Audioが無料でも利用できる!

 これは大変な進化だと思います。

 ちょうどサイトに使い方やサンプルの記載がありますので、触ってみると面白いかと思います。アップロードするオーディオファイルの中身や、その利用の仕方によって生成する曲の内容や、反映させる楽器や反映の度合い、仕上げ方の指定により曲調が大きく変わってくるのがわかると思います。

 まずは無料版でもお試しをしてみると面白いと思いました。

 なお、この記事もStable Audioを紹介しているレベルマさんのブログを参考にさせていただきました。ありがとうございます!

コメント

アラ還素人ドラマーの音楽メモをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む

タイトルとURLをコピーしました