試しにIDを登録して少しづつ使ってみましたので、少しだけ感想も含めメモを(バージョンは、2024年4月17日のものです)
無料版は20クレジット
先のレポートにも記載したとおり、バージョン2は消費するクレジットがバージョン1の2倍になっているらしく、3分1曲まで2クレジットを消費、マックスは20クレジット/月です。無料で利用できるのですから、これは大変素晴らしいことだと思いますが、まだ初心者の域を出ない駆け出しにとっては、試行錯誤で結構をクレジット使っちゃいますので、まともな曲を作ろうとするとそれなりに時間がかかりそうです(真面目に金を払えという話ですよね)。
一応、AIで対応できるデータとその方法は
- テキストからオーディオ
- オーディオツーオーディオ
- プロンプトによる生成
になっています。この中から色々試していきながら生成していくことになります。
この中でテキストは他の生成系AIと同じように、プロンプトを入力していくことになるわけですが、このサイトにその方法が記載してあります。
- 気分を指定(音楽表現や、感じ鵜的な用語も可。日本語もエラーにはならないですが、これが適用されているかまでは、まだ実感として理解できてません)
- 楽器を選ぶ(例えば鳴きのギターとか、派手なドラムとか。生成して欲しい楽器を選ぶという感じですね)
- BPMを設定(速度、ですね)
- その他、詳細を記述(説明やジャンルなんかも)
サンプルもページにあります。これを聴きながらプロンプトを考える、みたいな感じで使うことになります。
気になるオーディオツーオーディオ
テキストだけでなく、オーディオデータをアップロードすることにより、テキストプロンプトと組み合わせて出力曲を自分のイメージと合わせていくことが可能です。
この際に、テキストとオーディオのmixtuerレートを変えることも可能です。
なお、StabelAudioの学習ですが、これはパートナーシップを有している、AudioSparxが提供する音楽のみで訓練されているそうです。この辺りも商用利用を見据えてよく考えられているな、という印象でした。なにせ、生成AI系は著作権などの課題をクリアすることが必須の状態なので。
さて、Stabel Audioですが、自分で本格的に使うとなったら、おそらく手始めはインスピレーションを得る使い方になるのではないかなと思いました。サンプルを聞いてみただけの話ではありますが、当然自分の中にないインスピレーションを得ることは十分可能そうですが、生成結果を元にオリジナルに整形していく、という作業のイメージがまだ湧きません。
この辺りは、無料利用から一歩足を踏み出さないと見えてこないのかもしれません。
Stable Audioをうまく使われている方がいらっしゃったらぜひ教えてください!
コメント