音楽と生成AI

 ChatGPTをきっかけに一気にAIが本格的な実用機を迎えました。AI(人工知能)は、実は1950年代に初めて出現しており、これまで60年以上の歴史を持ちます。

 第1次ブームでは推論技術が注目され、初の自然言語処理プログラム「イライザ」も登場。ただしこの時のAIは、実用的なものではなく一過性のブームで終了、その後冬の時代を経て、第2次ブームでさらなる進展がありました。現在は第3次ブームで機械学習やディープラーニングが主流となっています。

機械学習とディープラーニング

 ここで、機械学習とディープラーニングなのですが、どういった違いがあるのでしょうか?両者ともに人工知能の分野で使われる手法ですが、以下のような違いがあると言われてます。

  1. 機械学習:
    • 定義: 機械学習は、広義には機械(コンピューターやAIなどのマシン)に学習させることを指します。
    • 学習方法:
      • 教師あり学習: マシンに正解を示しながら多くのデータを与えて、訓練を通じてマシンが正解を示すことができるようにする方法です。例えば、画像の「猫」か「ねずみ」かを判別させる場合、「猫」と「ねずみ」のラベルを付けた画像を与えて特徴を学習させます。
      • 教師なし学習: ラベルの付いていないデータを与えて、データの特徴や全体の傾向を学習させます。マシンはデータを特徴によってグループ分けし、新しいデータを判別できるようになります。
      • 強化学習: マシンが出した結果に対して報酬や罰を与えることで、最良の方法を学習させる手法です。
  2. ディープラーニング:
    • 定義: ディープラーニングは機械学習を発展させた手法であり、人間の神経細胞を模したニューラルネットワークを使います。
    • 特徴:
      • ディープラーニングは、人間の認識過程に近い過程を踏んで正解を導き出せるようになります。例えば、「猫」の画像を認識する際、マシンは画像の特徴を見つけて過去のデータと突き合わせて回答を出します。人間の場合は全体を見てから細部を確認したり、その逆の作業をしたりすることで、より高度なパターン認識が可能です。
      • ディープラーニングは、自動運転の標識認識や医療研究のがん細胞検出、音声データの自動翻訳など、人間が指示しないことを読み取って判断するために使われます。

簡潔に言えば、機械学習はデータのパターンを学習させる手法であり、ディープラーニングはその一種で、より高度なパターン認識を行います。

生成AIとは

 昨今の生成AI(Generative AI)は、ディープラーニングの進化した形態の一つと言われています。以下に詳しく説明します。

  1. ディープラーニング:
    • ディープラーニングは、多層のニューラルネットワークを用いて、複雑なパターン認識や予測を行う技術です。画像認識、音声処理、自然言語処理などの分野で大きな成功を収めています。
    • ディープラーニングは、大量のデータと計算リソースを必要としますが、その高い表現力と汎用性から、さまざまなタスクに適用されています。
  2. 生成AI:
    • 生成AIは、ディープラーニングの一部であり、新しいデータを生成する能力を持ちます。これは、訓練データには含まれていないデータを生成することができる点で特徴的です。
    • 生成AIは、GAN(Generative Adversarial Networks)、VAE(Variational Autoencoders)、RNN(Recurrent Neural Networks)などのアーキテクチャを使用しています。
    • 例えば、GANは偽の画像を生成するために2つのネットワーク(生成器と識別器)を競わせる仕組みを利用しています。
  3. 応用分野:
    • 生成AIは、画像生成、文章生成、音楽生成、映画の脚本作成、ゲームのキャラクター生成など、多岐にわたる分野で活用されています。
    • 生成AIは、ディープラーニングの進歩によって実現されたものであり、その延長線上に位置しています。

総括すると、生成AIはディープラーニングの一部であり、新しいデータを創造する能力を持つ技術として、AIの進化において重要な位置を占めています。

生成AIを使ってみる

 これまで様々な楽器を通して音楽に親しんできました。

 その中で、これほどまだ生成AIが盛んになる数年前に、Magantaなるディープラーニングを利用したAIを使った作曲に挑戦を試みました。しかしながら、M1 Macintoshで上手く動かすことができず、挑戦そのものを断念、ここに至りました。

 昨今の生成AIを業務で利用することも増えたことから、テキスト系の生成AIに挑戦、少しづつですが自分の環境で動かせるようになってきたので、Magentaのリベンジも兼ねて音楽系の生成AIにチャレンジしてみることにしました。

 以前、数曲自力で作曲をしたことがあるのですが、これらの技術を使って無い才能をどこまで補ってくれるものなのかを、素人が確かめてみたいと思います。

 内容的に誤りがあったりすることも多々あると思うのですが、その辺は寛大な気持ちで見ていただけるとありがたいです。

タイトルとURLをコピーしました