2024.04.10
こんにちは。
アントアントのメルマガ担当です。
いつもメールマガジン「ここだけは知っておきたい編」をご覧いただき、誠にありがとうございます。
今回は、前回ご紹介した人気の生成AIサービス以外の『画像・音声・動画生成』に特化したサービスと生成AIサービスを選ぶポイント、生成AIを利用する際に知ってきたいリスクについてご紹介します!
まずは前回ご紹介した生成AIについての振り返りと、その基本的な定義について触れてみたいと思います。
生成AIは、与えられたデータやパターンを利用して新たなオリジナルデータを生成するAIのことを指します。
この技術には、ディープラーニング(深層学習)と呼ばれる機械学習技術が密接に関連しており、膨大なデータからパターンを学習し、情報を分析することで新しいデータを生み出します。
前回のメルマガでは、ここ最近よく聞く『ChatGPT(チャットジーピーティー)』 『Copilot(コパイロット)』 『Gemini(ジェミニ)』の各サービスの特徴や2024年3月時点でなにができるかについてをご紹介しました。
これらの人気サービスは主に文章の生成を得意とする生成AIでしたが、今回は画像や音声、動画の生成AIサービスについてご紹介します。
なお、こちらは2024年4月時点での内容となりますので各サービスの詳細については、サービス元にお問い合わせください。
前回の記事はこちら『生成AIってなに? 従来のAIとの違いと人気サービスの比較』
テキストでどんな画像を生成してほしいのか、要望を入力することで、その内容に応じてオリジナルの画像を生成するシステムです。
写真のような画像やアニメ、3Dなど様々な画像をわずかな時間で生成することができます。
DALL-E3 (ダリスリー) |
Stable Diffusion (ステーブルディフュージョン) |
Midjourney (ミッドジャーニー) |
|
---|---|---|---|
価格 |
・ChatGPT(GPT-4):有料 |
・ローカル環境で利用:無料 |
・ベーシック:$10(約1,520円)/ 月 ※無料版も過去はあったが現在は停止中 |
特徴 |
ChatGPT上で利用できるため、 |
ローカル環境で利用した場合は無料で使用でき、 カスタマイズなども行うことが出来る (しかし、高スペックなPCが必要となる場合がある) |
様々なニーズにあわせたプランがあり、 |
商用利用 |
△ ※コンテンツポリシーと |
△ ※下記の場合は商用利用禁止 ・商用利用不可のモデルをLoraで学習させた場合 |
△ ※有料プランに加入する必要がある ※年間100万米ドル以上の収入がある企業は「プロ」または「メガ」の有料プランへの加入が必須 |
テキスト情報から音声データを生成(変換)するシステムです。
特定の音声データを音声生成AIに学習させることで、その人の声で音声データを生成し、出力することもできます。
VALL-E |
Speechify (スピーチファイ) |
|
---|---|---|
価格 |
無料 |
無料 |
特徴 |
わずか3秒間の音声からその人の声を再現することができる 多言語対応(英語・日本語・中国語) |
テキストをオーディオブックに変換することができる 多言語対応(英語、イタリア語、ポルトガル語、スペイン語など) |
商用利用 |
〇 |
〇 |
テキストや画像データを元に、動画にしたい内容を入力することで自動的に動画コンテンツを生成するシステムです。
専門的な動画編集スキルがなくても高品質な動画を生成することができます。
Runway gen2 |
Sora (ソラ) |
|
---|---|---|
価格 |
・フリー:無料 |
未定 |
特徴 |
「テキスト」、「画像とテキスト」、「画像だけ」から |
テキストから最大60秒の動画を生成することができ、 |
商用利用 |
〇 |
不明 |
1.生成したいコンテンツと各サービスの特性を比較
生成したいコンテンツはなにか、各サービスで対応ができるかなどのサービスの特性を見極める必要があります。
2.導入する目的を明確にする
導入した場合の最終の目的を明確にする必要があります。
例えば、生産性の向上、データ分析、コスト削減、アイディア提案、業務改善など何を目的としているのかを考えてみましょう。
3.導入できるかどうか、リスクを知っておこう
サービスを導入したからといって使いこなせるかどうかは別問題です。
そのため、導入目的を明確にした上で、どのサービスであれば導入・運用できるかを検討する必要があります。
また、生成AIサービスは様々なリスクが潜んでいます。リスクを把握しておくことで、事前に防ぐことができることもあるので理解した上でサービスを利用しましょう。
生成AIを利用する際の主なリスクとしては以下があげられます。
生成AIサービスを利用する際は、これらのリスクをしっかり知ったうえで活用することをおすすめします。
生成AIを利用する際に気をつけたいのがこの『情報漏洩』です。
生成AIサービスを使った情報入力を行う際、入力された情報がAIの学習機能によって情報が保管され、第三者である他のユーザーに提供される可能性があります。
例え、回答を第三者の回答に使用しないサービスを利用したとしても、生成AIのサービス上には情報が残ってしまうため、機密情報や個人情報などは入力しないようにしなければなりません。
基本的に、AIが生成した画像などのAI生成物には著作権は発生しないとされています。
しかし、生成AIが画像などの生成物を生成する過程や学習機能を使ったデータの蓄積の際に、著作権があるものの関与が認められる場合は著作権侵害の可能性があるため、どのようなデータを用いてどのような過程で生成されたのかが重要となります。そのため、著作権・商標権の侵害にならないよう注意して、コンテンツを生成する必要があります。
生成AIは、完璧ではありません。
というのも、生成AIが学習した上で提供した情報ならまだしも、生成AI自体に情報がない場合やプロンプトを理解していない場合の回答は正確ではない場合があります。
そのため、情報を鵜呑みにするのではなく生成された情報の真偽を確かめるためのチェックを行う必要があります。
勿論、チェックは生成AIにさせるのではなく人間が行わなくてはいけません。
対話型の生成AIサービスでは、「プロンプト」と呼ばれる生成AIに対する質問や指示文を入力する必要があります。この「プロンプト」によって、生成AIは検索や文章の生成などを行います。
「プロンプト」を入力するフォーム利用して、特殊な指示を入力することで悪意のあるコードやコマンドを実行させたり、本来公開すべきでない情報やデータを引き出す攻撃のことを『プロンプトインジェクション』と言います。
こういった攻撃は、完全に防ぐことはできないため、プロンプトの内容(エラー返答など)を工夫したり、そもそも不要な情報を生成AIに学習させないことが重要となります。
ディープフェイクとは、「ディープラーニング(深層学習)」と「フェイク(偽物)」を組み合わせた造語で、生成AIを使用して生成された偽の画像や動画、音声といったコンテンツ、またはそのコンテンツを作るための技術のことを指します。
生成AIによって簡単に画像や動画、音声が作れるようになったため、本物か偽物かわからないコンテンツが生成され、詐欺やフェイクニュースなどの拡散に利用され、大きな問題となっています。
今回は前回ご紹介した人気の生成AIサービス以外の『画像・音声・動画生成』に特化したサービスと生成AIサービスを選ぶポイント、生成AIを利用する際に知ってきたいリスクについてご紹介しました。
生成AIサービスは、これからも技術が向上し、様々なことができるようになります。
その中で、生成AIを効率的に安全に活用するためには、様々なリスクがある中でどういった対策をとらなければならないのかなど新しい情報をキャッチしていくことが大事だといえるでしょう。
生成AIサービスの導入をお考えの方は是非、前回の『生成AIってなに? 従来のAIとの違いと人気サービスの比較』と併せて本記事を参考にしていただければと思います。