ARTSTUDIOWhitePallet

2026年 クリエイター向け生成AIまとめ(動画・画像・LLMの実践印象)

2026.03.26 AIによるアート
2026年 クリエイター向け生成AIまとめ(動画・画像・LLMの実践印象)

最近、生成AIの種類が一気に増えてきて、正直どれを触ればいいのか分かりにくくなってきました。

動画、画像、コード、文章…それぞれ強いツールも違います。
仕事や制作の様々な場面で色々なAIを試してみた印象をまとめておこうと思います。 クリエイター視点でのメモ的なまとめです。


① LLM: 大規模言語モデル

LLM: 大規模言語モデル

おそらく多くの方が「AI」と聞くとこれを連想されると思います。
LLMは人間で言う「脳」の部分。最近ではLAM「手」との組み合わせで新たな進化を見せています。 従来のチャットベースが広く知られていますが、最近では作業を一貫して行えるエージェント型が注目されています。 最近は単なるチャットAIというより、作業そのものを補助する方向に進んでいる印象があります。 特にコード生成や構成設計など、制作の前段階での使い勝手がかなり変わってきました。

- ChatGPT(GPT-5系 / 2026年時点)

説明の必要はないと思います。
現在のAIブームの火付け役となったOpenAIのLLM。 文脈理解力や言語表現力に優れている印象です。

- Claude

最近大注目のAnthropicのLLM。 以前からGPTより賢いと評判でしたが、日本ではあまり知られていませんでした。
LAMとの組み合わせで飛躍的に知名度、重要度があがりました。文脈の一貫性、推論力はトップクラス

- Gemini 3

GoogleのLLM。以前のBardより性能は向上したが、GPTやClaudeと比較すると記憶力や文脈理解力が弱く、会話の一貫性にばらつきがある印象です。
最大の強みは膨大なデータベース参照と、外部アクセス可能な点。

- Grok 4.20

xAIのLLM。他のLLMと違い、人格設定や個性的な発言が特徴。 学習データがSNSベースであるため創造性が強い反面、事実確認が必要なケースも見られる印象です。


② ターミナルAIエージェント

ターミナルAIエージェント

LLMがローカル上で動くAIエージェントの技術は、昨今最も話題となっています。
主にエンジニア向けでプログラムコード(システム開発やアプリ開発)がメインでしたが、最近ではデスクトップの操作をAIが行うことによりクリエイティブな制作フローを自動化することも可能になり大きな広がりを見せています。
GUI(マウスなどを動かす)タイプだけでなく、CLI(コマンドで動く)タイプも増えてきて、従来の「チャットに聞く」使い方とは少し変わってきています。ローカル環境と組み合わせる前提のものもあり、制作環境としては面白い流れです。

ただ、ローカルで直接動くLLMを入れるということは、それなりにリスクがあるため、APIやセキュリティなどの仕組みを理解した上で導入することをお勧めします。

- OpenClaw

GUI型のオープンソースモデル。

ローカルからAPI経由でGPT、Claude、Geminiといった高性能なLLMに実行させるツール。近年のAI業界で注目を集めている分野の一つです。

- ClaudeCode

Anthropicが開発したターミナル専用エージェントモデル。
Open Clawで最も利用されているLLMであるClaudeをエージェントとしていて、セキュリティ面のリスク管理も徹底されているため人気を集めています。

- Codex

OpenAIが開発したCLI。旧Codexの流れを汲むCLIエージェント。 LAM系の独立したアプリとしてリリースされていますが、ローカル環境でシステム開発、アプリ開発、環境構築などの面で注目されています。


③ 画像生成系

画像生成モデル

画像生成モデルは動画の参照画像を生成する役割として根強く人気があります。

- Midjourney v7

画像生成AIの中でも非常に人気の高いモデル 。
特にアート系のクオリティの高い画像を生成することに定評があり、多くのクリエイターにMVやPVなどの元フレームとして使われている。

- Nano Banana Pro

Geminiとの組み合わせでエージェント補助つきの画像生成モデル。
編集や資料作成には向いているが、文脈理解力は乏しく機械的な規制で生成拒否されることが多い印象。

- FLUX.2

写実性、リアルな再現性が特徴のモデル。
実写映像や細部の補完などに本領を発揮します。

- Stable Diffusion AUTOMATIC1111 (WebUI)

画像生成AIを世界的に広めたローカルモデル。
生成画像の印象を変化させるモデルや再現性を強くするLoRAなど拡張性が高いのが最大の魅力。

- Qwen-Image

Alibabaが開発した次世代画像生成モデル。
マルチアングル生成やレイヤー分離など、編集を前提とした構造的な画像生成が可能で、従来の1枚生成型とは異なるアプローチとして注目を集めています。


④ 動画生成系

動画生成モデル

動画生成はまだ発展途中ですが、 短いカットや素材作成用途としてはかなり実用的になってきました。
特に構図のアイデア出しや背景素材の生成には使いやすい印象です。

- Kling 3.0

おそらく動画生成AIの中では比較的安定して、クオリティが高く機能も充実しています。現状として映像作品を制作するならKlingがおすすめです。

- Hailuo 2.3

中国のMinMaxが開発した動画生成モデル。ダンスやアクションに特化していて、SNSショート、アクション系クリエイター向けのモデルという

- Vidu Q3

中国系の動画生成モデル。複数リファレンスでキャラクターを固定することが可能で、長尺動画にとっては重要なキャラクターの一貫性やカメラワークに強く、主にアニメ制作のクリエイターに人気のモデルです。

- Grok Imagine

XAIの生成モデル。立体推論の自然さが特に優秀です。2026年のアップデートで複数リファレンス対応が強化され、再び注目されています。 出力サイズは控えめですが、無料でもかなり使えるので初めて触る方はGrokから触るのが良いかと思います。
現在、無料での利用は終了したようです。(2026.3.26)

- Runway Gen-4.5

最近の生成動画AI界は中国が先行していて現在のアメリカの生成モデルとしては一番頑張っていると言えるモデルです。
最近発表されたNVIDIAと共同開発されたタイムリー生成など、中国とは違うアプローチで展開しています。

- Veo 3.1

Googleの動画生成モデル。8K対応と画質はトップクラスだが、肝心のクオリティでは他モデルと方向性の違いが見られる印象。
また利用コスト面もトップクラスなので現在は大手企業向けな印象。

- Seedance 2.0

ここ最近で最も話題となった中国の動画生成AI。
映画並みのクオリティで一気に動画生成AIの覇権を取る勢いでしたが、著作権や肖像権への配慮の観点から、グローバル展開は一時停止が発表されています。

- Sora 2

OpenAIの動画生成モデル。中国系のモデルに遅れをとっていて、話題性は落ち着いているが、ディズニーとの専属契約などで、再び注目されると思います。
※ 提供終了が発表されたため、利用は近日中に終了予定です。(2026.3.24)


⑤ その他のAI

その他のAI

最近では3Dモデル生成や音楽、音声の生成AIも登場して新たな可能性の広がりを見せています。

- GPT-OSS

ChatGPTの開発元であるOpenAIが開発したローカルLLM。スタンドアローンタイプなのでGPU依存だがファインチューニングによって独自のLLMとして学習させることが可能。

- Qwen 3.5

Alibabaが開発したローカルLLM。OCRも可能なマルチモーダルモデル。量子化されたタイプだとノートなどにも入れられる。一世代前のクラウドLLMと同等の性能を持ちエージェントとしての活用で需要が高まる可能性が高い。

-Perplexity

検索特化型AI。LLMと検索を組み合わせたRAG型モデルで、出典付きの情報収集が可能。制作時の資料調査やトレンド把握に向いています。 外部データを参照しながら回答するRAG型AIとしても注目されています。

- Suno

音楽生成モデル。従来のボーカロイド的な印象とは異なり、プロの歌唱に近い自然な楽曲を1分程度で生成します。

- ElevenLabs

音声生成モデル。人が話していると錯覚するレベルの音声生成モデル。任意の声、任意のトーンでテキストを読み上げます。 ボイスクローンを利用すると自分の声で原稿の読み上げや感情豊かな台詞などを生成可能です。

- Meshy

複数リファレンス画像から3D化して3Dモデル(データ)を生成。まだまだ精度は実用レベルではないが、今後注目されている分野の生成AIです。

- Mable

画像から空間を3D化して生成。世界の広がりを画像内の世界観に合わせて拡張します。舞台背景、室内の再現など用途が広く注目されています。

- Comfy UI

Stable DiffusionなどのAI画像・動画生成モデルをノード(処理ブロック)を接続して生成フローを構築するGUIツール。 画像生成・動画生成・LoRA・ControlNetなどを統合管理でき、上級者向けの制作環境として人気。

- Topaz

画像のアップスケール(サイズを拡大)やエンハンス(鮮明化)に特化したAIツール。ピンボケした写真や劣化画像に使うと驚くべき効果を発揮する。


⑥ 最近の傾向まとめ

まとめ

全体的に感じるのは、単体のAIよりも組み合わせ前提になってきていることです。
映像やアニメを制作したいというクリエイターの方であれば

  • 文章生成 (構想・設計)
  • 画像生成 (ビジュアル作成・編集)
  • 動画生成 (アウトプット)

といった流れで使うと効率が良いです。

記事を執筆中に「Sora提供終了」ニュースが飛び込んでくるなど、まだ変化が早い分野ですが、制作の補助ツールとしては確実に便利になってきています。
制作の可能性を広げるツールとして、今後も検証しながら整理していく予定です。

ログインできない場合 新規会員登録