2026年クリエイター向け生成AIまとめ（動画・画像・LLMの実践印象）

2026.03.26 AIによるアート

最近、生成AIの種類が一気に増えてきて、正直どれを触ればいいのか分かりにくくなってきました。

動画、画像、コード、文章…それぞれ強いツールも違います。
仕事や制作の様々な場面で色々なAIを試してみた印象をまとめておこうと思います。クリエイター視点でのメモ的なまとめです。

① LLM: 大規模言語モデル

おそらく多くの方が「AI」と聞くとこれを連想されると思います。
LLMは人間で言う「脳」の部分。最近ではLAM「手」との組み合わせで新たな進化を見せています。従来のチャットベースが広く知られていますが、最近では作業を一貫して行えるエージェント型が注目されています。最近は単なるチャットAIというより、作業そのものを補助する方向に進んでいる印象があります。特にコード生成や構成設計など、制作の前段階での使い勝手がかなり変わってきました。

- ChatGPT（GPT-5系 / 2026年時点）

説明の必要はないと思います。
現在のAIブームの火付け役となったOpenAIのLLM。文脈理解力や言語表現力に優れている印象です。

- Claude

最近大注目のAnthropicのLLM。以前からGPTより賢いと評判でしたが、日本ではあまり知られていませんでした。
LAMとの組み合わせで飛躍的に知名度、重要度があがりました。文脈の一貫性、推論力はトップクラス

- Gemini 3

GoogleのLLM。以前のBardより性能は向上したが、GPTやClaudeと比較すると記憶力や文脈理解力が弱く、会話の一貫性にばらつきがある印象です。
最大の強みは膨大なデータベース参照と、外部アクセス可能な点。

- Grok 4.20

xAIのLLM。他のLLMと違い、人格設定や個性的な発言が特徴。学習データがSNSベースであるため創造性が強い反面、事実確認が必要なケースも見られる印象です。

② ターミナルAIエージェント

LLMがローカル上で動くAIエージェントの技術は、昨今最も話題となっています。
主にエンジニア向けでプログラムコード(システム開発やアプリ開発)がメインでしたが、最近ではデスクトップの操作をAIが行うことによりクリエイティブな制作フローを自動化することも可能になり大きな広がりを見せています。
GUI(マウスなどを動かす)タイプだけでなく、CLI(コマンドで動く)タイプも増えてきて、従来の「チャットに聞く」使い方とは少し変わってきています。ローカル環境と組み合わせる前提のものもあり、制作環境としては面白い流れです。

ただ、ローカルで直接動くLLMを入れるということは、それなりにリスクがあるため、APIやセキュリティなどの仕組みを理解した上で導入することをお勧めします。

- OpenClaw

GUI型のオープンソースモデル。

ローカルからAPI経由でGPT、Claude、Geminiといった高性能なLLMに実行させるツール。近年のAI業界で注目を集めている分野の一つです。

- ClaudeCode

Anthropicが開発したターミナル専用エージェントモデル。
Open Clawで最も利用されているLLMであるClaudeをエージェントとしていて、セキュリティ面のリスク管理も徹底されているため人気を集めています。

- Codex

OpenAIが開発したCLI。旧Codexの流れを汲むCLIエージェント。 LAM系の独立したアプリとしてリリースされていますが、ローカル環境でシステム開発、アプリ開発、環境構築などの面で注目されています。

③ 画像生成系

画像生成モデルは動画の参照画像を生成する役割として根強く人気があります。

- Midjourney v7

画像生成AIの中でも非常に人気の高いモデル。
特にアート系のクオリティの高い画像を生成することに定評があり、多くのクリエイターにMVやPVなどの元フレームとして使われている。

- Nano Banana Pro

Geminiとの組み合わせでエージェント補助つきの画像生成モデル。
編集や資料作成には向いているが、文脈理解力は乏しく機械的な規制で生成拒否されることが多い印象。

- FLUX.2

写実性、リアルな再現性が特徴のモデル。
実写映像や細部の補完などに本領を発揮します。

- Stable Diffusion AUTOMATIC1111 (WebUI)

画像生成AIを世界的に広めたローカルモデル。
生成画像の印象を変化させるモデルや再現性を強くするLoRAなど拡張性が高いのが最大の魅力。

- Qwen-Image

Alibabaが開発した次世代画像生成モデル。
マルチアングル生成やレイヤー分離など、編集を前提とした構造的な画像生成が可能で、従来の1枚生成型とは異なるアプローチとして注目を集めています。

④ 動画生成系

動画生成はまだ発展途中ですが、短いカットや素材作成用途としてはかなり実用的になってきました。
特に構図のアイデア出しや背景素材の生成には使いやすい印象です。

- Kling 3.0

おそらく動画生成AIの中では比較的安定して、クオリティが高く機能も充実しています。現状として映像作品を制作するならKlingがおすすめです。

- Hailuo 2.3

中国のMinMaxが開発した動画生成モデル。ダンスやアクションに特化していて、SNSショート、アクション系クリエイター向けのモデルという

- Vidu Q3

中国系の動画生成モデル。複数リファレンスでキャラクターを固定することが可能で、長尺動画にとっては重要なキャラクターの一貫性やカメラワークに強く、主にアニメ制作のクリエイターに人気のモデルです。

- Grok Imagine

XAIの生成モデル。立体推論の自然さが特に優秀です。2026年のアップデートで複数リファレンス対応が強化され、再び注目されています。出力サイズは控えめですが、~~無料でもかなり使えるので初めて触る方はGrokから触るのが良いかと思います。~~
現在、無料での利用は終了したようです。(2026.3.26)