はじめに
2025年現在、生成AIは高度な文脈理解を備え、簡潔なプロンプトでも適切な応答を生成できるようになっています。また、AIの自己学習機能が向上し、ユーザーが細かく指示を出さなくても、適切な応答を得られるケースが増えています。そのような状況の中で、以下のような記事を目にする機会も増えました。
「Prompt Engineering is Dead(プロンプトエンジニアリングは死んだ)」
確かに、生成AIの進化に伴い、不要になっていった(または、今後なっていく)プロンプトエンジニアリングの手法はあるように思います。しかし、本当にそうなのでしょうか?
このあたりについて、プロンプトエンジニアリングの歴史や最近の動向なども踏まえながら、今後についてできるだけ具体的な情報に基づいて客観的な視点で予想してみたいと思います。
なお、2025年7月9日にオライリー・ジャパンから出版される以下の書籍「生成AIのプロンプトエンジニアリング」から、筆者の解説や主張なども引用します。
なお、私はこの書籍の監訳を担当しました。多くの人にとって読みやすくなるように、構成や論理展開の見直し、細部の日本語化、脚注の追加などを行っています。また、付属するすべてのノートブックを動作検証し、複数のバグを修正しています。原著の出版時点と本書の出版時点で状況とのずれが出てしまっていますが、この分野の書籍では回避が難しい問題なので、その点はご了承ください
そもそもプロンプトエンジニアリングとは?
この書籍の中では、プロンプトとプロンプトエンジニアリングを以下のように定義しています。
プロンプト(Prompt) とは、ChatGPTやMidjourneyのような生成AIと対話する際に与える入力のことで、通常はテキストです。プロンプトは、モデルが望ましい応答を予測するために使用される、一連の指示としての役割を果たします。プロンプトの応答は、ChatGPTのような大規模言語モデル(Large Language Model:LLM)であればテキストで、Midjourneyのような拡散モデル(Diffusion Model)であれば画像です。
プロンプトエンジニアリング(Prompt Engineering) とは、有用な、あるいは望ましい結果を確実に生み出すプロンプトを発見するプロセス(過程)のことです。
つまり、Google Geminiであれば、以下の赤枠の入力がプロンプトで、それを改善することがプロンプトエンジニアリングということになります。
このシンプルなプロンプトに対する応答は以下のようになりました。
うーん、ラーメンにシイタケ… そして、不自然にこぼれるスープ…(この時、たまたまGeminiさん絶不調だったのかもしれませんが…
)
このような漠然としたプロンプトでは得られないような望ましい応答を得るのがプロンプトエンジニアリングということですね。「メタプロンプティング」というプロンプトエンジニアリングの手法を使いつつ、以下のようにプロンプトを改善すると、自分好みの美味しそうなラーメンにすることができました。
とても美味しそうなラーメンのクローズアップ写真を生成してください。白いどんぶりに、透き通った琥珀色のスープが注がれ、細めの黄色い麺がスープに浸っている。具材には、とろけるような豚の角煮チャーシューが2枚、中心が半熟でオレンジ色の黄身が美しい味付け卵が2つ、シャキシャキとしたメンマ、そして鮮やかな緑色のネギの細切りがこんもりと盛られている。スープからは湯気が立ち上り、食欲をそそる香りが漂っている。どんぶりの縁には、濃い緑色の海苔が添えられている。背景は、自然光が差し込む温かみのある木製のテーブル。全体的に、明るくクリアな焦点で、ラーメンの質感とディテールが際立つように描写してください。
なお、プロンプトエンジニアリングの手法にはメタプロンプティングのように名前が付いているものもありますが、そうでないものも多数あります。この記事では具体的な手法についてはリストアップして紹介しません。
ちなみに、現在の主要な生成AIサービスを表形式でまとめると、以下のようになります。
プロンプトエンジニアリングの歴史
「プロンプトエンジニアリング」という言葉自体がいつから使われるようになったのかははっきりしませんが、2020年にAI研究者Gwern Branwen氏が造った言葉ではないかというツイートがありました。
コンピューター科学などの研究論文を公開しているarXiv(アーカイブ)で、初めて「prompt engineering」という言葉を含む論文が公開されたのは2021/06/24です。
「Cutting Down on Prompts and Parameters: Simple Few-Shot Learning with Language Models(プロンプトとパラメーターの削減: 言語モデルによるシンプルなフューショット学習)」というタイトルの論文で、要旨(abstract)の書き出しに以下のような記述があります。
Prompting language models (LMs) with training examples and task descriptions has been seen as critical to recent successes in few-shot learning. In this work, we show that finetuning LMs in the few-shot setting can considerably reduce the need for prompt engineering.
日本語訳:
近年、フューショット学習の成功には、言語モデル(LM)に訓練の例とタスクの説明をプロンプトとして与えることが不可欠であると考えられてきました。本研究では、フューショット学習においてLMをファインチューニングすることで、プロンプトエンジニアリングの必要性を大幅に低減できることを示します。
この内容からすると、一部の研究者たちの間ではプロンプトエンジニアリングという用語はすでに使われたと考えられます。
以下のグラフは、arXivでの「prompt engineering」という言葉を含む論文の累積件数です。2021/06/24からの1年間で28件、2年間で149件でしたが、その後の2年間で1400件まで増加していることがわかります。特に2023年あたりから多くの研究者が研究の対象として、プロンプトエンジニアリングを注目していたことがわかります。
では、一般の人にこの言葉が知られるようになったのはいつ頃からでしょうか?
Google検索されるようになったのは、Google Trendsを見ると、OpenAIが ChatGPT(GPT-3.5ベース) を一般公開し(2022年11月30日)、登録者が無料で使用可能になった2022年の年末からのようです。流行りだしたのはGPT-4が登場した2023年3月、そして7月にも急増し、その後は少し落ち着いてきたという状況です。
日本でも少し遅れて、「プロンプトエンジニアリング」というキーワードでのGoogle検索が増加しています。
そのような状況の中で、2023年5月27日、Baiduの共同創設者でCEOのRobin Liはあるフォーラムでの登壇で、「10年後には、世界の仕事の半分がプロンプトエンジニアリングになり、プロンプトを書けない人は時代遅れになるだろう」という旨の発言をしています。
さらに同年、大規模言語モデル「Claude」の開発で知られるAnthropic社がプロンプトエンジニアを最高で $375,000(約5,500万円) の給与で募集することもありました。
日本でも、プロンプトエンジニアという職種を「AIの魔術師」と題してNHK(BSで放送)が特集しています。
しかし、2年前に年収5,000万円とまで言われた職業が今や無くなるのではないかと言われています。
「プロンプトエンジニアリングは不要」と言われる理由
「プロンプトエンジニアリングは不要」と言われる理由は、主に以下の2点であると考えます。
- 生成AIの進化
- 一般ユーザーのプロンプトエンジニアリングスキルの向上
まず、1について考えてみましょう。初期の生成AIでは人間には不自然に感じるプロンプトが効果的なことも多々あったようです。例えば、人間には「しつこい」と感じるような強調(似た表現の繰り返し)でも、AIがそのキーワードの出現頻度や文脈から重要度を学習し、より強くそのコンセプトを反映した出力を生成する傾向がありました。また人間にとって無意味な文字列をプロンプトに含めて、性能を向上させたという報告もあったようです。
arXivを検索してみると、人間には意味不明でランダムな文字列のセパレーターが、GPT-2などのモデルにとっては有効なトリガーとなり得ることを示した論文もありました。
プロンプトエンジニアリングの中でも、こうした黒魔術のような手法はモデルの進化とともに機能しなくなっていったのではないかと考えられます。
また、2023年以降のモデルでは特に、プロンプトの曖昧さを検出して、「もう少し具体的に教えてください」といった追加の情報をユーザーに求める応答ができるようになってきました。プロンプトエンジニアではなくても、生成AIとの対話を重ねることで欲しい回答が得られるようになっています。
さらに、主要な生成AIにはより深い推論と詳細な分析を行うモードが導入されています。このモードでは、質問の背景や関連する要素を考慮しながら、より思慮深い回答を生成します。このような進化により、プロンプトエンジニアリングスキルを持たないユーザーでも欲しい回答に短時間で辿り着けるようになってきています。
Microsoft Copilotの「Think Deeper」
次に2つ目の理由について考えてみましょう。おそらく、近頃は多くの人がGoogle検索(ググる)よりも生成AIと対話しながら、問題を解決することが多くなっているのではないでしょうか。その過程で、プロンプトエンジニアリングやLLMの動作原理を学んだり、意識して学ばなくてもLLMのクセを把握して、知らず知らずのうちにプロンプトエンジニアリングスキルを身に着けている可能性もあります。
そのような状況下でいわゆる「プロンプトエンジニア」と呼ばれるような人たちの優位性が薄れているのではないかと考えます。そして、それが「プロンプトエンジニアリングは不要」という極論になっているのではないかと推測できます。
ただし、上記見解は、あくまでもLLMのプロンプトエンジニアに対するものであって、画像生成AIのプロンプトエンジニアに対しては当てはまらないと私は予想しています。むしろその優位性は今後さらに上昇するかもしれません。
画像生成では、欲しい画像を生成させるために、潜在空間(モデルが学習した概念を保持するベクトル空間)を効率的に探索し、望んだ画像にたどり着く必要があります。そのため、プロンプトに黒魔術的なワードを追加したり、生成された画像をもとに新たな画像を生成したりするテクニックが求められます。それには知識や経験則が必要で、特殊な技能になっていきそうな気がしています(※あくまでも個人的な見解ですが…)。
なお、以下は「ジブリアニメに出てくる女の子と犬バス」の英訳をMidjourneyに与えて生成された画像です。
「隣のトトロ」の「猫バス」のような「犬バス」が生成されるか実験する意図でしたが、それはくみ取ってもらえませんでした。女の子をよく見ると、バスの窓を貫通しており、手の指の本数や上半身と足の位置関係なども不自然です。バスの行き先も読めません。欲しい画像に近い画像を得られるプロンプトを短時間で見つけ出し、様々な手法で細部を微調整していくのは知識と経験が無い人には難しい作業と言えます。
プロンプトエンジニアリングの必要性と今後の展望
「生成AIのプロンプトエンジニアリング」の筆者は、プロンプトエンジニアリングがそれ自体で人気のある職種になるのではなく、マイクロソフトのExcelの熟練度のように、多くの仕事で必要とされるスキルになると予想しています。
多くの仕事で必要とされるスキルになるのであれば、AIにかかわらない人もこの技術を習得することは大いに意義があると考えられます。生成AIに質問することはGoogle検索に代わり、多くの人の問題解決の第1ステップになってきています。日々多用してきたGoogle検索の効果的な使い方(例えば、サイト内検索・除外検索など)を知らずに損をしていた、なんてことを繰り返さないように、プロンプトエンジニアリングの知識もあらかじめ勉強しておけば日々の仕事に役立つのではないでしょうか。
ということで、改めて先ほどの書籍の内容を軽く紹介しておきます。
本書は、以下のような10個の章で構成されています。
- 1章 : プロンプトの5つの原則
- 2章 : テキスト生成のための大規模言語モデル入門
- 3章 : LLMによるテキスト生成の標準的な手法
- 4章 : LangChainを用いた高度なテキスト生成手法
- 5章 : FaissとPineconeによるベクトルデータベース
- 6章 : ツールとメモリーを使う自律エージェント
- 7章 : 画像生成のための拡散モデル入門
- 8章 : Midjourneyによる画像生成の標準的な手法
- 9章 : Stable Diffusionを用いた高度な画像生成手法
- 10章 : AIを活用したアプリケーションの構築
はじめに、1章で普遍的な「プロンプトの5つの原則」を学び、2章以降でテキスト生成モデル(LLM)と画像生成モデル(拡散モデル)のプロンプトエンジニアリング手法を紹介しながら、5つの原則がどう適用されているかを解説していきます。そして、最後に10章で、これまで得た知識(手法)を応用して、AIによる画像付きのブログ記事生成アプリケーションを開発する、という流れになっています。
なお、この「プロンプトの5つの原則」は、生成AIのモデルが進歩するにつれ、初期のプロンプトのトリックやハックの多くが徐々に不要となるのを目にしてきた筆者が、新しいモデルでも有用であり、テキストと画像の両方の生成で共通に機能する、と考える原則です。
本書は、PythonとAIの知識があると読みやすいですが、そうではない方でも読むことができると思います(コードにはすべて解説があるので)。最近オライリーから数冊似た名前の書籍が出ていますが、それらと比較して実践的で初学者向けな内容になっているのではないかと思います。また、以下のような画像生成についての解説も多くあるのが、特徴の1つと言えます。
本書の中で、筆者は以下のようにも述べています。
OpenAIの共同設立者であるSam Altmanが主張するように、生成AIを使いこなす鍵は、「最後に1つのマジックワードを加えることで、応答文全体を劇的に変化させるような、プロンプトのハック方法を見つけること」でなく、「アイデアの質とあなた自身が何を求めているかを理解すること」なのです。5年後にそれを「プロンプトエンジニアリング」と呼ぶかどうかはわかりませんが、生成AIを効果的に使うことの重要性は増すばかりでしょう。
最後に、「今後、プロンプトエンジニアリングは不要になるでしょうか?」という質問をいくつかの生成AIにしてみました。その結果、いずれも似たような回答が得られました。簡単にまとめると以下のような回答でした。
- プロンプトエンジニアリングは形を変えて進化する可能性が高い
- 完全に不要になるというより、役割や重要性が変化していく
確かにその通りではないかと思います(AIの分野の進化はあまりにも速く今後のことを予測するのは難しいですが…)。例えば、生成AIのAPIを活用してどう要求を満たしていくか、AIエージェントへの長期的な行動指示により、目的を実現するサービスをどのように構築するか、といったこともプロンプトエンジニアリングのメインの対象になるのかもしれません。もしくは「プロンプトエンジニアリング」という言葉では表現されなくなっていくのかもしれません。
いずれにしても、生成AIはあらゆる分野のゲームチェンジャーになることが容易に想像できます。米IT業界を中心に、生成AIの導入に伴い人員を削減する動きが進んでいるというニュースを目にする機会が増えました。
この流れは全世界へ、別の業界へと広がっていくことが予想されます。この技術を理解し、どう活用するかを学ぶことは、多くの人にとってさらに重要な課題になっていくのではないかと考えます。
まとめ
「できるだけ客観的に」と言いながら、主観的な予測も多くなってしまいましたが、最後にこの記事をまとめます。
- プロンプトエンジニアリングの手法は多数あり、それらの一部が死んだ(もしくは今後死んでいく)
- 特に、古いモデルでのみ機能した黒魔術的手法が死んだ
- プロンプトエンジニアリングについての知識が確立され、それが非プロンプトエンジニアにも共有されてきた
- それに伴い、プロンプトエンジニアという職種は死に、プロンプトエンジニアリングという言葉も死ぬかもしれない
- LLMよりも画像生成AIでは黒魔術的な手法が機能する
- プロンプトエンジニアリングの概念が変わりつつある
- 生成AIから欲しい情報を引き出すための手法や生成AIを最大限に活用するためのプログラミング技術などは継続して、すべてのエンジニアに基礎スキルとして要求されていく
- 生成AIをうまく活用する技術の重要度はますます高くなる
Views: 0