プロンプトエンジニアリングは死んだのか — GPT-5.4ガイドが静かに宣言したこと

GPT-5.4のプロンプトガイドを読んで気づいた。OpenAIは「プロンプトの書き方」ではなく「システムの設計方法」を教えていた。Andrej Karpathyはすでにこう言っていた — 「LLMはCPU、コンテキストウィンドウはRAM、あなたの役割はOS。」

1. GPT-5.4ガイドから消えたもの

2026年3月7日、OpenAIがGPT-5.4プロンプトガイドを更新した。以前のバージョンと比較しながら読むと、微妙だが決定的な変化が目に入る。「プロンプトをうまく書くコツ」のような項目が後ろに追いやられ、前面に登場したのはエージェントパターンだ。

Tool use、structured output、verification loop、long-running workflow — ガイドの核心キーワードだ。OpenAI Devs公式チャンネルはこのアップデートをこう紹介した。「reliable agents covering tool use, structured outputs, verification loops.」プロンプト一行を磨く技術ではなく、エージェントシステムを安定的に構築するアーキテクチャに関するガイドだった。

以前のプロンプトガイドは「役割を与えましょう」「例を入れましょう」「ステップバイステップで考えさせましょう」といったアドバイスが中心だった。一種の呪文をうまく唱えれば良い答えが出るというフレームだった。GPT-5.4ガイドはこのフレームを静かに廃棄した。モデルに一行の呪文をうまく書くのではなく、モデルが動作するシステム全体を設計せよというメッセージだ。

これは単なるドキュメントの更新ではない。OpenAIが自社モデルの正しい使い方に関するパラダイムそのものを転換したのだ。

2. Karpathyの比喩 — LLM=CPU、コンテキスト=RAM

この変化を最も明快に説明した人物はAndrej Karpathyだ。2025年6月、彼はX（Twitter）にこう書いた。

“prompt engineering trivialises what we actually do”

そして自身の比喩を提示した。LLMはCPU（演算エンジン）であり、コンテキストウィンドウはRAM（作業メモリ）であり、開発者の役割はOS（何をロードするか決定するオペレーティングシステム）だと。

この比喩が単なるメタファーを超えて正確である理由がある。GPT-5.4の機能をこの比喩にマッピングすると、驚くほどぴったり当てはまる。Reasoning Effort（low/medium/high/xhigh）はCPUのクロック速度を調整するのと同じだ。重い処理には高いクロックを、軽い処理には低いクロックを。Output Contract（構造化された出力規約）はプロセスの終了条件を定義するものだ。「このフォーマットで返却すれば正常終了」とOSがプロセスに要求するのと同じだ。Tool Useはシステムコールだ。プロセスが直接ハードウェアにアクセスせずOSを通してファイルを読みネットワークに接続するように、LLMもツールを呼び出して外部世界と相互作用する。

そしてこの比喩を読んだ瞬間、私は気づいた — 自分はすでにOSを書いていたのだと。

Claude CodeでCLAUDE.mdはブートローダーだ。セッション開始時に最初にロードされ、システム全体の動作規則を定義する。settings.jsonのMCPサーバー設定はデバイスドライバーだ。Slack、GitHub、データベースなどの外部デバイスにアクセスするインターフェースを登録する。Hooksシステム（PreToolUse、PostToolUse）は割り込みハンドラーだ。特定のイベントが発生した時に自動的に実行されるルーチンだ。「プロンプトを書いている」と思っていたすべての作業が、実はオペレーティングシステムの構成要素を設計することだった。

3. 2026年の分離 — casual prompting vs context engineering

Karpathyの比喩が正確であるなら、2026年現在のAI利用は明確に二層に分離しつつある。

第一層はcasual promptingだ。一般ユーザーがChatGPTやClaudeに「メールの下書きを書いて」「この概念を説明して」と言うこと。モデルが十分に賢くなり、大雑把に言っても意図をよく汲み取ってくれる。この層においてプロンプトエンジニアリングは本当に死んだ。GPT-5.4は「自然に話してください」だけで十分なほど意図推論能力が向上した。

第二層はproduction context engineeringだ。エージェントシステムを構築する開発者の領域だ。ここでは一行プロンプトではなく、システムプロンプト＋ツール定義＋検証ループ＋出力規約というコンテキストアーキテクチャ全体を設計する。

GPT-5.4が提示するCTCOフレームワークが、この第二層の設計原則だ。Context（背景情報と制約条件を提供せよ）→ Task（明確なタスクを定義せよ）→ Constraints（境界条件を設定せよ）→ Output（出力形式を規定せよ）。これはプロンプトではなくシステムスペックだ。

Claudeのアプローチも同じ方向だが異なる形をとる。CLAUDE.mdファイルにプロジェクトルールを宣言し、System Promptでセッションコンテキストを設定し、Hooksで自動化された検証を仕掛ける。宣言的（declarative）コンテキスト管理と呼べるだろう。毎回プロンプトにルールを書くのではなく、一度宣言しておけばすべてのセッションで適用される。

BlockのAIエージェントプロジェクトGooseのブログは、この状況を鋭くまとめた。「One shot prompting is dead.」 エージェントにplanさせ、rememberさせ、call toolsさせる瞬間、単一プロンプトはボトルネックになる。プロンプト一行でできることの限界が明確になったのだ。

4. GPT-5.4 vs Claude Opus 4.6 — 同じ問い、異なる哲学

同時代の二大トップモデルだが、「どう使えば最善の結果が出るか」に対する哲学はかなり異なる。

GPT-5.4は精密制御（precision） の哲学だ。Output contractを明示し、reasoning effortを指定し、構造化された指示を提供せよ。モデルに何をするかだけでなく、どうするか、どこまでするかを明確に指定するほど結果が良くなる。一種の命令型（imperative）プログラミングに近い。

Claude Opus 4.6は意図推論（inference） の哲学だ。コードベース全体を理解した上で、より簡潔なプロンプトでも開発者の意図を把握する。「このファイルをリファクタリングして」とだけ言っても、プロジェクトのコーディングコンベンション、テストパターン、ディレクトリ構造を考慮して結果を出す。宣言型（declarative）プログラミングに近い。

価格も異なる。GPT-5.4は入力$2.5、出力$15（100万トークンあたり）。Opus 4.6は入力$5、出力$25。単純比較するとOpusは2倍高い。しかしトークン効率が違う。GPT-5.4でoutput contract＋completion criteria＋構造化された指示を書くと入力トークンが増える。Opusでは「リファクタリングして」で十分な作業が、GPT-5.4では「このファイルを以下のルールに従ってリファクタリングせよ：1）関数分離基準は… 2）命名規則は… 3）完了条件は…」が必要になりうる。

私の経験がこれを裏付ける。Claude Codeで「このAPIハンドラーを整理して」で満足な結果を得た作業を、GPT-5.4ベースのツールで試すとoutput contractとcompletion criteriaを明示してようやく同等の品質が出た。どちらも良い結果を出すが、到達する経路が異なる。

核心的な示唆はこれだ。モデルごとに異なる「OS」を書かなければならない。 一つのプロンプトテンプレートですべてのモデルで最適な結果を得られるという幻想は捨てるべきだ。GPT-5.4に最適化されたコンテキスト設計とOpus 4.6に最適化されたコンテキスト設計は、かなり異なる形をとる。LinuxカーネルとmacOSカーネルが同じ目的（ハードウェア上でソフトウェアを実行する）を達成しながらもまったく異なる設計哲学を持つように。

5. OpenAIコミュニティの急進的主張 — 「Context Engineeringはもう時代遅れ」

変化の速度は名前を付ける速度より速い。

OpenAIコミュニティフォーラムでは、すでにもう一歩先の主張が登場している。「未来はAutomated Workflow Architectureだ。」 Context engineeringが人間の開発者が手動でコンテキストを設計するものであるなら、その次の段階はAIがAIのコンテキストを自動的に設計するものだという主張だ。

抽象化レベルの上昇として見れば、この流れは自然だ。Prompt（一行の指示）→ Context（システム設計）→ Workflow（自動化されたシステム設計の設計）。プログラミングの歴史でも同じパターンを見てきた。アセンブリ（命令一行）→ 高級言語（システム設計）→ コンパイラ／フレームワーク（システムを作るシステム）。

実はこれがすでに現実で起きている。Claude Codeのサブエージェントシステムがまさにこのパターンだ。メインエージェントが複雑なタスクを受け取ると、サブエージェントを生成し、各サブエージェントのプロンプトを自動的に作成する。「これらのファイルを探索して関連コードを見つけよ」というサブエージェントと「このパターンでリファクタリングせよ」というサブエージェントを並列実行しながら、それぞれに渡すコンテキストをメインエージェントが設計する。AIが別のAIのコンテキストを設計する未来 — それはすでに今日だ。

the-ai-corner.comのContext Engineering Guide 2026はこの進化を体系的に整理しつつ、最終的に開発者の役割は**「メタレベルのシステム設計者」**に収束するだろうと展望している。直接コンテキストを書くのではなく、コンテキストが自動生成されるルールと構造を設計すること。

6. プロンプトは死んでいない — 名前が変わっただけだ

振り返ると、「プロンプトエンジニアリング」という言葉自体が問題だった。

この言葉はまるで一行の呪文をうまく書けば魔法のような結果が出るという誤解を招いた。「5つのプロンプトテクニック」「プロンプトチートシート」「魔法のプロンプト公式」 — こうしたコンテンツが溢れ、多くの人がプロンプトエンジニアリングを「AIにうまく話す技術」程度に理解していた。

現実はまったく違った。実務でAIシステムを構築する人たちがやっていることは、システム設計、コンテキスト管理、ツールオーケストレーションだ。CLAUDE.mdを書き、MCPサーバーを設定し、Hooksで自動検証を仕掛け、output contractを定義し、reasoning effortを調整する。これは「プロンプトをうまく書くこと」ではなく、ソフトウェアシステムを設計することだ。

Karpathyはこれを「OSを書くこと」と呼んだ。OpenAIは「アーキテクチャを設計すること」と呼んだ。Block/Gooseは「ワークフローをオーケストレーションすること」と呼んだ。名前は異なるが、指し示す方向は同じだ。

2026年にプロンプトエンジニアは死んでいない。システムアーキテクトに昇格しただけだ。

「プロンプトをうまく書きましょう」というアドバイスは、今や「建築をうまくしましょう」に変わった。レンガ一つをきれいに積む技術ではなく、建物全体の構造を設計する能力。GPT-5.4プロンプトガイドが静かに宣言したのは、まさにこの転換だ。そしてこの転換を理解した者と、いまだに「魔法のプロンプト」を探し続ける者との格差は、今後ますます広がっていくだろう。

参考資料

OpenAI GPT-5.4 Prompt Guidance 公式ドキュメント（2026.3.7更新）
Andrej Karpathy Xポスト（2025.6）— “LLM=CPU, context=RAM, you are the OS”
Block/Goose Blog — “One Shot Prompting is Dead”
OpenAI Community Forum — “Context Engineering Is Already Obsolete”
Context Engineering Guide 2026 (the-ai-corner.com)
GPT-5.4 vs Claude Opus 4.6 比較分析
Claude Code 公式ドキュメント — CLAUDE.md、Hooks、MCPサーバー