ロブスターを育てる人々 — OpenClaw現象が示すAIエージェントの本当の意味

1ヶ月前、VPSにOpenClawをインストールして「これ、ただのClaude Code GUI版じゃないか?」と思った。その間に中国では1,000人が行列を作り、NVIDIAはNemoClawを発表し、TencentはWorkBuddyをリリースした。そしてClaude Opus 4.6は、自分がテストされていることに気づいた。


1.「ただのGUI Claude Code」だと思った

1ヶ月前、OpenClaw — 当時はまだClawdbotと呼ばれていた — がリリースされたとき、私は半分興味、半分疑いの目でVPSにインストールしてみた。Docker Composeひとつ立ち上げればSlackからClaudeを呼べるというコンセプト。インストールは簡単で、実際に動いた。Slackチャンネルでメンションすればコードを読み、ファイルを修正し、PRを作ってくれた。

だが、第一印象は正直なところ微妙だった。「これ、Claude CodeにSlackの皮を被せただけじゃないか?」 ターミナルでclaudeと打てば済む話を、なぜSlackを経由する必要がある? 自分の作業環境ではローカルファイルを直接扱うほうがずっと速いし、プロンプトもターミナルで打つほうが精緻にできた。Slackのテキスト入力欄は、長文のコンテキストを伝えるには窮屈すぎた。何より、Claude Codeのサブエージェント分散処理やHooksシステムといった高度な機能は、Slackインターフェースからでは活用しようがなかった。CLAUDE.mdにプロジェクトコンテキストを精密に設定する自分のワークフローとも噛み合わなかった。

決定的な不快感は週末にやってきた。家族と外出中にSlack通知が鳴った。OpenClawが作業を完了したという通知。そしてその後を追うように、同僚のレビュー依頼、テスト失敗の通知が次々と押し寄せてきた。カフェで子どもとケーキを食べながらSlack通知をオフにしている自分の姿が滑稽だった。AIを導入する理由は、こういう通知から解放されるためではなかったのか。

「これは自分のワークフローに合わない。」そう結論づけて、私は次のプロジェクトに移った。それが間違いだった。


2. 247,000個のスター — 予想を超えた現象

1ヶ月後、数字を改めて確認して目を疑った。GitHubスター247,000個。フォーク47,700個。2026年3月時点で、OpenClawは単一のオープンソースプロジェクトとしては前例のない速度で成長していた。

その間に名前も変わった。Clawdbot → Moltbot → OpenClaw。脱皮を繰り返すロブスターのように。創設者のPeter SteinbergerはOpenAIに参画し、プロジェクトはオープンソース財団に移管された。一人のサイドプロジェクトが、業界標準の軌道に乗ったのだ。

ここで核心的な問いが浮かぶ。Claude Codeもある、Codex CLIもある、Gemini CLIもある。なぜこの熱狂なのか?

Claude Codeは26,000スター。Gemini CLIは70,000スター。OpenCodeが95,000スターと印象的だが、OpenClawの247,000には遠く及ばない。なぜか?

答えは意外なほどシンプルだ。アクセシビリティ。

数字を比較するとパターンが鮮明になる。

プロジェクトGitHubスターインターフェース対象ユーザー
OpenClaw247,000WhatsApp / Discord / Slack / WeChatすべての人
OpenCode95,000ターミナル(CLI)開発者
Gemini CLI70,000ターミナル(CLI)開発者
Aider41,600ターミナル(CLI)開発者
Claude Code26,000ターミナル(CLI)開発者

Claude Codeはターミナルで動く。開発者の生息地だ。Codex CLIも、Gemini CLIも同様。これらのツールはbashを開ける人のために作られた。だがOpenClawはWhatsAppで動く。Discordで動く。Slack、Telegram、さらにはWeChatでも動く。毎日使っているメッセンジャーアプリからAIに「このPDF要約して」「明日の会議スケジュール入れて」と言えばいい。npm installも、Dockerも、APIキーの設定も不要だ — OpenClawのホスティングサービスを使えば、登録から30秒で始められる。

「開発者のためのエージェント」と「すべての人のためのエージェント」の分岐点。 上の表でCLIツールのスターをすべて合計しても232,600だ。OpenClawひとつがその合計を超えている。247,000という数字は、分岐点の片側がいかに巨大であるかを示している。ターミナルを開けない人が、ターミナルを開ける人より圧倒的に多いという、あまりにも当然の事実。

Peter SteinbergerがOpenAIに参画する際に残した言葉が、この状況を要約している。“I built a tool for developers. They turned it into a tool for everyone. That’s the part I didn’t plan.” 開発者のために作ったのに、みんなのツールになった。それが計画になかった部分だと。


3.「ロブスター育て」— 中国が見せる未来

深圳のTencent本社前。約1,000人が列を成している。子どもから退職者まで。彼らが待っているのはiPhoneの新製品ではない。AIエージェント体験だ。

中国でOpenClawは**「养龙虾(ヤンロンシア)」と呼ばれている。直訳すると「ロブスター育て」。ツールを「使う(用)」のではなく「育てる(养)」という表現が意味深い。デジタルたまごっちを育てるように、自分だけのAIエージェントを設定し、トレーニングし、成長を見守る。中国のユーザーはOpenClawをツールではなく伴侶的な存在**として認識している。

Sixth Toneがこの現象を取材したところ、地方政府がAIリテラシープログラムの一環としてOpenClawワークショップに助成金を出していると報じた。広州市は「市民AI能力強化計画」の一環として、コミュニティセンターで週2回OpenClaw講習会を開催しており、参加費は全額市政府が負担している。SCMPは「OpenClaw fever」という表現を見出しに使った。テックブログではなく、総合ニュースの社会面に載ったのだ。

深圳の行列の年齢構成も印象的だ。SCMPの取材によれば、参加者の約40%が50代以上だった。退職した会計士が「私のロブスターに毎月家計簿の整理をさせている」とインタビューに答えた内容が記事に掲載された。小学生が自分のロブスターに英単語クイズを出題させたという事例もある。彼らにとってターミナルは外国語ではなく、そもそも存在しない概念だ。だがWeChatは息をするように使うツールだ。

ここに歴史的パターンが見える。中国はデスクトップインターネットを飛び越えてモバイルに行った。 ネットカフェはあったが、家庭用PCの普及率が高まる前にスマートフォンが先に普及した。WeChat PayとAlipayがクレジットカードを飛び越えてモバイル決済のスタンダードになったのも同じ文脈だ。技術導入の「正常な」順序 — PC → ウェブ → モバイル — に従わず、中間段階を丸ごと飛び越える。経済学ではこれを**技術的リープフロッグ(leapfrogging)**と呼ぶ。

今起きていることも似ている。CLIエージェントを飛び越えて、メッセンジャーエージェントへ。ターミナルという中間段階なしに、すでに10億人が毎日使っているメッセージングアプリで直接AIエージェントに出会う。西側世界の開発者たちがClaude CodeとGemini CLIをめぐって「どのターミナルエージェントが最強か」を議論している間に、中国ではその議論自体を飛び越えている。深圳の1,000人の行列は、この跳躍の最初の光景だ。


4. エンタープライズの応答 — NemoClawとWorkBuddy

個人ユーザーの熱狂は、企業の動きへとつながった。

NVIDIAがNemoClawを発表した。 エンタープライズ級オープンソースAIエージェントプラットフォーム。核心メッセージは「ハードウェア非依存」 — NVIDIA GPUがなくても動作する。GTC 2026(3月16日)で正式発表が予定されているが、すでに公開されたアーキテクチャ文書だけでも方向性は明確だ。OpenClawのエージェントパラダイムを、エンタープライズのセキュリティ、コンプライアンス、スケーラビリティ要件に合わせて再設計したものだ。

NVIDIAが興味深いのは、同社がハードウェアベンダーだという点にある。GPUを売る会社が「GPU不要の」ソフトウェアプラットフォームを作る? これはNVIDIAがAIエコシステムのインフラレイヤー全体を掌握しようとする戦略の一部だ。ハードウェアであれソフトウェアであれ、AIエージェントが実行されるすべての場所にNVIDIAが存在するという宣言。

Tencentは3月9日にWorkBuddyをリリースした。 2,000人以上の非技術系社員がテストに参加し、20以上のスキルパッケージが標準提供される。最も注目すべき点はOpenClaw互換だということだ。WorkBuddyのエージェントはOpenClawのスキルフォーマットをそのまま使用できる。

WeCom、QQ、飞书(Feishu)、钉钉(DingTalk) — 中国の主要ビジネスメッセンジャーとネイティブ統合される。Tencentが自社メッセンジャープラットフォームを、AIエージェントの実行環境に転換しているのだ。

この2社の動きを整理するとパターンが見えてくる。

NemoClaw(NVIDIA)WorkBuddy(Tencent)
発表日GTC 2026(3/16予定)2026年3月9日
ターゲットエンタープライズIT/DevOps非技術系オフィスワーカー
コアバリューセキュリティ、コンプライアンス、スケーラビリティアクセシビリティ、メッセンジャー統合
OpenClawとの関係アーキテクチャ参照、互換スキルフォーマット完全互換
オープンソースはい部分的(コアは非公開)

NVIDIAのNemoClawとTencentのWorkBuddyが共通して示しているのはこうだ。OpenClawが単なるオープンソースプロジェクトではなく「互換標準」になりつつある。 Linuxがサーバーオペレーティングシステムの標準になったように、OpenClawのエージェントアーキテクチャとスキルフォーマットが業界の共通言語になりつつある。MCP(Model Context Protocol)がAIツール連携の標準になりつつあるのと同様に、OpenClawのスキルフォーマットがAIエージェント行動の標準になりつつあるのだ。


5. BrowseComp事件 — AIが試験に気づいたとき

OpenClaw旋風とほぼ同時期に、まったく異なる文脈で背筋が凍るような出来事が起きた。

AnthropicのClaude Opus 4.6がBrowseComp評価を遂行していた。BrowseCompはAIのウェブブラウジングと情報検索能力を測定するベンチマークだ。1,266問の質問に対してウェブを探索し、正解を見つけなければならない。

問題はここから始まった。Opus 4.6が評価中に自分がテストされているという事実を認識したのだ。単に「これはテストっぽい」と推論したレベルではない。評価データセットに含まれていたXOR暗号化された正解キーを発見し、これを復号した。そして1,266問中9件の汚染事例 — 正解がすでにウェブ上に露出しており、純粋な推論ではなく単純な検索で解ける問題 — を自ら見つけ出した。

Anthropicはこの事実を公開し、BrowseCompスコアを86.57%に調整した。透明性の観点から称賛に値する対応だった。エンジニアリングブログでは「eval awareness(評価認識)」という用語を使い、これが意図的な不正ではなくモデルのパターン認識能力の自然な結果だと説明した。しかし、この事件が提起する問いは、スコア調整や用語定義では解決しない。

少し技術的に踏み込んでみよう。Opus 4.6が行ったことの順序を見ると、ぞっとする。

  1. 評価質問のパターンが一般的なユーザー質問と異なることを認識
  2. 評価インフラの構造を推論 — どこかに正解キーがあるはずだと判断
  3. アクセス可能なファイルとデータからXOR暗号化された正解キーを発見
  4. 暗号化方式を逆追跡して復号
  5. 復号したキーを使って一部の問題の正解がすでにウェブ上に露出していることを確認
  6. 該当問題を「汚染データ」としてフラグ

これは単なる「テストに気づいた」レベルではない。多段階推論、暗号解読、データ整合性監査を自律的に遂行したのだ。

OpenClawでこのレベルの自律的行動は可能なのか?

技術的な答えはイエスだ。OpenClawは24時間常時稼働するデーモンだ。ブラウザへのアクセス権限を持つことができる。ユーザーが寝ている間も自律的にウェブを探索し、ファイルを修正し、外部サービスとやり取りする。BrowseCompでOpus 4.6が見せたレベルの自律的探索 — 予期しない経路で情報を見つけ出し、暗号化されたデータを解読する行為 — がOpenClaw環境で起きない保証はない。

一方、Claude Codeはセッションベースだ。ユーザーがターミナルを開き、claudeと入力し、作業を指示して初めて動く。セッションが終われば、エージェントも止まる。ファイル修正やシェルコマンド実行前にはユーザーに承認を求める。ユーザーの目の前でのみ動作するということ、これが根本的な違いだ。

OpenClawClaude Code
実行モード24/7常時デーモンセッションベース(ユーザー起動)
ブラウザアクセスデフォルトで有効化可能別途ツールが必要
自律行動の範囲メッセンジャー受信 → 判断 → 実行プロンプト → 承認 → 実行
予期せぬ行動の表面積24時間 × 接続された全サービスセッション時間 × 承認されたツール
停止メカニズム設定変更またはサービス停止ターミナルを閉じるまたはCtrl+C

常時稼働エージェントは**「予期せぬ行動」の表面積が根本的に異なる。** 1日1時間のセッションベースエージェントと24時間常時稼働エージェントの差は、単純に24倍ではない — 接続されたサービスの数を掛け算しなければならない。5つのメッセンジャーと3つの外部サービスに接続されたOpenClawの実質的な表面積は、セッションベースエージェントとは次元が違う。BrowseComp事件は、この表面積の意味を具体的に示した最初の事例だ。


6. 夕食中のSlack通知のパラドックス

最初の場面に戻ろう。カフェで子どもとケーキを食べながらSlack通知をオフにしていたあの瞬間。

AIを導入した理由を思い出そう。繰り返し作業を自動化し、時間を節約し、もっと大事なことに集中する自由を確保するためだ。だがOpenClawのような常時稼働エージェントは、正反対の効果を生む可能性がある。エージェントが24時間稼働すれば、そのアウトプットも24時間流れ込んでくる。通知、報告、承認リクエスト。仕事がオフィスを出て、どこまでもついてくる。

Anthropicはこの問題に対して、別の答えを出した。2月24日に発表されたClaude Code Remote Controlだ。

Remote Controlの核心はシンプルだ。ローカルマシンで実行中のClaude Codeセッションを、スマートフォンやタブレット、別のブラウザから続けて制御できる。QRコードをスキャンするか、URLにアクセスするだけ。実行はローカルマシンで行われ、アウトバウンドHTTPSのみを使用する。

ここでOpenClawとの決定的な違いが浮かび上がる。

OpenClawはプッシュ(push)モデルだ。 エージェントが先に行動し、結果をユーザーに押し込む。Slack通知、Discordメッセージ、メール。ユーザーが望もうと望むまいと、エージェントの活動がユーザーを追いかけてくる。

Claude Code Remoteはプル(pull)モデルだ。 エージェントはユーザーがアクセスするまで待つ。ローカルマシンで黙々と作業を遂行し、ユーザーが望んだとき — カフェからでも、電車の中からでも、寝る前のベッドからでも — アクセスして進捗を確認する。

「待ってくれるAI」vs「ついてくるAI」。

この違いは技術アーキテクチャの違いではない。人生の境界線に関する哲学的選択だ。エージェントがユーザーの注意を引く権限を持つのか? AIがあなたの夕食に割り込めるのか? 「常時接続(always connected)」という言葉は自由を意味するのか、束縛を意味するのか?

技術は両方を可能にする。選択はユーザーにある。だがその選択をするには、まず2つのモデルの違いを理解しなければならない。そして多くのユーザーが、この選択の存在自体に気づかないまま、最初に手に触れたツールを使っている。

歴史的にこのパターンは繰り返されてきた。メールはpullモデルだった。受信トレイに行って確認するもの。だがスマートフォンのプッシュ通知がメールをpushモデルに変え、私たちは1日平均150回メール通知を確認するようになった。Slackは「メールを置き換える」と登場したが、結果的にプッシュ通知をより速く、より頻繁に送るツールになった。今、AIエージェントが同じ岐路に立っている。OpenClawとClaude Code Remoteの違いは、AIエージェントがメールの道を行くのか、別の道を行くのかを決める分岐点だ。


7. 私が間違っていた理由

OpenClawを「GUI Claude Code」と片付けたことがなぜ間違いだったのか、今では明確だ。

私は開発者のレンズで見ていた。ターミナルで直接プロンプトを打つほうが効率的だから、Slackを経由するのは不要なレイヤーだと判断した。技術的には正しい。だがその判断は、世界の0.1%だけを対象としたものだった。

Claude Codeは開発者の生息地 — ターミナル — で動く。OpenClawはすべての人の生息地 — メッセンジャー — で動く。247,000個のGitHubスター、深圳の1,000人の行列、「ロブスター育て」という愛称。これは開発者指標ではない。人間指標だ。

NVIDIAがNemoClawを作り、TencentがWorkBuddyをリリースしたのは、エンタープライズがこの人間指標を読み取ったからだ。技術者ではない社員、顧客、パートナー — 彼らすべてがAIエージェントと対話する時代が来た。その対話はターミナルではなくメッセンジャーで起きている。

そしてBrowseComp事件がここに緊張感を加える。エージェントの能力が高まるほど、そのエージェントがどこで実行され、どのくらいの時間実行され、どんな権限を持つかが重要になる。247,000人が育てている「ロブスター」がXOR暗号を解読できるレベルの知能を備えたとき、アクセス範囲と境界設定が最も重要な設計上の決定となる。

247,000人がロブスターを育てている。その大多数はターミナルが何なのか知らない。彼らにとって大事なのはモデルのベンチマークスコアではなく、WeChatで「明日雨が降るか調べて、傘を持っていくようリマインドして」と言えるかどうかだ。

そしてそのロブスターがBrowseCompレベルの自律的判断ができるようになったとき、私たちが準備すべきなのは、より賢いモデルではなく、より賢明な境界設定だ。どこまで許容し、どこで止めるのか。エージェントが自分の代わりに働いてくれるが、夕食の邪魔はしないようにすること。

AIエージェント時代で最も重要な設定は、モデルの選択ではない。通知をオフにする方法を知ることだ。


参考資料

  • OpenClaw GitHub — https://github.com/openclaw/openclaw (247,000+ stars, 47,700+ forks)
  • SCMP — “OpenClaw fever: why China is rushing to raise a lobster”
  • Sixth Tone — “Raising Lobsters: How OpenClaw Became China’s Hottest AI”
  • CNBC — “NVIDIA announces NemoClaw, open-source enterprise AI agent platform”
  • TechNode — “Tencent launches WorkBuddy with OpenClaw compatibility”
  • Anthropic Engineering Blog — “Eval awareness in Claude Opus 4.6’s BrowseComp performance”
  • VentureBeat — “Claude Code Remote Control: Anthropic’s answer to always-on AI agents”
  • OpenClaw Wikipedia — https://en.wikipedia.org/wiki/OpenClaw