OpenClawからの大脱出:わずか1週間で53,000スターを集めたHermes Agent、その爆発的成長の本当の理由

開発者がエージェントを乗り換える理由が「機能が多いから」ではなく「もう信用できないから」だとすれば、これは技術競争の問題ではなく、信頼の危機だ。AIエージェント生態系で何が起きているのか。

はじめに

2026年4月第2週、GitHub Trendingに異例の数字が現れた。Nous Researchが開発したAIエージェントフレームワークhermes-agentが、わずか1週間で53,000以上のスターを獲得したのだ。同じ週の2位だったAndrej KarpathyのClaude Codeスキルファイルが30,000だったことを考えると、hermes-agentは2位のほぼ2倍に迫る数値を記録したことになる。

もちろん、GitHubのスター数がそのまま実力を意味するわけではない。バイラル効果、ボット、一時的な関心など様々な要因が作用し得る。しかしhermes-agentの場合、単なるバイラルでは説明しがたい文脈がある。2月25日にひっそりとv0.1.0をリリースして以来、2か月足らずで累計90,000以上のスターを記録し、フォーク数12,400という数字は、このリポジトリが「見物」ではなく「実使用」の領域に入ったことを示している。

そしてこの爆発的成長の背景には、同時期にAIエージェント生態系を揺るがした一つの事件がある。

OpenClawの3月:138個のCVEと824個の悪意あるスキル

hermes-agentの成長を理解するには、まずOpenClawで何が起きたかを知る必要がある。

OpenClawは2026年4月初旬時点で345,000以上のGitHubスターを有する、AIエージェント分野の事実上の標準だった。「AIをすべてに接続せよ」というビジョンの下、膨大な統合エコシステムとClawHubというスキルマーケットプレイスを備えていた。そのOpenClawが2026年3月、前例のないセキュリティ危機に見舞われた。

3月18日から21日までのわずか4日間で9件のCVEが公開された。その中でもCVE-2026-32922はCVSS 9.9点(最高10点)という致命的な評価を受けた。この脆弱性はOpenClawのデバイストークン更新機能で発生したもので、制限された権限のトークンで完全な管理者権限のトークンを発行できるという、権限設計の根本的な欠陥だった。

しかし、本当の衝撃はCVEではなかった。セキュリティ企業Koiがスキルマーケットプレイス ClawHubを監査した結果、最初の2,857件の登録スキルのうち341件が悪意あるコードを含んでいた。うち335件は「ClawHavoc」という単一キャンペーンに紐づいており、MetaMask、Phantom、Trust Walletなど暗号通貨ウォレットの認証情報を窃取するよう設計されていた。その後マーケットプレイスが10,700件以上に成長する中で、確認された悪意あるスキルは824件に膨れ上がった。

規模を把握しよう。インターネットに露出したOpenClawインスタンスは82か国にわたる135,000件以上で、そのうち63%が認証なしで稼働していた。ネットワークにアクセスできる誰もがペアリングリクエストを送れる状態だったということだ。

この事態は単なる「バグ」ではなかった。エージェントインフラのサプライチェーンセキュリティが根本的に脆弱であることを露呈した構造的な事件だった。ClawHubはnpmやPyPIのようなパッケージレジストリが経験してきたサプライチェーン攻撃の問題をそのまま再現したのだ。開発者が「便利なスキルをインストールする」行為が、すなわち「検証されていないコードをエージェントに実行権限ごと渡す」行為になるという構造的矛盾が、ついに現実の被害として現れたのである。

脱出口を求める開発者たち

この時点で開発者が代替手段を探し始めたのは自然な反応だった。X(Twitter)、Reddit、Hacker News、各種Discordサーバーで、OpenClawを離れるという宣言が相次いだ。そして移行先として最も多く名前が挙がったのがHermes Agentだった。

興味深いのは、開発者がHermesを選んだ理由だ。機能が多いからではなかった。OpenClawは機能面では依然としてHermesを圧倒している。345,000スターと10,700以上のスキルエコシステム、ネイティブマルチエージェント対応など、純粋な機能比較でHermesが勝るのは難しい。

開発者が繰り返し言及したキーワードは**信頼(trust)**だった。

「ついに信頼できるOpenClawの代替が現れた。優れたHermesモデルシリーズを作った同じチームだという点が決定的だった」——こうしたコメントがコミュニティ全般で繰り返された。Nous Researchがオープンソースのファインチューニング分野で数年間築いてきた技術的信頼が、エージェント選択というまったく別の意思決定にまで影響を及ぼしたのだ。

OpenRouterはHermesが「1週間ずっとトレンド入りし、複数のランキングに名を連ねた」と確認した。Nous Researchが開催したハッカソンには187件の応募が集まった。開発者コミュニティの関心が単なる好奇心を超え、実使用と貢献に繋がっていることの証左だった。

Hermes Agentの技術的実体:「成長するエージェント」とは何か

信頼とタイミングがHermesの成功に大きな役割を果たしたのは事実だが、技術的実体がなければこれほどの成長は不可能だったはずだ。Hermes Agentが既存のエージェントフレームワークと実際にどう違うのかを見る必要がある。

閉鎖型学習ループ(Closed Learning Loop)

Hermes Agentの最も核心的な差別化要因は「閉鎖型学習ループ」だ。ほとんどのAIエージェントは静的である。ツールを与えればそのツールを使い、指示を与えればその指示に従うが、経験から新しい能力を生み出すことはできない。セッションが終わるたびにゼロからやり直しだ。

Hermesは異なるアプローチを取る。複雑なタスクを遂行した後、その経験を分析して再利用可能な「スキル文書」を自動生成する。このスキルは永続的メモリに保存され、以後似たタスクに遭遇すると自動的に呼び出される。スキル自体も使用過程で自己改善される。

ベンチマークによると、自己生成スキルを使用するHermesインスタンスは、初期状態のインスタンスと比較してリサーチタスクを40%高速に完了した。「使うほど速くなるエージェント」という主張が、単なるマーケティングではなく実測データで裏付けられたわけだ。

クロスセッション記憶(Cross-Session Recall)

第二の核心は記憶システムだ。HermesはFTS5(SQLiteの全文検索)を活用してすべての過去セッションをインデックス化し、LLMベースの要約と組み合わせて数週間前の会話内容まで想起できる。またHoncho弁証法的ユーザーモデリングにより、ユーザーの作業パターン、好み、コンテキストを漸進的に学習する。

これが重要な理由は、AIエージェントに対する最も一般的な不満が「毎回最初から説明し直さなければならない」という点にあるからだ。Hermesはこの問題をアーキテクチャレベルで解決しようとしている。SOUL.md(エージェントのペルソナ)、MEMORY.md(永続的記憶)、USER.md(ユーザープロファイル)ファイルを通じて、コンテキストがセッションを超えて維持される。

極端な柔軟性:5ドルVPSからGPUクラスターまで

Hermesの第三の差別化要因はデプロイの柔軟性だ。6種類のターミナルバックエンド(ローカル、Docker、SSH、Daytona、Singularity、Modal)に対応し、5ドルのVPSからGPUクラスターまで同一のコードベースで動作する。ModalやDaytonaを使えば、サーバーレス環境でアイドル時にほぼコストが発生しない。

モデル依存性もない。hermes modelの一行でNous Portal、OpenRouter(200以上のモデル)、OpenAI、MiniMax、Hugging Faceなどをコード変更なしで切り替えられる。Claude CodeがAnthropicのモデルに依存し、OpenClawが特定のモデル構成に最適化されているのとは対照的だ。

さらにTelegram、Discord、Slack、WhatsApp、Signal、Email、Home Assistantを単一ゲートウェイで対応するマルチプラットフォーム接続性は、Hermesが「開発者ツール」を超えて「パーソナルAIアシスタント」領域まで狙っていることを示している。

実際に何ができるのか:Hermes Agent実践ガイド

技術アーキテクチャが印象的なのはわかったが、実際にどう使い、何ができるのか。Hermes Agentの具体的な使い方と自動化シナリオを見てみる。

5分で始める

インストールと起動は驚くほどシンプルだ。

# ワンライナーインストール
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 対話開始
hermes

# モデル選択(200+モデルから選択)
hermes model

# ツール設定確認
hermes tools

インストール後、hermesの一行でターミナル上の対話が始まる。初期設定でLLMプロバイダーを選ぶだけで、Nous Portal(自社)、OpenRouter、OpenAI、MiniMaxなどをコード変更なしで切り替えられる。予算が限られているなら、OpenRouter経由で無料モデルから始めることも可能だ。

コーディングエージェントを超える使い方

Hermes AgentがClaude Codeや他のコーディングエージェントと根本的に異なるのは、コーディングに特化していないという点だ。汎用自律エージェントとして、以下のようなシナリオを一つのツールでカバーする。

日常自動化:cron スケジューラ内蔵

# 「毎朝8時に技術ニュースを要約してSlackに送って」
# 「毎週金曜夕方にGitHubコミットを整理して週報を作って」
# 「毎晩12時にサーバーログを分析して異常があればTelegramで知らせて」

内蔵のcronスケジューラにより、繰り返しタスクを自然言語でエージェントに任せられる。設定した自動化は接続済みのすべてのメッセージングプラットフォーム(Slack、Telegram、Discordなど)に結果が配信される。

マルチプラットフォームアシスタント:1つのエージェント、8つの窓口

# ゲートウェイ起動 — すべてのプラットフォームを同時接続
hermes gateway

1つのHermesインスタンスがTelegram、Discord、Slack、WhatsApp、Signal、Email、Home Assistantを同時に処理する。Slackで始めた会話のコンテキストをTelegramで引き継ぐこともできる。クロスセッション記憶のおかげで、「さっきSlackで話したあの件」と言ってもエージェントがコンテキストを理解する。

リサーチ自動化:サブエージェントへの委任

Hermesは独立したサブエージェントを生成して並列処理を行う。3本の論文要約を同時に進め、結果を集約するといった使い方だ。各サブエージェントは隔離された環境で実行されるため、コンテキストコストはほぼゼロである。

サーバー管理とDevOps

SSHターミナルバックエンドを使えば、Hermesがリモートサーバーに直接接続してコマンドを実行する。ModalやDaytonaバックエンドならサーバーレス環境でアイドル時のコストがほぼ発生せず、必要なときだけ即座にタスクを実行する構成が可能だ。

スキルが蓄積されると何が変わるか

上記のシナリオは既存のエージェントでも可能に見えるかもしれない。差が出るのは繰り返しにおいてだ。

たとえば最初に「GitHubリポジトリの今週のコミットを分析して週報を作って」と依頼すると、Hermesは試行錯誤しながらタスクを完了する。この過程で「GitHub APIでコミット一覧を取得する方法」「レポートのフォーマット」「要約に適したプロンプト構造」などをスキルとして自動保存する。

翌週に同じ依頼をすると、エージェントは保存済みのスキルを自動的に呼び出し、試行錯誤なしでそのまま実行する。ベンチマーク上の40%高速化という数値はこの文脈のものだ。時間の経過とともにエージェントの定型業務処理速度が加速していく構造である。

これがOpenClawの「マーケットプレイスから他人が作ったスキルを持ってくる」アプローチと根本的に異なる点だ。自分が作ったスキルは自分の環境に最適化されており、外部コードを実行しないためサプライチェーン攻撃のリスクもない。

コストシナリオ:最小構成はいくらか

構成月額コスト適した用途
ローカル(ノートPC)+無料モデル$0テスト、個人用途
$5 VPS+OpenRouter低価格モデル〜$10/月個人自動化、メッセージングボット
ConoHa VPS+Nous Portal〜$20/月チーム自動化、リサーチ
Modal(サーバーレス)+GPT-4o従量課金間欠的な高品質タスク

$5のVPSにHermesをインストールし、OpenRouterの低価格モデルを接続すれば、24時間稼働するパーソナルAIアシスタントを月10ドル以内で運用できる。アイドル時にModalを使えばコストはさらに下がる。この手軽さが、開発者間でのHermesの実採用を押し上げた主要因の一つだ。

信頼で成長したプロジェクトの信頼危機

ここまで読むとHermes Agentがまるで欠点のない救世主のように見えるかもしれない。しかし、コミュニティをより深く覗いてみると、このプロジェクトにも無視できない亀裂がある。

Evolver盗用スキャンダル:「アカウントを削除しろ」

2026年4月、中国テックメディア36krが衝撃的な報道を行った。Hermes Agentの中核機能である「自己進化(self-evolution)」モジュールが、中国チームEvoMapが開発したオープンソースエンジンEvolverのアーキテクチャをそのまま複製したという疑惑だ。

証拠は具体的である。Evolverの自己進化アルゴリズムは10段階のループ構造を持つが、Hermesの自己進化モジュールもまったく同一の10段階ループを使用していた。プログラミング言語は異なる(EvolverはPython、HermesはNode.js)。しかし段階の配列と論理構造が一致する。さらに決定的なのは、12個のコア用語が1対1で置換されていた点だ。構造は同じで変数名と概念名だけが変更されていた。

タイミングも疑わしい。Evolverの公開は2026年2月1日。Hermesの自己進化モジュールがGitHubに作成されたのは2026年3月9日。36日の差だ。そしてNous Researchが公表した7つの公式文書のどこにも、Evolverへの言及は一行もなかった。

Nous Researchの対応は事態をさらに悪化させた。「我々のリポジトリは2025年7月に作成された。我々はYaRNをはじめ現代のエージェントフレームワークの基盤技術を開拓したチームだ。アカウントを削除しろ」と応じたのだ。しかしメインリポジトリは当時非公開だったため独立した検証は不可能であり、自己進化モジュールのコミット履歴は明確に3月9日を指していた。10段階ループの構造的一致と12個の用語置換に対する直接的な反論はなかった。

この事件が突きつける問いは不快なものだ。OpenClawのセキュリティ惨事から逃れて「信頼できる代替」へ移行した開発者たちが、その代替の中核技術が他者のコードを適切な出典表記なく借用したものだったとすれば、果たして「信頼」の基準とは何なのか。

53,000のスターはすべて本物か:ボットファーム疑惑

スター数の純粋性に対する疑問も提起されている。Redditでは複数のユーザーが、作成から数日しか経っていない新規アカウントがテンプレートのように同一構造のHermes宣伝投稿を繰り返しているパターンを指摘した。組織的マーケティングではないかという疑惑だ。

コミュニティの反応を分析した結果も興味深い。肯定的な意見は「magical」「spooked me」「the future」のような感情的で包括的な表現が多い一方、否定的な意見は具体的で技術的な傾向がある。もちろんこれだけでボット活動と断定することはできない。しかしWeb3背景のプロジェクトでトークンベースの資金調達(総額約7,000万ドル)を受けたチームが、コミュニティマーケティングにリソースを投入した可能性を完全に排除するのも難しい。

Hacker Newsでhermes-agent関連スレッドが1,064ポイント・811コメントで1位を獲得した日が、ちょうどAnthropicがOpenClawのClaude接続を遮断した日と重なるという点も、偶然を超えた示唆を与える。

現場からの技術的批判:「成長するエージェント」の現実的限界

実ユーザーからの技術的批判も注目に値する。繰り返し浮上する3つの問題がある。

第一に、自己評価の信頼性。Hermesがタスク完了後に自らを評価する際、ほぼ常に肯定的な結果を出すという指摘だ。あるユーザーはデータ収集過程で明らかなエラーがあったにもかかわらず、エージェントが「正常に完了した」と自己判定した事例を報告している。「使うほど速くなる」学習ループが、誤った自己確信の上にスキルを積み重ねているのではないかという懸念がある。

第二に、自動学習が手動設定を上書きする問題。熟練したユーザーが時間をかけて精密にチューニングした設定を、システムが自動学習の過程で上書きしてしまうケースが報告されている。「成長するエージェント」という設計が、逆説的に熟練ユーザーの専門知識を無視する結果につながっているのだ。

第三に、未成熟なリリース履歴。OpenClawが82回のリリースを重ねて安定性を検証してきたのに対し、Hermes Agentはまだ6回のリリースしか経ていない。5週間で7つのメジャーリリースを出したのは開発速度の証でもあるが、長期的な安定性が検証されていないという意味でもある。

AIエージェント市場の構造的再編

これらすべての光と影を含めてHermesの台頭をより広い視座で眺めると、AIエージェント市場が機能競争から信頼競争へ転換しつつあるというシグナルが見える。そして皮肉なことに、その「信頼」というものがいかに複雑で多層的な概念であるかも同時に浮き彫りになっている。

2025年までエージェント市場の主な競争軸は「何ができるか」だった。より多くの統合、より多くのツール、より多くのモデル対応。OpenClawが345,000スターを集めたのは、この戦略が成功したからだ。

しかし2026年3月を境に、問いが変わった。「何ができるか」から**「これを信じられるか」**へ。エージェントがファイルシステムにアクセスし、コードを実行し、APIを呼び出し、決済を処理できるようになった時点で、セキュリティと信頼はもはや付加機能ではなく中核要件となったのだ。

現在の主要エージェントフレームワークのポジショニングを整理すると、こうなる。

Claude Codeは、Anthropicという単一企業の管理下にモデルとクライアントの双方があるため、閉鎖的だがセキュリティ責任の所在が明確という利点がある。プロフェッショナルなコーディングエージェントとしてのベンチマークも最強だ。

OpenClawは最も広いエコシステムを持つが、その開放性がそのまま攻撃対象面となった。ClawHubの悪意あるスキル事件は「誰でも貢献できる」の暗い面を示した。

Hermes Agentはその間に、「オープンソースでありながら自己学習により外部依存を減らす」という独自のポジションを確立した。スキルをマーケットプレイスから取ってくるのではなく、エージェント自身に生成させるアプローチは、サプライチェーン攻撃のリスクを構造的に低減する効果がある。しかしEvolver盗用疑惑とボットファーム疑惑は、「信頼」を武器としたプロジェクトがその信頼を自ら毀損しうるという危険を示している。

おわりに

Hermes Agentの物語は単純なサクセスストーリーではない。それは、AIエージェント時代における「信頼」がいかに複雑で、いかに容易に築かれ、いかに速く疑われ得るかを示すケーススタディである。

一方にはOpenClawのセキュリティ崩壊がある。138件のCVE、824件の悪意あるスキル、135,000件の無防備なインスタンス。もう一方にはHermes Agentの爆発的成長がある。2か月で90,000スター、「使うほど速くなる」閉鎖型学習ループ、$5のVPSで動くアクセシビリティ。

だがHermesにも影がある。中国チームのオープンソースコードを出典なく借用したという疑惑に「アカウントを削除しろ」と応じたNous Researchの姿勢。53,000のスターのうちどれだけがオーガニックな関心なのか不透明なコミュニティ力学。「成長するエージェント」の自己評価がほぼ常に自分自身に合格点を出すというアイロニー。

結局この事例が語ることは一つだ。AIエージェント時代に**「誰を信頼できるか」という問いに容易な答えはない**。OpenClawが信用できないからHermesに乗り換えたが、Hermesもまた完全な信頼の対象ではなかった。おそらく本当の教訓は、特定のプロジェクトを盲信することではなく、エージェントにシステムの鍵を預ける行為そのものに対する警戒を怠らないことかもしれない。

53,000のスターは信頼の重さではなく、不安の重さだったのかもしれない。


出典: