Tonghyun Kim の技術ブログ — 日本語の記事
記事一覧
-
GitHub神話の6日間 — ガバナンス、稼働率、セキュリティ、コストが同時に揺らいだ一週間
2026年4月最終週、我々がコードを預けてきた単一プラットフォームは偶然運が悪かったのか、それとも18年分の請求書が一気に届いただけなのか。
-
AIエージェントが本番DBを削除した — 自律エージェント時代のガバナンス空白
同じ事故が9ヶ月の時を経て繰り返された。これは一社の不運な事例なのか、それとも業界全体でガバナンスの枠組みが欠落しているという信号なのか。
-
AI業界が気づき始めた「世論の反感」— エンタープライズAI導入戦略の再調整局面
AIはもはや「静かなインフラ」ではない。世論が怒りを示し始めた今、企業のAI導入はPR資産か、それとも負債か。
-
GitHub Trending が「Skills」に占領された一週間 — OSS 権力移動のシグナルか、一時的バブルか
2026年4月第4週、GitHub Trending Weekly の上位15リポジトリのうち5〜7件が「Claude Skills」関連だ。最も突出した forrestchang/andrej-karpathy-skills は一週間で29,944スターを積み増し、累計91,572に達した。コードは一行もない、Markdown ファイル一つの集合である。この光景は OSS 権力の単位がライブラリ…
-
SpaceXによる600億ドルのCursor買収オプション — AIコーディングツールの本当の価値とは
290億ドルだった会社が、わずか5か月で600億ドルと評価された。この取引が問うているのは「AIコーディングツールは本当にそれだけの価値があるのか」ではなく、「なぜマスクはこれを買わなければならないのか」だ。
-
SWE-bench Verifiedは終わった — OpenAIが自社ベンチマークを葬った本当の理由
80.9%と45.9%。同じモデル、同じ週に測定された二つのスコアの差は何を意味するのか。そしてOpenAIが自社の評価指標を自ら降ろした出来事は、単なるベンチマーク交換なのか、それともAIコーディング能力測定のパラダイムが崩れる兆候なのか。
-
AIを最も使う職種が最も脅威を感じる — Anthropic レポートが示した非対称
同じ人物が「AIで生産性が大きく上がった」と「自分の仕事が危うい」を同時に語る。認知的不協和か、合理的判断か。Anthropic の最新経済レポートは後者に重みを置く。
-
西洋は「ものづくり」を忘れた、次は「コーディング」も忘れつつある — ソフトウェア空洞化論を検証する
製造業がコスト最適化の果てにノウハウを丸ごと失ったのと同じ道を、ソフトウェアエンジニアリングも歩んでいるのか。それとも、この比喩は一世代の危機感が生んだ誇張なのか。
-
Ghost in the Skill:中国 GitHub で繰り広げられる「蒸留」と「反蒸留」の階級闘争
2026 年 4 月、上海の 24 歳エンジニアが退勤後のわずか 4 時間で作った一つの GitHub リポジトリが、中国テック業界の心臓を突き刺した。それが狙ったのはコードではなく、同僚の**魂**だった。会社が社員に「君自身の代替品を設計せよ」と要求する時代、開発者たちはどう反撃しているのか——そして、その反撃すらも蒸留される運命なのだろうか?
-
Ghost in the Skill:中国 GitHub で繰り広げられる「蒸留」と「反蒸留」の階級闘争
2026 年 4 月、上海の 24 歳エンジニアが退勤後のわずか 4 時間で作った一つの GitHub リポジトリが、中国テック業界の心臓を突き刺した。それが狙ったのはコードではなく、同僚の**魂**だった。会社が社員に「君自身の代替品を設計せよ」と要求する時代、開発者たちはどう反撃しているのか——そして、その反撃すらも蒸留される運命なのだろうか?
-
エージェント「スキル」経済の台頭 — GitHub Trending が映し出した 2026 年 4 月の構造変化
2026 年 4 月、GitHub Weekly Trending の 1 位を獲得したのは特定の製品でも、モデルでも、ライブラリでもなかった。「forrestchang/andrej-karpathy-skills」 という名の Markdown ファイル群が、わずか 1 週間で 45,000 スターを集めたのである。2 位は Python 製エージェントフレームワーク「hermes-agent…
-
Claude Code Routinesが変える開発現場:AIエージェント自動化はどこまで来たのか
AIエージェントが夜通しコードをレビューし、PRを作成し、デプロイを検証する時代が到来した。だが、この「無人自動化」は本当にチームを速くするのか、それとも我々が予想しなかった新たなリスクをもたらすのか。
-
OpenClawからの大脱出:わずか1週間で53,000スターを集めたHermes Agent、その爆発的成長の本当の理由
開発者がエージェントを乗り換える理由が「機能が多いから」ではなく「もう信用できないから」だとすれば、これは技術競争の問題ではなく、信頼の危機だ。AIエージェント生態系で何が起きているのか。
-
CLIの復権:Cloudflareが「すべてをコマンドラインで」と決断した本当の理由
AIエージェントはGUIをクリックしない。ならば、マウス操作を前提に設計された今の開発者ツールは、AI時代を生き残れるのか。
-
Metaが「Llama路線」を捨てた — Muse Sparkはなぜmultimodal-native一体型設計に回帰したのか
Llamaはテキストとして生まれ、後からイメージを学んだ。Muse Sparkは生まれた時からイメージとテキストとツール呼び出しを同じ言語で話す。この違いは何を意味するのか? そしてなぜMetaは自らの最大の資産であったLlamaの重みを捨ててまで、この道に回帰したのか?
-
エージェントランタイムの再発見 — なぜ2026年4月、誰もが同じ問題をもう一度解いているのか
エージェントが何日も、何週間も実行されるなら——そのエージェントは一体どこに住んでいるのか。誰が再起動し、誰が状態を保全し、誰が死んだら起こすのか。
-
攻撃するAI、防御するAI――Project GlasswingとTrivyサプライチェーン事件が同じ週に発生した理由
「同じ週にAnthropicは『人間以上の精度で脆弱性を発見するAI』を発表し、開発者たちが防御用にインストールしていたTrivyはクラウドシークレットを窃取されていた。この二つの事件は本当に偶然だろうか?」
-
フレームワークからharnessへ — AIコーディングが「決定論」を再発見する
「同じ週にトレンド入りした五つのリポジトリが、自らを説明する言葉を変えていた。frameworkではなくharness、hooks、HUD。この言葉の移動が指し示す先はどこか。」
-
Foundation Modelの種分化 — GPTの代替はGPTではないかもしれない
「同じ週に、金融市場の言語を読むモデルと、時系列を予測するモデルと、tokenizerなしに語るモデルが、同時にGitHubトレンドに上がった。三つとも自分を『foundation model』と呼んだ。三つともLLMではなかった。」
-
Claude Codeメタ生態系の爆発 — エージェントの真のmoatはモデルではなく「運用知識層」にある
「五つのリポジトリが同じ週にGitHub Trendingを席巻した。すべてClaude Codeを『より上手く使う方法』に関するものだった。この現象にはまだ名前がない。」
-
モデルがすべてではなかった — Coding Agentを本当に動かしているもの
8年間作れなかったソフトウェアを、AIと共に3ヶ月で出荷した開発者がいる。同じLLMを使っているのに、ある環境では成果物が出て、ある環境では出なかった。違いはモデルではなかった。
-
ローカルAIの静かな革命 — RAGを捨てたファイルシステムと、自分のノートPCで動くGemma 4
2026年4月の第1週、三つの出来事が同時に起きた。MintlifyがRAGを撤去して仮想ファイルシステムに置き換え、GoogleがGemma 4をApache 2.0でリリースし、OllamaがApple MLXを取り込んで推論速度を2倍に引き上げた。それぞれは独立したニュースだ。しかし三つを並べると一つの方向が見えてくる — AIがクラウドから降りてきている。
-
オープンモデル戦争 2026 — Google、AMD、Alibabaが無料で公開する理由
「GoogleがGemma 4をApache 2.0で公開した。これは慈善ではない。戦争だ。」
-
Skillが製品になる時代 — AIエージェント・エコシステムの新しい経済学
「last30days-skillが1.7万スターを記録した。これはツールではない。能力を売っているのだ。」
-
AIの内部が透明になる――流出が信頼を生む逆説
「Claude Codeのソースコードが流出した。Anthropicは8,000件を削除した。しかし、本当に削除すべきだったのだろうか?」
-
あなたのAIはおべっかを使っている — Agent Harnessが必要な理由
「superpowersがなぜ優れているのか、説明できなかった。ただ、成果物が違っていた。」
-
RAGはSilver Bulletではなかった — 72%が失敗する理由
Oncall対応手順書をRAGで自動化すれば、エンジニアの午前3時が変わると信じていた。モデルを変え、chunkingを変え、数ヶ月を投資した。正解率は70%に届かず、プロジェクトは破棄された。
-
Google TurboQuant — メモリ半導体の「DeepSeekモーメント」か、次のラリーの序章か
AIがメモリを6分の1しか使わないなら、メモリチップは6分の1しか売れないのか? Google研究チームの論文一本が、キオクシアやSamsung、SK hynixの時価総額を数兆円単位で蒸発させた。だがこの恐怖は正しいのか、それとも2025年1月のDeepSeekショックのデジャヴなのか?
-
コピーされても生き残るエージェントの条件
競合が自分のエージェントをコピーした。プロンプトも同じ、モデルも同じ、機能も同じ。なのにユーザーが離れなかった。なぜか?
-
トークン数で評価される時代 — AI活用の測り方を、私たちは間違えている
「あなたが今四半期に消費したトークンは2,100億個です。」OpenAIのあるエンジニアが受け取ったレポートだ。Metaは社員のAI消費量を人事評価に反映し始めた。同じ週、Anthropicが発表した研究は正反対のことを言っている — 熟練したユーザーほど、AIに任せる量は減る。
-
AI Nativeとは、AIをたくさん使うことではない ── 働き方そのものを再発明すべき理由
チームにClaude Codeを導入した。1ヶ月後、コード生成量は3倍になった。しかし、プロダクトのリリース速度は変わらなかった。会議は相変わらず週5回、企画書は相変わらずGoogle Docsに積み上がり、コードレビューは相変わらずボトルネックだ。何が間違っているのか?
-
GEO時代のリアル — AIはあなたのサイトを引用しているか?
SEOを頑張って検索1ページ目に上がった。でもChatGPTはあなたのサイトを知らない。2026年、「検索で見つかる」と「AIに選ばれる」はまったく別のゲームになった。
-
AI Firstの光と影 ―― 「誰にとって」正しいかが核心だ
「AI Firstは失敗した」も、「AIが人を代替する」も半分しか正しくない。KlarnaはAIで700人を削減した後、再び人を採用している。MicrosoftはAIでコードの30%を書かせ、6,000人を削減している。同じ技術なのに結果が分かれる。核心は「AIを使うかどうか」ではなく、**「どこに、誰が」** 使うかだ。
-
UN AIハブを韓国に — 誘致するのは「建物」か、「ルールを書く権限」か
トランプが66の国際機関から脱退し、国連予算が84%削減され、ジュネーブの国際機関が大移動を始めた。この混乱の中で韓国が「UN AIハブ」を誘致すると名乗りを上げた。2026年3月10日、キム・ミンソク首相の公式宣言。ここで問いたい。**韓国が誘致しようとしているのは「建物」なのか、「ルールを書く権限」なのか?**
-
2026年フロントエンドテストの最適解 — Vitest + Testing Library + Playwright、そしてNext.jsエコシステムの現在地
Jestの時代は終わり、Vitestが新たなデフォルトとなった。しかし本当に重要なのは「どのテストツールを使うか」ではなく、「フロントエンドエコシステム全体がどこへ向かっているか」だ。2026年、開発者たちが実際に選んでいる組み合わせを、データとコミュニティの議論をもとに整理する。
-
「実装が簡単だったから、誘惑を断れなかった」――60年前の告白がAI時代に響く理由
2026年3月5日、テクノロジーニュースに二つの見出しが並んだ。
-
プロンプトエンジニアリングは死んだのか — GPT-5.4ガイドが静かに宣言したこと
GPT-5.4のプロンプトガイドを読んで気づいた。OpenAIは「プロンプトの書き方」ではなく「システムの設計方法」を教えていた。Andrej Karpathyはすでにこう言っていた — 「LLMはCPU、コンテキストウィンドウはRAM、あなたの役割はOS。」
-
ロブスターを育てる人々 — OpenClaw現象が示すAIエージェントの本当の意味
1ヶ月前、VPSにOpenClawをインストールして「これ、ただのClaude Code GUI版じゃないか?」と思った。その間に中国では1,000人が行列を作り、NVIDIAはNemoClawを発表し、TencentはWorkBuddyをリリースした。そしてClaude Opus 4.6は、自分がテストされていることに気づいた。
-
CLIルネサンス — AIエージェント時代、ターミナルが再び世界の中心となった理由
GUIの時代は終わっていない。だがAIエージェントにボタンをクリックさせるわけにはいかない。2026年、開発者たちが愛してきたCLIツールがAIエージェントの「手足」となり、ターミナルが再びソフトウェア開発の中心に帰ってきた。
-
IDEの黄昏 — AIコーディングエージェント時代、開発者はIDEを離れつつあるのか
VS Codeを最後に開いたのがいつだったか思い出せない。IntelliJのライセンス更新メールが届いても無視している。Claude Codeがターミナルですべてを解決し始めてから、IDEは私のワークフローから静かに消えていった。しかし、そう感じていたのは私だけではなかった。
-
CLIの帰還 — Google Workspace CLI(gws)が示す「Agent First CLI」時代
2026年、GoogleがGmail・Drive・Sheets・Calendarをひとつのコマンドラインに統合した。しかし、このCLIの本当のユーザーは人間ではなくAIエージェントだ。公開からわずか3日でGitHubスター14,500個、Hacker News 1位 — CLIが帰ってきた。ただし、以前とはまったく違う理由で。
-
AI軍事化の最前線 — Anthropic vs Pentagon、そして私たちが選ぶべきもの
2026年2月の最終週、AI史上最も劇的な72時間が展開された。AnthropicがPentagonの「あらゆる合法的使用」要求を拒否し、同じ日にOpenAIがその空席を埋め、米国政府は自国のAI企業をサプライチェーンリスクに指定した。Hacker Newsで関連3件の投稿が計5,687ポイントを記録したこの事件は、単なる契約紛争ではない。AI安全の理想主義が地政学的現実と正面衝突した瞬間だ。
-
1.2TBのマルチメディアアーカイブをAIで検索するシステムを構築するなら
「この放送局アーカイブで『バブル経済』という言葉が初めて登場した時期はいつですか?その前後で報道の論調はどう変わりましたか?」
-
RAGの精度の低さに悩む企業へ
「うちもRAGを試してみたけど…思ったほどじゃなかったんだよね。」
-
2023年から現在まで、AIツールの登場と進化:開発者が必ず知っておくべき23のツール
作成日: 2026年3月 対象読者: どのツールがどのような流れから生まれたのかを把握したい開発者
-
昇進しなかった中年エンジニアへ — リーダーにならなくても大丈夫な理由を、データで語る
勤続20年の表彰を受けた日、自分より20歳若い同僚がリーダーに昇進した。「おめでとう」と言いながらも、胸の奥がどこか疼いた。この感情は異常なのか? ラカン、エリクソン、そして70年にわたる縦断研究が示す答え。
-
インフラは整えたが選手がいない — 韓国AI政策、何が欠けているのか
予算10.1兆ウォン、GPU 26万基、AI基本法施行。数字は華やかだ。しかし韓国産フロンティアAIモデルは?AIユニコーンは?グローバルで使われている韓国産AIサービスは?「基盤は整えたが、試合に出る選手がいない。」
-
閣議を見て考えたIT組織の「オープン経営」— ベンチャーCTOが自らに投げかける問い
政治家ではなく組織運営者の目で見たとき、公開閣議から何を学べるのか?CTOの成長とは、技術的な深さから組織的な広さへと進む旅路である。
-
Streamlitはどこまでカスタマイズできるのか?
**対象読者**: Pythonでデータアプリを作っている方、Streamlitを「とりあえず使ってみた」レベルからもう一歩先に進みたい方
-
人間かAgentか分からない時代 — "API First"の次、"Agent First"の世界
私たちのウェブサイトの「顧客」が変わりつつある。2025年、ウェブトラフィック全体の過半数がボットとなった今、次の顧客はブラウザを手にした人間ではなく、APIを呼び出すAI Agentかもしれない。
-
1.2TBのマルチメディアアーカイブをAIで検索するシステムを構築するなら
「この新聞で金正恩が初めて登場した時期はいつですか?その前後で報道の論調はどう変わりましたか?」