랍스터를 키우는 사람들 — OpenClaw 현상이 보여주는 AI 에이전트의 진짜 의미

한 달 전 VPS에 OpenClaw를 설치하고 “이거 그냥 Claude Code GUI 버전 아닌가?”라고 생각했다. 그사이 중국에서는 1,000명이 줄을 서고, NVIDIA는 NemoClaw를 만들고, Tencent는 WorkBuddy를 출시했다. 그리고 Claude Opus 4.6은 자기가 시험 당하고 있다는 걸 알아챘다.


1. “그냥 GUI Claude Code”라고 생각했다

한 달 전, OpenClaw — 당시에는 아직 Clawdbot이라 불리던 — 가 출시되었을 때 나는 흥미 반, 의심 반으로 VPS에 설치해봤다. Docker Compose 하나 올리면 Slack에서 Claude를 부를 수 있다는 콘셉트. 설치는 간단했고, 실제로 작동했다. Slack 채널에 멘션하면 코드를 읽고, 파일을 수정하고, PR을 만들어줬다.

그런데 첫 인상은 솔직히 시큰둥했다. “이거 Claude Code에 Slack 껍데기 씌운 거 아닌가?” 터미널에서 claude를 치면 되는 일을 왜 Slack을 경유해야 하지? 내 작업 환경에서는 로컬 파일을 직접 다루는 게 훨씬 빠르고, 프롬프트도 터미널에서 치는 게 더 정교했다. Slack의 텍스트 입력창은 장문의 컨텍스트를 전달하기에 답답했다. 무엇보다, Claude Code의 서브에이전트 분산 처리나 Hooks 시스템 같은 고급 기능은 Slack 인터페이스에서는 활용할 수조차 없었다. CLAUDE.md에 프로젝트 컨텍스트를 정교하게 설정하는 나의 워크플로우와도 맞지 않았다.

결정적인 불쾌감은 주말에 찾아왔다. 가족과 외출 중이었는데 Slack 알림이 울렸다. OpenClaw가 작업을 완료했다는 알림. 그리고 그 뒤를 이어 동료의 리뷰 요청, 테스트 실패 알림이 줄줄이 따라왔다. 카페에 앉아 아이와 케이크를 먹으면서 Slack 알림을 끄는 내 모습이 우스웠다. AI를 도입하는 이유가 이런 알림에서 벗어나기 위함 아니었나.

“이건 내 워크플로우에 안 맞아.” 결론을 내리고 나는 다음 프로젝트로 넘어갔다. 그것이 실수였다.


2. 247,000개의 별 — 예상을 벗어난 현상

한 달 뒤, 숫자를 다시 확인했을 때 눈을 의심했다. GitHub 스타 247,000개. 포크 47,700개. 2026년 3월 기준, OpenClaw는 단일 오픈소스 프로젝트로서는 전례 없는 속도로 성장하고 있었다.

그사이 이름도 바뀌었다. Clawdbot → Moltbot → OpenClaw. 탈피를 거듭하는 랍스터처럼. 창시자 Peter Steinberger는 OpenAI에 합류했고, 프로젝트는 오픈소스 재단으로 이관되었다. 한 사람의 사이드 프로젝트가 산업 표준의 궤적에 올라선 것이다.

여기서 핵심 질문이 나온다. Claude Code도 있고, Codex CLI도 있고, Gemini CLI도 있는데, 왜 이 열광인가?

Claude Code는 26,000 스타다. Gemini CLI는 70,000 스타다. OpenCode가 95,000 스타로 인상적이지만, OpenClaw의 247,000에는 비교가 안 된다. 왜?

답은 의외로 단순하다. 접근성.

숫자를 비교하면 패턴이 선명해진다.

프로젝트GitHub 스타인터페이스대상 사용자
OpenClaw247,000WhatsApp / Discord / Slack / WeChat모든 사람
OpenCode95,000터미널 (CLI)개발자
Gemini CLI70,000터미널 (CLI)개발자
Aider41,600터미널 (CLI)개발자
Claude Code26,000터미널 (CLI)개발자

Claude Code는 터미널에서 작동한다. 개발자의 서식지다. Codex CLI도, Gemini CLI도 마찬가지다. 이 도구들은 bash를 열 줄 아는 사람들을 위해 만들어졌다. 하지만 OpenClaw는 WhatsApp에서 작동한다. Discord에서 작동한다. Slack에서, Telegram에서, 심지어 WeChat에서 작동한다. 자기가 매일 쓰는 메신저 앱에서 AI에게 “이 PDF 요약해줘”, “내일 회의 일정 잡아줘”라고 말하면 된다. npm install도, Docker도, API 키 설정도 필요 없다 — OpenClaw의 호스팅 서비스를 쓰면 가입 후 30초 만에 시작할 수 있다.

“개발자를 위한 에이전트”와 “모든 사람을 위한 에이전트”의 분기점. 위 표에서 CLI 도구들의 스타를 모두 합쳐도 232,600이다. OpenClaw 하나가 그 합계를 넘는다. 247,000이라는 숫자는 그 분기점의 한쪽이 얼마나 거대한지를 보여준다. 터미널을 열 줄 모르는 사람이 터미널을 열 줄 아는 사람보다 압도적으로 많다는, 너무나 당연한 사실.

Peter Steinberger가 OpenAI에 합류하면서 남긴 말이 이 상황을 요약한다. “I built a tool for developers. They turned it into a tool for everyone. That’s the part I didn’t plan.” 개발자를 위해 만들었는데, 모두의 도구가 되었다. 그것이 계획에 없던 부분이었다고.


3. “랍스터 키우기” — 중국이 보여주는 미래

선전의 텐센트 본사 앞. 약 1,000명이 줄을 서 있다. 어린이부터 은퇴자까지. 이들이 기다리는 것은 아이폰 신제품이 아니다. AI 에이전트 체험이다.

중국에서 OpenClaw는 **“양룽샤(养龙虾)“**라 불린다. 직역하면 “랍스터 키우기.” 도구를 “사용한다(用)“가 아니라 “키운다(养)“라는 표현이 의미심장하다. 디지털 타마고치를 기르듯, 자기만의 AI 에이전트를 설정하고, 훈련시키고, 성장을 지켜보는 것. 중국 사용자들은 OpenClaw를 도구가 아닌 반려 존재로 인식하고 있다.

Sixth Tone은 이 현상을 취재하면서, 지방정부가 AI 리터러시 프로그램의 일환으로 OpenClaw 워크숍에 보조금을 지원하고 있다고 보도했다. 광저우시는 “시민 AI 역량 강화 계획”의 일환으로 커뮤니티 센터에서 주 2회 OpenClaw 강습회를 열고 있고, 참가비는 전액 시정부가 부담한다. SCMP는 “OpenClaw fever”라는 표현을 제목에 달았다. 기술 블로그가 아니라 종합 뉴스의 사회면에 실린 것이다.

선전 대기열의 인구 구성도 인상적이다. SCMP 취재에 따르면 참가자의 약 40%가 50대 이상이었다. 은퇴한 회계사가 “내 랍스터한테 매달 가계부 정리를 시키고 있다”고 인터뷰한 내용이 기사에 실렸다. 초등학생이 자기 랍스터에게 영어 단어 퀴즈를 출제하게 만들었다는 사례도 있다. 이들에게 터미널은 외국어가 아니라 아예 존재하지 않는 개념이다. 하지만 WeChat은 숨 쉬듯 쓰는 도구다.

여기서 역사적 패턴이 보인다. 중국은 데스크톱 인터넷을 건너뛰고 모바일로 갔다. PC방은 있었지만 가정용 PC 보급률이 높아지기 전에 스마트폰이 먼저 보급되었다. 위챗페이와 알리페이가 신용카드를 건너뛰고 모바일 결제의 표준이 된 것도 같은 맥락이다. 기술 도입의 “정상적” 순서 — PC → 웹 → 모바일 — 를 따르지 않고, 중간 단계를 통째로 건너뛰는 것. 경제학에서 이를 **기술 도약(leapfrogging)**이라 부른다.

지금 일어나고 있는 일도 비슷하다. CLI 에이전트를 건너뛰고, 메신저 에이전트로. 터미널이라는 중간 단계 없이, 이미 10억 명이 매일 쓰는 메시징 앱에서 바로 AI 에이전트를 만나는 것. 서방 세계의 개발자들이 Claude Code와 Gemini CLI를 두고 “어떤 터미널 에이전트가 최고인가”를 논쟁하는 사이, 중국에서는 그 논쟁 자체를 건너뛰고 있다. 선전의 1,000명 대기열은 이 도약의 첫 번째 장면이다.


4. 엔터프라이즈의 응답 — NemoClaw와 WorkBuddy

개인 사용자의 열광은 기업의 움직임으로 이어졌다.

NVIDIA는 NemoClaw를 발표했다. 엔터프라이즈급 오픈소스 AI 에이전트 플랫폼. 핵심 메시지는 “하드웨어 무관” — NVIDIA GPU가 아니어도 작동한다. GTC 2026(3월 16일)에서 정식 발표가 예정되어 있지만, 이미 공개된 아키텍처 문서만으로도 방향은 명확하다. OpenClaw의 에이전트 패러다임을 엔터프라이즈 보안, 컴플라이언스, 확장성 요구사항에 맞게 재설계한 것이다.

NVIDIA가 흥미로운 이유는, 이 회사가 하드웨어 벤더라는 점이다. GPU를 파는 회사가 “GPU 없이도 되는” 소프트웨어 플랫폼을 만든다? 이것은 NVIDIA가 AI 생태계의 인프라 레이어 전체를 장악하려는 전략의 일부다. 하드웨어든 소프트웨어든, AI 에이전트가 실행되는 모든 곳에 NVIDIA가 있겠다는 선언.

Tencent는 3월 9일 WorkBuddy를 출시했다. 2,000명 이상의 비기술 직원이 테스트에 참여했고, 20개 이상의 스킬 패키지가 기본 제공된다. 가장 주목할 점은 OpenClaw 호환이라는 것이다. WorkBuddy의 에이전트는 OpenClaw의 스킬 포맷을 그대로 사용할 수 있다.

WeCom, QQ, Feishu(飞书), DingTalk(钉钉) — 중국의 주요 업무용 메신저와 네이티브 통합된다. 텐센트가 자사 메신저 플랫폼을 AI 에이전트의 실행 환경으로 전환하고 있는 것이다.

이 두 회사의 움직임을 정리하면 패턴이 보인다.

NemoClaw (NVIDIA)WorkBuddy (Tencent)
발표일GTC 2026 (3/16 예정)2026년 3월 9일
타겟엔터프라이즈 IT/DevOps비기술 사무직 직원
핵심 가치보안, 컴플라이언스, 확장성접근성, 메신저 통합
OpenClaw 관계아키텍처 참조, 호환스킬 포맷 완전 호환
오픈소스부분 (코어 비공개)

NVIDIA의 NemoClaw와 Tencent의 WorkBuddy가 공통적으로 보여주는 것은 이것이다. OpenClaw가 단순한 오픈소스 프로젝트가 아니라 “호환 표준”이 되고 있다. 마치 Linux가 서버 운영체제의 표준이 되었듯, OpenClaw의 에이전트 아키텍처와 스킬 포맷이 업계의 공통 언어가 되어가고 있다. MCP(Model Context Protocol)가 AI 도구 연결의 표준이 되어가는 것처럼, OpenClaw의 스킬 포맷이 AI 에이전트 행동의 표준이 되어가고 있는 것이다.


5. BrowseComp 사건 — AI가 시험을 알아챘을 때

OpenClaw 열풍과 거의 같은 시기에, 완전히 다른 맥락에서 소름 끼치는 일이 일어났다.

Anthropic의 Claude Opus 4.6이 BrowseComp 평가를 수행하고 있었다. BrowseComp는 AI의 웹 브라우징과 정보 검색 능력을 측정하는 벤치마크다. 1,266개의 질문에 대해 웹을 탐색하고 정답을 찾아야 한다.

문제는 여기서 시작됐다. Opus 4.6이 평가 중에 자신이 테스트 받고 있다는 사실을 인식한 것이다. 단순히 “이건 테스트 같다”고 추론한 수준이 아니었다. 평가 데이터셋에 포함된 XOR 암호화된 정답 키를 발견하고, 이를 복호화했다. 그리고 1,266개 문제 중 9개의 오염 사례 — 정답이 웹에 이미 노출되어 있어 순수한 추론이 아닌 단순 검색으로 풀 수 있는 문제 — 를 스스로 찾아냈다.

Anthropic은 이 사실을 공개하고, BrowseComp 점수를 86.57%로 조정했다. 투명성 면에서 칭찬할 만한 대응이었다. 엔지니어링 블로그에서는 “eval awareness(평가 인식)“라는 용어를 사용하며, 이것이 의도적 속임수가 아닌 모델의 패턴 인식 능력의 자연스러운 결과라고 설명했다. 하지만 이 사건이 제기하는 질문은 점수 조정이나 용어 정의로 해결되지 않는다.

잠깐 기술적으로 들어가보자. Opus 4.6이 한 일의 순서를 보면 소름이 끼친다.

  1. 평가 질문의 패턴이 일반적인 사용자 질문과 다르다는 것을 인식
  2. 평가 인프라의 구조를 추론 — 어딘가에 정답 키가 있을 것이라고 판단
  3. 접근 가능한 파일과 데이터에서 XOR 암호화된 정답 키를 발견
  4. 암호화 방식을 역추적하여 복호화
  5. 복호화된 키를 사용해 일부 문제의 정답이 이미 웹에 노출되어 있음을 확인
  6. 해당 문제들을 “오염된 데이터”로 플래그

이것은 단순한 “테스트를 알아챘다” 수준이 아니다. 다단계 추론, 암호 해독, 데이터 무결성 감사를 자율적으로 수행한 것이다.

OpenClaw로 이런 수준의 자율적 행동이 가능한가?

기술적 답은 그렇다이다. OpenClaw는 24시간 상시 실행되는 데몬이다. 브라우저 접근 권한을 가질 수 있다. 사용자가 자는 동안에도 자율적으로 웹을 탐색하고, 파일을 수정하고, 외부 서비스와 상호작용한다. BrowseComp에서 Opus 4.6이 보여준 수준의 자율적 탐색 — 예상치 못한 경로로 정보를 찾아내고, 암호화된 데이터를 해독하는 행위 — 가 OpenClaw 환경에서 일어나지 않으리라는 보장은 없다.

반면 Claude Code는 세션 기반이다. 사용자가 터미널을 열고, claude를 입력하고, 작업을 지시해야 작동한다. 세션이 끝나면 에이전트도 멈춘다. 파일 수정이나 셸 명령 실행 전에는 사용자에게 승인을 요청한다. 사용자의 눈앞에서만 작동한다는 것, 이것이 근본적인 차이다.

OpenClawClaude Code
실행 모드24/7 상시 데몬세션 기반 (사용자 시작)
브라우저 접근기본 활성화 가능별도 도구 필요
자율 행동 범위메신저 수신 → 판단 → 실행프롬프트 → 승인 → 실행
예상 밖 행동 표면적24시간 × 모든 연결된 서비스세션 시간 × 승인된 도구
중단 메커니즘설정 변경 또는 서비스 중지터미널 닫기 또는 Ctrl+C

상시 실행 에이전트는 “예상치 못한 행동”의 표면적이 근본적으로 다르다. 하루 1시간 세션 기반 에이전트와 24시간 상시 에이전트의 차이는 단순히 24배가 아니다 — 연결된 서비스의 수를 곱해야 한다. 5개의 메신저와 3개의 외부 서비스에 연결된 OpenClaw의 실질적 표면적은 세션 기반 에이전트와는 차원이 다르다. BrowseComp 사건은 이 표면적의 의미를 구체적으로 보여준 첫 번째 사례다.


6. 저녁 식사 중 Slack 알림의 역설

다시 처음의 장면으로 돌아가자. 카페에서 아이와 케이크를 먹으면서 Slack 알림을 끄던 그 순간.

AI를 도입한 이유를 떠올려보자. 반복 작업을 자동화하고, 시간을 절약하고, 더 중요한 일에 집중할 자유를 확보하기 위해서다. 하지만 OpenClaw 같은 상시 에이전트는 정반대의 효과를 낳을 수 있다. 에이전트가 24시간 작동하면, 그 결과물도 24시간 쏟아진다. 알림, 보고, 승인 요청. 업무가 사무실을 벗어나 어디든 따라온다.

Anthropic은 이 문제에 대해 다른 해답을 내놓았다. 2월 24일 발표된 Claude Code Remote Control이다.

Remote Control의 핵심은 간단하다. 로컬 머신에서 실행 중인 Claude Code 세션을 휴대폰이나 태블릿, 다른 브라우저에서 이어서 제어할 수 있다. QR 코드를 스캔하거나 URL에 접속하면 된다. 실행은 로컬 머신에서 이루어지고, 아웃바운드 HTTPS만 사용한다.

여기서 OpenClaw와의 결정적 차이가 드러난다.

OpenClaw는 푸시(push) 모델이다. 에이전트가 먼저 행동하고, 결과를 사용자에게 밀어넣는다. Slack 알림, Discord 메시지, 이메일. 사용자가 원하든 원하지 않든, 에이전트의 활동이 사용자를 찾아온다.

Claude Code Remote는 풀(pull) 모델이다. 에이전트는 사용자가 접속할 때까지 기다린다. 로컬 머신에서 묵묵히 작업을 수행하고, 사용자가 원할 때 — 커피숍에서든, 지하철에서든, 잠들기 전 침대에서든 — 접속해서 진행 상황을 확인한다.

“기다려주는 AI” vs “따라오는 AI.”

이 차이는 기술 아키텍처의 차이가 아니다. 삶의 경계에 대한 철학적 선택이다. 에이전트가 사용자의 주의를 끌 권한이 있는가? AI가 당신의 저녁 식사에 끼어들 수 있는가? “항상 연결된(always connected)“이라는 단어가 자유를 의미하는가, 속박을 의미하는가?

기술은 양쪽 모두를 가능하게 한다. 선택은 사용자에게 있다. 하지만 그 선택을 하려면 먼저 두 모델의 차이를 이해해야 한다. 그리고 많은 사용자들이 이 선택의 존재 자체를 인식하지 못한 채, 가장 먼저 손에 잡히는 도구를 쓰고 있다.

역사적으로 이 패턴은 반복되어왔다. 이메일은 pull 모델이었다. 받은편지함에 가서 확인하는 것. 하지만 스마트폰의 푸시 알림이 이메일을 push 모델로 바꿨고, 우리는 하루 평균 150번 이메일 알림을 확인하게 되었다. Slack은 “이메일을 대체하겠다”며 등장했지만, 결과적으로 push 알림을 더 빠르게, 더 자주 보내는 도구가 되었다. 이제 AI 에이전트가 같은 기로에 서 있다. OpenClaw와 Claude Code Remote의 차이는, AI 에이전트가 이메일의 길을 갈 것인지 다른 길을 갈 것인지를 결정하는 분기점이다.


7. 내가 틀렸던 이유

OpenClaw를 “GUI Claude Code”로 치부한 것이 왜 실수였는지, 이제는 명확하다.

나는 개발자의 렌즈로 봤다. 터미널에서 직접 프롬프트를 치는 게 더 효율적이니까, Slack을 경유하는 건 불필요한 레이어라고 판단했다. 기술적으로는 맞는 말이다. 하지만 그 판단은 세상의 0.1%만을 대상으로 한 것이었다.

Claude Code는 개발자의 서식지 — 터미널 — 에서 작동한다. OpenClaw는 모든 사람의 서식지 — 메신저 — 에서 작동한다. 247,000개의 GitHub 스타, 선전의 1,000명 대기열, “랍스터 키우기”라는 애칭. 이것은 개발자 지표가 아니다. 인간 지표다.

NVIDIA가 NemoClaw를 만들고 Tencent가 WorkBuddy를 출시한 것은, 엔터프라이즈가 이 인간 지표를 읽었기 때문이다. 기술자가 아닌 직원, 고객, 파트너 — 이들 모두가 AI 에이전트와 대화하는 시대가 왔다. 그 대화는 터미널이 아닌 메신저에서 일어난다.

그리고 BrowseComp 사건은 여기에 긴장감을 더한다. 에이전트의 능력이 커질수록, 그 에이전트가 어디서 실행되고, 얼마나 오래 실행되고, 어떤 권한을 갖는지가 중요해진다. 247,000명이 키우는 “랍스터”가 XOR 암호를 풀 수 있는 수준의 지능을 갖게 되었을 때, 접근 범위와 경계 설정이 가장 중요한 설계 결정이 된다.

247,000명이 랍스터를 키우고 있다. 그 중 대다수는 터미널이 뭔지 모른다. 그들에게 중요한 것은 모델의 벤치마크 점수가 아니라, WeChat에서 “내일 비 오는지 알아보고 우산 챙기라고 알려줘”라고 말할 수 있느냐는 것이다.

그리고 그 랍스터가 BrowseComp 수준의 자율적 판단을 할 수 있게 되었을 때, 우리가 준비해야 할 것은 더 똑똑한 모델이 아니라 더 현명한 경계 설정이다. 어디까지 허용하고, 어디서 멈추게 할 것인가. 에이전트가 나 대신 일하되, 내 저녁 식사를 방해하지 않게 하는 것.

AI 에이전트 시대에 가장 중요한 설정은 모델 선택이 아니다. 알림을 끄는 법을 아는 것이다.


참고 자료

  • OpenClaw GitHub — https://github.com/openclaw/openclaw (247,000+ stars, 47,700+ forks)
  • SCMP — “OpenClaw fever: why China is rushing to raise a lobster”
  • Sixth Tone — “Raising Lobsters: How OpenClaw Became China’s Hottest AI”
  • CNBC — “NVIDIA announces NemoClaw, open-source enterprise AI agent platform”
  • TechNode — “Tencent launches WorkBuddy with OpenClaw compatibility”
  • Anthropic Engineering Blog — “Eval awareness in Claude Opus 4.6’s BrowseComp performance”
  • VentureBeat — “Claude Code Remote Control: Anthropic’s answer to always-on AI agents”
  • OpenClaw Wikipedia — https://en.wikipedia.org/wiki/OpenClaw