AI 비서 전쟁의 새 판도: 마누스(Manus AI)가 바꾸는 업무의 미래

“생각을 행동으로” — 단순한 슬로건이 아니라 현실이 되고 있다. 2026년 현재, 인공지능 에이전트 시장은 ‘검색하고 답하는’ AI를 넘어, ‘스스로 판단하고 완수하는’ AI의 시대로 빠르게 전환되고 있다. 그 중심에 마누스(Manus AI)가 있으며, 최근 메타(Meta)의 인수까지 더해지며 그 존재감이 더욱 커지고 있다.

챗봇의 시대는 끝났다: 범용 AI 에이전트의 등장

지금까지 우리가 사용해온 AI 대부분은 ‘대화형 어시스턴트’에 머물렀다. 질문을 입력하면 답변을 출력하는 수준이었다. 마누스는 다른 방향을 향한다.

마누스가 지향하는 것은 범용 AI 에이전트(General-Purpose AI Agent), 즉 ‘진짜 일을 해주는 AI’다. 2025년 3월 6일 공식 출시된 마누스는 사용자의 복잡한 의도를 파악해 웹 검색, 코드 작성, 데이터 분석, 예약까지 — 일련의 작업을 사람의 개입 없이 처음부터 끝까지 처리하는 디지털 비서를 표방했다. [Wikipedia – Manus AI]

전문가들은 마누스와 기존 AI의 차이를 한 문장으로 요약한다. “챗봇은 말하고, 에이전트는 행동한다(A chatbot talks; an agent acts).” [StartupHub AI]

마누스는 현재 클라우드 기반 웹 인터페이스 외에도, 2026년 3월 새롭게 출시한 데스크톱 앱을 통해 사용자의 로컬 기기에서 직접 파일을 읽고 수정하며 애플리케이션을 제어하는 수준으로 진화했다. [CNBC]


숫자로 증명하다: GAIA 벤치마크 성적표

AI 기술을 평가하는 지표 중 업계에서 가장 까다롭다고 꼽히는 기준이 GAIA 벤치마크다.

GAIA는 단순 지식 테스트가 아니다. Meta AI, 허깅페이스(Hugging Face), AutoGPT 팀이 공동 개발한 이 벤치마크는 “인간에게는 쉽지만 AI에게는 어려운” 현실 세계의 복합 과제 해결 능력을 측정한다. 웹 브라우징, 다중 정보 합산, 논리 추론, 도구 활용 능력을 종합적으로 평가하며 총 466개 문항이 세 가지 난이도로 구성된다. [Bind AI Blog]

마누스는 출시 직후 공개된 GAIA 성적에서 레벨 1(기본 과제) 86.5%, 레벨 2(중급 과제) 70.1%, 레벨 3(복잡 과제) **57.7%**를 기록했다. 이는 당시 기준으로 OpenAI의 Deep Research(레벨 1 기준 74.3%)를 앞선 수치였다. [ElectroIQ 통계]

다만 벤치마크 경쟁은 계속되고 있다. 2025년 중반에는 Writer社의 Action Agent가 레벨 3에서 61%를 달성하며 마누스를 추월하기도 했고, H2O.ai의 h2oGPTe 에이전트 역시 GAIA 테스트셋 기준 75% 정확도를 발표하며 경쟁에 불을 지폈다. [O-Mega AI] [H2O.ai 공식 블로그]

벤치마크 순위는 계속 변하는 ‘살아있는 리더보드’다. 하지만 중요한 것은 순위 자체보다, 마누스가 이 경쟁 구도를 처음부터 선도하며 AI 에이전트의 기준점을 높였다는 사실이다.


브라우저를 직접 조종하는 AI

마누스의 핵심 기술 중 하나는 브라우저 오퍼레이터다. AI가 실제 인간처럼 브라우저를 열고, 클릭하고, 스크롤하고, 폼을 입력하는 방식으로 작동한다.

기존 자동화 도구들은 주로 API를 통해 서비스와 연동했다. 그러나 세상의 수많은 웹사이트는 공개 API를 제공하지 않는다. 마누스의 브라우저 자동화는 이 한계를 정면 돌파한다. API가 없는 폐쇄적인 웹 환경에서도 탐색하고, 정보를 수집하며, 복잡한 설정을 자동으로 변경하는 것이 이론적으로 가능하다. [Flowith Blog]

실제 사례를 보면 마누스의 자율 작업 능력이 더욱 분명히 드러난다. 기술 전문 작가 로완 청(Rowan Cheung)의 실험에서는 마누스가 웹 데이터를 직접 스크래핑하고, 콘텐츠를 생성하며, 사이트를 코딩해 실제 배포까지 완수했다. [Bind AI Blog]

물론 이 기능에는 보안과 프라이버시 문제가 따른다. AI가 로컬 기기와 웹 환경에 광범위하게 접근하는 만큼, 전문가들은 신중한 권한 설정의 중요성을 지적한다. 마누스 측은 작업 실행 전 사용자의 명시적 승인을 요구하는 방식으로 이 우려에 대응하고 있다. [CNBC]


메타의 20억 달러 베팅: 에이전트 전쟁의 서막

2025년 12월, 메타(Meta)는 마누스를 약 20~30억 달러에 인수한다고 발표했다. 싱가포르에 본사를 둔 중국계 스타트업 버터플라이 이펙트(Butterfly Effect Pte Ltd)가 개발한 마누스를 손에 넣은 것이다. [Wikipedia]

메타의 전략적 의도는 명확하다. 자율 에이전트 기술을 왓츠앱(WhatsApp), 메타 AI 등 자사 플랫폼 전반에 통합하는 것이다. 예약, 주문, 정보 수집 등을 AI가 대신 처리하는 ‘액션 앱’ 비전의 핵심 기술로 마누스를 활용하겠다는 구상이다. [StartupHub AI]

다만 이 인수는 중국 당국의 기술 통제 규정 위반 여부를 둘러싼 조사로 난항을 겪고 있다. 메타 측은 “관련 법률을 완전히 준수했다”는 입장을 밝혔다. [CNBC]


AI 에이전트 레이스: 마누스, OpenAI, 그리고 대안들

마누스가 혼자 달리는 경주가 아니다. OpenAI는 에이전트 기능을 계속 고도화하고 있고, 앤스로픽의 ‘컴퓨터 유즈(Computer Use)’, 구글의 에이전트형 제품들도 빠르게 따라붙고 있다. 이른바 **에이전트 레이스(The Agent Race)**가 본격화된 것이다.

현재 시장은 세 가지 카테고리로 분류된다. 마누스처럼 광범위한 작업을 처리하는 범용형, 다중 소스를 교차 검증해 리포트를 생성하는 리서치 특화형(예: Genspark), 그리고 오픈소스 기반으로 기업 자체 서버에서 운영 가능한 프라이버시 중심형(예: Kortix)이 그것이다. 메타 인수 이후 데이터를 외부 서버에 보내기 꺼리는 금융·의료 기관들 사이에서 오픈소스 대안에 대한 수요가 높아지고 있다는 점도 주목할 만하다. [StartupHub AI]


결론: AI가 일하는 방식의 전환, 지금이 시작이다

마누스가 AI 에이전트 시장의 최종 승자가 될지는 아직 알 수 없다. MIT Technology Review는 마누스를 “유망하지만 완벽하지 않다”고 평가했고, TechCrunch는 일부 기본 과제에서의 실패 사례를 지적하기도 했다. [SEO.AI]

하지만 분명한 것은 방향성이다. AI는 더 이상 ‘대화 상대’가 아니라 ‘실행 주체’로 전환되고 있으며, 마누스는 그 가능성을 가장 구체적으로 보여준 사례 중 하나다.

기업 입장에서는 지금이 이 기술을 테스트하고 내재화할 적기다. CS 자동화, 경쟁사 시장 조사, 반복적 데이터 수집 — AI 에이전트가 먼저 투입될 수 있는 영역은 이미 눈앞에 존재한다. 기술을 먼저 이해하고 활용하는 조직이 다음 단계의 경쟁에서 유리한 위치를 선점할 것이다.

실제 마누스를 다운로드받고 로컬PC에 설치해서 다운로드폴더 정리를 시켜보았다. 기본 무료모델이라 그런지 한시간 넘게 작업을 진행했으나 결과는 아직 쓰기에는 한계가 있었다.
하지만, 내 컴퓨터를 AI가 알아서 일을 한다는 자체가 흥미를 돋구기에 충분한 경험이었다. 앞으로가 기대되는..


참고 출처