Anthropic Research로 살펴보는 General-Purpose Agent로의 진화

Agentic AI 구축/Agentic AI 트렌드

Anthropic Research로 살펴보는 General-Purpose Agent로의 진화

gksyb4235 2026. 1. 26. 15:54

AI Agent 연구의 핵심 트렌드

최근 AI Agent 연구의 흐름은 크게 두 가지 방향으로 수렴하고 있다.

첫째는 다양한 작업을 하나의 에이전트가 수행할 수 있는 General Agent의 등장이다.

둘째는 단일 질의에 응답하는 수준을 넘어, 더 긴 시간 동안 상태를 유지하며 지속적으로 작동하는 에이전트로의 진화다.

이 글에서는 이 중 General Purpose Agent의 관점에서 최근 공개된 대표적인 사례와 그로부터 도출되는 설계 원칙을 정리한다.

특히 Anthropic의 Research 기능 구축 과정에서 공유된 교훈은, 현재 AI Agent 연구가 어디로 향하고 있는지를 잘 보여준다.

최근 AI 에이전트 시장에서는 Anthropic의 Claude Code가 단순한 개발 도구를 넘어 General Purpose Agent로 확장되며 주목을 받고 있다. Anthropic은 이를 재브랜딩한 Cowork를 통해 코딩뿐 아니라 문서 작성, 리서치, 프레젠테이션 제작 등 비개발 업무까지 아우르며 기업 사용자 저변을 빠르게 넓히고 있다.

이러한 흐름은 에이전트를 실제 업무 단위로 투입하려는 엔터프라이즈 수요가 본격화되고 있음을 보여준다.

시에 Meta가 범용 AI 에이전트 기업 Manus를 인수한 사례는, 범용 에이전트가 차세대 핵심 플랫폼으로 부상하고 있음을 단적으로 드러낸다.

범용 에이전트의 대표 사례: Anthropic Research

https://www.anthropic.com/engineering/multi-agent-research-system

Anthropic은 2025년 7월, Claude에 Research 기능을 도입하면서 실제 프로덕션 환경에서 다중 에이전트 시스템을 운영하며 얻은 엔지니어링 경험과 교훈을 공개했다. 이 Research 기능은 웹 검색, Google Workspace, 다양한 외부 도구를 결합해 복잡한 연구 질의를 수행하는 General Purpose Agent 시스템이다.

핵심은 Single Model이 모든 작업을 수행하는 구조가 아니라, 하나의 주 Agent가 연구 전략을 수립하고 다수의 sub-agent를 병렬로 생성해 탐색을 수행하는 Multi-Agent 아키텍처에 있다. 이 구조는 Prototype 단계를 넘어 Production 수준으로 확장되면서, 아키텍처 설계, 도구 호출 방식, 프롬프트 엔지니어링 전반에 중요한 시사점을 남겼다.

왜 General Purpose Agent에 Multi Agent가 적합한가?

General한 Task의 본질은 예측 불가능성에 있다.

어떤 단계를 거쳐야 할지 사전에 완전히 정의할 수 없고, 조사 과정에서 드러나는 단서에 따라 탐색 경로가 계속 바뀐다.

이러한 특성 때문에 연구는 고정된 파이프라인이나 단발성 추론으로 처리하기 어렵다.

Multi Agent 시스템은 이러한 문제에 자연스럽게 부합한다. 여러 Sub Agent가 각자 독립적인 Context Window를 가지고 병렬로 탐색을 수행함으로써, 하나의 관점에 갇히지 않고 폭넓은 탐색을 가능하게 한다.

이후 중요한 정보만을 주 에이전트로 압축해 전달함으로써, 핵심인 ‘정보 압축’을 효과적으로 수행한다.

Anthropic의 내부 평가에 따르면, Claude Opus 4를 주 에이전트로 하고 Claude Sonnet 4를 서브에이전트로 구성한 다중 에이전트 시스템은 단일 Claude Opus 4 대비 약 90% 이상의 성능 향상을 보였다. 특히 여러 독립적인 탐색 경로를 동시에 추적해야 하는 개방형 연구 질의에서 차이가 두드러졌다.

Anthropic은 다중 에이전트 시스템의 성능 향상을 단순히 “더 똑똑한 협업”으로 설명하지 않는다.

분석 결과, 성능 분산의 대부분은 토큰 사용량, 도구 호출 횟수, 모델 선택이라는 세 가지 요인으로 설명되었다.

단일 에이전트는 하나의 컨텍스트 윈도우라는 물리적 한계에 묶이지만, 다중 에이전트는 독립적인 컨텍스트를 병렬로 활용함으로써 사실상 토큰 예산을 확장한다. 이는 단일 에이전트로는 처리하기 어려운 정보량과 탐색 깊이를 가능하게 한다.

물론 이때 비용은 급격히 증가한다는 한계가 있다.

일반적인 채팅 대비 에이전트 기반 상호작용은 약 4배, 다중 에이전트 시스템은 약 15배의 토큰을 소모한다.

따라서 이러한 아키텍처는 고부가가치 연구 과업에 선택적으로 적용되어야 하며, 모든 도메인에 적합한 만능 해법은 아니다.

Anthropic의 Research 시스템 아키텍처 개요

Anthropic Research는 오케스트레이터–워커 패턴을 기반으로 한다.

사용자의 질의는 주 Agent에 전달되고, 주 Agent는 이를 분석해 여러 전문화된 Sub Agent를 생성한다.

각 Sub Agent는 검색 도구를 반복적으로 사용하며 특정 관점에서 정보를 수집하고, 그 결과를 주 Agent에게 반환한다.

(예시 : 2025년의 AI 에이전트 기업에 대한 정보를 수집하고, 그 결과로 기업 목록을 주 에이전트에게 반환하여 최종 답변을 종합)

이 과정은 단발성 검색이 아닌 다단계 동적 탐색이라는 점에서 기존 RAG와 구별된다.

새로운 정보를 발견하면 전략을 수정하고, 필요하다면 추가 Sub Agent를 생성하며 탐색을 확장한다.

충분한 정보가 수집되면, Citation Agent가 개입해 모든 주장에 대한 출처를 정리하고 최종 결과를 생성한다.

다음은 다중 에이전트 Research 시스템의 전체 워크플로를 보여주는 프로세스 다이어그램이다.

사용자가 질의를 제출하면, 시스템은 반복적인 연구 과정을 수행하는 LeadResearcher 에이전트를 생성.
LeadResearcher는 먼저 접근 방식을 숙고하고, Context를 유지하기 위해 그 계획을 Memory에 저장.
(이는 Context Window가 200,000 토큰을 초과할 경우 내용이 잘릴 수 있기 때문에, 계획을 보존하는 것이 중요하기 때문)
이후 LeadResearcher는 특정 연구 과제를 가진 전문화된 Sub Agent들을 생성한다
각 Sub Agent는 독립적으로 웹 검색을 수행하고, 사고 과정을 도구 사용과 교차시키며 결과를 평가한 뒤, 그 발견 내용을 LeadResearcher에게 반환한다.
LeadResearcher는 이러한 결과를 종합하고 추가적인 연구가 필요한지를 판단한다.
필요하다면 새로운 서브에이전트를 생성하거나 전략을 수정할 수 있다.
충분한 정보가 수집되면, 시스템은 연구 루프를 종료하고 모든 결과를 CitationAgent에게 전달한다.
CitationAgent는 문서와 연구 보고서를 처리해 인용이 필요한 구체적인 위치를 식별함으로써,
모든 주장들이 출처에 정확히 귀속되도록 보장한다.

이렇게 인용이 포함된 최종 연구 결과가 사용자에게 반환된다.

Full Research 자료: https://www.anthropic.com/engineering/multi-agent-research-system

How we built our multi-agent research system

On the the engineering challenges and lessons learned from building Claude's Research system

www.anthropic.com

저작자표시 비영리 변경금지 (새창열림)

'Agentic AI 구축 > Agentic AI 트렌드' 카테고리의 다른 글

Context Isolation 관점에서 본 Multi-Agent 구조의 한계와 Sub Agent Delegation (0)	2026.01.27
Context를 효과적으로 설계해야 하는 이유 (Context Offloading) (0)	2026.01.27
Context Management의 중요성 (긴 Context는 반드시 실패한다) (0)	2026.01.27
AI Agent Architecture에서 Planning이 중요해진 이유 (0)	2026.01.26
작업의 길이 관점에서 본 AI Agent (METR Evaluation) (0)	2026.01.26

현재글Anthropic Research로 살펴보는 General-Purpose Agent로의 진화

ybin's

gksyb4235 님의 블로그 입니다.

Openness, Baetyl, AWS IoT Greengrass, OAI nrUE, Systemic Bias, Network Slicing, FlexRIC, Azure IoT Edge, OAI CN5G, RSRP Prediction, O-RAN Testbed, ns3 oran, O-RAN, Google Coral TPU, KT uCloud Edge, LSTM, RobustScaler, Disaggregation, srsRAN, OpenAirInterface,

Today :
Yesterday :

ybin's