🔬 과학자를 위한 AI 연구 환경, Claude Science 정식 출시

Anthropic이 과학 연구자들을 위한 전용 AI 워크벤치(workbench) Claude Science를 공개했습니다. 기존 Claude 서비스의 연장선이 아닌, 연구 현장에서 실제로 쓰이는 도구들을 하나의 환경으로 통합한 독립적인 연구 플랫폼입니다. 2025년 가을 생명과학 분야에 첫발을 내딛은 이후 약 9개월 만에 나온 가장 큰 규모의 확장으로, 현재 베타(beta) 버전으로 제공되고 있습니다.

왜 지금, 왜 과학자인가

과학 연구의 일상은 생각보다 훨씬 파편화되어 있습니다. 연구자들은 PubMed에서 논문을 찾고, Jupyter Notebook으로 데이터를 분석하고, R로 통계를 돌리고, HPC(고성능 컴퓨팅) 클러스터 터미널에서 작업을 제출하는 과정을 하루에도 수십 번 반복합니다. 각 데이터베이스는 저마다의 스키마(schema)와 쿼리 언어를 갖고 있어, 정작 연구 자체보다 도구를 다루는 데 더 많은 시간이 소요되는 경우도 적지 않습니다. Claude Science는 이 모든 흐름을 단일 환경 안으로 끌어들이는 것을 목표로 합니다.

통합 에이전트 구조와 60개 이상의 스킬

Claude Science의 핵심은 조율 에이전트(coordinating agent) 구조입니다. 사용자는 하나의 범용 에이전트와 대화하지만, 그 뒤에서는 유전체학(genomics), 단일세포(single-cell), 단백질체학(proteomics), 구조생물학(structural biology), 화학정보학(cheminformatics) 등 각 분야에 특화된 60개 이상의 스킬과 커넥터(connector)가 작동합니다. 필요에 따라 에이전트가 하위 에이전트(sub-agent)를 생성하거나 사용자가 직접 만든 전문 에이전트와 연동할 수도 있습니다. 별도의 리뷰어 에이전트(reviewer agent)는 인용 오류, 추적 불가능한 수치, 코드와 불일치하는 그래프를 자동으로 감지하고 수정합니다.

재현 가능한 과학적 아티팩트

Claude Science가 그래프나 원고(manuscript)를 생성할 때는 해당 결과물을 만든 정확한 코드와 실행 환경, 생성 과정에 대한 자연어 설명, 전체 메시지 히스토리가 함께 저장됩니다. 3D 단백질 구조, 게놈 브라우저 트랙(genome browser track), 화학 구조식 등 시각적으로 복잡한 결과물도 네이티브로 렌더링(rendering)됩니다. 수개월 후에도 동일한 결과를 재현하거나 검증할 수 있는 감사 가능한(auditable) 이력이 자동으로 남는다는 점은, 재현성(reproducibility) 위기가 오랫동안 지적되어 온 과학계에서 의미 있는 접근입니다.

컴퓨팅 자원 관리의 자동화

단백질 폴딩이나 대규모 유전체 파이프라인처럼 무거운 분석은 연구자가 직접 클러스터 작업을 설정하고 결과를 확인하는 반복 작업을 요구합니다. Claude Science는 이 과정을 대신 처리합니다. 분석 계획을 초안으로 제시하고, 새로운 컴퓨팅 자원에 접근하기 전에 사용자의 확인을 구하며, 기존 HPC 클러스터(SSH 연결)나 Modal 계정을 통한 온디맨드(on-demand) GPU를 활용해 단일 GPU에서 수백 개까지 규모를 자동으로 조절합니다. 대용량·민감 데이터는 연구실 인프라 밖으로 나가지 않으며, 각 분석 단계에 필요한 컨텍스트(context)만 Claude에 전송됩니다.

실제 연구자들의 사용 사례

베타 기간 동안 실제 연구자들이 이미 의미 있는 결과를 만들어냈습니다. 조직 표적 의약품을 개발하는 Manifold Bio는 Claude Science를 활용해 수백 개의 표적 후보를 표면 발현, 세포 내 이동, 안전성 기준으로 평가하고 순위를 매겼습니다. 일반 코딩 어시스턴트와 달리 데이터 수집부터 판단까지 엔드투엔드(end-to-end)로 처리할 수 있었다는 점을 핵심 차별점으로 꼽았습니다.

Allen Institute의 신경과학자 Jérôme Lecoq는 20여 개의 커스텀 스킬로 구성된 멀티 에이전트 리뷰 파이프라인을 구축했습니다. 수천 편의 논문에서 핵심 주장과 정량적 결과를 추출하고, 섹션별로 전담 에이전트가 리뷰를 작성하며, 액터-크리틱(actor-critic) 쌍 구조로 정확성과 인용 충실도를 검증합니다. 이전에는 2년이 걸리던 리뷰 작성이 이제 100페이지 이상의 리뷰 10편을 동시에 진행할 수 있는 수준이 됐습니다.

UCSF 뇌종양 센터의 역학자 Stephen Francis 교수는 신경교종(glioma) 연구에서 Claude Science를 도입한 후 분석 시간이 기존의 약 10분의 1 수준으로 줄었다고 밝혔으며, 독립적인 검증을 통해 결과의 신뢰성도 확인했습니다.

시작 방법과 지원 프로그램

Claude Science 앱은 macOS와 Linux에서 Pro, Max, Team, Enterprise 플랜 사용자에게 베타로 제공됩니다. Team 및 Enterprise 사용자는 관리자가 기능을 활성화해야 하며, 학술 기관 및 비영리 연구 기관의 연구실을 위한 할인 Team 플랜도 별도로 운영됩니다. 또한 최대 50개의 연구 프로젝트에 최대 3만 달러 상당의 크레딧을 지원하는 'AI for Science' 프로그램을 운영하며, Modal은 선정 프로젝트에 최대 2,000달러의 컴퓨팅 자원을 추가 지원합니다. 신청은 2026년 7월 15일까지이며, 프로젝트는 9월 1일부터 12월 1일까지 진행됩니다. 시작은 claude.com/science에서 할 수 있습니다.

바이브코더·AI 개발자에게 시사하는 것

Claude Science는 단순한 챗봇 래퍼(wrapper)가 아니라, 도메인 특화 에이전트 오케스트레이션(orchestration), 감사 가능한 아티팩트 생성, 컴퓨팅 자원 자동화를 하나로 묶은 복합 시스템입니다. 특히 멀티 에이전트 구조와 액터-크리틱 패턴, 세션 포크(fork) 기능 등은 AI 개발자들이 자신의 도메인에 적용할 수 있는 설계 패턴으로도 주목할 만합니다. 과학 연구 자동화라는 구체적인 문제를 풀면서 AI 에이전트 시스템이 실제로 어떤 모습이어야 하는지를 보여주는 사례로, 바이브코더 커뮤니티에도 많은 영감을 줄 것입니다.

📎 출처: Anthropic 뉴스룸