앤스로픽, 미토스급 최상위 AI모델 ‘페이블5’ 일반 공개

엔스로픽

앤스로픽, 미토스급 최상위 AI모델 ‘페이블5’ 일반 공개

동아일보 | 업데이트 2026.06.11

해킹 악용 차단 안전장치 적용
‘인류 최후의 시험’ 정답률 59%… “GPT가 나흘 걸린 일 36시간만에”
위험한 질문은 이전 모델로 우회… ‘미토스5’는 검증된 기관에만 제공

기업공개(IPO)를 앞둔 앤스로픽이 그간 공개를 미뤄 온 최상위 인공지능(AI) 모델 ‘미토스’ 수준의 모델을 일반에 공개했다. 사이버 보안 등 민감한 분야에서의 악용 우려를 차단하기 위한 안전장치도 함께 도입했다. 너무 뛰어난 성능 때문에 보안에 대한 우려, 이른바 ‘미토스 쇼크’가 이어지자 소수 파트너에게만 제공해 온 미토스를 대중용으로 다듬어 출시한 것이다.

● 안전장치 적용된 미토스급 모델

9일(현지 시간) 앤스로픽은 미토스급 모델을 일반용으로 안전하게 조정한 ‘클로드 페이블5’와 보안 특화 모델인 ‘클로드 미토스5’를 출시했다고 밝혔다. 미토스5는 종전처럼 앤스로픽의 승인을 받은 소수 기관과 기업에만 제공하고, 일반 사용자와 개발자에게는 안전장치가 적용된 페이블5를 공개한 것. 앤스로픽은 ‘페이블’의 어원이 라틴어 ‘파불라(fabula)’로, 신화를 뜻하는 ‘미토스’와 유사한 뜻이라고 소개했다.

성능은 현존 공개 모델 가운데 최고 수준이다. 앤스로픽에 따르면 페이블5는 AI 모델의 한계를 측정하는 ‘인류 최후의 시험(HLE)’에서 정답률 59%를 기록했다. 전작 클로드 오퍼스4.8(49.8%)은 물론 오픈AI 최신 모델 GPT-5.5(41.4%)를 크게 앞선 수치다. AI로 물리학 난제를 푸는 스타트업인 피지컬슈퍼인텔리전스(PSI)의 매슈 파인스 최고경영자는 “물리학 연구 과제에서 GPT-5.5가 4일이 걸린 작업을 페이블5가 36시간 만에 따라잡았다”고 밝혔다.

다만 성능에는 일종의 ‘제한’이 있다. 악용 위험이 큰 분야에는 안전장치가 적용됐기 때문이다. 해커의 악용이 우려되는 사이버 보안이나, 생물무기 등에 악용될 수 있는 생물학, 화학 등에 대한 질의에 대해서는 바로 아래 단계 모델인 ‘오퍼스4.8’이 응답을 대신 처리하고 이용자에게 해당 사실을 고지한다.

앤스로픽은 자사 홈페이지를 통해 “페이블5는 거의 모든 AI 성능 벤치마크에서 최첨단 성능을 보여주며 소프트웨어 엔지니어링, 지식 기반 작업, 컴퓨터 비전, 과학 연구 등 다양한 분야에서 탁월한 성능을 입증했다”고 밝혔다. 이어 “안전장치가 없다면 페이블5의 사이버 보안 기능이 악용돼 심각한 피해를 초래할 수 있다”며 “모델을 안전하고 신속하게 출시하기 위해 안전장치를 보수적으로 조정했다”고 설명했다.

● 모델 복제하는 ‘증류’도 걸러

이 같은 안전장치는 경쟁 AI 모델의 기능을 빼내는 무단 ‘증류’에도 적용된다. 증류는 고성능 AI에게 수십만 개의 질문을 던진 뒤 나온 답변을 학습 데이터로 활용하는 일종의 ‘압축 학습 방식’이다. 통상 기업이 자사 상위 모델 성능에 버금가는 경량 모델을 만들 때 쓰이지만, 최근 중국의 일부 AI 모델이 타사 AI 모델을 ‘증류’해 학습시켰다는 문제 제기가 잇따랐다.

앤스로픽은 페이블5가 간혹 무해한 요청까지 거를 수 있으나, 그 비율은 평균적으로 약 5% 미만이라고 설명했다. 이런 제한이 없는 미토스5는 앤스로픽의 보안 협의체 ‘프로젝트 글래스윙’을 통해 검증된 기관에만 선별 제공된다. 국내에서는 해당 프로젝트에 참여하는 것으로 알려진 삼성전자와 SK하이닉스, SK텔레콤, 한국인터넷진흥원(KISA) 등이 접속권을 받을 것으로 보인다.

전혜진 기자 sunrise@donga.com

듣는 DBR 브리핑

앤스로픽, 미토스급 최상위 AI모델 ‘페이블5’ 일반 공개