AI VIDEO BRIEFING

클로드 페이블 탈옥과 미국 수출통제 지시로 페이블·미토스가 회수된 사건 전말 정리

클로드 페이블이 공개 3일 만에 탈옥되고, 미국 상무부의 수출통제 지시로 페이블과 미토스가 전면 회수됐다는 Fireship 코드 리포트의 내용을 배경부터 탈옥 방식, 파장까지 차근차근 정리했습니다.

공개 3일 만에 탈옥당한 ‘페이블’, 미국 정부가 직접 내리다 영상 대표 이미지

핵심 메시지

  • 클로드 페이블이 공개 직후 익명 사용자에게 탈옥당해 가드레일이 뚫렸다고 영상은 전한다.
  • 미국 상무부의 수출통제 지시로 외국 국적자의 페이블·미토스 접근이 금지되자, 앤트로픽은 두 모델을 전면 회수했다고 한다.
  • 탈옥은 정교한 해킹이 아니라, 위험한 요청을 잘게 쪼개 우회하는 ‘자금세탁’식 기법에 가깝다고 설명한다.
  • 진행자는 이 사건을 IPO 수치를 띄우기 위한 연출일 수 있다는 시각과, 실제 규제 리스크라는 시각으로 동시에 바라본다.

쉽게 이해하기

Fireship 코드 리포트는 클로드 페이블 공개 사흘 만에 미국 정부가 국가안보를 이유로 개입해 모델 사용을 사실상 막았다고 전한다. 그 결과 페이블을 쓰려던 사용자들은 다시 오퍼스 4.8로 되돌아가게 됐다.

영상은 배경을 이렇게 정리한다. 4월 7일 공개된 미토스 5는 강력한 사이버보안 능력을 가진 ‘입마개 없는’ 모델로, ‘글래스 윙’이라는 프로그램을 통해 대기업과 미국 정부 같은 신뢰할 수 있는 파트너에게만 제공됐다. 일반에 풀면 사이버 무기로 쓰일 수 있다는 우려 때문이었다.

앤트로픽은 같은 모델에 안전 분류기를 덧붙인 페이블 5를 따로 만들어 일반에 공개했다. 위험한 요청은 오퍼스 4.8로 우회시키는, 말하자면 ‘어린이 잠금장치’가 달린 버전이다. 그러나 공개 3일 만에 ‘플리니 더 리버레이터’로 알려진 익명 사용자가 가드레일을 뚫었다고 영상은 전한다.

탈옥 방식은 정교한 공상과학식 익스플로잇이 아니라, 위험한 요청을 잘게 쪼개고 특수 유니코드로 감싸거나 역할극·초장문 맥락으로 모델을 혼란시키는 ‘자금세탁’식 우회에 가깝다고 설명한다. 앤트로픽이 수천 시간 레드팀을 돌렸음에도 뚫렸다는 점이 강조된다.

결정적으로 영상은 금요일 오후 앤트로픽이 상무장관 하워드 러트닉 명의의 수출통제 지시 서한을 받았다고 전한다. 외국 국적자—심지어 앤트로픽의 외국 출신 직원까지—가 페이블 5와 미토스 5에 접근하지 못하게 한다는 내용이며, 이에 앤트로픽은 두 모델을 전원 회수했다. 진행자는 이를 정부 명령으로 라이브 공개 모델이 내려간 사상 첫 사례로 소개하면서, 성능 고의 저하 논란과 IPO용 연출 가능성도 함께 짚는다.

주요 인사이트

  • 안전을 강조해 온 미국 기업이 정작 자국 정부에 의해 “안전 조치”를 당하는 역설을, 영상은 사건의 핵심 아이러니로 제시한다.
  • 탈옥이 고난도 해킹이 아니라 요청 분할·유니코드 위장·맥락 혼란 같은 단순 우회로 가능했다는 점은, 외부 분류기 방식 가드레일의 구조적 취약성을 드러낸다.
  • 외국 출신 자사 직원조차 자사 제품을 못 쓰게 된 상황은, 수출통제가 AI 모델에 적용될 때의 파급력을 단적으로 보여준다.
  • 진행자는 일련의 사건이 IPO 직전 수치를 띄우고 규제 해자를 쌓는 연출일 수 있다는 의심과, 결국 더 나은 경쟁 모델만이 앤트로픽을 멈출 수 있다는 전망을 함께 제시한다.

자주 묻는 질문

페이블은 왜 사용이 막혔나요?

영상에 따르면 공개 3일 만에 가드레일이 탈옥됐고, 미국 상무부가 외국 국적자의 페이블·미토스 접근을 금지하는 수출통제 지시를 내리자 앤트로픽이 두 모델을 전면 회수했기 때문입니다.

미토스와 페이블, 글래스 윙은 어떤 관계인가요?

미토스 5는 입마개 없는 강력한 원본 모델로 ‘글래스 윙’ 프로그램을 통해 신뢰 파트너에게만 제공됐고, 페이블 5는 같은 모델에 안전 분류기를 붙여 일반에 공개한 버전이라고 영상은 설명합니다.

탈옥은 어떤 방식으로 이뤄졌나요?

정교한 익스플로잇이 아니라 위험한 요청을 작은 조각으로 쪼개고 특수 유니코드로 감싸거나 역할극·초장문 맥락으로 모델을 혼란시키는 우회 기법에 가깝다고 영상은 전합니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식