- "AI 벤치마크에서 오픈AI 모델과 동등한 성능 보였다" 주장
- 중국 정치에 부정적인 민감한 부분은 답변 거부하기도
중국 연구소가 오픈AI(OpenAI)의 o1에 필적하는 최초의 '추론(reasoning)' AI 모델을 공개했다고 테크크런치 등 전문 매체들이 전했다.
퀀트 트레이더(계량적 방식에 의해 근거를 찾고, 철저히 규칙에 기반해 매매하는 거래자)로부터 자금을 지원받은 인공지능(AI) 개발 회사인 딥씨크(DeepSeek)는 20일 딥씨크-R1(DeepSeek-R1)이라는 이름의 추론 AI 모델 미리보기 버전을 공개했다. 딥씨크는 이것이 오픈AI의 o1과 경쟁할 수 있는 추론 모델이라고 주장한다.
일반 모델과 달리 추론 모델은 질문이나 쿼리를 고려하는 데 더 많은 시간을 할애하여 효과적으로 사실 확인을 수행한다. 이를 통해 일반적으로 모델이 빠져드는 일부 함정을 피할 수 있다.
o1과 마찬가지로 딥씨크-R1은 작업을 통해 추론하고, 미리 계획하며, 모델이 답을 내놓도록 지원하는 일련의 작업을 수행한다. 이 작업은 다소 시간이 걸릴 수 있다. o1과 마찬가지로 질문의 복잡성에 따라 딥씨크-R1도 답하기 전에 수십 초 동안 생각할 수 있다.
딥씨크는 딥씨크-R1이 두 가지 AI 벤치마크인 AIME와 MATH에서 오픈AI의 o1-프리뷰 모델과 동등한 성능을 보였다고 주장했다. AIME는 다른 AI 모델을 사용해 모델의 성능을 평가하며, "MATH는 단어 문제 모음이다. 그러나 이 모델은 완벽하지 않다. 일부 논평가는 딥씨크-R1이 틱택토 등 논리 문제에 어려움을 겪는다"고 지적했다.
딥씨크는 또한 보호 장치를 무력화시킬 수 있다고 한다. 한 엑스(X·옛 트위터) 사용자는 모델을 통해 자세한 필로폰 제조법을 제공받기도 했다.
나아가 딥씨크-R1은 정치적으로 민감하다고 여겨지는 질문을 차단하는 것으로 보인다. 테스트에서 이 모델은 중국 지도자 시진핑, 천안문 광장, 중국의 대만 침공의 지정학적 영향 등에 대한 질문에는 대답하기를 거부했다.
이러한 행동은 중국 정부가 AI 프로젝트에 압력을 가한 결과일 가능성이 크다. 중국의 모델은 중국 인터넷 규제 당국의 벤치마킹을 거쳐야 하며, 모델의 응답이 '사회주의의 핵심 가치를 구현'할 수 있도록 보장해야 한다. 보도에 따르면, 중국 정부는 모델을 훈련하는 데 사용할 수 없는 소스의 블랙리스트까지 만들고 적용했다. 그 결과 많은 중국 AI 시스템은 규제 당국의 분노를 일으킬 수 있는 주제에 응답하지 않았다.
추론 모델에 대한 관심이 높아진 것은, 모델에 더 많은 데이터와 컴퓨팅 파워를 제공하면 모델의 성능이 지속적으로 향상된다는 '확장 법칙'의 타당성 검증이 이루어지고 있기 때문이다. 오픈AI, 구글, 앤트로픽 등 주요 AI 연구소의 모델이 예전만큼 극적으로 개선되지 않고 있다는 언론 보도가 쏟아지고 있다.
이로 인해 새로운 AI 접근 방식, 아키텍처, 개발 기술에 대한 경쟁이 벌어졌다. 그중 하나가 o1 및 딥씨크-R1과 같은 모델이다. 이들 추론 모델은 작업을 완료할 수 있는 추가 처리 시간을 모델에 제공한다. 마이크로소프트의 사티야 나델라 CEO는 이번 주 회사의 이그나이트 컨퍼런스 기조연설에서 이를 언급하면서 "우리는 새로운 확장 법칙의 출현을 보고 있다"고 말했다.
딥씨크는 딥씨크-R1을 오픈소스로 공개하고 API를 출시할 계획이라고 밝혔다. 이는 AI를 사용하여 거래 결정을 알리는 중국의 퀀트 헤지펀드인 하이플라이어 캐피탈 매니지먼트(High-Flyer Capital Management)의 지원을 받고 있다.
하이플라이어는 모델 훈련을 위한 자체 서버 클러스터를 구축하고 있는데, 1만 개의 엔비디아 A100 GPU를 장착하고 비용은 약 1억 3800만 달러에 달한다. 한편 리앙 웬펑이 설립한 하이플라이어는 딥씨크 조직과 기술을 통해 '초지능' AI를 실현하는 것을 목표로 하고 있다.