검색
-
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?
- 마이크로소프트(MS) 창업자 빌 게이츠가 "인터넷의 발명만큼 중대한 사건"이라고 극찬한 챗GPT(Chat GPT)는 오픈AI에서 개발한 대화형 인공지능(AI) 서비스로, 대량의 데이터를 학습해 새로운 정보를 생성하고 응답하는 능력을 갖춘 시스템이다. 챗GPT는 챗(Chat)과 GPT(Generative Pre-trained Transformer)의 합성어로, 트랜스포머(Transformer) 계열의 대규모 언어 모델(GPT-3.5)을 기반으로 한다. GPT-3.5는 오픈AI에서 개발한 GPT-3의 업그레이드 버전으로, 1000억 개의 파라미터를 가지고 있다. 파라미터란 AI가 학습할 수 있는 변수의 수를 의미하는데, 이는 GPT-3의 2배에 달한다. 챗GPT는 강화학습(RLHF) 방식을 채택해 자신의 행동에 따른 보상을 통해 스스로 학습하고 발전할 수 있다. 챗GPT는 번역 및 문장 재구성, 텍스트 요약, 콘텐츠 생성, 코딩 등 다양한 영역에서 우수한 성능을 뽐내고 있다. 무엇보다 인간 고유의 영역이라 여겨져 온 창작의 영역까지 AI가 파고든 사실에 많은 사람이 놀라고 있다. 지난해 11월 선보인 챗GPT는 출시된 지 5일 만에 이용자 수 100만 명을 확보했고, 1억 명을 돌파하는 데는 두 달이면 충분했다. 현재 전 세계적으로 가장 많은 사용자를 보유하고 있는 AI 서비스로 자리매김했다. AI 지능 저하 '드리프트' 현상이란? 인공지능(AI)의 새로운 패러다임인 챗GPT와 같은 채팅AI가 의사 면허 시험을 통과하거나 복잡한 수학 문제를 놀라운 정확도로 풀 수 있다는 보고서도 나왔다. 그런데 최근 챗GPT의 성능이 급격히 저하되는 현상이 나타나 인공지능 학계를 발칵 뒤집어 놓았다. 파겐 와사니 테크롤로지스(Fagen Wasanni Technologies)와 일본 매체 기가진(gigazine)의 최근호에 따르면 올해 3월부터 6월까지 채팅 AI의 수학 능력이 급격히 떨어지는 현상이 발견됐다. 이러한 채팅 AI의 지능 저하 현상을 '드리프트(drift)'라고 한다. 외신에 따르면 미국 스탠포드 대학과 UC 버클리가 올해 3월과 6월 두 차례에 걸쳐 오픈AI의 대규모 언어모델(LLM) 'GPT-3.5'와 'GPT-4'로 구동되는 챗GPT에 '수학 문제', '코드 생성', '시각적 추론', '민감한 질문' 등 4가지 과제를 부여해 그 답변의 신속성과 정확성을 분석했다. 그 결과, '17077은 소수인가?'와 같은 단순 수학 문제에 대한 GPT-4의 응답 정확도가 2023년 3월부터 6월 사이에 97.6%에서 무려 2.4%로 급락한 것으로 나타났다. 두 대학의 연구진에 따르면, "AI의 드리프트 문제는 매우 복잡한 AI 모델의 일부를 개선하려고 할 때 모델의 다른 부분의 성능이 저하되는 문제"라고 설명했다. 연구원들은 3월과 6월 다양한 버전의 LLM을 테스트하고 위의 네 가지 과제 외에 미국 의사 면허 시험, 시각적 추론을 포함한 다양한 AI 작업에서 성능을 평가했다. 그 결과, LLM이 제공하는 답변에 상당한 변동성이 있는 것으로 나타났다. 특히 GPT-4의 수학 문제 해결 능력은 3월과 6월 사이에 정확도가 84.0%에서 51.1%로 떨어지는 등 급격히 악화됐다. 반면, GPT-3.5의 정확도는 같은 기간 동안 49.6%에서 76.2%로 향상됐다. 연구원들은 또한 특정 작업에서 지시를 따르는 GPT-4의 능력이 저하되는 것을 관찰했다. 예를 들어, '행운의' 숫자와 관련된 수학 문제에서 GPT-4의 정확도는 3월과 6월 사이에 83.6%에서 35.2%로 떨어졌고 GPT-3.5의 정확도는 30.6%에서 48.2%로 오히려 증가했다. 또한 ‘민감하거나 위험한 질문’에 답변하려는 LLM의 의지에 변화가 있었다. GPT-4는 응답률이 21.0%에서 5.0%로 급격히 낮아졌고, GPT-3.5는 2.0%에서 5.0%로 소폭 증가했다. 복잡한 추론 과제에서 GPT-4는 정확한 답변을 생성하는 점이 1.2%에서 37.8%로 증가해 개선된 모습을 보였다. 그러나 GPT-3.5의 추론 완전 일치 성공률은 22.8%에서 14.0%로 감소했다. 연구원들은 또한 시간이 지남에 따라 LLM이 생성한 코드의 실행 가능성도 감소하는 것을 관찰했다. 또 미국 의사 면허 시험에서 GPT-4의 성적은 86.6%에서 82.4%로 소폭 하락한 반면, GPT-3.5는 54.7%였다. 시각적 추론 과제에서 약간의 개선이 있었지만 두 모델 모두 전반적인 정확도는 여전히 낮았다. 연구진은 짧은 시간 내에 GPT-3.5와 GPT-4의 성능과 동작에 상당한 변화가 있었다는 점을 강조했다. "AI 미세 조종시 다른 영역서 후퇴" 스탠포드대 제임스 조우(James Zou) 컴퓨터 과학 연구원은 "AI 모델을 미세 조정해 특정 방향으로 강화하면 다른 영역에서는 후퇴할 위험이 있다"며 "AI 모델을 지속적으로 개선하는 것은 매우 어렵다"고 말했다. 또한 조우 연구원은 "우리는 GPT-4와 같은 AI 모델에서 언젠가 드리프트 문제가 발생할 것으로 예상했지만, 이렇게 빨리 드리프트 문제가 발생한 것에 대해 매우 놀랐다"고 했다. 해외 매체 크립토폴리탄(Cryptopolitan)은 AI의 드리프트 문제에 대해 "이 문제는 프롬프트 엔지니어링(Prompt Engineering)이라는 급성장 중인 트렌드와 관련이 있을 수 있다"고 추측했다. '프롬프트 엔지니어링'은 사용자가 프롬프트를 만들어 AI로부터 특정 반응을 이끌어내는 개념이다. 이 매체는 "GPT-4의 수학적 능력 저하가 프롬프트 엔지니어링에 대응하기 위해 취해진 우발적 결과일 수 있다"고 지적했다. 오픈AI "개선 위해 다양한 연구 진행" 드리프트 문제에 대해 오픈AI 측은 "새로운 AI 모델을 출시할 때, 우리는 새로운 모델을 더 똑똑하게 만드는 것을 최우선 과제로 삼고 있다. 또한 우리는 새로운 AI 모델 버전이 포괄적인 작업의 개선으로 이어지고 있는지 확인하기 위해 다양한 조사와 연구를 진행하고 있다. 하지만 우리의 평가 방법은 완벽하지 않기 때문에 지속적으로 개선해 나가고 있다"고 말했다. 조우는 AI의 드리프트 문제에 대해 "중요한 것은 지능이 떨어진다고 해서 기술을 포기하는 것이 아니라 그 어느 때보다 AI를 면밀하게 모니터링하는 것"이라고 말했다. 아울러 연구팀은 챗GPT와 같은 AI 모델에 대해 수천 개의 질문을 던져 체계적인 테스트를 계속하고 있으며, 시간이 지남에 따라 성능 변화를 분석하고 있다고 덧붙였다.
-
- IT/바이오
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?
-
-
홍채 스캔 '월드코인', 영국·독일 등 조사 직면...문제점은 무엇?
- 오픈AI 샘 알트먼 최고경영자(CEO)가 지난 7월 24일 출시한 홍채 스캔 암호화폐 프로젝트 '월드코인'이 개인 정보 보호 문제로 영국 , 독일, 프랑스 등 세계 각국 규제 기관의 조사에 직면했다. 월드코인은 알트먼이 독일 출신 알렉스 블라니아와 2019년 공동 창립한 블록체인 프로젝트다. 범용인공지능 시대에 인간의 일자리가 줄어들면 보편적 기본소득(UBI)을 보장해야 한다는 비전을 가지고 시작했다. 홍채 인식을 통해 인간임을 증명하면 디지털 신분증명인 월드ID가 발급되고, 매주 월드코인 1개가 지급되는 구조다. 영국과 프랑스 독일 등 선진국 규제 기관은 지난 7월 월드코인이 출시 직후 데이터 수집에서 홍채 스캔을 통해 사용자에게 암호화폐를 지급하는 방식에 주목해 월드코인을 조사하겠다고 발표했다. 홍채 스캔 '월드코인' 프로젝트란? 월드코인 프로젝트의 핵심 서비스는 실제 인간만이 가질 수 있는 계정인 '월드 ID'다. 신원을 확인하고 월드 ID를 발급받기 위해 고객은 볼링공 크기의 은색 공인 '오브(orb)'를 사용해 직접 홍채 스캔을 신청해야 한다. 오브의 홍채 스캔을 통해 실제 사람임을 확인하면 월드 ID가 생성된다. 일부 국가에서는 망막 스캔을 제공하면 새로운 '신원 및 금융 네트워크'를 구축하기 위한 계획의 일환으로 월드코인에서 만든 자체 암호화폐 WLD를 무료로 제공하기도 한다. 이 프로젝트는 시범 테스트에서 이미 2백만 명의 사용자를 확보했으며, 지난 7월 말 출시와 함께 20개국 35개 도시에서 홍채 스캔을 위해 오브 운영을 확대하고 있다. 월드코인 측은 인간과 매우 유사한 언어를 구사하는 챗GPT(ChatGPT)와 같은 생성형 AI 챗봇의 시대에는 월드 ID가 필요할 것이라고 주장했다. 알트먼은 월드코인이 생성형 AI로 인해 경제가 어떻게 재편될 것인지에 대한 해답을 제시할 수 있을 것이라고 말했다. 그는 월드코인 출시 직후 트위터 통해 "(월드코인 프로젝트의) 목표는 인간성 증명(proof of personhood, PoP)을 통해 글로벌 금융 및 신분증명 네트워크를 만드는 것"이라고 밝혔다. 또 "이런 일은 AI 시대에 특히 중요하며, 월드코인이 미래 AI 시스템의 접근권한, 혜택, 거버넌스에 대한 논의에 기여하길 바란다"고 말했다. '망막 스캔'으로 개인정보 노출...사기 악용 우려 그러나 월드코인의 홍채 스캔 방식은 개인 정보 유출과 사기 위험에 노출될 수 있다는 비판을 받고 있다. 영국, 독일, 프랑스 등 여러 국가의 데이터 규제 기관은 월드코인의 개인 데이터 수집 방식을 조사하겠다고 나섰다. 이더리움 공동 창시자 비탈릭 부테린도 월드코인의 인증 시스템이 개인 정보 보호와 보안 등 여러 문제점을 가지고 있다고 지적했다. 월드코인 측은 홍채 스캔 과정에서 사용자의 개인 정보를 저장하지 않으며, 오브는 단지 실제 사람임을 확인하는 역할만 한다고 주장했다. 또한 월드 ID는 온라인에서 실제 사람과 AI 봇을 구분하는 데 도움이 될 것이라고 말했다. 그럼에도 영국의 데이터 규제 당국인 정보위원회는 월드코인 출시 다음날 개인 데이터 수집이 의심스럽다면서 홍채 스캔 프로젝트를 조사하겠다고 밝혔다. 프랑스와 독일, 심지어 아프리카 국가인 케냐도 월드코인의 홍채 스캔에 대해 우려를 제기했다. 암호화폐 이더리움 공동 창시자 비탈릭 부테린(Vitalik Buterin) 또한 지난 7월 25일 새로 출시된 월드코인의 인증 시스템인 '인간성 증명(PoP)' 방식에 대해 우려를 표명했다. 부테린은 "월드코인의 인증 시스템은 접근성, 개인 정보 보호, 보안 및 중앙 집중화와 관련된 문제에 직면해 있다"고 지적했다. 부테린에 따르면 맞춤형 생체 인식 장치는 모든 개인이 접근할 수 없으며 동일한 장치의 적절한 구성을 보장하지 않는다. 그는 다른 사람이 월드 아이디 소지자의 홍채를 스캔하면 사기 가능성이 높아진다고 우려를 표명했다. 또 전화 해킹 우려가 있고 사이버 공격의 가능성을 제기했다. 반면 월드코인은 인증 과정에서 사용자의 개인 정보를 저장하지 않으며, 홍채 스캔은 단지 사용자가 봇이 아닌 사람인지 확인해 사기 행위를 방지하는 것이 목적이라고 주장했다. 프랑스 국가정보자유위원회(BayLDA)에서도 월드코인의 홍채 스캔 데이터 수집 방식에 대해 "의심스럽다"고 밝혔다. 독일 바이에른 주 데이터 보호 감독청(BayLDA) 또한 홍채를 스캔하는 인간 신원 확인 프로젝트인 월드코인에 대해 조사 중이다. 로이터에 따르면 독일의 데이터 감시 기관은 민감한 생체 인식 데이터의 대규모 처리에 대한 우려 때문에 작년 말부터 샘 알트먼의 월드코인 프로젝트를 조사해 왔다. 마이클 윌 BayLDA 청장은 "망막 스캔 데이터 기술이 금융 정보 전송에 사용하기에 적합하지 않다"며 "월드코인 사용자들에게 잠재적인 위험을 초래할 수 있다"고 지적했다. 선진국 외에 암호화폐 거래가 활발한 아프리카 국가인 케냐도 지난 2일 공공 안전에 대한 잠재적 위험을 이유로 월드코인의 현지 활동을 중단시켰다. 키투레 킨디키 케냐 내무부 장관은 성명에서 "관련 보안, 금융 서비스 및 데이터 보호 기관이 앞서 언급한 활동의 진위 여부와 적법성을 확인하기 위해 문의와 조사를 시작했다"고 말했다. 케냐 통신청과 데이터 보호 위원회는 월드코인의 운영에 대한 예비 검토 결과, 금전적 보상에 대한 대가로 소비자 동의를 얻는 것이 유인 행위에 해당한다고 밝혔다. 킨디키 장관은 정부가 월드코인의 활동에 대해 우려하고 있으며, 정부 기관은 월드코인이 수집한 데이터를 어떻게 사용할 것인지 조사할 것이라고 말했다. 그는 자세한 설명 없이 월드코인의 활동에 관여하는 모든 사람에 대해 조치가 취해질 것이라고 덧붙였다. 현지 언론은 2일 현재 35만 명 이상의 케냐인이 약 7000 케냐 실링(49달러) 상당의 무료 암호화폐 토큰을 받고 월드코인에 가입했다고 보도했다. 케이맨 제도에 본사를 둔 월드코인 재단은 케냐 및 기타 국가에서 시행 중인 개인정보 보호 조치에 대한 이해를 높이기 위해 당국과 협력할 것이라고 밝혔다. 월드코인 재단은 성명에서 "월드코인은 글로벌 디지털 경제에 포용적이고, 개인정보를 보호하며, 탈중앙화된 진입로를 제공하기 위해 최선을 다하고 있으며, 현지 규제 당국 및 기타 이해관계자와 긴밀히 협력하면서 케냐에서 서비스를 재개하기를 고대하고 있다"고 말했다. 월드코인의 암호화폐 WLD 코인 가격은? 한편, 월드코인의 WLD 토큰은 바이낸스와 OKX 등 주요 거래소에 상장된 지난 7월 24일 출시 직후 20% 이상 급등해 최고가인 3.30달러를 기록했다. 이후 각국의 규제 기관의 반대 등에 부딪혀 가격이 하락한 WLD 코인은 16일 현재 약 1.5 달러에 거래되고 있다. 국내 가상자산 거래소 중에는 빗썸과 코빗이 월드코인의 WLD 토큰을 상장해 거래를 지원하고 있다. 빗썸에선 한때 7000원까지 이상 급등하기도 했으나, 16일 현재는 글로벌 평균 수준인 2200원을 유지하고 있다. 개인 정보가 고스란히 노출될 수 있는 인간 신원 확인을 위한 홍채 스캔과 코인 무료 제공을 결합한 월드코인이 향후 어떻게 발전할지 귀추가 주목되고 있다.
-
- 경제
-
홍채 스캔 '월드코인', 영국·독일 등 조사 직면...문제점은 무엇?