검색
-
-
[퓨처 Eyes(8)] 인공지능 규제, 어디까지 가능할까?
- 인공지능(Artificial Intelligence, AI)을 인간이 어디까지 규제할 수 있을까. 인공지능은 기계가 인간의 학습 능력, 추론 능력, 지각 능력, 자연어 이해 능력 등 인간의 지능을 모방하도록 설계된 컴퓨터 시스템이나 소프트웨어를 말한다. 기계가 데이터를 통해 학습하고, 그 학습된 내용을 기반으로 예측하거나 분류하는 기술인 머신러닝, 인공 신경망을 기반으로 복잡한 문제를 해결하려고 하는 딥러닝, 자동화된 기계가 인간의 행동을 모방하도록 설계와 프로그래밍하는 분야인 로보틱스 등이 모두 인공지능에 속한다. 현재 인공지능 기술은 의료, 금융, 제조, 자동차, 엔터테인먼트 등 다양한 산업 분야에서 활용되며, 효율성을 높이고 새로운 가능성을 열고 있다. 그런데, 하루가 다르게 성장하는 인공지능 시장을 두고 규제 방안을 먼저 마련해야 한다는 목소리가 높아지고 있다. 구테흐스 UN 사무총장, AI 규제 제안 안토니우 구테흐스 유엔 사무총장은 올여름 처음으로 유엔 안전보장이사회 회의를 소집해 AI의 잠재적 위험성에 대해 구체적으로 논의하면서 AI를 규제해야 하는지, 어느 정도까지 규제해야 하는지에 대한 논의가 뜨거워졌다. BBC에 따르면 구테흐스 총장은 AI 기반 사이버 공격부터 오작동하는 AI의 위험, AI가 잘못된 정보를 퍼뜨리는 방법, 심지어 AI와 핵무기 간의 상호 작용에 이르기까지 다양한 분야에 대해 언급했다. 그는 "AI의 이러한 위험에 대처하지 않으면 현재와 미래 세대에 대한 우리의 책임을 방기하는 것"이라고 주장했다. 이후 구테흐스 총장은 글로벌 규제 필요성을 조사하기 위해 유엔 패널 설립을 추진했다. '인공지능 고위급 자문기구'라고 불리는 이 패널은 '전현직 정부 전문가와 산업계, 시민사회, 학계 전문가'로 구성될 예정이다. 이 기구는 올해 말 이전에 초기 연구 결과를 발표할 계획이다. 기술거물, AI규제 한 목소리 앞서 9월 중순 일론 머스크와 메타의 마크 저커버그 등 미국 기술업계의 거물들은 워싱턴에서 미국 의원들과 회담을 갖고 AI와 잠재적인 미래 규제에 대해 논의했다. 그러나 일부 AI 전문가들은 글로벌 규제 성공 가능성에 대해 회의적인 시각을 가지고 있다. 45년 동안 AI를 연구해 온 피에르 하렌도 부정적인 사람 중 한 명이다. 하렌은 컴퓨터 대기업 IBM에서 7년간 근무하며 고객을 위한 인공지능 왓슨 슈퍼컴퓨터 기술 설치 팀을 이끌었다. 2010년에 출시된 왓슨은 사용자의 질문에 대답할 수 있으며, AI의 선구자 중 하나에 속한다. 이러한 배경을 가진 하렌은 지난해 챗GPT와 기타 소위 '생성형 AI' 프로그램의 출현과 그 능력에 "깜짝 놀랐다"고 말했다. 생성형 AI는 간단히 말해 단어, 이미지, 음악, 동영상 등 새로운 콘텐츠를 빠르게 생성할 수 있는 AI다. 한 가지 예에서 아이디어를 얻어 완전히 다른 상황에 적용할 수도 있다. 하렌은 챗GPT의 이러한 능력이 인간과 비슷하다고 말했다. 그는 "이 기계는 우리가 주입하는 것을 반복하는 앵무새가 아니다"라면서 "고차원적인 유추를 하고 있다"고 했다. 북한·이란 등 걸림돌 그렇다면 이 인공지능이 통제 불능 상태가 되는 것을 막기 위한 일련의 규칙이나 규제 장치는 어떻게 만들 수 있을까? 하렌은 북한 등 일부 국가가 AI를 규제하는 기구나 규칙에 가입하지 않을 것이기 때문에 인공지능 통제는 사실상 불가능하다고 말했다. 그는 "우리는 북한이나 이란과 같은 비협조적인 국가가 있는 세상에 함께 살고 있다"며 "그들은 AI 관련 규제를 인정하지 않을 것이다. 비협조적인 행위자에 대한 규제는 하늘의 별 따기다"라고 말했다. AI 규제를 찬성하는 사람들은 악의적인 행위자들이 AI 기술을 발판으로 삼아 위험한 기능을 습득하는 것이 상대적으로 쉬워진다는 점을 걱정하고 있다. 예를 들어 물리학자는 이론적으로 핵폭탄을 만드는 방법을 알고 있지만 실제로 핵폭탄을 제조하는 것은 매우 힘들다. 그러나 AI의 도움을 받으면 손쉽게 핵폭탄을 만들 수도 있다. 위키피디아의 창립자 지미 웨일즈는 거대 기술 기업의 경계를 넘어 수많은 프로그래머가 인터넷을 통해 기본 코드를 무료로 사용할 수 있는 AI 소프트웨어를 사용하고 있다고 말했다. 그는 "수만 명의 개인 개발자가 이러한 혁신을 기반으로 기술을 개발하고 있다. 이들에 대한 규제는 결코 일어나지 않을 것"이라고 우려했다. 영국, 11월 AI 규제 글로벌 서밋 개최 올리버 다우든 영국 부총리는 지난 9월 정부가 행동하지 않으면 인공지능이 세계 질서를 불안정하게 만들 수 있다고 경고했다. 다우든 부총리는 뉴욕에서 열린 유엔 총회에서 "현재 AI에 대한 글로벌 규제는 발전 속도에 비해 뒤처지고 있다"고 우려했다. 그는 과거에는 각국 정부가 기술 발전에 대응하여 규제를 만들었지만, 이제는 AI의 발전과 함께 규제를 만들어야 한다고 주장했다. 다우든은 정부와 시민이 위험을 적절히 완화할 수 있다는 확신을 가져야 하는 것처럼 AI 관련 기업도 "스스로 숙제를 해결해야 한다"며 규제 확립을 강조했다. 영국은 오는 11월 AI 규제를 논의하기 위해 '글로벌 서밋' 개최를 앞두고 있다. 규제가 없는 AI는 결국 일자리를 빼앗고, 잘못된 정보를 부추기거나 차별을 고착화할 수 있다는 취지에서다. 인공지능 자체가 내포하는 편향성과 불투명성 등 기술적 한계와 인공지능 오작동에 따른 잠재적 위험 요인에 대응해 기존 인공지능의 한계를 극복하고 초거대 인공지능의 신뢰성을 확보하기 위한 국제적인 규제 마련이 시급한 상황이다. 한국, 인공지능 규제 방안 한편, 한국에서는 빠르면 11월부터 인공지능 서비스에서 발생할 수 있는 위험 요인 등을 민간 자율로 평가하는 검·인증 체계와 AI 생성물에 대한 워터마크 표시 제도가 추진된다. 과학기술정보통신부는 25일 서울 강서구 LG사이언스파크에서 열린 제4차 인공지능 최고위 전략대화에서 이 같은 내용을 담은 '인공지능 윤리·신뢰성 확보 추진 계획'을 발표했다. 민간 자율 AI 윤리·신뢰성 확보 지원, 선도적인 AI 윤리·신뢰성을 위한 기술·제도적 기반 마련, 사회 전반에 책임 있는 AI 의식 확산 등을 골자로 한 이번 계획의 세부 과제로 과기정통부는 오는 11월부터 민간 자율 AI 신뢰성 검·인증을 추진하겠다고 밝혔다. 인공지능이 생성한 결과물에 대한 표시 제도 도입도 11월부터 추진한다. 이용자 보호를 위해 가시적 워터마크를 권고하며, 표시 의무화는 의견 수렴과 국제 동향을 고려해 단계적 도입을 검토한다.
-
- 포커스온
-
[퓨처 Eyes(8)] 인공지능 규제, 어디까지 가능할까?
-
-
LG화학, 中화유그룹과 모로코에 LFP 양극재 공장 구축
- 한국의 LG화학이 중국의 화유그룹과 업무협약을 체결해 리튬·인산·철(LFP) 양극재 사업에 본격 진출한다. 이와 함께 리튬 가공, 니켈 제련, 전구체로 이어지는 리튬·인산·철(LFP)양극재 소재 수직 계열화에 나선다. LG화학은 지난 22일(현지시간) 중국 화유그룹의 자회사인 유산(Youshan)과 양극재 공급망에 대한 포괄적 업무협약(MOU)을 맺었다고 24일 밝혔다고 연합뉴스가 전했다. 화유는 해외 고객들에게 더 가까이 다가가 현지 인센티브의 혜택을 받기 위해 해외 진출을 모색하는 중국 전기차 및 배터리 업체들에 합류했다. 이번 MOU로 LG화학과 화유그룹 산하 유산은 모로코에 전기차(EV) 배터리 소재 공장을 건설해 매년 5만t 규모의 LFP 양극재 합작공장을 짓는다. 2026년 양산이 목표다. 5만t은 보급형 전기차 50만대(350㎞ 주행 가능한 50㎾h 용량 전기차 기준)에 필요한 양극재를 만들 수 있는 양이다. 모로코 공장에서 생산되는 LFP는 북미 지역에 공급될 예정이다. 모로코는 LFP 양극재의 핵심 원재료인 인광석 매장량이 500억t으로 전 세계 매장량의 73%를 차지한다. LG화학은 또 모로코가 미국과 자유무역협정(FTA)을 맺어 미국 인플레이션 감축법(IRA) 보조금을 받을 수 있는 자격 요건도 충족한다고 밝혔다. IRA는 미국이 전기차에 대한 중국의 공급망에서 이탈하는 것을 막기 위해 고안됐다. 자동차 배터리에 사용되는 중요 광물의 40% 이상을 미국 또는 자유무역 파트너로부터 조달하여 차량 1대당 3750달러(약 500만 원)의 세액공제를 받을 수 있도록 하고 있으며, 한국은 미국과 자유무역협정을 체결하고 있다. LFP 양극재는 주로 보급형 전기차에 쓰이는 배터리 소재로, 니켈·코발트·망간(NCM) 양극재보다 에너지 밀도는 낮지만 가격 경쟁력이 높아 고객사 수요가 증가하는 추세다. LG화학은 추후 LFP에 망간을 더해 용량과 출력을 높인 LMFP 양극재 등으로 사업을 확장할 계획이다. 또 LG화학은 모로코에서 화유그룹 산하 화유코발트와 리튬 컨버전 플랜트 사업도 추진한다. 컨버전 플랜트란 리튬 정광(리튬 광석을 가공해 농축한 고순도 광물)에서 양극재 생산에 필요한 수산화리튬과 탄산리튬을 추출하는 시설이다. 모로코 리튬 컨버전 플랜트는 2025년까지 연산 5만2000t의 리튬 양산 체제를 마련해 모로코 LFP 공장에 리튬을 공급할 에정이다. 이외에도 LG화학과 화유코발트는 인도네시아에서 니켈 제련·전구체를 아우르는 양극재 수직계열화를 위해 협력하기로 했다. LG화학은 인도네시아에 연간 5만톤 규모의 전구체 공장과 전구체 생산을 위한 니켈 광석의 혼합 수산화물 추출 공장 등 2개의 시설을 건설할 계획이라고 밝혔다. 신학철 LG화학 부회장은 "모로코의 양극재 공장을 전세계 주요 거점으로 설정하고, 급성장하는 LFP 양극재 시장에 능동적으로 대응하겠다"고 밝혔다. 또 신 부회장은 "원재료에서 전구체, 양극재에 이르는 소재 수직 통합 체계를 더욱 탄탄히 구축하겠다"고 말했다.
-
- 산업
-
LG화학, 中화유그룹과 모로코에 LFP 양극재 공장 구축
-
-
[퓨처 Eyes(4)] 2023년 이후 주목받는 AI 트렌드 5가지
- 인공지능(AI) 시장은 지난 몇 년 동안 기하급수적인 속도로 성장했다. 전 세계적으로 널리 알려진 챗GPT(ChatGPT)와 구글 바드(Bard), IBM의 왓슨(Watson), 네이버의 클로바X와 같은 제품 덕분에 이런 성장이 가능했다. 글로벌 경영 컨설팅 회사인 맥킨지(McKinsey)는 현재 전체 조직의 50~60%가 이미 AI 기반 도구를 사용하고 있으며, 이 비율은 가까운 미래에 더욱 늘어날 것으로 추정된다. 포브스 보고에 따르면, AI는 현재 세계에서 가장 빠르게 성장하고 있는 산업 중 하나이다. 이 분야의 시장 가치는 10년 내로 연평균 37.3%의 성장률을 기록하며, 같은 기간 동안 약 1조 8100억 달러의 누적 가치에 이를 것으로 전망된다. 이러한 증가세는 근거가 없는 것이 아니며, 실제로 많은 전문가들이 2030년까지 AI가 세계 경제에 기여할 가치가 15조 7000억 달러에 이를 것으로 예측한다. 이는 현재 인도와 중국의 GDP를 합한 것보다도 더 큰 금액이다. 이러한 예상은 생성형 AI)와 자연어 처리(NLP) 같은 특정 기술 트렌드의 발전 덕분이라고 할 수 있다. 기술의 중요성이 점점 부각됨에 따라, 시장 및 기술 전문가들은 AI가 주도하거나 영향을 미칠 주요 트렌드들에 주목하고 있다. AI 어시스턴트의 성장부터 생성형 AI의 부상까지 코인텔레그래프가 진단한 '2023년 이후 주목받는 AI트렌드 5가지'를 소개한다. AI 어시스턴트 사용 증가 기술이 지속적으로 발전하며 확장되면서, AI 어시스턴트는 다양한 서비스 분야의 자동화와 디지털화를 가능하게 하는 준비 상태에 있다. AI 기반 디지털 서비스 개발사 VAIOT의 최고 운영 책임자 파베 안드루슈키에비츠는 법률 서비스, 공공 행정, 시민 서비스 등이 AI의 도움으로 크게 향상될 수 있는 몇몇 분야라고 지적했다. 그는 "AI 어시스턴트는 사용자에게 더 나은 접근성과 비용 절감, 사용의 편리성을 제공한다. 법률 서비스의 경우, 많은 사람들이 비용 문제나 접근성의 어려움으로 인해 이용하는데 어려움을 겪기도 한다. AI 어시스턴트는 24시간 연중무휴로 모바일 기기에서 접근 가능한 '자연스러운 사용자 인터페이스'를 제공함으로써, 이런 부분의 장벽을 낮추어 누구나 쉽게 법률 지원을 받을 수 있도록 도와준다"고 설명했다. 포춘 500대 기업에서 AI 도입 선호도 상승 AI 컨설팅 전문 회사 킨포크스(Keenfolks)의 미구엘 마차도 CEO이자 공동 창립자는 최근 사람들이 AI 제품의 빠른 확장 속도와 폭넓은 접근성에 대해 놀라게 될 것이라고 전망했다. 그는 오픈AI의 챗GPT 인터페이스가 2022년 3월에 출시된 후 현재 사용자 수가 1억 명이 넘는 것을 예로 들었다. 그는 "다양한 파일럿 실험을 통해, 포춘 500대 기업은 AI 전략을 더 빠르게 조정하고 향상시킬 수 있을 것이며, 커뮤니티는 언어 모델에 대한 지식을 활용하여 협동 학습과 기술 개발을 추진하는 플랫폼 구축에 핵심 역할을 할 것"이라고 강조했다. 마차도는 법률, 인사, 재무 등의 분야에서 최고 경영진이 비즈니스를 혁신하기 위해 AI를 적극 도입하는 추세가 확산되고 있다고 지적했다. 그는 "노코드(Nocode) 솔루션의 등장은 AI도입을 대중화해서 기술적 전문성이 부족한 브랜드들도 첨단 기술을 그들의 운영체계에 손쉽게 통합하게 만들어줄 것"이라고 덧붙였다. 생성형 AI 급성장 최근 몇 년 간 많은 AI 기반 애플리케이션은 기존 데이터를 활용하여 예측하거나 인사이트를 추출하는 예측 모델에 주로 의존했다. 이렇게 생성된 결과는 기존 데이터에서 파생되며 실제로 새로운 내용을 제공하지 않는다. 반면, 생성형 AI는 머신러닝과 딥러닝을 사용해 기존 학습 데이터 위에 구축된 새로운 패턴을 사용하여 독립적으로 계산된 독창적인 정보를 생성한다. 지난 한 해 동안 이러한 모델은 텍스트, 이미지, 오디오 및 비디오 콘텐츠를 생성하는 데 광범위하게 사용됐다. 메타와 언스트앤영의 생성형 AI 전문가이자 기술 자문인 헨리 아더(Henry Ajder)는 이 기술의 미래 가능성에 대해 "우리는 현재 생성형 기술의 초기 단계에 있으며, 앞으로 합성 미디어는 단순한 신기함에서 벗어나 엔터테인먼트, 교육, 접근성 등의 분야에서 큰 발전을 이끌 것"이라고 전망했다. 자연어 처리(NLP) 시스템의 성장 가까운 미래에 큰 관심을 받을 것으로 예상되는 AI 분야 중 하나는 자연어 처리(NLP)이다. 이 기술은 검색 엔진부터 음성 인식 시스템까지, 많은 사람들이 일상적으로 의존하는 다양한 기술 제품의 핵심이다. NLP를 통해, 기계는 사람의 언어를 보다 자연스럽게 이해하고 해석하여 대응할 수 있다. 실제로, 언어 모델링, 구문 분석, 감정 분석, 기계 번역, 음성 인식 등의 방식을 활용하여 이 기술은 다양한 비즈니스 환경에서 사용자에게 현실적인 대응을 제공한다. 아직 초기 단계이 이 분야의 잠재력을 강조하는 그랜드 뷰 리서치(Grand View Research)의 최신 보고서에 따르면, 2023년에서 2030년 사이에 연평균 40.4%의 성장률을 보일 것으로 예상되며, 10년 후에는 약 4385억 달러의 시장 규모를 이룰 것으로 전망된다. 의료 분야의 AI 활용 확대 포브스에 따르면, 의료 분야에서 AI의 활용은 질병을 진단하고 치료하는 의사의 방식을 혁신적으로 바꿀 것으로 보인다. 또한 신약 개발과 의학 연구 분야에서도 머신 러닝의 적용이 확대될 것이다. 2027년까지 신약 개발에 AI가 사용되는 규모는 40억 달러에 달할 것으로 예상된다(45.7%의 연평균 성장률로 성장). 마찬가지로 미국 의료 서비스 제공업체의 50% 이상이 내부 의료 프로세스의 일부로 로보틱스 프로세스 자동화와 같은 AI 도구를 도입했거나 도입할 계획이다. 2027년까지 AI가 신약 개발에서 차지하는 부분은 약 40억 달러로 추정되며, 이는 45.7%의 연평균 성장률로 성장할 것으로 예측된다. 또한, 미국의 의료 서비스 제공자 중 절반 이상이 로보틱스 프로세스 자동화 등의 AI 도구를 의료 프로세스에 통합하거나 도입 계획을 세우고 있다. 결과적으로 AI, 머신러닝, 딥러닝, 자연어 처리와 같은 첨단 기술이 주도하는 디지털 시대로 전환하면서 다양한 산업에서 이러한 기술의 적용이 확대되어, 보다 디지털화되고 자동화된 미래를 구축하는 데 큰 역할을 할 것으로 예상된다.
-
- 포커스온
-
[퓨처 Eyes(4)] 2023년 이후 주목받는 AI 트렌드 5가지
-
-
코로나19 종식 후 명품 '짝퉁' 시장 급성장
- 코로나19의 종식에 따라 집콕 생활에서 벗어나 다시 외부에서 일상 생활을 즐기고 있는 가운데, 명품 짝퉁 시장이 급성장세를 보이고 있는 것으로 나타났다. 패션 전문 매체 '마리 클레르(Marie Claire)'는 명품 짝퉁 시장에서 신발, 핸드백, 의류 및 시계가 높은 비중을 차지하고 있다고 전했다. 소셜 미디어의 활성화와 일부 유명 연예인들이 명품 착용 사진 등을 공유하면서, 대중의 명품에 대한 소비 욕구가 크게 증가한 것이 이러한 위조품 시장 확대 배경 중 하나로 지목된다. 영국의 법률 회사인 '데번포트 리용(Davenports Lyons)'의 연구에 따르면, 영국 소비자의 2/3가 짝퉁 명품 구매를 자랑스럽게 생각하며 주변 사람들에게 과시한다고 밝혔다. 경제협력개발기구(OECD)와 유럽연합 특허청의 연구에 따르면, 위조품 시장에서 상위 5위 중 대부분이 패션과 뷰티 제품으로 이루어져 있다. 그 나이키, 맥 코스메틱스, 삼성, 비아그라, 아디다스 등의 브랜드가 상위에 랭크되어 있다. 특히, 명품 브랜드 중에서 샤넬과 루이 비통의 가짜 제품이 아마존과 이베이와 같은 온라인 플랫폼에서 광범위하게 판매되고 있어, 관련 법적 대응이 진행 중이라는 소식이다. 국내에서는 시계 브랜드 롤렉스의 가짜 제품이 가장 많이 적발되었으며, 이에 이어 루이 비통과 샤넬이 그 뒤를 이었다. 짝퉁 시장이 큰 비중을 차지하는 중국에서는 중국 기업인 장 첸(Zhang Chen)이 짝퉁 명품을 구분해낼 수 있는 교육 프로그램을 개설했다. 이 교육은 7일 간 진행되며, 참가 비용은 약 2000유로(대략 290만원)이다. 명품 브랜드들은 NFT(대체 불가능한 토큰, 블록체인의 토큰을 다른 토큰으로 대체하는 것이 불가능함) 인증서와 같은 첨단 기술과 감정사의 전문 교육을 강화하여 짝퉁 시장의 확산을 막기 위한 다양한 노력을 기울이고 있다. 한편, 한국에서도 가짜 명품 시장이 크게 확대되고 있다. 기획재정위원회 소속 더불어민주당 현병도 의원의 데이터에 따르면, 지난 1년 간 가짜 명품 시장은 141%나 증가했다.
-
- 생활경제
-
코로나19 종식 후 명품 '짝퉁' 시장 급성장
-
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?
- 마이크로소프트(MS) 창업자 빌 게이츠가 "인터넷의 발명만큼 중대한 사건"이라고 극찬한 챗GPT(Chat GPT)는 오픈AI에서 개발한 대화형 인공지능(AI) 서비스로, 대량의 데이터를 학습해 새로운 정보를 생성하고 응답하는 능력을 갖춘 시스템이다. 챗GPT는 챗(Chat)과 GPT(Generative Pre-trained Transformer)의 합성어로, 트랜스포머(Transformer) 계열의 대규모 언어 모델(GPT-3.5)을 기반으로 한다. GPT-3.5는 오픈AI에서 개발한 GPT-3의 업그레이드 버전으로, 1000억 개의 파라미터를 가지고 있다. 파라미터란 AI가 학습할 수 있는 변수의 수를 의미하는데, 이는 GPT-3의 2배에 달한다. 챗GPT는 강화학습(RLHF) 방식을 채택해 자신의 행동에 따른 보상을 통해 스스로 학습하고 발전할 수 있다. 챗GPT는 번역 및 문장 재구성, 텍스트 요약, 콘텐츠 생성, 코딩 등 다양한 영역에서 우수한 성능을 뽐내고 있다. 무엇보다 인간 고유의 영역이라 여겨져 온 창작의 영역까지 AI가 파고든 사실에 많은 사람이 놀라고 있다. 지난해 11월 선보인 챗GPT는 출시된 지 5일 만에 이용자 수 100만 명을 확보했고, 1억 명을 돌파하는 데는 두 달이면 충분했다. 현재 전 세계적으로 가장 많은 사용자를 보유하고 있는 AI 서비스로 자리매김했다. AI 지능 저하 '드리프트' 현상이란? 인공지능(AI)의 새로운 패러다임인 챗GPT와 같은 채팅AI가 의사 면허 시험을 통과하거나 복잡한 수학 문제를 놀라운 정확도로 풀 수 있다는 보고서도 나왔다. 그런데 최근 챗GPT의 성능이 급격히 저하되는 현상이 나타나 인공지능 학계를 발칵 뒤집어 놓았다. 파겐 와사니 테크롤로지스(Fagen Wasanni Technologies)와 일본 매체 기가진(gigazine)의 최근호에 따르면 올해 3월부터 6월까지 채팅 AI의 수학 능력이 급격히 떨어지는 현상이 발견됐다. 이러한 채팅 AI의 지능 저하 현상을 '드리프트(drift)'라고 한다. 외신에 따르면 미국 스탠포드 대학과 UC 버클리가 올해 3월과 6월 두 차례에 걸쳐 오픈AI의 대규모 언어모델(LLM) 'GPT-3.5'와 'GPT-4'로 구동되는 챗GPT에 '수학 문제', '코드 생성', '시각적 추론', '민감한 질문' 등 4가지 과제를 부여해 그 답변의 신속성과 정확성을 분석했다. 그 결과, '17077은 소수인가?'와 같은 단순 수학 문제에 대한 GPT-4의 응답 정확도가 2023년 3월부터 6월 사이에 97.6%에서 무려 2.4%로 급락한 것으로 나타났다. 두 대학의 연구진에 따르면, "AI의 드리프트 문제는 매우 복잡한 AI 모델의 일부를 개선하려고 할 때 모델의 다른 부분의 성능이 저하되는 문제"라고 설명했다. 연구원들은 3월과 6월 다양한 버전의 LLM을 테스트하고 위의 네 가지 과제 외에 미국 의사 면허 시험, 시각적 추론을 포함한 다양한 AI 작업에서 성능을 평가했다. 그 결과, LLM이 제공하는 답변에 상당한 변동성이 있는 것으로 나타났다. 특히 GPT-4의 수학 문제 해결 능력은 3월과 6월 사이에 정확도가 84.0%에서 51.1%로 떨어지는 등 급격히 악화됐다. 반면, GPT-3.5의 정확도는 같은 기간 동안 49.6%에서 76.2%로 향상됐다. 연구원들은 또한 특정 작업에서 지시를 따르는 GPT-4의 능력이 저하되는 것을 관찰했다. 예를 들어, '행운의' 숫자와 관련된 수학 문제에서 GPT-4의 정확도는 3월과 6월 사이에 83.6%에서 35.2%로 떨어졌고 GPT-3.5의 정확도는 30.6%에서 48.2%로 오히려 증가했다. 또한 ‘민감하거나 위험한 질문’에 답변하려는 LLM의 의지에 변화가 있었다. GPT-4는 응답률이 21.0%에서 5.0%로 급격히 낮아졌고, GPT-3.5는 2.0%에서 5.0%로 소폭 증가했다. 복잡한 추론 과제에서 GPT-4는 정확한 답변을 생성하는 점이 1.2%에서 37.8%로 증가해 개선된 모습을 보였다. 그러나 GPT-3.5의 추론 완전 일치 성공률은 22.8%에서 14.0%로 감소했다. 연구원들은 또한 시간이 지남에 따라 LLM이 생성한 코드의 실행 가능성도 감소하는 것을 관찰했다. 또 미국 의사 면허 시험에서 GPT-4의 성적은 86.6%에서 82.4%로 소폭 하락한 반면, GPT-3.5는 54.7%였다. 시각적 추론 과제에서 약간의 개선이 있었지만 두 모델 모두 전반적인 정확도는 여전히 낮았다. 연구진은 짧은 시간 내에 GPT-3.5와 GPT-4의 성능과 동작에 상당한 변화가 있었다는 점을 강조했다. "AI 미세 조종시 다른 영역서 후퇴" 스탠포드대 제임스 조우(James Zou) 컴퓨터 과학 연구원은 "AI 모델을 미세 조정해 특정 방향으로 강화하면 다른 영역에서는 후퇴할 위험이 있다"며 "AI 모델을 지속적으로 개선하는 것은 매우 어렵다"고 말했다. 또한 조우 연구원은 "우리는 GPT-4와 같은 AI 모델에서 언젠가 드리프트 문제가 발생할 것으로 예상했지만, 이렇게 빨리 드리프트 문제가 발생한 것에 대해 매우 놀랐다"고 했다. 해외 매체 크립토폴리탄(Cryptopolitan)은 AI의 드리프트 문제에 대해 "이 문제는 프롬프트 엔지니어링(Prompt Engineering)이라는 급성장 중인 트렌드와 관련이 있을 수 있다"고 추측했다. '프롬프트 엔지니어링'은 사용자가 프롬프트를 만들어 AI로부터 특정 반응을 이끌어내는 개념이다. 이 매체는 "GPT-4의 수학적 능력 저하가 프롬프트 엔지니어링에 대응하기 위해 취해진 우발적 결과일 수 있다"고 지적했다. 오픈AI "개선 위해 다양한 연구 진행" 드리프트 문제에 대해 오픈AI 측은 "새로운 AI 모델을 출시할 때, 우리는 새로운 모델을 더 똑똑하게 만드는 것을 최우선 과제로 삼고 있다. 또한 우리는 새로운 AI 모델 버전이 포괄적인 작업의 개선으로 이어지고 있는지 확인하기 위해 다양한 조사와 연구를 진행하고 있다. 하지만 우리의 평가 방법은 완벽하지 않기 때문에 지속적으로 개선해 나가고 있다"고 말했다. 조우는 AI의 드리프트 문제에 대해 "중요한 것은 지능이 떨어진다고 해서 기술을 포기하는 것이 아니라 그 어느 때보다 AI를 면밀하게 모니터링하는 것"이라고 말했다. 아울러 연구팀은 챗GPT와 같은 AI 모델에 대해 수천 개의 질문을 던져 체계적인 테스트를 계속하고 있으며, 시간이 지남에 따라 성능 변화를 분석하고 있다고 덧붙였다.
-
- IT/바이오
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?