검색
-
-
챗GPT, 음성↔텍스트 상호 변환...소통 능력 향상 기대
- 대화형 인공지능(AI) 서비스 챗GPT가 텍스트를 통해 사용자와 소통했던 단계를 벗어나 사진을 인식하고 음성을 텍스트로 변환하고, 텍스트를 다시 음성으로 합성할 수 있는 버전을 도입한다고 밝혀 이전보다 더 인간다운 모습을 보일 전망이다. 기술 과학 전문매체 기즈모도(GIZMODO)에 따르면, 챗GPT 제조사인 오픈AI는 챗GPT에 도입될 프로모션 비디오를 통해 사용자에게 이미지 인식 기능에 대해 선보이고 있다고 전했다. 예를 들어, 사용자가 챗GPT에게 자전거 좌석을 낮춰달라고 요청하면 챗봇은 먼저 모든 종류의 좌석을 낮추기 위한 일반적인 조언을 했다. 위의 사진에서 볼수 있듯이 처음 자전거 좌석을 사용하는 이용자가 자전거 좌석 캐치 주위에 원을 그린 후 더 자세한 도움을 요청하면, 챗GPT는 해당 볼트 유형을 인식하고 엘렌 렌치가 필요하다고 답했다. 이 시스템은 사용자 설명서와 공구 상자의 사진을 보고 올바른 크기의 렌치가 있는지도 확인할 수 있다고 기즈모도는 설명했다. 음성 인식 시스템 적용 물론, 이미지 인식은 많은 챗봇 서비스에서 실험한 것이 아니지만 음성 인식 시스템과 음성 합성에 대한 최신 기술을 보유하고 있다는 것이 오픈AI 측의 설명이다. 오픈AI는 챗봇의 새로운 음성 서비스를 사용자에게 소개하기 위해 '어머니가 챗GPT에게 특정 숲에 살고 있는 고슴도치에 대한 이야기를 자녀들에게 읽어 달라'고 요청하는 비디오를 공개했다. 비디오의 말투는 자연스러웠지만, 그림책의 캐릭터들이 각각의 고유한 목소리를 내지는 않았다. 캐릭터의 음성은 시스템에 라이선스를 부여한 성우의 목소리를 기반으로 하기 때문이다. 이는 일레븐랩스(ElevenLabs)와 같은 다른 AI 음성 합성과 유사하다. 해당 서비스는 처음에는 딥페이크(인공지능을 기반으로 활용한 인간 이미지 합성 기술)나 괴롭힘에 사용돼 비판을 받았다. 오픈AI는 자사의 첫 번째 음성 서비스가 챗GPT 음성 채팅에서만 적용된다고 밝혔고, 최근 새로운 팟캐스트 음성 번역 기능을 발표한 스포티파이(Spotify)에 음성 시스템 라이선스를 제공하고 있다. 이로써 스페인어, 프랑스어, 독일어로 인기 팟캐스터의 목소리를 모방할 수 있게 될 예정이다. 물론 이 새로운 기능은 챗GPT의 '플러스(Plus)' 또는 '엔터프라이즈(Enterprise)' 서비스 비용을 지불한 사용자에게만 제공되며 두 기능 모두 10월 중순께 iOS와 안드로이드(Android)에서 사용할 수 있게 된다. 챗GPT 웹 버전 사용자도 곧 이미지 기능을 이용할 수 있게 될 전망이다. 다만, 이 시스템은 프로모션 비디오에서 제안하는 것처럼 빠르거나 능숙하지는 않을 것으로 보인다. 과학 기술매체 와이어드(Wired)에 따르면, 챗GPT 시험용 버전을 기반으로 음성 인식이 응답하는 데 몇 초가 걸렸다. 이 매체는 이미지 시스템이 사진 속 사람을 식별하려고 시도하지 않을 것이며, 사생활을 어떻게 보호할지 두고 봐야 할 것이라고 지적했다. 오픈AI 대변인은 기즈모도에 "시간이 지나면서 점진적으로 개선하고 위험을 줄일 수 있는 세부 사항들을 다듬는 것이 중요하다"며 "이 새로운 기능을 최소화하기 위해 '레드팀'을 구성했다"고 밝혔다. 그러나 사용자들이 다시 한번 챗봇의 윤리적 경계를 넘어서는 것은 시간문제다. 챗GPT는 지난 2022년 11월 공개 직후 대대적으로 인기를 끈 이후 사용자 수가 감소했다. 이는 일부 사용자들이 오픈AI가 챗봇의 기능을 제한했다고 느꼈기 때문이다. 오픈AI는 피해를 최소화하고 챗봇 사용자들이 자유롭게 활용할 수 있는 윤리적 균형을 찾는 데 어려움을 겪고 있다. 한국어 개인정보 방침 제공 한편, 오픈AI는 지난 2023년 9월 비영어 국가 중 처음으로 한국어로 된 개인정보 처리방침을 제공하고 국내 이용자를 위한 개인정보 가이드라인을 마련했다. 회사 서비스를 통해 수집되는 개인정보를 추가로 이용하기 위한 조건과 아동의 기준이 상향된 것으로, 국내 이용자 687명의 개인정보 유출 건에 대한 개인정보보호위원회의 개선 권고 일환이다. 오픈AI가 대한민국 이용자로부터 수집한 개인정보를 활용하기 위해서는 먼저 수집된 개인정보의 추가적인 이용·제공이 당초 수집 목적과 관련성이 있어야 한다. 동시에 수집한 데이터를 추가로 이용·제공할 수 있다는 예측도 가능해야 한다. 또 대한민국 '아동'의 연령기준을 13세에서 14세로 상향했다. 이밖에도 '처리 위탁 및 국외 이전'의 기준을 마련하고 '개인정보 파기 절차 및 방법', '정보주체와 법정대리인의 권리', '연락처', '국내대리인'을 명시했다.
-
- IT/바이오
-
챗GPT, 음성↔텍스트 상호 변환...소통 능력 향상 기대
-
-
고인과 대화하는 디지털 네크로맨시, 구원일까 모독일까
- 인공지능(AI) 기술이 발달하면서 고인을 디지털 방식으로 소생시키는 기술에 사회의 이목이 집중되고 있다. 일본매체 나조로지(nazology)에 따르면 이른바 '디지털 네크로맨시(digital necromancy, 디지털 강령술)'라 불리는 이 기술은 고인의 텍스트 기록과 이미지를 기반으로 그들과의 상호작용을 구현한다. 일기나 편지와 같은 기록을 활용해 실제 인간과 같은 대화를 가능하게 하는 챗GPT(ChatGPT)와 같은 언어 모델, 또는 생성형 AI(인공지능)를 통해 실존하지 않는 이미지와 영상을 합성하는 기술이 결합된 것이다. 일본에서는 '가상의 고인'이라는 이름으로 이 기술이 큰 주목을 받고 있으며, 해외에도 '실제로 고인과 대화 가능한 AI' 서비스가 속속 등장하고 있다. 특히 2019년 일본 NHK 홍백전에서 'AI 미소라 히바리'의 무대가 큰 화제가 되었다. 약 34년 전인 1989년 세상을 떠난 국민 가수 미소라 히바리의 목소리와 노래 스타일을 야마하의 'VOCALOID: AI' 기술로 완벽하게 재현한 것이었다. 이 같은 기술의 등장은 사회적으로 큰 관심사로 자리잡았지만 윤리적 논란도 동반되고 있다. AI를 활용한 '미소라 히바리'의 재현에 대한 반응은 엇갈렸다. 일부는 감동으로 눈물을 흘렸으나, 다른 이들은 이를 기묘하게 여기거나 죽은 이에 대한 무례로 비판했다. 죽은 이의 부활은 정말로 기술의 금기인가? 이러한 질문에 따른 답을 찾기 위한 프로젝트가 2020년 한국에서 진행되어 전세계적인 주목을 받았다. 해당 프로젝트는 가상현실을 재현하는 VR(Virtual Reality) 기술을 활용하여 어린 나이에 사망한 딸과 어머니의 재회를 진정성 있게 재현했다는 평을 받았다. 장모 씨는 2016년 희귀 난치병으로 7세 딸 나연이를 잃었다. 그러나 3년 후, 텔레비전 다큐멘터리를 통해 나연이가 다시 재현되었다. 나연이의 실제 모습과 행동, 목소리를 재현하기 위해 모션 캡처와 딥 러닝 기술이 병행되었고, 장씨는 VR 고글을 통해 딸과의 감동적인 재회를 했다. 이 프로그램을 시청한 많은 사람들이 어머니와 딸의 VR 재회 장면에 감동을 받았다. 다수의 시청자들은 이 감동적인 순간을 칭찬했지만, 동시에 VR 기술을 통한 재회가 어머니의 상처를 더 깊게 할 수도 있다는 우려의 목소리도 커지고 있다. 이와 관련하여 AI 기술의 발전이 죽은 이를 디지털로 재현, 상호 작용하는 것의 윤리적 측면에 대한 논란이 계속되고 있다. 고인을 추모하며 묘소에 찾아가 그들에게 이야기하는 것과 같이, AI를 통해 사망한 이와의 상호작용은 어떻게 받아들여져야 할까? 특히 가장 가까운 가족들에게는 이러한 기술이 어떤 의미를 지니는지가 중요한 문제이다. 이러한 윤리적 논점은 기술 발전의 속도와 사회의 가치 사이에서의 균형을 찾아야 하는 어려운 과제로 떠오르고 있다.
-
- IT/바이오
-
고인과 대화하는 디지털 네크로맨시, 구원일까 모독일까
-
-
[퓨처 Eyes(4)] 2023년 이후 주목받는 AI 트렌드 5가지
- 인공지능(AI) 시장은 지난 몇 년 동안 기하급수적인 속도로 성장했다. 전 세계적으로 널리 알려진 챗GPT(ChatGPT)와 구글 바드(Bard), IBM의 왓슨(Watson), 네이버의 클로바X와 같은 제품 덕분에 이런 성장이 가능했다. 글로벌 경영 컨설팅 회사인 맥킨지(McKinsey)는 현재 전체 조직의 50~60%가 이미 AI 기반 도구를 사용하고 있으며, 이 비율은 가까운 미래에 더욱 늘어날 것으로 추정된다. 포브스 보고에 따르면, AI는 현재 세계에서 가장 빠르게 성장하고 있는 산업 중 하나이다. 이 분야의 시장 가치는 10년 내로 연평균 37.3%의 성장률을 기록하며, 같은 기간 동안 약 1조 8100억 달러의 누적 가치에 이를 것으로 전망된다. 이러한 증가세는 근거가 없는 것이 아니며, 실제로 많은 전문가들이 2030년까지 AI가 세계 경제에 기여할 가치가 15조 7000억 달러에 이를 것으로 예측한다. 이는 현재 인도와 중국의 GDP를 합한 것보다도 더 큰 금액이다. 이러한 예상은 생성형 AI)와 자연어 처리(NLP) 같은 특정 기술 트렌드의 발전 덕분이라고 할 수 있다. 기술의 중요성이 점점 부각됨에 따라, 시장 및 기술 전문가들은 AI가 주도하거나 영향을 미칠 주요 트렌드들에 주목하고 있다. AI 어시스턴트의 성장부터 생성형 AI의 부상까지 코인텔레그래프가 진단한 '2023년 이후 주목받는 AI트렌드 5가지'를 소개한다. AI 어시스턴트 사용 증가 기술이 지속적으로 발전하며 확장되면서, AI 어시스턴트는 다양한 서비스 분야의 자동화와 디지털화를 가능하게 하는 준비 상태에 있다. AI 기반 디지털 서비스 개발사 VAIOT의 최고 운영 책임자 파베 안드루슈키에비츠는 법률 서비스, 공공 행정, 시민 서비스 등이 AI의 도움으로 크게 향상될 수 있는 몇몇 분야라고 지적했다. 그는 "AI 어시스턴트는 사용자에게 더 나은 접근성과 비용 절감, 사용의 편리성을 제공한다. 법률 서비스의 경우, 많은 사람들이 비용 문제나 접근성의 어려움으로 인해 이용하는데 어려움을 겪기도 한다. AI 어시스턴트는 24시간 연중무휴로 모바일 기기에서 접근 가능한 '자연스러운 사용자 인터페이스'를 제공함으로써, 이런 부분의 장벽을 낮추어 누구나 쉽게 법률 지원을 받을 수 있도록 도와준다"고 설명했다. 포춘 500대 기업에서 AI 도입 선호도 상승 AI 컨설팅 전문 회사 킨포크스(Keenfolks)의 미구엘 마차도 CEO이자 공동 창립자는 최근 사람들이 AI 제품의 빠른 확장 속도와 폭넓은 접근성에 대해 놀라게 될 것이라고 전망했다. 그는 오픈AI의 챗GPT 인터페이스가 2022년 3월에 출시된 후 현재 사용자 수가 1억 명이 넘는 것을 예로 들었다. 그는 "다양한 파일럿 실험을 통해, 포춘 500대 기업은 AI 전략을 더 빠르게 조정하고 향상시킬 수 있을 것이며, 커뮤니티는 언어 모델에 대한 지식을 활용하여 협동 학습과 기술 개발을 추진하는 플랫폼 구축에 핵심 역할을 할 것"이라고 강조했다. 마차도는 법률, 인사, 재무 등의 분야에서 최고 경영진이 비즈니스를 혁신하기 위해 AI를 적극 도입하는 추세가 확산되고 있다고 지적했다. 그는 "노코드(Nocode) 솔루션의 등장은 AI도입을 대중화해서 기술적 전문성이 부족한 브랜드들도 첨단 기술을 그들의 운영체계에 손쉽게 통합하게 만들어줄 것"이라고 덧붙였다. 생성형 AI 급성장 최근 몇 년 간 많은 AI 기반 애플리케이션은 기존 데이터를 활용하여 예측하거나 인사이트를 추출하는 예측 모델에 주로 의존했다. 이렇게 생성된 결과는 기존 데이터에서 파생되며 실제로 새로운 내용을 제공하지 않는다. 반면, 생성형 AI는 머신러닝과 딥러닝을 사용해 기존 학습 데이터 위에 구축된 새로운 패턴을 사용하여 독립적으로 계산된 독창적인 정보를 생성한다. 지난 한 해 동안 이러한 모델은 텍스트, 이미지, 오디오 및 비디오 콘텐츠를 생성하는 데 광범위하게 사용됐다. 메타와 언스트앤영의 생성형 AI 전문가이자 기술 자문인 헨리 아더(Henry Ajder)는 이 기술의 미래 가능성에 대해 "우리는 현재 생성형 기술의 초기 단계에 있으며, 앞으로 합성 미디어는 단순한 신기함에서 벗어나 엔터테인먼트, 교육, 접근성 등의 분야에서 큰 발전을 이끌 것"이라고 전망했다. 자연어 처리(NLP) 시스템의 성장 가까운 미래에 큰 관심을 받을 것으로 예상되는 AI 분야 중 하나는 자연어 처리(NLP)이다. 이 기술은 검색 엔진부터 음성 인식 시스템까지, 많은 사람들이 일상적으로 의존하는 다양한 기술 제품의 핵심이다. NLP를 통해, 기계는 사람의 언어를 보다 자연스럽게 이해하고 해석하여 대응할 수 있다. 실제로, 언어 모델링, 구문 분석, 감정 분석, 기계 번역, 음성 인식 등의 방식을 활용하여 이 기술은 다양한 비즈니스 환경에서 사용자에게 현실적인 대응을 제공한다. 아직 초기 단계이 이 분야의 잠재력을 강조하는 그랜드 뷰 리서치(Grand View Research)의 최신 보고서에 따르면, 2023년에서 2030년 사이에 연평균 40.4%의 성장률을 보일 것으로 예상되며, 10년 후에는 약 4385억 달러의 시장 규모를 이룰 것으로 전망된다. 의료 분야의 AI 활용 확대 포브스에 따르면, 의료 분야에서 AI의 활용은 질병을 진단하고 치료하는 의사의 방식을 혁신적으로 바꿀 것으로 보인다. 또한 신약 개발과 의학 연구 분야에서도 머신 러닝의 적용이 확대될 것이다. 2027년까지 신약 개발에 AI가 사용되는 규모는 40억 달러에 달할 것으로 예상된다(45.7%의 연평균 성장률로 성장). 마찬가지로 미국 의료 서비스 제공업체의 50% 이상이 내부 의료 프로세스의 일부로 로보틱스 프로세스 자동화와 같은 AI 도구를 도입했거나 도입할 계획이다. 2027년까지 AI가 신약 개발에서 차지하는 부분은 약 40억 달러로 추정되며, 이는 45.7%의 연평균 성장률로 성장할 것으로 예측된다. 또한, 미국의 의료 서비스 제공자 중 절반 이상이 로보틱스 프로세스 자동화 등의 AI 도구를 의료 프로세스에 통합하거나 도입 계획을 세우고 있다. 결과적으로 AI, 머신러닝, 딥러닝, 자연어 처리와 같은 첨단 기술이 주도하는 디지털 시대로 전환하면서 다양한 산업에서 이러한 기술의 적용이 확대되어, 보다 디지털화되고 자동화된 미래를 구축하는 데 큰 역할을 할 것으로 예상된다.
-
- 포커스온
-
[퓨처 Eyes(4)] 2023년 이후 주목받는 AI 트렌드 5가지
-
-
오픈AI의 GPT-4 경쟁자 구글 '제미니', 올해 말 공개 예정
- 기술 대기업 구글에서 오픈AI의 생성형 인공지능(AI) 챗GPT의 대항마인 '제미니(Gemini)'를 출시한다. 현재 생성형 AI 시장의 예상 가치는 2032년까지 1조 3000억 달러에 달할 것으로 전망된다. 지난해 11월 첫선을 보인 오픈AI의 챗GPT는 이미 월간 활성 사용자 수가 1억 명을 돌파하며 그 성장세를 이어가고 있다. 이러한 상황에서 구글이 자체 개발한 대화형 AI 챗봇 '바드(Bard)'와 새로운 언어 모델(PaLM 2 LLM)을 선보이며 시장에서의 존재감을 확대하고 있다. 4일(현지시간) 기술 전문매체 더 테크아웃룩에 따르면 구글이 올해 말 오픈AI의 챗GPT의 GPT-4와 직접적으로 경쟁할 수 있는 '제미니'를 공개할 예정이라는 소식이 전해졌다. GPT-4는 오픈AI에서 개발한 자연어 처리(NLP) 모델로, GPT(Generative Pre-trained Transformer) 시리즈의 네 번째 버전으로 5000억 개의 파라미터를 가지고 있는 것으로 알려졌다. 이전 버전인 언어 기반 인공지능 모델 GPT-3는 약 1750억 개의 파라미터를 가지고 있다. 제미니는 구글이 보유한 TPUv5 칩, 총 1만6384개의 칩을 활용해 훈련되었으며, 훈련 데이터는 압도적인 65조 개의 토큰으로 이뤄져 있다. 또한 유튜브 콘텐츠와 알파고의 훈련 기법 역시 활용되었다. 시장 전문가들은 구글 제미니가 GPT-4를 능가할 세 가지 주요 이유를 지적한다. 첫째, 텍스트와 이미지 생성 능력, 둘째, 구글 서비스에서 확보한 독점적 학습 데이터, 그리고 셋째, 세르게이 브린(구글 공동 창업자)과 폴 바햄(딥마인드 수석 AI 과학자 겸 머신러닝 전문가) 등 AI 분야의 석학들이 구글의 딥마인드와 브레인 팀의 협력으로 더 많은 것을 기대할 수 있다는 점이다. 아직 결과는 미지수지만, 구글의 '제미니'가 얼마나 GPT-4에 버금가는 성능을 보여줄 것인지에 대한 관심이 높아지고 있다.
-
- IT/바이오
-
오픈AI의 GPT-4 경쟁자 구글 '제미니', 올해 말 공개 예정
-
-
마이크로소프트, AI 탑재 백팩 특허 획득
- 기술 대기업 마이크로소프트(MS)는 스마트 센서가 탑재된 인공지능(AI) 기반 백팩 디자인에 대한 특허를 취득했다. 미국 기술 전문매체 톰스 하드웨어(Tom's Hardware)에 따르면 미국 특허청(USPTO)은 지난 5월 출원된 마이크로소프트의 AI 기반 백팩 특허를 최근 승인했다. MS파워유저(MSPowerUser)가 처음 보도한 마이크로소프트의 디지털 비서가 장착된 백팩 특허는 '인공 지능 지원 웨어러블'에 대한 것으로 명시되어 있다. 공개된 AI 탑재 백팩 특허 삽화와 주요 예시 대부분은 독특한 디자인으로 시선을 끌고 있다. MS 스마트 백팩의 주요 디자인 특징으로 암 스트랩(Arm strap)에 여러 개의 센서가 내장됐다. 착용자의 정면을 향하고 있는 이 센서들은 각각 카메라, 마이크, GPS, 나침반 등의 기능을 포함한다. 마이크로소프트는 백팩의 스트랩(strap, 끈)에 햅틱 액추에이터(haptic actuator, 촉각적 피드백을 생성하기 위해 사용하는 장치)뿐만 아니라 LED와 스피커를 추가했다. 스마트 웨어러블에는 일부 실시간 처리가 필요한 것으로 보인다. 따라서 이미지, 텍스트, 음성, 얼굴 및 인지 인식을 제공하기 위해 다양한 인식 모듈이 들어 있다. 백팩에 탑재된 시스템은 AI 스마트 기능을 위해 내장된 처리 능력에 데이터를 공급하는 실시간 모니터뿐만 아니라 기록 장치(온보드 스토리지 사용), 무선 연결, 배터리 전원/충전 등의 기능도 갖추고 있다. 착용자는 위의 모든 감지 및 처리 기능을 갖춘 디지털 백팩을 통해 AI의 향상된 사물 식별과 분석, 주변 기기와의 상호 작용, 상황별 인사이트 확보 등의 혜택을 누릴 수 있을 것으로 예상된다. 위 그림에서 데이터 플로(Flow) 차트는 백팩과 데이터 피드가 개인용 컴퓨터 및 클라우드 서버와 함께 작동하는 방식을 보여준다. 또 다른 삽화(아래 그림)에서는 디지털 백팩을 메고 돌아다니는 사람이 스키장을 탐색하고 슈퍼마켓 가격을 확인하고 콘서트 티켓 예매를 고려하는 모습을 보여준다. 사용자는 때때로 "헤이 백팩, 이 포스터를 내 캘린더에 추가해 줘"와 같이 음성을 통해 백팩에 내장된 AI와 상호 작용할 수 있다. 또는 스트랩의 센서와 상호 작용해 일부 AI 동작 또는 상황에 맞는 작업을 실행할 수도 있다. 마이크로소프트의 특허는 주로 집 밖에서 디지털 비서의 유용성에 대해 집중한 면모가 돋보인다. PC 프로세서는 이제 전용 AI 가속 하드웨어를 갖추기 시작했으며, 마이크로소프트는 사무실 생산성 및 협업 도구에 AI를 빠르게 통합한 것으로 보인다. 그러나 톰스 하드웨어는 마이크로소프트의 AI 백팩은 개발 과정에서 드러난 시장성 부족이나 기타 단점으로 인해 많은 특허가 취소되었기 때문에 실현되지 않을 수도 있다고 전했다.
-
- IT/바이오
-
마이크로소프트, AI 탑재 백팩 특허 획득
-
-
반도체 '쿠데타', 엔비디아 AI원스톱 시스템으로 세계 선두로
- 인공지능(AI)의 성장과 함께 반도체 산업도 그 국면을 바꾸고 있다. CPU(중앙연산처리장치)와 GPU(그래픽처리장치)의 전통적인 경계는 흐려지며, 인텔과 엔비디아가 그 양대산맥에서 새로운 경쟁을 펼치고 있다. 특히, 엔비디아는 AI 분야에서의 독보적 지배력을 강조하며, 칩부터 소프트웨어, 그리고 다양한 서비스까지 AI 개발을 위한 원스톱 시스템을 제공함으로써 세계적인 톱 위치를 차지하게 되었다. 최근의 데이터센터와 인공지능 열풍은 기존의 반도체 업체들에게 큰 변화의 기회를 제공했다. 닛케이, 뉴욕타임스 등 외신들에 따르면, CPU 최대 업체인 미국 인텔과 GPU 최대 업체인 미국 엔비디아는 서로의 강점을 잠식하는 방향으로 성능 향상을 모색하고 있다. 이 중에서도 엔비디아는 AI에 특화된 원스톱 솔루션으로 시장의 주목을 받으며 독보적인 위치를 확립했다. 뉴욕타임스에 따르면, 신경과학자 출신의 기술 기업가 나빈 라오(Naveen Rao)는 "인텔이 인수한 스타트업에서 AI 작업에 적합한 GPU를 대체할 칩 개발을 했으나, 속도에서 뒤처진 인텔에 비해, 엔비디아는 신속한 제품 업그레이드와 새로운 AI 기능 도입으로 경쟁력을 확보했다"고 주장했다. 라오는 인텔을 떠나 모자이크ML(MosaicML)을 창업, 엔비디아의 칩을 사용해 경쟁사의 칩과 비교 평가했다. 그에 따르면 엔비디아는 자체 기술로 대규모 AI 프로그래머 커뮤니티를 형성해, 단순한 칩 생산 이상의 차별화를 달성했다고 전했다. 엔비디아의 경영전략 AI 집중 선택 엔비디아는 자사의 AI 알고리즘 및 개발 도구를 통해 개발자와 연구자들이 AI 솔루션을 제작하는 데 필요한 지원을 제공하며, 독특한 커뮤니티 활동을 통해 혁신적인 AI 솔루션을 지속적으로 개발하고 공유하고 있다. 엔비디아는 AI를 위한 다양한 제품 라인업을 보유, GPU를 비롯하여 AI에 특화된 칩, 클라우드 서비스, 고성능 서버 및 슈퍼컴퓨터 솔루션, 그리고 AI 연구와 개발 지원 시스템 등을 포함한다. 10년 동안 거의 경쟁 없는 자리를 유지하며, 챗봇용 텍스트 생성 등에도 성공한 바 있다. 엔비디아 젠슨 황(Jensen Huang) 최고경영자(CEO)는 '씨그래프(SIGGRAPH)'에서 생성 AI시대의 새로운 프로세서인 '그레이스 호퍼(Grace Hopper)' AI 반도체를 발표했다. 이 반도체는 엔비디아가 처음으로 데이터센터용으로 개발한 CPU를 포함하며, 주력 GPU 'H100'과 결합하면 AI 학습 속도를 기존 대비 약 4배 향상시킬 수 있다. 젠슨 황CEO는 "회사의 초점이 항상 AI 개발에 있어 원스톱 샵의 위치를 확보했다"고 밝혔다. 엔비디아 그레이스 호퍼 vs 인텔 GPU 맥스 리서치 회사인 옴디아(Omdia)에 따르면 구글, 아마존, 메타, IBM 등도 AI칩을 출시하고 있지만, 엔비디아는 AI 칩 시장의 70% 이상을 차지해, 2분기 매출은 월스트리트의 예상을 크게 뛰어넘는 64%의 증가를 기록했다. 현재 시가총액 1조 달러(약 1321조 원)로, 세계에서 가장 가치 있는 칩 제조업체로 올라섰다. 엔비디아는 지난 10여 년 동안 이미지, 얼굴, 음성 인식 등의 복잡한 AI 작업을 위한 칩의 생산에서 뚜렷한 우위를 보여왔다. 특히, 챗봇용 텍스트 생성 기술인 챗GPT와 같은 분야에서의 성과를 통해 그 능력을 입증하며, 초기 AI 추세를 선제적으로 파악하고 적극 반영함으로써 경쟁력을 강화했다. 인텔도 엔비디아에 뒤질세라 적극적인 반격 자세를 취하며 지난 6월 데이터센터용 AI 반도체인 'GPU 맥스 시리즈'를 시장에 선보였다. 이 제품은 고성능 GPU를 탑재하며, 특히 AI를 이용한 이미지 분석 등에서는 엔비디아의 H100보다 우수한 성능을 보여주는 것으로 알려졌다. 맥스 시리즈의 핵심 반도체는 인텔의 7나노미터 기술과 대만 TSMC의 5나노미터 기술이 통합됐다. 21년 만에 인텔로 복귀한 팻 겔싱어 CEO는 전통적인 독립 제조 방식에서 벗어나 엔비디아를 탄력있게 추격하고 있다. 캐나다의 조사기관 프레지던트 리서치 예상에 따르면 2023년 AI 반도체 시장은 전년 대비 30% 성장하여 218억 달러 규모에 이를 것으로 보인다. AI 반도체의 시장 점유율은 전체의 3%에 불과하지만, 고가 거래가 빈번하게 일어나고 있으며, AI 반도체는 현재의 반도체 시장에서 가장 주목받는 영역 중 하나다. 삼성전자와 비슷하지만 다른 엔비디아 전략 엔비디아와 삼성전자는 AI 분야에서 각기 다른 전략을 펼치며 세계적인 경쟁을 펼치고 있다. 엔비디아는 GPU와 같은 특화된 AI 하드웨어의 개발 및 제조에 중점을 둔다. 또한, 개발자들을 위해 소프트웨어 도구와 프레임워크를 제공하며, GPU 클라우드 서비스로 AI 작업의 효율성을 높이고 있다. 반면 삼성전자는 반도체 분야의 세계적인 위치를 바탕으로 AI 칩과 컴퓨팅 솔루션을 제작하며, 이를 스마트폰, 자율주행차, 그리고 다양한 AI 응용프로그램에 적용한다. 또한, 가전제품에서의 음성인식 AI 기술 개발로 스마트 홈 환경을 강화하고 있다. 예컨대, 엔비디아는 AI 하드웨어와 관련된 도구 및 서비스를 중심으로 생태계를 구축하는 반면, 삼성전자는 다양한 전자 제품에서 AI를 접목해 스마트한 기술 환경을 선도하고 있다. 두 기업은 각자의 강점을 바탕으로 AI 분야에서 세계 각국과 경쟁하며 주도권을 놓고 다투고 있다. 한편 반도체 기술의 지속적인 발전에 따라, 서로의 강점을 지닌 분야를 잠식하고 있는 인텔과 엔비디아의 싸움에 세계 반도체가 흥미진지하게 지켜보고 있다. 인텔과 엔비디아는 모두 압도적인 자금력과 연구 및 개발 능력을 보유하고 있어, 반도체 산업 내에서의 핵심적인 위치를 계속 유지할 것으로 전망된다. 산업 전문가들은 엔비디아에서 촉발된 반도체 산업의 독점적 구조 변화를 산업의 건강한 발전의 일환으로 평가하며, 이로 인해 경쟁이 활성화되어 더 우수한 기술 및 제품이 시장에 등장할 것이라는 기대감을 드러냈다.
-
- IT/바이오
-
반도체 '쿠데타', 엔비디아 AI원스톱 시스템으로 세계 선두로
-
-
네이버, 생성형 AI '하이퍼클로바X' 공개…11월 검색엔진에 통합
- 한국판 생성형 인공지능(AI)이 드디어 베일을 벗었다. 한국 대표 인터넷 대기업 네이버가 최근 생성형 AI '하이퍼클로바 X(HyperCLOVA X)'를 공개하며 세계 AI 경쟁 무대에 데뷔했다. 네이버의 대규모 언어모델(Large Language Model, LLM)은 챗GPT와 유사한 인공지능 챗봇인 '클로바 X'와 마이크로소프트 빙(Bing)에 해당하는 생성형 AI 기반 검색 엔진인 '큐(Cue)'등의 서비스를 제공한다. 세계는 현재 생성형 AI 분야에서의 경쟁이 가열되고 있다. 네이버의 생성형 AI 출시는 다른 글로벌 기업들의 AI 강화 움직임에 발맞춰 이루어진 것이다. 오픈AI는 마이크로소프트의 지원을 받으며 이 경쟁을 선도하고 있다. 구글은 '바드'라는 AI 챗봇을 출시하고 미국 인공지능 스타트업 '앤트로픽'(Anthropic)에 투자하는 한편, 중국의 바이두는 '어니봇'을 선보였다. 메타와 아마존 같은 기업들 또한 자신들만의 AI 챗봇을 곧 선보일 계획이다. 미국이 생성형 AI 분야를 선도하는 가운데, 네이버의 한국판 생성형 AI 출시는 국내외에서 높은 관심을 받고 있다. 해외 IT 전문 매체 테크크런치 보도에 따르면, 네이버 클라우드에서 출시한 '하이퍼클로바 X'는 지난 8월 24일부터 한국어와 영어로 베타 서비스를 시작했다. 그리고 '큐'는 9월의 베타 테스트를 마치고 11월에는 네이버의 기존 검색 엔진과 통합될 계획이다. 네이버 측은 "하이퍼클로바 X는 크리에이터와 기업 고객 모두가 사용 가능하다"라며, 이는 2021년에 출시된 한국어 LLM 하이퍼클로바의 업그레이드 버전이라고 설명했다. 또한, 하이퍼클로바는 2400억 개 이상의 파라미터를 가지고 있음을 공개했지만, 하이퍼클로바 X에 얼마나 많은 파라미터가 학습되었는지는 구체적으로 공개하지 않았다. 네이버 최수연 대표는 주주에게 보낸 서한에서 "회사는 AI 전문가 500명을 보유하고 있으며, 1000억 개 이상의 파라미터로 구성된 대규모 언어 모델을 독자적으로 개발한 전 세계 5개 기업 중 하나"라고 밝혔다. 네이버 클라우드의 기술 및 하이퍼스케일 AI 책임자인 성낙호 총괄은 "네이버 클라우드는 텍스트부터 이미지, 동영상, 오디오에 이르기까지 다양한 데이터를 분석하고 생성하는 다중 모드 언어 모델의 개발을 진행 중"이라고 밝혔다. 즉, 클로바 X는 텍스트, 이미지, 음성 등의 다양한 데이터 형태를 통합해 학습함으로써 기존 언어 모델보다 더 깊은 정보 인식과 풍부한 정보 제공이 가능하다. 네이버는 한국, 일본, 동남아시아뿐만 아니라 중동, 스페인, 멕시코와 같은 비영어권 국가와 정치적으로 민감한 지역에서도 맞춤형 AI 애플리케이션을 제공하려고 한다. 이를 통해 경쟁사들이 아직 진출하지 않은 지역에 주목하고 있다는 점을 강조했다. 네이버의 최수연 대표는 컨퍼런스에서 11월에 60만 대의 서버로 구축된 'GAK 세종'이라는 두 번째 데이터 센터를 한국에서 오픈할 예정이라고 밝혔다. 네이버는 지난해 12월부터 삼성과 함께 하이퍼스케일 AI를 위한 AI 칩 개발에 착수했고, 삼성 또한 곧 기업용 생성형 AI를 출시할 계획이다. 네이버는 판매자, 창작자, 광고주를 포함한 파트너들을 위한 AI 기술 도구를 선보일 예정이다. '클로바 for Writing'이라는 글쓰기 도구와 '클로바 for AD'라는 광고 상품을 통해 다양한 네이버 서비스에 생성형 AI를 신속하게 통합할 계획이다. 또한 네이버 클라우드는 AI 기반의 B2B 상품을 출시하며, '뉴로클라우드'라는 완전 관리형 하이브리드 클라우드 서비스와 '클로바 스튜디오'라는 AI 개발 도구로 고객 기업들의 자체 생성형 AI 구축을 지원할 방침이다. 전문가들은 네이버의 강점이 다양한 서비스와 파트너들이 연계되어 성장을 이끌어내며, 그 결과로 플랫폼의 발전이 이루어지는 '위닝 루프' 구조에 있다고 지적하며, "하이퍼클로바X가 이 과정을 가속화시킬 것"이라고 전망했다.
-
- IT/바이오
-
네이버, 생성형 AI '하이퍼클로바X' 공개…11월 검색엔진에 통합
-
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?
- 마이크로소프트(MS) 창업자 빌 게이츠가 "인터넷의 발명만큼 중대한 사건"이라고 극찬한 챗GPT(Chat GPT)는 오픈AI에서 개발한 대화형 인공지능(AI) 서비스로, 대량의 데이터를 학습해 새로운 정보를 생성하고 응답하는 능력을 갖춘 시스템이다. 챗GPT는 챗(Chat)과 GPT(Generative Pre-trained Transformer)의 합성어로, 트랜스포머(Transformer) 계열의 대규모 언어 모델(GPT-3.5)을 기반으로 한다. GPT-3.5는 오픈AI에서 개발한 GPT-3의 업그레이드 버전으로, 1000억 개의 파라미터를 가지고 있다. 파라미터란 AI가 학습할 수 있는 변수의 수를 의미하는데, 이는 GPT-3의 2배에 달한다. 챗GPT는 강화학습(RLHF) 방식을 채택해 자신의 행동에 따른 보상을 통해 스스로 학습하고 발전할 수 있다. 챗GPT는 번역 및 문장 재구성, 텍스트 요약, 콘텐츠 생성, 코딩 등 다양한 영역에서 우수한 성능을 뽐내고 있다. 무엇보다 인간 고유의 영역이라 여겨져 온 창작의 영역까지 AI가 파고든 사실에 많은 사람이 놀라고 있다. 지난해 11월 선보인 챗GPT는 출시된 지 5일 만에 이용자 수 100만 명을 확보했고, 1억 명을 돌파하는 데는 두 달이면 충분했다. 현재 전 세계적으로 가장 많은 사용자를 보유하고 있는 AI 서비스로 자리매김했다. AI 지능 저하 '드리프트' 현상이란? 인공지능(AI)의 새로운 패러다임인 챗GPT와 같은 채팅AI가 의사 면허 시험을 통과하거나 복잡한 수학 문제를 놀라운 정확도로 풀 수 있다는 보고서도 나왔다. 그런데 최근 챗GPT의 성능이 급격히 저하되는 현상이 나타나 인공지능 학계를 발칵 뒤집어 놓았다. 파겐 와사니 테크롤로지스(Fagen Wasanni Technologies)와 일본 매체 기가진(gigazine)의 최근호에 따르면 올해 3월부터 6월까지 채팅 AI의 수학 능력이 급격히 떨어지는 현상이 발견됐다. 이러한 채팅 AI의 지능 저하 현상을 '드리프트(drift)'라고 한다. 외신에 따르면 미국 스탠포드 대학과 UC 버클리가 올해 3월과 6월 두 차례에 걸쳐 오픈AI의 대규모 언어모델(LLM) 'GPT-3.5'와 'GPT-4'로 구동되는 챗GPT에 '수학 문제', '코드 생성', '시각적 추론', '민감한 질문' 등 4가지 과제를 부여해 그 답변의 신속성과 정확성을 분석했다. 그 결과, '17077은 소수인가?'와 같은 단순 수학 문제에 대한 GPT-4의 응답 정확도가 2023년 3월부터 6월 사이에 97.6%에서 무려 2.4%로 급락한 것으로 나타났다. 두 대학의 연구진에 따르면, "AI의 드리프트 문제는 매우 복잡한 AI 모델의 일부를 개선하려고 할 때 모델의 다른 부분의 성능이 저하되는 문제"라고 설명했다. 연구원들은 3월과 6월 다양한 버전의 LLM을 테스트하고 위의 네 가지 과제 외에 미국 의사 면허 시험, 시각적 추론을 포함한 다양한 AI 작업에서 성능을 평가했다. 그 결과, LLM이 제공하는 답변에 상당한 변동성이 있는 것으로 나타났다. 특히 GPT-4의 수학 문제 해결 능력은 3월과 6월 사이에 정확도가 84.0%에서 51.1%로 떨어지는 등 급격히 악화됐다. 반면, GPT-3.5의 정확도는 같은 기간 동안 49.6%에서 76.2%로 향상됐다. 연구원들은 또한 특정 작업에서 지시를 따르는 GPT-4의 능력이 저하되는 것을 관찰했다. 예를 들어, '행운의' 숫자와 관련된 수학 문제에서 GPT-4의 정확도는 3월과 6월 사이에 83.6%에서 35.2%로 떨어졌고 GPT-3.5의 정확도는 30.6%에서 48.2%로 오히려 증가했다. 또한 ‘민감하거나 위험한 질문’에 답변하려는 LLM의 의지에 변화가 있었다. GPT-4는 응답률이 21.0%에서 5.0%로 급격히 낮아졌고, GPT-3.5는 2.0%에서 5.0%로 소폭 증가했다. 복잡한 추론 과제에서 GPT-4는 정확한 답변을 생성하는 점이 1.2%에서 37.8%로 증가해 개선된 모습을 보였다. 그러나 GPT-3.5의 추론 완전 일치 성공률은 22.8%에서 14.0%로 감소했다. 연구원들은 또한 시간이 지남에 따라 LLM이 생성한 코드의 실행 가능성도 감소하는 것을 관찰했다. 또 미국 의사 면허 시험에서 GPT-4의 성적은 86.6%에서 82.4%로 소폭 하락한 반면, GPT-3.5는 54.7%였다. 시각적 추론 과제에서 약간의 개선이 있었지만 두 모델 모두 전반적인 정확도는 여전히 낮았다. 연구진은 짧은 시간 내에 GPT-3.5와 GPT-4의 성능과 동작에 상당한 변화가 있었다는 점을 강조했다. "AI 미세 조종시 다른 영역서 후퇴" 스탠포드대 제임스 조우(James Zou) 컴퓨터 과학 연구원은 "AI 모델을 미세 조정해 특정 방향으로 강화하면 다른 영역에서는 후퇴할 위험이 있다"며 "AI 모델을 지속적으로 개선하는 것은 매우 어렵다"고 말했다. 또한 조우 연구원은 "우리는 GPT-4와 같은 AI 모델에서 언젠가 드리프트 문제가 발생할 것으로 예상했지만, 이렇게 빨리 드리프트 문제가 발생한 것에 대해 매우 놀랐다"고 했다. 해외 매체 크립토폴리탄(Cryptopolitan)은 AI의 드리프트 문제에 대해 "이 문제는 프롬프트 엔지니어링(Prompt Engineering)이라는 급성장 중인 트렌드와 관련이 있을 수 있다"고 추측했다. '프롬프트 엔지니어링'은 사용자가 프롬프트를 만들어 AI로부터 특정 반응을 이끌어내는 개념이다. 이 매체는 "GPT-4의 수학적 능력 저하가 프롬프트 엔지니어링에 대응하기 위해 취해진 우발적 결과일 수 있다"고 지적했다. 오픈AI "개선 위해 다양한 연구 진행" 드리프트 문제에 대해 오픈AI 측은 "새로운 AI 모델을 출시할 때, 우리는 새로운 모델을 더 똑똑하게 만드는 것을 최우선 과제로 삼고 있다. 또한 우리는 새로운 AI 모델 버전이 포괄적인 작업의 개선으로 이어지고 있는지 확인하기 위해 다양한 조사와 연구를 진행하고 있다. 하지만 우리의 평가 방법은 완벽하지 않기 때문에 지속적으로 개선해 나가고 있다"고 말했다. 조우는 AI의 드리프트 문제에 대해 "중요한 것은 지능이 떨어진다고 해서 기술을 포기하는 것이 아니라 그 어느 때보다 AI를 면밀하게 모니터링하는 것"이라고 말했다. 아울러 연구팀은 챗GPT와 같은 AI 모델에 대해 수천 개의 질문을 던져 체계적인 테스트를 계속하고 있으며, 시간이 지남에 따라 성능 변화를 분석하고 있다고 덧붙였다.
-
- IT/바이오
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?