검색
-
-
구글, 차세대 AI '제미니' 출시 연기…영어 외 언어 처리 때문
- 구글이 차세대 인공지능(AI) 모델 '제미니(Gemini)' 출시를 내년으로 연기했다. 미국 경제매체 비즈니스 인사이더는 더 인포메이션을 인용해, 구글의 제미니는 영어가 아닌 다른 언어의 명령어를 처리하는 데 문제가 발생해 2024년 초로 출시가 미뤄졌다고 3일(현지시간) 보도했다. 제미니는 차세대의 AI이자 멀티모달 AI로, 다양한 형태의 데이터를 처리할 수 있다. 텍스트와 이미지뿐만 아니라 스케치나 서면 설명을 기반으로 웹사이트와 같은 다른 유형의 콘텐츠를 이해하고 생성할 수 있는 능력을 가지고 있다고 알려져 있다. 구글 제미니는 당초 올해 11월 출시될 예정이었다. 더 인포메이션은 이 결정에 대해 알고 있는 익명의 소식통 2명을 인용해, 구글 제미니가 다음 주 뉴욕, 워싱턴, 캘리포니아에서 열릴 예정이었던 미공개 출시 행사가 일부 영어가 아닌 프롬프트와 문의에 응답할 때 AI가 안정적으로 작동하지 않는다는 우려로 인해 2024년 초로 조용히 일정이 변경되었다고 보도했다. 비즈니스 인사이더는 구글 관계자가 자사의 논평 요청에 즉시 응답하지 않았다고 전했다. 제미니는 아직 일반에 공개되지는 않았지만, 훨씬 더 많은 컴퓨팅 파워를 활용하기 때문에 경쟁사인 오픈AI의 생성형 인공지능 GPT-4를 크게 능가하는 것으로 알려져 있다. 앞서 구글 부사장이자 바드(Bard) 및 구글 어시스턴트 매니저인 시시 하이오(Sissie Hsiao)는 제미니에 대해 "상당히 놀라운 것들을 봤다"고 말했다. 하이오는 "예를 들어, '케이크를 굽고 있어요, 3단 케이크를 아이싱하는 방법의 단계를 그림 3개로 그려주세요'라고 요청하면 제미니가 실제로 그 이미지를 생성한다"고 설명했다. 그는 "이것들은 완전히 새로운 이미지들이다. 인터넷에서 가져온 사진이 아니라, 이제는 텍스트뿐만 아니라 이미지로 인간과 대화할 수 있다"라고 덧붙였다. 구글은 이미 '바드(Bard)'라는 자체 생성형 AI 모델을 가지고 있지만, 오픈AI의 챗GPT는 지금까지 소비자 인지도 면에서 더 강세를 보였다. 하지만 분석가들은 제미니가 최종적으로 출시되면 이러한 상황이 변할 수 있다고 주장하고 있다. 구글 제미니는 구글 AI에서 개발한 대형 언어 모델(LLM)이다. 제미니는 1.6T 파라미터를 갖춘 트랜스포머 모델로, 텍스트와 코드의 방대한 데이터 세트에 대해 훈련됐다. 구글에 따르면 제미니는 100개 이상의 언어를 번역할 수 있다. 제미니는 시나 대본, 음악 작품, 이메일, 편지 등 다양한 창의적인 텍스트 형식을 생성할 수 있다. 그밖에 다양한 프로그래밍 언어로 코드를 생성할 수 있다. 이처럼 제미니는 대규모 언어 모델의 발전을 보여주는 중요한 기술로, 출시되면 다양한 방식으로 세상을 변화시킬 수 있을 것으로 기대된다.
-
- IT/바이오
-
구글, 차세대 AI '제미니' 출시 연기…영어 외 언어 처리 때문
-
-
웨어러블 AI 기기 스타트업 휴메인, AI 핀 출시
- 미국 실리콘밸리에 위치한 인공지능(AI) 스타트업 휴메인(Humane)이 옷 깃에 붙여 사용하는 웨어러블 AI 기기인 'AI 핀'을 출시했다고 일본 포브스(JAPAN Forbes)가 최근 보도했다. AI 핀은 명함 크기의 기기로, 옷에 핀으로 고정하여 사용할 수 있다. 지난 11월 9일 공개된 이 AI 핀은 카메라와 센서를 사용하여 주변 환경을 스캔하고 다양한 질문에 답했다. 주로 음성 명령으로 작동되지만, 사용자의 손바닥에 아이콘이나 텍스트를 투사할 수 있는 작은 프로젝터도 탑재되어 있다. 휴메인은 AI 핀의 컴퓨터 비전 기능을 강조했다. 스크린이 없이 음성과 터치를 통해 전화를 걸거나 문자를 보낼 수 있다. 아울러 AI 핀은 음식에 대한 영양가를 결정할 수 있는 기능과 음성으로 조작 가능한 번역 기능 등을 제공한다. 또한 이 AI 핀은 마이크로소프트와 오픈AI가 개발한 대규모 언어 모델(LLM), 퀄컴의 스냅드래곤 프로세서, 초광각 카메라 및 블루투스 연결 기능이 탑재되어 있다. 미국에서는 지난 11월 16일에 699달러(약 90만 원)에 출시됐으며 티모바일의 네트워크를 사용할 경우 월 24달러(약3만원)의 정보 이용료가 부과된다. 휴메인은 2018년, 전 애플 임원인 임란 초드리와 베사니 본조르노 부부가 스마트폰을 대체하기 위해 공동 설립한 스타트업이다. 초드리는 애플에서 아이폰의 스와이프 언락 기능 개발에 참여한 것으로 알려져 있으며, 본조르노는 첫 아이패드의 발매에 기여한 소프트웨어 엔지니어이다. AI 핀은 혁신적인 기능으로 주목받고 있지만, 일부 전문가들은 카메라가 프라이버시를 침해할 수 있다는 우려를 제기다. 이에 대해 휴메인은 사용 중임을 나타내는 '트러스트 라이트' 기능을 탑재하고 있으며, 마이크는 아마존이나 구글의 AI 어시스턴트(비서)와 마찬가지로 항상 켜져 있지 않으며 수동으로 활성화해야 한다고 설명했다. AI 핀은 출시 직후부터 다수의 투자자로부터 자금을 유치했다. 투자자로는 오픈AI의 전 CEO 샘 올트먼, 타이거 글로벌, 퀄컴 벤처 등이 포함되어 있다. 웨어러블 컴퓨팅 시장은 여러 가지 도전으로 진입이 어려운 시장으로 알려져 있다. 메타의 VR 헤드셋은 소수의 장치로 제한되어 있으며, 구글의 '구글 글래스'는 카메라의 프라이버시 침해 우려로 실패한 사례로 꼽힌다. 휴메인의 주요 경쟁자 중 하나는 창립자들의 이전 고용주인 애플이다. 애플은 지난 6월 강력한 혼합 현실(MR) 컴퓨팅을 위한 강력한 리얼리티 프로 헤드셋을 선보였다. 초드리와 본조르노는 AI핀 출시 발표에서 이 제품이 회사에 있어 시작일 뿐이라고 말했다. 휴메인은 향후 AI 핀을 더욱 발전시켜 다양한 웨어러블 AI 기기를 개발하고 출시할 계획임을 밝혔다. 한편, 휴메인은 우리나라 기업들과 다양한 협력을 맺고 있다. SK텔레콤과 함께 AI 핀의 한국 출시를 추진하고 있다. SK텔레콤은 AI 핀의 국내 판매와 마케팅을 담당할 예정이다. 또한, 휴메인은 LG전자와 AI 핀을 활용한 새로운 제품 개발을 협의하고 있다. 양사는 AI 핀을 활용한 스마트워치나 가전제품 등을 개발하는 방안을 검토하고 있다. 이외에도 삼성전자, 네이버, 카카오 등 국내 주요 기업과의 협력으로 AI 핀의 다양한 활용 가능성을 모색하고 있다. 휴메인은 웨어러블 AI 기기 시장에서 성공하기 위해서는 프라이버시 침해 우려를 해소하고, 웨어러블 기기의 사용 편리성을 높여야 할 것이다.
-
- IT/바이오
-
웨어러블 AI 기기 스타트업 휴메인, AI 핀 출시
-
-
AI 생성 논문을 전례 없는 정확도로 포착하는 '챗GPT 감지기'
- 인공지능(AI)이 인간의 능력을 넘어서면서 다양한 산업 분야에서 중요한 역할을 하고 있다. 하지만 이러한 AI의 능력이 다 유용한 것은 아닌 것 같다. 최근 한국은행의 보고에 따르면 의사, 회계사, 변호사와 같은 전문직의 업무 영역이 AI에 의해 위협받을 가능성이 제기됐다. 특히 교육계에서는 이 문제를 더욱 심각하게 받아들이고 있다. 자연과학, 응용과학, 의학 등의 분야에서 AI가 인간 대신 논문을 작성할 수 있게 되었다는 사실이 큰 우려를 낳고 있다. 그런데 이 같은 걱정을 앞으론 덜 수 있을 것 같다. 최근 국제 학술지 '네이처'는 캔자스 대학의 헤서 디자이어 교수와 그의 연구팀이 개발한 새로운 툴(도구)을 소개했다. 이 도구는 AI가 작성한 글을 분류할 수 있어, AI의 글쓰기 능력과 관련된 문제를 해결하는 데 도움이 될 것으로 기대된다. 최근에 개발된 새로운 AI 탐지 툴은 기존의 두 가지 AI 탐지기보다 우수한 성능을 자랑한다. 이 특화된 도구는 학술 출판사들이 AI 텍스트 생성기를 통해 만들어진 논문을 식별하는 데 큰 도움이 될 것으로 예상된다. 헤서 디자이어 교수는 이번 연구 결과가 AI 감지기 개발에 있어서의 중요한 진전을 보여준다고 언급했다. 이는 소프트웨어를 특정한 유형의 글쓰기에 맞게 조정함으로써 감지 능력을 강화할 수 있음을 시사한다. 문장 길이, 특정 단어 및 문장 부호 등으로 특징 디자이어 교수와 그의 연구팀은 챗GPT 탐지기를 '사이언스2(Science2)' 저널의 '퍼스펙티브(Perspective)' 기사에 적용한 사례를 소개했다. 이 탐지기는 기계 학습을 활용하여 글쓰기 스타일의 20가지 특성, 예를 들어 문장 길이의 변화, 특정 단어 및 문장 부호의 사용 빈도 등을 분석한다. 이를 통해 텍스트가 학술 과학자에 의해 작성되었는지, 아니면 챗GPT와 같은 AI에 의해 작성되었는지를 판별할 수 있으며, 이 연구는 높은 정확도를 달성했다고 보고됐다. 최근 진행된 연구에 따르면, 개발된 검출기는 미국 화학 학회(ACS)에서 발행한 10개의 화학 저널에서 나온 논문들의 서문 섹션을 분석하기 위해 특별히 교육을 받았다. 연구 팀은 논문의 서문 작성이 챗GPT를 사용할 경우 특히 쉽다는 점을 인지하고, 배경 문헌에 접근할 수 있는 상황에서 이 섹션을 선택했다. 연구원들은 이 도구를 효과적으로 교육하기 위해 100편의 인간이 작성한 서문을 사용했다. 이후, 그들은 챗GPT-3.5에게 ACS 저널의 스타일에 맞춰 200개의 서문을 작성하도록 요청했다. 이 중 100개는 논문의 제목을 도구에 제공하여 작성되었고, 나머지 100개는 논문의 초록을 기반으로 작성됐다. 실험 결과, 이 도구는 제목을 기반으로 한 챗GPT-3.5로 작성된 서문을 100% 정확도로 식별할 수 있었다. 반면, 논문 초록을 기반으로 작성된 서문의 경우, 정확도는 약간 낮은 98%로 나타났다. 이러한 결과는 동일한 저널에서 인간과 AI가 작성한 서문을 비교할 때 얻어졌다. 이 새로운 도구는 최신 버전인 챗GPT-4가 작성한 텍스트에서도 효과적으로 작동했다. 반면, AI 탐지기 ZeroGPT는 사용된 챗GPT 버전과 논문의 제목 또는 초록에서 생성된 소개에 따라 35~65%의 정확도로 AI가 작성한 소개를 식별하는 데 그쳤다. 또한, 챗GPT 제조사인 오픈AI가 제작한 텍스트 분류 도구의 성능 역시 높지 않았다. 이 도구는 AI로 작성된 소개를 찾아내는 데 약 10~55%의 정확도를 보였다. 이에 비해 새로운 챗GPT 탐지 도구는 훈련받지 않은 저널의 서문에서도 높은 성능을 발휘했다. 이 도구는 AI 탐지기를 혼동시키기 위해 다양한 프롬프트에서 생성된 AI 텍스트를 포착하는 데 성공했다. 하지만, 이 시스템은 과학 저널 기사에 특화되어 있어, 대학 신문의 실제 기사를 제시했을 때에는 인간이 작성한 것으로 인식하지 못하는 한계를 보였다. 학술 표절, 짧은 논문작성 기간 압박으로 탄생 베를린 응용과학대학교에서 학술 표절을 연구하는 컴퓨터 과학자인 데보라 웨버 울프는 학계에서 챗GPT의 사용이 증가하는 배경에 다른 문제들이 있다고 언급했다. 그녀는 많은 연구자들이 논문을 신속하게 작성해야 하는 압박을 받고 있으며, 이로 인해 논문 작성 과정이 과학의 중요한 부분으로 인식되지 않을 위험이 있다고 지적했다. 웨버 울프 교수는 AI 탐지 도구가 이와 같은 문제를 해결할 수 없다고 강조했다. 그녀는 이러한 도구들을 사회적 문제에 대한 '마법의 소프트웨어 솔루션'으로 여겨서는 안된다고 주장하며, 이는 더 넓은 사회적 맥락에서의 해결이 필요한 문제임을 시사했다.
-
- IT/바이오
-
AI 생성 논문을 전례 없는 정확도로 포착하는 '챗GPT 감지기'
-
-
'AI 선구자' 짐 켈러, "오픈소스와 비용 절감의 중요성" 강조
- 반도체 설계의 전설이자 '인공지능(AI) 선구자'로 불리는 짐 켈러 텐스토렌트 최고경영자(CEO)는 7일 "인공지능(AI)의 비용을 크게 줄이고 모든 구성 요소를 오픈소스화하여 혁신을 촉진해야 한다"며 '오픈소스'의 중요성을 강조했다. 켈러 CEO는 7일 삼성전자가 주최한 '삼성 AI 포럼 2023'에서 기조연설자로 나서, '자신만의 실리콘을 소유하라(Own Your Silicon)'를 주제로 "지난 20~30년 동안 오픈소스가 소프트웨어 개발의 핵심 동력이었다"고 말했다. 그는 애플의 'A칩', AMD의 '라이젠' CPU 등의 고성능 반도체 설계를 주도한 인물로, 현재 캐나다의 AI 반도체 스타트업인 텐스토렌트를 지휘하고 있다. 텐스토렌트는 현재 10억달러(1조3000억원)의 시장 가치를 가진 것으로 평가받고 있다. 2017년 시작된 삼성 AI 포럼은 AI와 컴퓨터공학 분야의 석학과 전문가들이 최신 연구 동향을 공유하고 미래의 혁신 전략을 논의하는 기술 교류의 장이다. 7회째를 맞은 올해는 약 1천 명이 참석한 가운데 열렸다. 켈러 CEO는 이날 강연에서 차세대 반도체 설계를 통한 AI 기술의 한계를 극복하는 방안을 제시했다. 켈러 CEO는 개방형 하드웨어 설계자산인 RISC-V(리스크 파이브)를 기반으로 한 하드웨어 구조 설계의 혁신을 통해 차세대 AI의 새로운 가능성을 주목했다. RISC-V는 축소 명령어 집합 컴퓨팅(RISC)을 기반으로 하는 반도체 개발에 필요한 모든 명령어 세트를 무료로 공개하는 개방형 표준 기술이다. 이 기술은 특정 기업이 소유권을 가지지 않아, 이를 활용한 소프트웨어가 개발되면 어떤 기업이든 이를 사용하여 무료로 반도체를 설계할 수 있다. 켈러 CEO는 "오픈소스의 가장 큰 장점은 여러 사람들이 자유롭게 수정하고 변경할 수 있다는 것이며, AI가 빠르게 발전하는 주요 이유 중 하나는 하드웨어 성능 향상과 오픈소스 개발의 결합에 있다"고 말했다. 그는 "향후 몇 년 이내에 대규모 교육을 통한 명령 실행 방식에서 문제를 인식하고 간단한 규칙을 적용해 작업을 처리하는 방식으로 변화가 이루어질 것"이라고 예측하며, "기술을 개방적으로 유지하는 것이 중요하다"고 특히 강조했다. 또한, AI 분야의 세계적 석학인 요슈아 벤지오 캐나다 몬트리올대 교수는 온라인 기조 강연에서, 대규모 언어 모델(LLM, Large Language Model)을 기반으로 한 AI 기술 발전이 연구자의 의도와 일치하지 않는 결과를 방지할 수 있는 안전한 AI 기계학습 알고리즘에 대해 소개했다. LLM은 방대한 양의 텍스트 데이터로 학습해 자연어를 이해하고 생성하는 능력이 뛰어난 언어 모델이다. 삼성전자 SAIT(구 종합기술원)는 '△ LLM과 산업용 AI의 변화(LLM and Transformation of AI for Industry) △ LLM과 시뮬레이션을 위한 초거대 컴퓨팅(Large-scale Computing for LLM and Simulation)'을 주제로 AI·CE(컴퓨터 공학, Computer Engineering) 분야 세부 세션을 각각 진행했다. AI 분야에서 세계적으로 우수한 신진 연구자를 발굴하기 위한 '삼성 AI 연구자상'에서는 미국 프린스턴 대학교의 제이슨 리 교수를 비롯한 5명의 연구자가 선정됐다. 제이슨 리 교수는 딥러닝, 강화학습, 최적화 등 AI 분야 이론과 응용 연구에 집중하고 있다. 해당 분야에서 우수 논문을 다수 게재해 전 세계 AI 연구 발전에 기여한 점이 높은 평가를 받았다. 경계현 삼성전자 대표이사 사장은 온라인으로 진행된 개회사에서 "생성형 AI 기술이 인류가 직면한 다양한 문제를 해결하는 혁신적인 수단으로 부상하고 있으며, 이에 따라 기술의 안전성, 신뢰성, 지속 가능성에 대한 심도 있는 연구가 필요하다"고 언급했다. 경 사장은 또한 "삼성전자는 고대역폭 메모리 칩을 포함한 AI 컴퓨팅 시스템의 핵심 부품을 통해 AI 생태계 강화에 계속해서 중요한 역할을 할 것"이라고 말하며, "이번 포럼이 AI와 반도체 기술을 통해 인류의 더 나은 미래를 모색하는 의미 있는 자리가 되기를 바란다"고 전했다. 삼성전자는 8일 서울R&D캠퍼스에서 삼성리서치 주관으로 '삼성 AI 포럼' 두 번째 날 행사를 진행한다. 비공개 행사로 진행되는 이 자리에서는 생성형 AI 기술의 발전 방향을 논의하고 관련 기술 동향을 공유할 계획이다.
-
- IT/바이오
-
'AI 선구자' 짐 켈러, "오픈소스와 비용 절감의 중요성" 강조
-
-
청각 장애인 위한 첨단 안경, 실시간 음성 자막 제공
- 영국 맨체스터에 사는 파울 셔틀워스(40세) 씨는 양쪽 귀에 심각한 청각 장애를 겪고 있다. 그러나 지난 2022년 크리스마스 때 받은 특별한 선물이 그의 생활에 변화를 가져다 주었다. 이 선물은 바로 라이브 캡션 기능이 있는 안경이다. 미국 과학 기술 매체 '사이언티픽 아메리칸(Scientific American)'에 따르면, 이 안경은 청각 장애인들이 대화에 더 쉽게 참여할 수 있게 도와주고 있다. 라이브 캡션 기술은 대화 중인 단어를 실시간으로 텍스트로 변환하여 안경 렌즈에 표시해주는 기능을 가지고 있다. 이로 인해 청각 장애인들이 일상 속에서 더 원활하게 의사소통을 할 수 있게 된다. 그러나 이 안경도 아직은 완벽하지 않아, 수화 통역사처럼 100% 정확한 번역을 제공하지는 못한다고 한다. 트랜스크라이브글라스(TranscribeGlass)의 공동 창업자인 톰 프리스키(Tom Pritsky)씨는 삼각한 양측성 난청을 겪고 있다. 그는 "이 안경은 대화 능력과 삶의 질을 크게 향상시켜준다"며, "보청기는 소리를 들려주지만, 명확하지 않고 일부 단어를 놓칠 때도 있다"고 말했다. 프리스키씨는 또한 "캡션과 자막이 있으면 대화를 계속 이해하고 빈틈 없이 따라갈 수 있어 큰 도움이 된다"고 덧붙였다. 2050년까지 청력 손실을 겪을 것으로 예상되는 약 25억 명의 사람들에게 이러한 라이브 캡션 안경은 큰 도움이 될 것으로 보인다. 라이브 캡션 안경은 음성 인식 기술의 발전과배터리 수명 향상으로 시장에 출시되기 시작했으며, 청력 손실이 있는 많은 사람들이 혜택을 받을 것으로 보인다. 구글 글라스 개발에 참여한 조지아공과대학교(Georgia Institute of Technology) 테드 스타너(Thad Starner) 교수는 "청력 손실을 겪고 있는 노인들이 이 안경을 사용하게 되면, 가족이나 친구들과의 사회적 연결망을 유지하고 강화할 수 있을 것"이라고 말했다. 프리스키는 "청각 장애나 난청이 있는 사람들은 오터(Otter)와 같은 앱을 사용해 대화를 기록할 수 있지만, 그 과정이 번거롭다"며, "시야에 실시간으로 캡션을 볼 수 있다면, 이는 커뮤니케이션 방식에 혁명을 일으킬 것"이라고 강조했다. 라이브 캡션 안경은 주로 안경 프레임, 마이크, 음성을 처리하는 온보드 컴퓨터, 배터리, 그리고 캡션을 디스플레이하는 기능으로 구성되어 있다. 엑스알에이아이 글라스(XRAI Glass)의 단 스카프 대표는 "음성 인식 소프트웨어의 발전이 이러한 기술의 현실화를 가능하게 했다"며 "이 기술을 적용할 수 있는 완벽한 하드웨어가 6개월 내에 출시될 것으로 보이며, 이제는 이 기술을 사용하려는 사용자를 찾는 것이 중요한 단계가 될 것"이라고 덧붙였다. 라이브 캡션 안경의 판매량은 기대에 비해 적었음에도 불구하고, 테드 스타너 교수는 기술의 중요한 발전을 강조하며 이를 긍정적으로 평가하고 있다. 그는 지난 30년 동안 다양한 기술적 실패를 겪었지만, 휴대용 배터리와 음성 인식 시스템의 업그레이드로 인해 라이브 캡션 안경이 곧 일반 가정에서 흔히 사용되는 기술이 될 것이라고 믿고 있다. 라자 쿠샬라가르(Raja Kushalnagar) 갤러뎃 대학교(Gallaudet University)의 정보 기술 프로그램 책임자이자 교수는 이 기술이 일상생활에 얼마나 큰 영향을 미치는지 직접 확인했다고 말했다. 그는 청각장애가 있는 아들과 대화하는 동안 이 기술의 효용성을 확인했다고 전했다. 쿠샬라가르 교수는 "예를 들어 부엌에서 요리를 하면서도 캡션을 읽을 수 있다"며 "이 기술 덕분에 걸으면서도 아들과 소통할 수 있게 되었다"고 덧붙였다. 라이브 캡션 안경이 청각장애인들에게 큰 도움을 주고 있지만, 아직 완벽한 해결책이라고는 할 수 없다. 특히 많은 사람이 있는 공간에서 배경 소음 때문에 캡션 소프트웨어가 정확한 대화를 포착하는 데 어려움을 겪고 있는 것이 그 예이다. 또한, 현재의 캡션 시스템은 화자의 정체성이나 감정, 억양 등을 정확하게 표현하지 못하는 문제도 있어, 통역사가 제공하는 맥락 전달과 비교된다. 이런 문제들이 앞으로 개선되어야 한다. 한편, 한국의 엑스퍼트아이엔씨는 청각장애인들을 위해 '씨사운드'라는 음성을 자막으로 변환해주는 안경을 개발했다. 이 안경은 AI STT(음성을 텍스트로 변환) 기술을 활용하여 92% 이상의 정확도로 한국어 음성을 자막으로 변환해준다.
-
- IT/바이오
-
청각 장애인 위한 첨단 안경, 실시간 음성 자막 제공
-
-
MS, 의료 지원 AI 도구 공개
- 마이크로소프트(MS)는 10일(현지시간) 의료 서비스용 인공지능(AI) 제품을 공개했다. MS는 미국 네바다주 라스베이거스에서 열린 헬스케어(HLTH) 2023 콘퍼런스에서 데이터 및 분석 플랫폼인 자사의 패브릭(Fabric) 내에 새로운 의료 서비스 전용 도구를 추가했다고 밝혔다. 이 도구는 전자 의료 기록과 이미지, 연구실 시스템, 의료 기기, 클레임 시스템 등 모든 정보를 결합해 의료 기관이 데이터를 표준화하고 손쉽게 이용할 수 있도록 지원한다. MS는 새로운 도구가 의료진이 데이터를 하나씩 검색하는 '시간 소모적인' 프로세스를 제거하는 데 도움이 될 수 있으므로 의료 제공자가 치료에 집중할 수 있다고 설명했다. 세계경제포럼(World Economic Forum)에 따르면 병원에서는 연간 50페타바이트(petabyte, pb)의 고립된 데이터를 생성한다. 이는 약 100억 개의 음악 파일에 해당한다. 많은 귀중한 통찰력이 담겨 있는 이 데이터의 97%는 사용되지 않는다. MS는 이 모든 데이터를 잘 활용하는 것이 환자의 삶과 의료 여정에 의미 있는 변화를 가져올 수 있는 임상과 운영상의 혁신을 여는 열쇠라고 강조했다. 의료용 패브릭은 시카고 통합 학술의료시스템인 노스웨스턴 메디슨(Northwestern Medicine)을 비롯해 캐나다의 아서 헬스(Arthur Health), 싱가포르 최대 공공 의료기관 네트워크인 싱헬스(SingHealth) 등 일부 의료 기관에서 시범 사용해 오고 있다. 노스웨스턴 메디슨의 최고정보책임자인 더그 킹(Doug King)은 "MS 기술은 우리가 살고 있는 방법과 환자를 돌보는 방법을 바꿀 것"이라며 더 많은 환자들을 진료하는 데 도움이 될 것으로 기대했다. MS는 또 환자 진료에 도움을 주는 생성형 AI 챗봇인 '애저(Azure) AI 헬스봇'도 출시할 예정이라고 밝혔다. 이 AI 챗봇은 미 식품의약국(FDA)과 같은 외부 기관의 데이터뿐만 아니라 의료 기관 자체 내부 데이터로부터 정보를 추출할 수 있다. 리니샤 바즈 MS 건강 및 생명 과학의 수석 제품 관리자는 챗봇을 사용하여 조직 내 직원이 특정 질병을 치료하는 방법, 내부 프로토콜 및 프로세스와 같은 질문을 할 수 있다고 말했다. 또 환자도 환자 포털 내에서 챗봇을 사용하여 자신의 증상과 의학 용어에 대해 명확하게 질문할 수 있다고 덧붙였다. 바즈는 언론 브리핑에서 "정말 중요한 것은 이 프로세스에 가드레일과 안전장치를 구축했다는 점"이라고 말했다. MS는 임상 문서와 메모 등과 같은 다양한 비정형 데이터 원본에서 중요한 의료 정보에 레이블을 지정하고 추출할 수 있는 '의료용 텍스트 분석(Text Analytics for health)'이라는 또 다른 솔루션을 발표했다. 바즈는 이 도구가 영어 외에 스페인어, 프랑스어, 이탈리아어, 독일어, 포르투갈어, 히브리어로도 출시될 예정이라고 전했다. 이를 통해 의료진이 특정 질병을 어떻게 치료하는지 내부 프로토콜과 프로세스에 대해 질문해 답을 얻을 수 있고, 환자들도 자신의 증상과 의료 용어에 대해 명확한 질문을 할 수도 있다고 MS는 설명했다. MS는 이와 함께 의사, 간호사 등이 더 많은 정보를 기반으로 의사 결정을 내리는 데 도움을 주는 '애저 AI 헬스 인사이트(Azure AI Health Insights)' 모델도 공개했다. 이 모델은 생성형 AI를 사용해 의료진에게 환자의 의료 기록에 대한 개요를 제공하고, 복잡한 의학 용어로 된 보고서를 환자가 더 잘 이해할 수 있는 언어로 풀어준다. 또 여러 보고서에서 발생할 수 있는 오류와 불일치를 식별해 의료진을 지원한다고 MS는 설명했다. 바즈는 "애저 AI에 포함된 마이크로소프트의 새로운 의료 서비스 도구가 환자 경험을 개선하고 임상의가 더 나은 치료를 제공하는 데 집중할 수 있도록 도울 것"이라고 말했다. MS 측은 새로운 솔루션은 10일부터 미리 보기로 사용할 수 있다고 밝혔다.
-
- IT/바이오
-
MS, 의료 지원 AI 도구 공개
-
-
챗GPT, 음성↔텍스트 상호 변환...소통 능력 향상 기대
- 대화형 인공지능(AI) 서비스 챗GPT가 텍스트를 통해 사용자와 소통했던 단계를 벗어나 사진을 인식하고 음성을 텍스트로 변환하고, 텍스트를 다시 음성으로 합성할 수 있는 버전을 도입한다고 밝혀 이전보다 더 인간다운 모습을 보일 전망이다. 기술 과학 전문매체 기즈모도(GIZMODO)에 따르면, 챗GPT 제조사인 오픈AI는 챗GPT에 도입될 프로모션 비디오를 통해 사용자에게 이미지 인식 기능에 대해 선보이고 있다고 전했다. 예를 들어, 사용자가 챗GPT에게 자전거 좌석을 낮춰달라고 요청하면 챗봇은 먼저 모든 종류의 좌석을 낮추기 위한 일반적인 조언을 했다. 위의 사진에서 볼수 있듯이 처음 자전거 좌석을 사용하는 이용자가 자전거 좌석 캐치 주위에 원을 그린 후 더 자세한 도움을 요청하면, 챗GPT는 해당 볼트 유형을 인식하고 엘렌 렌치가 필요하다고 답했다. 이 시스템은 사용자 설명서와 공구 상자의 사진을 보고 올바른 크기의 렌치가 있는지도 확인할 수 있다고 기즈모도는 설명했다. 음성 인식 시스템 적용 물론, 이미지 인식은 많은 챗봇 서비스에서 실험한 것이 아니지만 음성 인식 시스템과 음성 합성에 대한 최신 기술을 보유하고 있다는 것이 오픈AI 측의 설명이다. 오픈AI는 챗봇의 새로운 음성 서비스를 사용자에게 소개하기 위해 '어머니가 챗GPT에게 특정 숲에 살고 있는 고슴도치에 대한 이야기를 자녀들에게 읽어 달라'고 요청하는 비디오를 공개했다. 비디오의 말투는 자연스러웠지만, 그림책의 캐릭터들이 각각의 고유한 목소리를 내지는 않았다. 캐릭터의 음성은 시스템에 라이선스를 부여한 성우의 목소리를 기반으로 하기 때문이다. 이는 일레븐랩스(ElevenLabs)와 같은 다른 AI 음성 합성과 유사하다. 해당 서비스는 처음에는 딥페이크(인공지능을 기반으로 활용한 인간 이미지 합성 기술)나 괴롭힘에 사용돼 비판을 받았다. 오픈AI는 자사의 첫 번째 음성 서비스가 챗GPT 음성 채팅에서만 적용된다고 밝혔고, 최근 새로운 팟캐스트 음성 번역 기능을 발표한 스포티파이(Spotify)에 음성 시스템 라이선스를 제공하고 있다. 이로써 스페인어, 프랑스어, 독일어로 인기 팟캐스터의 목소리를 모방할 수 있게 될 예정이다. 물론 이 새로운 기능은 챗GPT의 '플러스(Plus)' 또는 '엔터프라이즈(Enterprise)' 서비스 비용을 지불한 사용자에게만 제공되며 두 기능 모두 10월 중순께 iOS와 안드로이드(Android)에서 사용할 수 있게 된다. 챗GPT 웹 버전 사용자도 곧 이미지 기능을 이용할 수 있게 될 전망이다. 다만, 이 시스템은 프로모션 비디오에서 제안하는 것처럼 빠르거나 능숙하지는 않을 것으로 보인다. 과학 기술매체 와이어드(Wired)에 따르면, 챗GPT 시험용 버전을 기반으로 음성 인식이 응답하는 데 몇 초가 걸렸다. 이 매체는 이미지 시스템이 사진 속 사람을 식별하려고 시도하지 않을 것이며, 사생활을 어떻게 보호할지 두고 봐야 할 것이라고 지적했다. 오픈AI 대변인은 기즈모도에 "시간이 지나면서 점진적으로 개선하고 위험을 줄일 수 있는 세부 사항들을 다듬는 것이 중요하다"며 "이 새로운 기능을 최소화하기 위해 '레드팀'을 구성했다"고 밝혔다. 그러나 사용자들이 다시 한번 챗봇의 윤리적 경계를 넘어서는 것은 시간문제다. 챗GPT는 지난 2022년 11월 공개 직후 대대적으로 인기를 끈 이후 사용자 수가 감소했다. 이는 일부 사용자들이 오픈AI가 챗봇의 기능을 제한했다고 느꼈기 때문이다. 오픈AI는 피해를 최소화하고 챗봇 사용자들이 자유롭게 활용할 수 있는 윤리적 균형을 찾는 데 어려움을 겪고 있다. 한국어 개인정보 방침 제공 한편, 오픈AI는 지난 2023년 9월 비영어 국가 중 처음으로 한국어로 된 개인정보 처리방침을 제공하고 국내 이용자를 위한 개인정보 가이드라인을 마련했다. 회사 서비스를 통해 수집되는 개인정보를 추가로 이용하기 위한 조건과 아동의 기준이 상향된 것으로, 국내 이용자 687명의 개인정보 유출 건에 대한 개인정보보호위원회의 개선 권고 일환이다. 오픈AI가 대한민국 이용자로부터 수집한 개인정보를 활용하기 위해서는 먼저 수집된 개인정보의 추가적인 이용·제공이 당초 수집 목적과 관련성이 있어야 한다. 동시에 수집한 데이터를 추가로 이용·제공할 수 있다는 예측도 가능해야 한다. 또 대한민국 '아동'의 연령기준을 13세에서 14세로 상향했다. 이밖에도 '처리 위탁 및 국외 이전'의 기준을 마련하고 '개인정보 파기 절차 및 방법', '정보주체와 법정대리인의 권리', '연락처', '국내대리인'을 명시했다.
-
- IT/바이오
-
챗GPT, 음성↔텍스트 상호 변환...소통 능력 향상 기대
-
-
고인과 대화하는 디지털 네크로맨시, 구원일까 모독일까
- 인공지능(AI) 기술이 발달하면서 고인을 디지털 방식으로 소생시키는 기술에 사회의 이목이 집중되고 있다. 일본매체 나조로지(nazology)에 따르면 이른바 '디지털 네크로맨시(digital necromancy, 디지털 강령술)'라 불리는 이 기술은 고인의 텍스트 기록과 이미지를 기반으로 그들과의 상호작용을 구현한다. 일기나 편지와 같은 기록을 활용해 실제 인간과 같은 대화를 가능하게 하는 챗GPT(ChatGPT)와 같은 언어 모델, 또는 생성형 AI(인공지능)를 통해 실존하지 않는 이미지와 영상을 합성하는 기술이 결합된 것이다. 일본에서는 '가상의 고인'이라는 이름으로 이 기술이 큰 주목을 받고 있으며, 해외에도 '실제로 고인과 대화 가능한 AI' 서비스가 속속 등장하고 있다. 특히 2019년 일본 NHK 홍백전에서 'AI 미소라 히바리'의 무대가 큰 화제가 되었다. 약 34년 전인 1989년 세상을 떠난 국민 가수 미소라 히바리의 목소리와 노래 스타일을 야마하의 'VOCALOID: AI' 기술로 완벽하게 재현한 것이었다. 이 같은 기술의 등장은 사회적으로 큰 관심사로 자리잡았지만 윤리적 논란도 동반되고 있다. AI를 활용한 '미소라 히바리'의 재현에 대한 반응은 엇갈렸다. 일부는 감동으로 눈물을 흘렸으나, 다른 이들은 이를 기묘하게 여기거나 죽은 이에 대한 무례로 비판했다. 죽은 이의 부활은 정말로 기술의 금기인가? 이러한 질문에 따른 답을 찾기 위한 프로젝트가 2020년 한국에서 진행되어 전세계적인 주목을 받았다. 해당 프로젝트는 가상현실을 재현하는 VR(Virtual Reality) 기술을 활용하여 어린 나이에 사망한 딸과 어머니의 재회를 진정성 있게 재현했다는 평을 받았다. 장모 씨는 2016년 희귀 난치병으로 7세 딸 나연이를 잃었다. 그러나 3년 후, 텔레비전 다큐멘터리를 통해 나연이가 다시 재현되었다. 나연이의 실제 모습과 행동, 목소리를 재현하기 위해 모션 캡처와 딥 러닝 기술이 병행되었고, 장씨는 VR 고글을 통해 딸과의 감동적인 재회를 했다. 이 프로그램을 시청한 많은 사람들이 어머니와 딸의 VR 재회 장면에 감동을 받았다. 다수의 시청자들은 이 감동적인 순간을 칭찬했지만, 동시에 VR 기술을 통한 재회가 어머니의 상처를 더 깊게 할 수도 있다는 우려의 목소리도 커지고 있다. 이와 관련하여 AI 기술의 발전이 죽은 이를 디지털로 재현, 상호 작용하는 것의 윤리적 측면에 대한 논란이 계속되고 있다. 고인을 추모하며 묘소에 찾아가 그들에게 이야기하는 것과 같이, AI를 통해 사망한 이와의 상호작용은 어떻게 받아들여져야 할까? 특히 가장 가까운 가족들에게는 이러한 기술이 어떤 의미를 지니는지가 중요한 문제이다. 이러한 윤리적 논점은 기술 발전의 속도와 사회의 가치 사이에서의 균형을 찾아야 하는 어려운 과제로 떠오르고 있다.
-
- IT/바이오
-
고인과 대화하는 디지털 네크로맨시, 구원일까 모독일까
-
-
[퓨처 Eyes(4)] 2023년 이후 주목받는 AI 트렌드 5가지
- 인공지능(AI) 시장은 지난 몇 년 동안 기하급수적인 속도로 성장했다. 전 세계적으로 널리 알려진 챗GPT(ChatGPT)와 구글 바드(Bard), IBM의 왓슨(Watson), 네이버의 클로바X와 같은 제품 덕분에 이런 성장이 가능했다. 글로벌 경영 컨설팅 회사인 맥킨지(McKinsey)는 현재 전체 조직의 50~60%가 이미 AI 기반 도구를 사용하고 있으며, 이 비율은 가까운 미래에 더욱 늘어날 것으로 추정된다. 포브스 보고에 따르면, AI는 현재 세계에서 가장 빠르게 성장하고 있는 산업 중 하나이다. 이 분야의 시장 가치는 10년 내로 연평균 37.3%의 성장률을 기록하며, 같은 기간 동안 약 1조 8100억 달러의 누적 가치에 이를 것으로 전망된다. 이러한 증가세는 근거가 없는 것이 아니며, 실제로 많은 전문가들이 2030년까지 AI가 세계 경제에 기여할 가치가 15조 7000억 달러에 이를 것으로 예측한다. 이는 현재 인도와 중국의 GDP를 합한 것보다도 더 큰 금액이다. 이러한 예상은 생성형 AI)와 자연어 처리(NLP) 같은 특정 기술 트렌드의 발전 덕분이라고 할 수 있다. 기술의 중요성이 점점 부각됨에 따라, 시장 및 기술 전문가들은 AI가 주도하거나 영향을 미칠 주요 트렌드들에 주목하고 있다. AI 어시스턴트의 성장부터 생성형 AI의 부상까지 코인텔레그래프가 진단한 '2023년 이후 주목받는 AI트렌드 5가지'를 소개한다. AI 어시스턴트 사용 증가 기술이 지속적으로 발전하며 확장되면서, AI 어시스턴트는 다양한 서비스 분야의 자동화와 디지털화를 가능하게 하는 준비 상태에 있다. AI 기반 디지털 서비스 개발사 VAIOT의 최고 운영 책임자 파베 안드루슈키에비츠는 법률 서비스, 공공 행정, 시민 서비스 등이 AI의 도움으로 크게 향상될 수 있는 몇몇 분야라고 지적했다. 그는 "AI 어시스턴트는 사용자에게 더 나은 접근성과 비용 절감, 사용의 편리성을 제공한다. 법률 서비스의 경우, 많은 사람들이 비용 문제나 접근성의 어려움으로 인해 이용하는데 어려움을 겪기도 한다. AI 어시스턴트는 24시간 연중무휴로 모바일 기기에서 접근 가능한 '자연스러운 사용자 인터페이스'를 제공함으로써, 이런 부분의 장벽을 낮추어 누구나 쉽게 법률 지원을 받을 수 있도록 도와준다"고 설명했다. 포춘 500대 기업에서 AI 도입 선호도 상승 AI 컨설팅 전문 회사 킨포크스(Keenfolks)의 미구엘 마차도 CEO이자 공동 창립자는 최근 사람들이 AI 제품의 빠른 확장 속도와 폭넓은 접근성에 대해 놀라게 될 것이라고 전망했다. 그는 오픈AI의 챗GPT 인터페이스가 2022년 3월에 출시된 후 현재 사용자 수가 1억 명이 넘는 것을 예로 들었다. 그는 "다양한 파일럿 실험을 통해, 포춘 500대 기업은 AI 전략을 더 빠르게 조정하고 향상시킬 수 있을 것이며, 커뮤니티는 언어 모델에 대한 지식을 활용하여 협동 학습과 기술 개발을 추진하는 플랫폼 구축에 핵심 역할을 할 것"이라고 강조했다. 마차도는 법률, 인사, 재무 등의 분야에서 최고 경영진이 비즈니스를 혁신하기 위해 AI를 적극 도입하는 추세가 확산되고 있다고 지적했다. 그는 "노코드(Nocode) 솔루션의 등장은 AI도입을 대중화해서 기술적 전문성이 부족한 브랜드들도 첨단 기술을 그들의 운영체계에 손쉽게 통합하게 만들어줄 것"이라고 덧붙였다. 생성형 AI 급성장 최근 몇 년 간 많은 AI 기반 애플리케이션은 기존 데이터를 활용하여 예측하거나 인사이트를 추출하는 예측 모델에 주로 의존했다. 이렇게 생성된 결과는 기존 데이터에서 파생되며 실제로 새로운 내용을 제공하지 않는다. 반면, 생성형 AI는 머신러닝과 딥러닝을 사용해 기존 학습 데이터 위에 구축된 새로운 패턴을 사용하여 독립적으로 계산된 독창적인 정보를 생성한다. 지난 한 해 동안 이러한 모델은 텍스트, 이미지, 오디오 및 비디오 콘텐츠를 생성하는 데 광범위하게 사용됐다. 메타와 언스트앤영의 생성형 AI 전문가이자 기술 자문인 헨리 아더(Henry Ajder)는 이 기술의 미래 가능성에 대해 "우리는 현재 생성형 기술의 초기 단계에 있으며, 앞으로 합성 미디어는 단순한 신기함에서 벗어나 엔터테인먼트, 교육, 접근성 등의 분야에서 큰 발전을 이끌 것"이라고 전망했다. 자연어 처리(NLP) 시스템의 성장 가까운 미래에 큰 관심을 받을 것으로 예상되는 AI 분야 중 하나는 자연어 처리(NLP)이다. 이 기술은 검색 엔진부터 음성 인식 시스템까지, 많은 사람들이 일상적으로 의존하는 다양한 기술 제품의 핵심이다. NLP를 통해, 기계는 사람의 언어를 보다 자연스럽게 이해하고 해석하여 대응할 수 있다. 실제로, 언어 모델링, 구문 분석, 감정 분석, 기계 번역, 음성 인식 등의 방식을 활용하여 이 기술은 다양한 비즈니스 환경에서 사용자에게 현실적인 대응을 제공한다. 아직 초기 단계이 이 분야의 잠재력을 강조하는 그랜드 뷰 리서치(Grand View Research)의 최신 보고서에 따르면, 2023년에서 2030년 사이에 연평균 40.4%의 성장률을 보일 것으로 예상되며, 10년 후에는 약 4385억 달러의 시장 규모를 이룰 것으로 전망된다. 의료 분야의 AI 활용 확대 포브스에 따르면, 의료 분야에서 AI의 활용은 질병을 진단하고 치료하는 의사의 방식을 혁신적으로 바꿀 것으로 보인다. 또한 신약 개발과 의학 연구 분야에서도 머신 러닝의 적용이 확대될 것이다. 2027년까지 신약 개발에 AI가 사용되는 규모는 40억 달러에 달할 것으로 예상된다(45.7%의 연평균 성장률로 성장). 마찬가지로 미국 의료 서비스 제공업체의 50% 이상이 내부 의료 프로세스의 일부로 로보틱스 프로세스 자동화와 같은 AI 도구를 도입했거나 도입할 계획이다. 2027년까지 AI가 신약 개발에서 차지하는 부분은 약 40억 달러로 추정되며, 이는 45.7%의 연평균 성장률로 성장할 것으로 예측된다. 또한, 미국의 의료 서비스 제공자 중 절반 이상이 로보틱스 프로세스 자동화 등의 AI 도구를 의료 프로세스에 통합하거나 도입 계획을 세우고 있다. 결과적으로 AI, 머신러닝, 딥러닝, 자연어 처리와 같은 첨단 기술이 주도하는 디지털 시대로 전환하면서 다양한 산업에서 이러한 기술의 적용이 확대되어, 보다 디지털화되고 자동화된 미래를 구축하는 데 큰 역할을 할 것으로 예상된다.
-
- 포커스온
-
[퓨처 Eyes(4)] 2023년 이후 주목받는 AI 트렌드 5가지
-
-
오픈AI의 GPT-4 경쟁자 구글 '제미니', 올해 말 공개 예정
- 기술 대기업 구글에서 오픈AI의 생성형 인공지능(AI) 챗GPT의 대항마인 '제미니(Gemini)'를 출시한다. 현재 생성형 AI 시장의 예상 가치는 2032년까지 1조 3000억 달러에 달할 것으로 전망된다. 지난해 11월 첫선을 보인 오픈AI의 챗GPT는 이미 월간 활성 사용자 수가 1억 명을 돌파하며 그 성장세를 이어가고 있다. 이러한 상황에서 구글이 자체 개발한 대화형 AI 챗봇 '바드(Bard)'와 새로운 언어 모델(PaLM 2 LLM)을 선보이며 시장에서의 존재감을 확대하고 있다. 4일(현지시간) 기술 전문매체 더 테크아웃룩에 따르면 구글이 올해 말 오픈AI의 챗GPT의 GPT-4와 직접적으로 경쟁할 수 있는 '제미니'를 공개할 예정이라는 소식이 전해졌다. GPT-4는 오픈AI에서 개발한 자연어 처리(NLP) 모델로, GPT(Generative Pre-trained Transformer) 시리즈의 네 번째 버전으로 5000억 개의 파라미터를 가지고 있는 것으로 알려졌다. 이전 버전인 언어 기반 인공지능 모델 GPT-3는 약 1750억 개의 파라미터를 가지고 있다. 제미니는 구글이 보유한 TPUv5 칩, 총 1만6384개의 칩을 활용해 훈련되었으며, 훈련 데이터는 압도적인 65조 개의 토큰으로 이뤄져 있다. 또한 유튜브 콘텐츠와 알파고의 훈련 기법 역시 활용되었다. 시장 전문가들은 구글 제미니가 GPT-4를 능가할 세 가지 주요 이유를 지적한다. 첫째, 텍스트와 이미지 생성 능력, 둘째, 구글 서비스에서 확보한 독점적 학습 데이터, 그리고 셋째, 세르게이 브린(구글 공동 창업자)과 폴 바햄(딥마인드 수석 AI 과학자 겸 머신러닝 전문가) 등 AI 분야의 석학들이 구글의 딥마인드와 브레인 팀의 협력으로 더 많은 것을 기대할 수 있다는 점이다. 아직 결과는 미지수지만, 구글의 '제미니'가 얼마나 GPT-4에 버금가는 성능을 보여줄 것인지에 대한 관심이 높아지고 있다.
-
- IT/바이오
-
오픈AI의 GPT-4 경쟁자 구글 '제미니', 올해 말 공개 예정
-
-
마이크로소프트, AI 탑재 백팩 특허 획득
- 기술 대기업 마이크로소프트(MS)는 스마트 센서가 탑재된 인공지능(AI) 기반 백팩 디자인에 대한 특허를 취득했다. 미국 기술 전문매체 톰스 하드웨어(Tom's Hardware)에 따르면 미국 특허청(USPTO)은 지난 5월 출원된 마이크로소프트의 AI 기반 백팩 특허를 최근 승인했다. MS파워유저(MSPowerUser)가 처음 보도한 마이크로소프트의 디지털 비서가 장착된 백팩 특허는 '인공 지능 지원 웨어러블'에 대한 것으로 명시되어 있다. 공개된 AI 탑재 백팩 특허 삽화와 주요 예시 대부분은 독특한 디자인으로 시선을 끌고 있다. MS 스마트 백팩의 주요 디자인 특징으로 암 스트랩(Arm strap)에 여러 개의 센서가 내장됐다. 착용자의 정면을 향하고 있는 이 센서들은 각각 카메라, 마이크, GPS, 나침반 등의 기능을 포함한다. 마이크로소프트는 백팩의 스트랩(strap, 끈)에 햅틱 액추에이터(haptic actuator, 촉각적 피드백을 생성하기 위해 사용하는 장치)뿐만 아니라 LED와 스피커를 추가했다. 스마트 웨어러블에는 일부 실시간 처리가 필요한 것으로 보인다. 따라서 이미지, 텍스트, 음성, 얼굴 및 인지 인식을 제공하기 위해 다양한 인식 모듈이 들어 있다. 백팩에 탑재된 시스템은 AI 스마트 기능을 위해 내장된 처리 능력에 데이터를 공급하는 실시간 모니터뿐만 아니라 기록 장치(온보드 스토리지 사용), 무선 연결, 배터리 전원/충전 등의 기능도 갖추고 있다. 착용자는 위의 모든 감지 및 처리 기능을 갖춘 디지털 백팩을 통해 AI의 향상된 사물 식별과 분석, 주변 기기와의 상호 작용, 상황별 인사이트 확보 등의 혜택을 누릴 수 있을 것으로 예상된다. 위 그림에서 데이터 플로(Flow) 차트는 백팩과 데이터 피드가 개인용 컴퓨터 및 클라우드 서버와 함께 작동하는 방식을 보여준다. 또 다른 삽화(아래 그림)에서는 디지털 백팩을 메고 돌아다니는 사람이 스키장을 탐색하고 슈퍼마켓 가격을 확인하고 콘서트 티켓 예매를 고려하는 모습을 보여준다. 사용자는 때때로 "헤이 백팩, 이 포스터를 내 캘린더에 추가해 줘"와 같이 음성을 통해 백팩에 내장된 AI와 상호 작용할 수 있다. 또는 스트랩의 센서와 상호 작용해 일부 AI 동작 또는 상황에 맞는 작업을 실행할 수도 있다. 마이크로소프트의 특허는 주로 집 밖에서 디지털 비서의 유용성에 대해 집중한 면모가 돋보인다. PC 프로세서는 이제 전용 AI 가속 하드웨어를 갖추기 시작했으며, 마이크로소프트는 사무실 생산성 및 협업 도구에 AI를 빠르게 통합한 것으로 보인다. 그러나 톰스 하드웨어는 마이크로소프트의 AI 백팩은 개발 과정에서 드러난 시장성 부족이나 기타 단점으로 인해 많은 특허가 취소되었기 때문에 실현되지 않을 수도 있다고 전했다.
-
- IT/바이오
-
마이크로소프트, AI 탑재 백팩 특허 획득
-
-
반도체 '쿠데타', 엔비디아 AI원스톱 시스템으로 세계 선두로
- 인공지능(AI)의 성장과 함께 반도체 산업도 그 국면을 바꾸고 있다. CPU(중앙연산처리장치)와 GPU(그래픽처리장치)의 전통적인 경계는 흐려지며, 인텔과 엔비디아가 그 양대산맥에서 새로운 경쟁을 펼치고 있다. 특히, 엔비디아는 AI 분야에서의 독보적 지배력을 강조하며, 칩부터 소프트웨어, 그리고 다양한 서비스까지 AI 개발을 위한 원스톱 시스템을 제공함으로써 세계적인 톱 위치를 차지하게 되었다. 최근의 데이터센터와 인공지능 열풍은 기존의 반도체 업체들에게 큰 변화의 기회를 제공했다. 닛케이, 뉴욕타임스 등 외신들에 따르면, CPU 최대 업체인 미국 인텔과 GPU 최대 업체인 미국 엔비디아는 서로의 강점을 잠식하는 방향으로 성능 향상을 모색하고 있다. 이 중에서도 엔비디아는 AI에 특화된 원스톱 솔루션으로 시장의 주목을 받으며 독보적인 위치를 확립했다. 뉴욕타임스에 따르면, 신경과학자 출신의 기술 기업가 나빈 라오(Naveen Rao)는 "인텔이 인수한 스타트업에서 AI 작업에 적합한 GPU를 대체할 칩 개발을 했으나, 속도에서 뒤처진 인텔에 비해, 엔비디아는 신속한 제품 업그레이드와 새로운 AI 기능 도입으로 경쟁력을 확보했다"고 주장했다. 라오는 인텔을 떠나 모자이크ML(MosaicML)을 창업, 엔비디아의 칩을 사용해 경쟁사의 칩과 비교 평가했다. 그에 따르면 엔비디아는 자체 기술로 대규모 AI 프로그래머 커뮤니티를 형성해, 단순한 칩 생산 이상의 차별화를 달성했다고 전했다. 엔비디아의 경영전략 AI 집중 선택 엔비디아는 자사의 AI 알고리즘 및 개발 도구를 통해 개발자와 연구자들이 AI 솔루션을 제작하는 데 필요한 지원을 제공하며, 독특한 커뮤니티 활동을 통해 혁신적인 AI 솔루션을 지속적으로 개발하고 공유하고 있다. 엔비디아는 AI를 위한 다양한 제품 라인업을 보유, GPU를 비롯하여 AI에 특화된 칩, 클라우드 서비스, 고성능 서버 및 슈퍼컴퓨터 솔루션, 그리고 AI 연구와 개발 지원 시스템 등을 포함한다. 10년 동안 거의 경쟁 없는 자리를 유지하며, 챗봇용 텍스트 생성 등에도 성공한 바 있다. 엔비디아 젠슨 황(Jensen Huang) 최고경영자(CEO)는 '씨그래프(SIGGRAPH)'에서 생성 AI시대의 새로운 프로세서인 '그레이스 호퍼(Grace Hopper)' AI 반도체를 발표했다. 이 반도체는 엔비디아가 처음으로 데이터센터용으로 개발한 CPU를 포함하며, 주력 GPU 'H100'과 결합하면 AI 학습 속도를 기존 대비 약 4배 향상시킬 수 있다. 젠슨 황CEO는 "회사의 초점이 항상 AI 개발에 있어 원스톱 샵의 위치를 확보했다"고 밝혔다. 엔비디아 그레이스 호퍼 vs 인텔 GPU 맥스 리서치 회사인 옴디아(Omdia)에 따르면 구글, 아마존, 메타, IBM 등도 AI칩을 출시하고 있지만, 엔비디아는 AI 칩 시장의 70% 이상을 차지해, 2분기 매출은 월스트리트의 예상을 크게 뛰어넘는 64%의 증가를 기록했다. 현재 시가총액 1조 달러(약 1321조 원)로, 세계에서 가장 가치 있는 칩 제조업체로 올라섰다. 엔비디아는 지난 10여 년 동안 이미지, 얼굴, 음성 인식 등의 복잡한 AI 작업을 위한 칩의 생산에서 뚜렷한 우위를 보여왔다. 특히, 챗봇용 텍스트 생성 기술인 챗GPT와 같은 분야에서의 성과를 통해 그 능력을 입증하며, 초기 AI 추세를 선제적으로 파악하고 적극 반영함으로써 경쟁력을 강화했다. 인텔도 엔비디아에 뒤질세라 적극적인 반격 자세를 취하며 지난 6월 데이터센터용 AI 반도체인 'GPU 맥스 시리즈'를 시장에 선보였다. 이 제품은 고성능 GPU를 탑재하며, 특히 AI를 이용한 이미지 분석 등에서는 엔비디아의 H100보다 우수한 성능을 보여주는 것으로 알려졌다. 맥스 시리즈의 핵심 반도체는 인텔의 7나노미터 기술과 대만 TSMC의 5나노미터 기술이 통합됐다. 21년 만에 인텔로 복귀한 팻 겔싱어 CEO는 전통적인 독립 제조 방식에서 벗어나 엔비디아를 탄력있게 추격하고 있다. 캐나다의 조사기관 프레지던트 리서치 예상에 따르면 2023년 AI 반도체 시장은 전년 대비 30% 성장하여 218억 달러 규모에 이를 것으로 보인다. AI 반도체의 시장 점유율은 전체의 3%에 불과하지만, 고가 거래가 빈번하게 일어나고 있으며, AI 반도체는 현재의 반도체 시장에서 가장 주목받는 영역 중 하나다. 삼성전자와 비슷하지만 다른 엔비디아 전략 엔비디아와 삼성전자는 AI 분야에서 각기 다른 전략을 펼치며 세계적인 경쟁을 펼치고 있다. 엔비디아는 GPU와 같은 특화된 AI 하드웨어의 개발 및 제조에 중점을 둔다. 또한, 개발자들을 위해 소프트웨어 도구와 프레임워크를 제공하며, GPU 클라우드 서비스로 AI 작업의 효율성을 높이고 있다. 반면 삼성전자는 반도체 분야의 세계적인 위치를 바탕으로 AI 칩과 컴퓨팅 솔루션을 제작하며, 이를 스마트폰, 자율주행차, 그리고 다양한 AI 응용프로그램에 적용한다. 또한, 가전제품에서의 음성인식 AI 기술 개발로 스마트 홈 환경을 강화하고 있다. 예컨대, 엔비디아는 AI 하드웨어와 관련된 도구 및 서비스를 중심으로 생태계를 구축하는 반면, 삼성전자는 다양한 전자 제품에서 AI를 접목해 스마트한 기술 환경을 선도하고 있다. 두 기업은 각자의 강점을 바탕으로 AI 분야에서 세계 각국과 경쟁하며 주도권을 놓고 다투고 있다. 한편 반도체 기술의 지속적인 발전에 따라, 서로의 강점을 지닌 분야를 잠식하고 있는 인텔과 엔비디아의 싸움에 세계 반도체가 흥미진지하게 지켜보고 있다. 인텔과 엔비디아는 모두 압도적인 자금력과 연구 및 개발 능력을 보유하고 있어, 반도체 산업 내에서의 핵심적인 위치를 계속 유지할 것으로 전망된다. 산업 전문가들은 엔비디아에서 촉발된 반도체 산업의 독점적 구조 변화를 산업의 건강한 발전의 일환으로 평가하며, 이로 인해 경쟁이 활성화되어 더 우수한 기술 및 제품이 시장에 등장할 것이라는 기대감을 드러냈다.
-
- IT/바이오
-
반도체 '쿠데타', 엔비디아 AI원스톱 시스템으로 세계 선두로
-
-
네이버, 생성형 AI '하이퍼클로바X' 공개…11월 검색엔진에 통합
- 한국판 생성형 인공지능(AI)이 드디어 베일을 벗었다. 한국 대표 인터넷 대기업 네이버가 최근 생성형 AI '하이퍼클로바 X(HyperCLOVA X)'를 공개하며 세계 AI 경쟁 무대에 데뷔했다. 네이버의 대규모 언어모델(Large Language Model, LLM)은 챗GPT와 유사한 인공지능 챗봇인 '클로바 X'와 마이크로소프트 빙(Bing)에 해당하는 생성형 AI 기반 검색 엔진인 '큐(Cue)'등의 서비스를 제공한다. 세계는 현재 생성형 AI 분야에서의 경쟁이 가열되고 있다. 네이버의 생성형 AI 출시는 다른 글로벌 기업들의 AI 강화 움직임에 발맞춰 이루어진 것이다. 오픈AI는 마이크로소프트의 지원을 받으며 이 경쟁을 선도하고 있다. 구글은 '바드'라는 AI 챗봇을 출시하고 미국 인공지능 스타트업 '앤트로픽'(Anthropic)에 투자하는 한편, 중국의 바이두는 '어니봇'을 선보였다. 메타와 아마존 같은 기업들 또한 자신들만의 AI 챗봇을 곧 선보일 계획이다. 미국이 생성형 AI 분야를 선도하는 가운데, 네이버의 한국판 생성형 AI 출시는 국내외에서 높은 관심을 받고 있다. 해외 IT 전문 매체 테크크런치 보도에 따르면, 네이버 클라우드에서 출시한 '하이퍼클로바 X'는 지난 8월 24일부터 한국어와 영어로 베타 서비스를 시작했다. 그리고 '큐'는 9월의 베타 테스트를 마치고 11월에는 네이버의 기존 검색 엔진과 통합될 계획이다. 네이버 측은 "하이퍼클로바 X는 크리에이터와 기업 고객 모두가 사용 가능하다"라며, 이는 2021년에 출시된 한국어 LLM 하이퍼클로바의 업그레이드 버전이라고 설명했다. 또한, 하이퍼클로바는 2400억 개 이상의 파라미터를 가지고 있음을 공개했지만, 하이퍼클로바 X에 얼마나 많은 파라미터가 학습되었는지는 구체적으로 공개하지 않았다. 네이버 최수연 대표는 주주에게 보낸 서한에서 "회사는 AI 전문가 500명을 보유하고 있으며, 1000억 개 이상의 파라미터로 구성된 대규모 언어 모델을 독자적으로 개발한 전 세계 5개 기업 중 하나"라고 밝혔다. 네이버 클라우드의 기술 및 하이퍼스케일 AI 책임자인 성낙호 총괄은 "네이버 클라우드는 텍스트부터 이미지, 동영상, 오디오에 이르기까지 다양한 데이터를 분석하고 생성하는 다중 모드 언어 모델의 개발을 진행 중"이라고 밝혔다. 즉, 클로바 X는 텍스트, 이미지, 음성 등의 다양한 데이터 형태를 통합해 학습함으로써 기존 언어 모델보다 더 깊은 정보 인식과 풍부한 정보 제공이 가능하다. 네이버는 한국, 일본, 동남아시아뿐만 아니라 중동, 스페인, 멕시코와 같은 비영어권 국가와 정치적으로 민감한 지역에서도 맞춤형 AI 애플리케이션을 제공하려고 한다. 이를 통해 경쟁사들이 아직 진출하지 않은 지역에 주목하고 있다는 점을 강조했다. 네이버의 최수연 대표는 컨퍼런스에서 11월에 60만 대의 서버로 구축된 'GAK 세종'이라는 두 번째 데이터 센터를 한국에서 오픈할 예정이라고 밝혔다. 네이버는 지난해 12월부터 삼성과 함께 하이퍼스케일 AI를 위한 AI 칩 개발에 착수했고, 삼성 또한 곧 기업용 생성형 AI를 출시할 계획이다. 네이버는 판매자, 창작자, 광고주를 포함한 파트너들을 위한 AI 기술 도구를 선보일 예정이다. '클로바 for Writing'이라는 글쓰기 도구와 '클로바 for AD'라는 광고 상품을 통해 다양한 네이버 서비스에 생성형 AI를 신속하게 통합할 계획이다. 또한 네이버 클라우드는 AI 기반의 B2B 상품을 출시하며, '뉴로클라우드'라는 완전 관리형 하이브리드 클라우드 서비스와 '클로바 스튜디오'라는 AI 개발 도구로 고객 기업들의 자체 생성형 AI 구축을 지원할 방침이다. 전문가들은 네이버의 강점이 다양한 서비스와 파트너들이 연계되어 성장을 이끌어내며, 그 결과로 플랫폼의 발전이 이루어지는 '위닝 루프' 구조에 있다고 지적하며, "하이퍼클로바X가 이 과정을 가속화시킬 것"이라고 전망했다.
-
- IT/바이오
-
네이버, 생성형 AI '하이퍼클로바X' 공개…11월 검색엔진에 통합
-
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?
- 마이크로소프트(MS) 창업자 빌 게이츠가 "인터넷의 발명만큼 중대한 사건"이라고 극찬한 챗GPT(Chat GPT)는 오픈AI에서 개발한 대화형 인공지능(AI) 서비스로, 대량의 데이터를 학습해 새로운 정보를 생성하고 응답하는 능력을 갖춘 시스템이다. 챗GPT는 챗(Chat)과 GPT(Generative Pre-trained Transformer)의 합성어로, 트랜스포머(Transformer) 계열의 대규모 언어 모델(GPT-3.5)을 기반으로 한다. GPT-3.5는 오픈AI에서 개발한 GPT-3의 업그레이드 버전으로, 1000억 개의 파라미터를 가지고 있다. 파라미터란 AI가 학습할 수 있는 변수의 수를 의미하는데, 이는 GPT-3의 2배에 달한다. 챗GPT는 강화학습(RLHF) 방식을 채택해 자신의 행동에 따른 보상을 통해 스스로 학습하고 발전할 수 있다. 챗GPT는 번역 및 문장 재구성, 텍스트 요약, 콘텐츠 생성, 코딩 등 다양한 영역에서 우수한 성능을 뽐내고 있다. 무엇보다 인간 고유의 영역이라 여겨져 온 창작의 영역까지 AI가 파고든 사실에 많은 사람이 놀라고 있다. 지난해 11월 선보인 챗GPT는 출시된 지 5일 만에 이용자 수 100만 명을 확보했고, 1억 명을 돌파하는 데는 두 달이면 충분했다. 현재 전 세계적으로 가장 많은 사용자를 보유하고 있는 AI 서비스로 자리매김했다. AI 지능 저하 '드리프트' 현상이란? 인공지능(AI)의 새로운 패러다임인 챗GPT와 같은 채팅AI가 의사 면허 시험을 통과하거나 복잡한 수학 문제를 놀라운 정확도로 풀 수 있다는 보고서도 나왔다. 그런데 최근 챗GPT의 성능이 급격히 저하되는 현상이 나타나 인공지능 학계를 발칵 뒤집어 놓았다. 파겐 와사니 테크롤로지스(Fagen Wasanni Technologies)와 일본 매체 기가진(gigazine)의 최근호에 따르면 올해 3월부터 6월까지 채팅 AI의 수학 능력이 급격히 떨어지는 현상이 발견됐다. 이러한 채팅 AI의 지능 저하 현상을 '드리프트(drift)'라고 한다. 외신에 따르면 미국 스탠포드 대학과 UC 버클리가 올해 3월과 6월 두 차례에 걸쳐 오픈AI의 대규모 언어모델(LLM) 'GPT-3.5'와 'GPT-4'로 구동되는 챗GPT에 '수학 문제', '코드 생성', '시각적 추론', '민감한 질문' 등 4가지 과제를 부여해 그 답변의 신속성과 정확성을 분석했다. 그 결과, '17077은 소수인가?'와 같은 단순 수학 문제에 대한 GPT-4의 응답 정확도가 2023년 3월부터 6월 사이에 97.6%에서 무려 2.4%로 급락한 것으로 나타났다. 두 대학의 연구진에 따르면, "AI의 드리프트 문제는 매우 복잡한 AI 모델의 일부를 개선하려고 할 때 모델의 다른 부분의 성능이 저하되는 문제"라고 설명했다. 연구원들은 3월과 6월 다양한 버전의 LLM을 테스트하고 위의 네 가지 과제 외에 미국 의사 면허 시험, 시각적 추론을 포함한 다양한 AI 작업에서 성능을 평가했다. 그 결과, LLM이 제공하는 답변에 상당한 변동성이 있는 것으로 나타났다. 특히 GPT-4의 수학 문제 해결 능력은 3월과 6월 사이에 정확도가 84.0%에서 51.1%로 떨어지는 등 급격히 악화됐다. 반면, GPT-3.5의 정확도는 같은 기간 동안 49.6%에서 76.2%로 향상됐다. 연구원들은 또한 특정 작업에서 지시를 따르는 GPT-4의 능력이 저하되는 것을 관찰했다. 예를 들어, '행운의' 숫자와 관련된 수학 문제에서 GPT-4의 정확도는 3월과 6월 사이에 83.6%에서 35.2%로 떨어졌고 GPT-3.5의 정확도는 30.6%에서 48.2%로 오히려 증가했다. 또한 ‘민감하거나 위험한 질문’에 답변하려는 LLM의 의지에 변화가 있었다. GPT-4는 응답률이 21.0%에서 5.0%로 급격히 낮아졌고, GPT-3.5는 2.0%에서 5.0%로 소폭 증가했다. 복잡한 추론 과제에서 GPT-4는 정확한 답변을 생성하는 점이 1.2%에서 37.8%로 증가해 개선된 모습을 보였다. 그러나 GPT-3.5의 추론 완전 일치 성공률은 22.8%에서 14.0%로 감소했다. 연구원들은 또한 시간이 지남에 따라 LLM이 생성한 코드의 실행 가능성도 감소하는 것을 관찰했다. 또 미국 의사 면허 시험에서 GPT-4의 성적은 86.6%에서 82.4%로 소폭 하락한 반면, GPT-3.5는 54.7%였다. 시각적 추론 과제에서 약간의 개선이 있었지만 두 모델 모두 전반적인 정확도는 여전히 낮았다. 연구진은 짧은 시간 내에 GPT-3.5와 GPT-4의 성능과 동작에 상당한 변화가 있었다는 점을 강조했다. "AI 미세 조종시 다른 영역서 후퇴" 스탠포드대 제임스 조우(James Zou) 컴퓨터 과학 연구원은 "AI 모델을 미세 조정해 특정 방향으로 강화하면 다른 영역에서는 후퇴할 위험이 있다"며 "AI 모델을 지속적으로 개선하는 것은 매우 어렵다"고 말했다. 또한 조우 연구원은 "우리는 GPT-4와 같은 AI 모델에서 언젠가 드리프트 문제가 발생할 것으로 예상했지만, 이렇게 빨리 드리프트 문제가 발생한 것에 대해 매우 놀랐다"고 했다. 해외 매체 크립토폴리탄(Cryptopolitan)은 AI의 드리프트 문제에 대해 "이 문제는 프롬프트 엔지니어링(Prompt Engineering)이라는 급성장 중인 트렌드와 관련이 있을 수 있다"고 추측했다. '프롬프트 엔지니어링'은 사용자가 프롬프트를 만들어 AI로부터 특정 반응을 이끌어내는 개념이다. 이 매체는 "GPT-4의 수학적 능력 저하가 프롬프트 엔지니어링에 대응하기 위해 취해진 우발적 결과일 수 있다"고 지적했다. 오픈AI "개선 위해 다양한 연구 진행" 드리프트 문제에 대해 오픈AI 측은 "새로운 AI 모델을 출시할 때, 우리는 새로운 모델을 더 똑똑하게 만드는 것을 최우선 과제로 삼고 있다. 또한 우리는 새로운 AI 모델 버전이 포괄적인 작업의 개선으로 이어지고 있는지 확인하기 위해 다양한 조사와 연구를 진행하고 있다. 하지만 우리의 평가 방법은 완벽하지 않기 때문에 지속적으로 개선해 나가고 있다"고 말했다. 조우는 AI의 드리프트 문제에 대해 "중요한 것은 지능이 떨어진다고 해서 기술을 포기하는 것이 아니라 그 어느 때보다 AI를 면밀하게 모니터링하는 것"이라고 말했다. 아울러 연구팀은 챗GPT와 같은 AI 모델에 대해 수천 개의 질문을 던져 체계적인 테스트를 계속하고 있으며, 시간이 지남에 따라 성능 변화를 분석하고 있다고 덧붙였다.
-
- IT/바이오
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?