검색
-
-
구글, 생성형AI 신모델 1.5프로 출시⋯AI비서 '프로젝트 아스트라' 공개
- 미국 구글 모회사 알파벳은 14일(현지시간) 인공지능(AI) 모델 제미나이(Gemini)의 경량판 1.5프로를 출시했다. 또한 구글은 사람처럼 대화하는 비서(assistant)와 같은 인공지능(AI) 기능 '프로젝트 아스트라'도 선보였다. 이날 로이터통신 등 외신들에 따르면 구글은 이날 미 캘리포니아주 마운틴뷰 쇼어라인 엠피씨어터에서 '구글 연례개발자회의(I/O)'를 열고 자사의 최신 AI 모델인 제미나이를 통해 AI의 미래를 현실화하기 위한 비전을 발표했다. 순다르 피차이 최고경영자(CEO)는 "제미나이 생태계에 상상 가능한 AI의 모든 것을 담았다"며 "이번 주부터 미국 내 모든 이용자에게 완전히 개편된 경험인 'AI 개요'를 시작한다는 것을 발표하게 돼 기쁘다"고 말했다. 'AI 개요'는 제미나이를 이용해 검색 결과를 빠르게 요약하고 관련 링크를 제공받을 수 있는 기능이다. 이용자들은 대화 형태로 자유롭게 검색할 수 있고, 사진뿐만 아니라 동영상으로도 검색이 가능해진다. 구글은 작년부터 AI를 이용해 질문에 대한 답변 초안을 작성하기 시작했지만 지금까지는 실험용 버전이었다.검색 엔진에 생성형 AI를 탑재한 것은 구글 검색이 등장한 이후 25년만에 가장 큰 변화다. 특히 검색에 대한 결과는 지금까지 다양한 링크가 제공된 것과 달리 대화 형태로 제공된다. 미국 이용자를 시작으로 앞으로 몇 달 안에 더 많은 국가에 제미나이를 탑재한 새로운 검색 기능이 제공된다. 구글은 연말까지 10억 명 이상의 사용자에게 제공할 계획이라고 밝혔다. 구글은 또 제미나이와 구글의 음성 모델을 기반으로 하는 새로운 '프로젝트 아스트라(Project Astra)'도 선보였다.이는 미래 AI 어시스턴트를 위한 구글의 비전으로, AI가 사람처럼 보고 들을 수 있고 음성으로 대화하면서 이용자의 개인 비서 역할을 하는 기능이다. 구글 지메일과 구글 문서, 캘린더 등 구글 앱에서 개인 정보를 가져와 이용자의 스케줄을 알려주고 계획을 짜준다. 이 비전을 위한 전 단계로 구글은 '제미나이 라이브'를 선보였다. 이 기능은 사람처럼 대화하고 이미지는 업로드를 통해 인식한다. 구글은 '제미나이 라이브'를 수개월 내에 출시하고 이후 실시간 시각과 청각 등 프로젝트 아스트라를 위한 기능도 추가할 계획이다. 구글은 또 지난 2월 공개한 멀티모달 AI 모델 제미나이 1.5 프로를 이날부터 한국어를 포함해 35개 언어로 출시한다고 밝혔다. 제미나이 1.5 프로는 제미나이 1.0 울트라의 업그레이드 버전이다. 100개의 이메일을 단 몇 초 만에 요약하고 1시간 분량의 동영상을 한 번에 처리할 수 있다. AI 모델이 한 번에 처리할 수 있는 정보의 양을 '콘텍스트 윈도'라 하고, 이는 단어·이미지·영상·오디오·코드 등의 의미를 가진 '토큰'으로 구성된다. 제미나이 1.5 프로는 최대 100만개의 토큰 처리 능력을 갖췄는데, 조만간 200만 개의 토큰 처리 능력을 갖춘 버전도 출시할 예정이다. 제미나이 1.5 프로보다 더 가벼우면서도 같은 멀티모달 추론 기능과 긴 콘텍스트 기능을 갖춘 제미나이 1.5 플래시도 선보였다. 텍스트 투 이미지 AI인 이마젠의 최신 버전인 이마젠3와 함께 텍스트를 입력하면 1분 이상의 영상을 만들어주는 AI 모델 비오(Veo)도 공개했다.또 서버용 AI 반도체인 TPU 6세대인 트릴리움(Trillium)도 발표했다. 이전 모델 대비 칩당 최대 컴퓨팅 성능이 4.7배 향상됐다고 구글은 설명했다. 구글은 "이번 행사를 통해 '제미나이 시대'의 본격 개막을 알렸다"며 "제미나이 생태계 완성으로 AI 혁신을 가속화해나갈 계획"이라고 밝혔다.
-
- IT/바이오
-
구글, 생성형AI 신모델 1.5프로 출시⋯AI비서 '프로젝트 아스트라' 공개
-
-
오픈AI, 인간과 같은 반응속도로 대화하는 생성AI 개발
- 미국 오픈AI는 13일(현지시간) 새로운 생성 인공지능(AI) 'GPT-4o'를 개발했다고 발표했다. 이날 로이터통신 등 외신들에 따르면 오픈AI는 기존 챗GTP와 비교해 처리속도를 2배로 높이는 한편 운용비용을 절반으로 줄인 새로운 AI모델 'GPT-4o'을 출시한다고 밝혔다. 'GPT-4o'는 사람과 같은 반응속도로 대화가 가능해 그동안 약점으로 꼽혔던 반응 지연을 극복해 AI활용이 더욱 확산될 것으로 예상된다. 오픈AI가 내놓은 'GPT-4o'는 챗GPT를 움직이는 기반이 되는 기술이며 지난해 11월 발표된 현재 가동중인 GPT-4터보를 개선한 모델이다. o는 '모든 것'을 의미하는 옴니의 머리글자를 따온 것이다. 새로운 AI는 한국어를 포함한 50개 언어에 대응하며 문자, 동영상, 음성을 모든 인식한다고 오픈AI측은 설명했다. 실시간 번역 뿐만 아니라 스마트폰 카메레르 사용해 사람 얼굴 표정을 읽거나 그래프를 분석할 수도 있다. AI음성에 대한 반응속도는 빠를 경우 232 밀리초(1000분의 1초) 평균 320 밀리초로 사람이 실제로 대화하는 시간과 같은 수준을 실현했다는 것이 오픈AI의 지적이다. 사람의 감성을 읽고 농담도 해 더욱 자연스런 대화가 가능하게 됐다는 것이다. 이날 열린 웹발표회의 설명회에서는 개발자가 음성으로 챗GPT로 취침전에 어울리는 모습으로 이야기를 들을 수 있도록 주문했다. 음성톤을 만담식으로 얘기한다든지 노래를 부르면서 읽게하는 조작도 보여주었다. 미라 무라티 최고기술책임자(CTO)는 "지금까지 AI모델의 지능을 높이는 것에 주력해왔지만 사용하기 쉽도록 큰 개선을 이루었다"고 강조했다. 신기술 탑재후에도 챗GPT의 기본요금을 변하지 않는다. 텍스트와 동영상용의 일부 기능만 무료로 사용할 수 있다. 음성을 사용하는 기능은 월 20달러의 유료사용자와 법인에게 우선 제공되며 수주이내에 사용할 수 있게 된다고 오픈AI는 밝혔다. 데이터운용의 부하를 피하기 위해 이용회수는 계약에 따라 제한된다. 생성AI는 미국 구글의 '제미나이(Gemini)1.5프로', 미국 스타트업 앤솔로픽이 개발한 '클로드(Claude)3', 미국 메타의 '라마(Llama)3' 등 신기술이 속속 출시돼 성능경쟁이 격화하고 있다.
-
- IT/바이오
-
오픈AI, 인간과 같은 반응속도로 대화하는 생성AI 개발
-
-
구글, 제미나이 1.5 프로 공개…"최대 100만개 토큰 처리"
- 구글은 15일(현지시간) 자체 개발한 멀티모달 인공지능(AI) 모델 제미나이 1.0 프로의 업데이트 버전 '제미나이 1.5 프로'를 공개했다. 이날 정보통신(IT)매체 더 버지는 구글은 비즈니스 도구, 개인 비서, 그리고 그 사이의 모든 것을 위한 도구로서 제미나이에 올인하고 있음을 분명히 밝혔으며, 그 계획을 강력하게 추진하고 있다고 전했다. 제미나이 시리즈는 학습 규모에 따라 울트라, 프로, 나노 등으로 구분되며, 이날 공개된 '제미나이 1.5 프로'는 구글의 이전 AI 모델 '제미나이 1.0 울트라'와 유사한 성능을 지닌 중형 멀티모달 모델이다. 이 모델은 텍스트, 이미지, 음성, 비디오 생성 능력을 갖추고 있다. 구글은 '제미나이 1.5 프로'가 기존 '1.0 프로' 모델에 비해 복잡한 정보를 동시에 처리하는 능력이 크게 개선되어, 보다 긴 문맥을 이해하는 데 뛰어난 역량을 보인다고 밝혔다. AI 모델이 한 번에 처리할 수 있는 정보의 양은 '콘텍스트 윈도우(context window)'로 정의되며, 이는 텍스트, 이미지, 비디오, 오디오, 코드 등을 포함한 다양한 형태의 정보를 의미하는 '토큰(token)'이라는 단위로 측정된다. 순다르 피차이 구글 CEO는 토큰에 대해 "약 10~11시간 분량의 동영상과 수만 줄의 코드에 해당한다"라고 간단하게 설명했다. 다시 말하면, 컨텍스트 윈도우는 AI 봇에게 모든 콘텐츠에 대해 한 번에 질문할 수 있음을 의미한다. 제미나이 1.5 프로는 최대 100만 개의 토큰을 처리할 수 있는 능력을 갖추고 있다. 이는 기존 '제미나이 1.0 프로' 모델이 처리할 수 있는 3만2000개의 토큰에 비해 현저히 향상된 규모다. 참고로 오픈AI의 GPT-4가 12만8000개를 처리할 수 있다. 이 모델은 1시간 분량의 비디오, 11시간 분량의 오디오 파일, 3만줄이 넘는 코드, 70만단어 이상의 텍스트 등 방대한 양의 정보를 한 번에 처리할 수 있는 능력을 가지고 있다. 예를 들어, 400페이지가 넘는 아폴로 11호 달 탐사 임무와 관련된 문서가 제공될 경우, 제미나이 1.5 프로는 문서 전체의 내용, 이미지 및 세부 정보를 통합적으로 이해하고 추론할 수 있다. 구글은 제미나이 1.5 프로가 미국 배우 버스터 키튼의 무성영화를 분석할 때, 영화의 구성과 사건뿐만 아니라 놓치기 쉬운 세부 내용까지 파악할 수 있다고 설명했다. 이 AI 모델은 문맥 기반 학습 능력이 탁월하여, 소멸 위기에 처한 언어인 칼라망(Kalamang)어의 문법서를 학습한 후, 사람과 유사한 수준에서 영어-칼라망어 번역 작업을 수행할 수 있다. 제미나이 1.5 프로는 '구글 AI 스튜디오'라는 개발자용 AI 개발 도구와 기업들이 AI 모델을 활용할 수 있는 '버텍스 AI' 플랫폼을 통해 프리뷰 버전으로 제공된다. 피차이는 또 "구글의 연구원들이 1000만 개의 토큰 콘텍스트 윈도우를 테스트 중이며, 이는 '왕좌의 게임' 시리즈 전체를 한꺼번에 볼 수 있는 분량"이라고 말했다. 그는 확대된 콘텍스트 윈도우가 비즈니스에 크게 유용할 것으로 보고 있다. 피차이는 "쿼리 창이 상당히 넓어진 것으로 생각하면 된다"면서 "다양한 개인적 콘텍스트와 정보를 포함시킬 수 있는 새로운 사용 사례가 가능해질 것"이라고 말했다. '쿼리(query)'는 데이터베이스, 검색 엔진, 정보 시스템 등에서 정보를 요청하기 위해 사용하는 질문이나 요청을 의미한다. 또한 피차이는 영화 제작자들이 영화 전체를 업로드하여 제미나이에게 평론가들의 의견을 물어보거나, 기업이 방대한 재무 기록을 분석하는 데 제미나이를 활용할 수 있는 가능성을 거론하면서 "이것은 우리가 달성한 가장 큰 혁신 중 하나라고 생각한다"라고 덧붙였다.
-
- IT/바이오
-
구글, 제미나이 1.5 프로 공개…"최대 100만개 토큰 처리"