검색
-
-
인텔, 2025년까지 AI 지원 PC 1억 대에 칩 공급
- 인텔(Intel)은 2025년까지 최대 1억 대의 인공지능(AI)을 지원하는 PC에 자사의 코어 프로세서를 공급하는 것을 목표로 하고 있다. 이는 예상되는 전체 글로벌 PC 시장의 20% 이상을 차지할 것으로 보인다. 28일(현지시간) 일본 경제신문 니케이 아시아에 따르면 인텔은 AI PC 시대에는 칩 성능뿐만 아니라 서비스 및 사용자 경험도 중요하다고 강조했다. 인텔은 AI 기반 PC 시대에는 칩의 성능뿐만 아니라 서비스와 사용자 경험이 중요하다고 보고, 이를 위해 소프트웨어 및 애플리케이션 개발자와의 협력을 강화하고 있다. 인텔은 마이크로소프트와 협력하여 AI PC를 '정의'하고 있으며 이 개념에는 세 가지 핵심 요소가 있다. 인텔과 마이크로소프트는 AI PC를 정의하는 데 협력하고 있으며, 이 개념에는 세 가지 핵심 요소가 포함된다. 첫 번째는 AI 워크로드를 처리하기 위해 설계된 신경 처리 장치(NPU)를 내장한 인텔의 코어 울트라(Core Ultra) PC 칩셋, 두 번째는 마이크로소프트의 AI 챗봇인 코파일럿(Copilot)을 위한 전용 "코파일럿 키"를 갖춘 키보드, 그리고 세 번째는 업무 효율성을 높일 수 있는 잠재력이다. AI 지원 PC는 미국 수화를 영어로 즉각 번역하고, 비디오를 실시간으로 전사하며, 텍스트를 파워포인트 슬라이드로 자동 변환하는 등의 기능을 제공할 예정이다. 인텔은 이러한 사용 사례를 확장하고 파트너를 확보하기 위해 적극적으로 노력하고 있다. 구체적으로, 마이크로소프트 팀즈(Microsoft Teams), 웹엑스(Webex), 줌(Zoom) 등 화상 회의 서비스 제공업체와 협력하여, 사용자의 시선을 카메라에 자동으로 맞추는 시선 추적, 배경을 제거하고 스마트 프레이밍을 조정하는 등의 AI 기반 기능을 개발하고 있다. 2022년 하반기부터 전체 PC 산업은 러시아-우크라이나 전쟁과 인플레이션 상승의 영향으로 수요 감소를 경험했다. 카운터포인트리서치는 2023년에 상업용 및 소비자 부문의 수요 둔화로 인해 글로벌 PC 시장이 전년 대비 14% 축소되었다고 보고했다. 이 리서치 기관은 윈도우 11 운영체제의 교체, Arm(암) 기반 PC의 보급 확대, AI 지원 PC의 확산 등으로 인해 올해 글로벌 PC 시장이 코로나19 팬데믹 이전 수준으로 회복될 것으로 전망했다. 애플을 제외한 주요 PC 제조업체들은 올해 말 AI 지원 PC 출시를 계획하고 있다. 에이서(Acer)의 제이슨 첸(Jason Chen) 회장은 최근 기자들에게 생성 AI가 업계에 새로운 기회를 제공하며, 2024년에는 회사의 최우선 과제가 될 것이라고 밝혔다. 에이서는 대만 타이베이에 본사를 두고 있는 다국적 정보통신기술(ICT) 기업이다. 이 회사는 컴퓨터, 1976년에 설립된 이 회사는 노트북, 스마트폰, 태블릿, 디스플레이 등 다양한 IT 제품의 생산 및 판매를 통해 세계 최대 규모의 PC 제조업체 중 하나로 성장했다. 인텔은 전 세계 PC용 마이크로프로세서 시장에서 가장 큰 공급업체로, 특히 노트북 칩 시장에서 약 76%의 점유율을 보유하고 있다. 한편, 인텔은 연내 파운드리(반도체 수탁생산) 1.8나노(㎚·10억분의 1m) 공정 양산에 나서겠다고 선언해 글로벌 반도체 업계를 도발했다. 나노는 반도체 회로 선폭을 의미하는 단위로, 선폭이 좁을수록 소비전력이 줄고 처리 속도가 빨라진다. 현재 가장 앞선 양산 기술은 3나노다. 인텔은 지난 21일 미국 캘리포니아주 새너제이에서 파운드리 전략을 발표하는 'IFS(인텔 파운드리 서비스) 다이렉트 커넥트' 행사를 열었다. 이는 2021년 3월 파운드리 사업 진출 선언 이후 대규모 투자 계획을 발표해온 인텔이 처음 여는 파운드리 사업 설명회였다. 행사에서 인텔은 올해 말부터 1.8나노 공정(18A)의 양산에 들어간다고 발표했다. 당초 양산 시점은 2025년이라고 밝혔는데, 이를 앞당긴 것이다. 세계 파운드리 1위인 대만 TSMC와 2위 삼성전자가 2나노 주도권을 두고 치열하게 경쟁하는 와중에 후발주자인 인텔이 파운드리 공정 양산을 선언해 업계의 주목을 받고 있다. 인텔은 지난해 9월 1.8나노급인 18A 공정 반도체 웨이퍼 제품을 깜짝 공개해 삼성전자와 TSMC를 긴장시켰다. 이날 인텔은 1.8 나노 공정에서는 MS의 칩을 생산한다고 밝혔다. 사티아 나델라 MS 최고경영자(CEO)는 이날 사전 녹화된 영상을 통해 "가장 진보되고 고성능이며 고품질 반도체의 안정적인 공급이 필요하다"며 "그것이 우리가 인텔과 함께 일하는 것에 매우 흥분하는 이유"라고 밝혔다.
-
- IT/바이오
-
인텔, 2025년까지 AI 지원 PC 1억 대에 칩 공급
-
-
휴메인, SK텔레콤 손잡고 웨어러블 'AI Pin' 한국 시장 진출 본격화
- 웨어러블 AI 스타트업 휴메인(Humane)이 한국 최대 이동통신사 SK텔레콤과 손잡고 혁신적인 웨어러블 기기 'Ai Pin'을 한국 시장에 출시한다고 발표했다. 미국의 기술 전문 매체 테크크런치(TechCrunch)는 27일(현지시간) 휴메인은 원래 미국 시장 진출을 계획하고 있었으나, SK텔레콤과의 전략적 제휴를 통해 한국 시장에 먼저 발을 들이기로 결정했다고 보도했다. 이번 파트너십은 단순한 MVNO(모바일 가상 네트워크 운영자) 관계를 넘어서, 휴메인의 'CosmOS' 운영 체제의 라이선스 제공을 포함하며, 한국 시장에 맞춘 새로운 구독 서비스 개발과 앱이 필요 없는 OS 및 생태계를 위한 수익 창출 방안에 대한 협력이 진행될 예정이다. MVNO(Mobile Virtual Network Operator)는 자체 네트워크 구축 없이 기존 통신 사업자의 네트워크를 임대해 서비스를 제공하는 가상 이동통신 사업자를 의미한다. MVNO는 통신 사업자에게는 초기 투자 없이 새로운 시장에 진출하고 고객을 확보할 기회를, 소비자에게는 다양한 요금제 및 서비스 선택권을 제공한다. SK텔레콤은 이번 파트너십을 통해 자사의 인공지능 서비스를 강화하고 새로운 수익 창출 기회를 모색할 것으로 기대하고 있다. 휴메인의 'CosmOS' 운영 체제의 라이선싱을 통해, SK텔레콤은 차세대 웨어러블 시장에서의 선두 주자로 자리매김하고, 미래 기술을 선도하는 기업으로의 이미지를 강화할 수 있을 것으로 보인다. 휴메인은 SK텔레콤의 넓은 네트워크와 인프라를 활용해 'Ai Pin'의 생산과 판매를 더욱 효율적으로 진행할 수 있게 되며, 한국 시장에서의 사업 확장에 따른 기회를 넓힐 수 있을 것이다. 이와 더불어, SK텔레콤과의 협력을 통해 브랜드 인지도와 신뢰성을 증진시킬 수 있을 것으로 기대된다. 그러나 이번 파트너십은 양사에게 일정한 도전과제도 제시한다. SK텔레콤은 휴메인의 'CosmOS' 운영 체제에 대한 기술적 불확실성, 초기 투자 비용의 부담, 그리고 새로운 사업 모델을 구축해야 하는 등의 문제에 직면할 가능성이 있다. 이러한 도전과제는 향후 양사가 협력을 통해 해결해 나가야 할 과제로 남아 있다. 휴메인은 SK텔레콤에 대한 의존도 증가, 기술 공유에 따른 잠재적 위험, 그리고 수익 분배 협상에서 불리한 위치에 처할 가능성 등의 문제에 직면할 수 있다. 이처럼 SK텔레콤과 휴메인 간의 파트너십은 양사에게 동시에 기회와 도전을 제공한다. 성공적인 협력을 이루기 위해서는 양사 간의 상호 신뢰와 긴밀한 협력을 바탕으로 장점을 최대한 활용하고, 단점을 최소화하기 위한 지속적인 노력이 요구된다. 'Ai Pin'의 한국 시장 출시 일정은 아직 확정되지 않았다. 미국에서의 출시 지연을 고려할 때, 한국 출시 시점은 신중하게 고려될 필요가 있다. 미국 실리콘밸리에 위치한 AI 스타트업 휴메인은 지난해 11월 옷깃에 붙여 사용하는 웨어러블 AI 기기인 'AI 핀’을 출시했다. AI 핀은 명함 크기의 기기로, 옷에 핀으로 고정하여 사용할 수 있다. 지난 11월 9일 공개된 이 AI 핀은 카메라와 센서를 사용하여 주변 환경을 스캔하고 다양한 질문에 답했다. 주로 음성 명령으로 작동되지만, 사용자의 손바닥에 아이콘이나 텍스트를 투사할 수 있는 작은 프로젝터도 탑재되어 있다. 휴메인은 2018년, 전 애플 임원인 임란 초드리와 베사니 본조르노 부부가 스마트폰을 대체하기 위해 공동 설립한 스타트업이다. 초드리는 애플에서 아이폰의 스와이프 언락 기능 개발에 참여한 것으로 알려져 있으며, 본조르노는 첫 아이패드의 발매에 기여한 소프트웨어 엔지니어이다. AI 핀은 혁신적인 기능으로 주목받고 있지만, 일부 전문가들은 카메라가 프라이버시를 침해할 수 있다는 우려를 제기했다. 이에 대해 휴메인은 사용 중임을 나타내는 '트러스트 라이트' 기능을 탑재하고 있으며, 마이크는 아마존이나 구글의 AI 어시스턴트(비서)와 마찬가지로 항상 켜져 있지 않으며 수동으로 활성화해야 한다고 설명했다. AI 핀은 출시 직후부터 다수의 투자자로부터 자금을 유치했다. 투자자로는 오픈AI의 전 CEO 샘 올트먼, 타이거 글로벌, 퀄컴 벤처 등이 포함된다. 웨어러블 컴퓨팅 시장은 진입 장벽이 높고 여러 도전에 직면해 있는 것으로 알려져 있다. 예를 들어, 메타의 VR 헤드셋은 사용 가능한 장치가 제한적이며, 구글의 '구글 글래스'는 카메라를 통한 개인정보 침해 문제로 실패한 사례 중 하나로 지적된다. 휴메인이 웨어러블 AI 기기 시장에서 성공을 거두려면, 사용자의 프라이버시 침해 문제를 해결하고 사용 편리성을 높이는 등의 과제를 안고 있다.
-
- IT/바이오
-
휴메인, SK텔레콤 손잡고 웨어러블 'AI Pin' 한국 시장 진출 본격화
-
-
아이폰·안드로이드 사용자 '인증 앱' 사용법은?
- 디지털 세계화가 된 오늘날, 온라인 계정에 대한 보안은 가장 중요한 문제가 됐다. 그런데 최근 전문가들이 모든 아이폰과 안드로이드 사용자들에게 '텍스트 코드'로 로그인하는 것을 중단하라고 경고했다. 영국 최대 언론사 더 선(The SUN)은 스마트폰 소유자는 다단계 인증을 켜야 하며 그렇지 않으면 해커가 이를 감시할 위험이 있다고 16일(현지시간) 보도했다. 그러면서 모바일 장치에 추가 보호 계층을 추가하는 한 가지 방법은 다단계 인증(MFA, Multi-Factor Authentication)을 활성화하는 것이라고 강조했다. MFA는 로그인 프로세스에 보호 계층을 더하고 보안 침해로부터 보호하는 것을 말하는데, 로그인하기 전에 문자 확인과 같은 추가 수준의 확인을 통해 계정을 보호한다. 그러나 SMS 메시지는 심(SIM) 스와핑, 중간자 공격 등 다양한 기술을 통한 가로채기에 취약하고, SMS는 네트워크 문제나 지연으로 인해 신뢰할 수 없다. 실제로 지난달 미국 증권거래위원회(SEC)가 공식 X(구 '트위터') 계정에 '비트코인 현물 상장지수펀드(ETF) 승인' 가짜뉴스는 '심(SIM) 스와핑' 해킹 공격으로 이뤄졌다고 밝힌 바 있다. 심 스와핑은 유심칩으로 불리는 휴대전화 심 카드를 복제 또는 옮겨서 설치한 후 피해자의 휴대전화 번호를 통해 개인정보를 빼돌리는 해킹수법이다. 이러한 이유로 전문가들은 인증 앱 사용을 권장하고 있다. 많은 스마트폰과 앱에는 구글, 애플, 메타(구 '페이스북')과 같은 자체 2FA(2단계 인증)가 내장되어 있다. 애플은 자사의 웹사이트에서 아이폰(iPhone)의 2FA를 "누군가가 당신의 비밀번호를 알고 있더라도 당신이 자신의 계정에 접근할 수 있도록 보장하기 위해 설계된 '추가 보안 계층'이다"라고 설명했다. 이러한 앱은 기기에서 직접 시간 기반 코드를 생성해, SMS와 같은 외부 통신 채널이 필요하지 않는다. 또한 잠재적으로 손상된 와이파이(Wi-Fi) 네트워크를 통해 코드가 전송되지 않아 훨씬 더 안전해지고, 많은 인증 앱은 PIN(개인식별 번호)이나 생체 인식 인증과 같은 추가 보안 기능을 제공하여 추가 보호 계층을 추가한다. 애플 인증자 사용법 애플 인증기를 켜려면 아이폰의 설정으로 이동한 다음 비밀번호를 누른다. 얼굴인식이나 ID를 터치해 비밀번호에 액세스한 다음, 2FA를 설정하려는 계정을 누른다. 다만, 이 2FA 방법은 모든 웹사이트나 앱에서 작동하지 않는다는 점에 주의해야 한다. 다음으로 인증코드 설정을 클릭한다. 설정 키 입력 및 QR 코드 스캔이라는 두 가지 옵션 메뉴가 표시되면, 설정 키를 선택한 경우 앱이나 웹사이트 페이지로 이동하여 설정 키를 복사하면 된다. 구글 인증기 설정 구글 인증(Google Authenticator)을 설정하는 것은 어렵지 않다. 애플 앱 스토어 또는 구글 플레이 스토어에서 앱을 다운로드 하면 된다. 기기 상단 구글 계정으로 이동해 보안 탭을 누른다. 구글 로그인에서 2단계 확인을 누르면 된다. '인증 앱'에서 설정을 탭하고 화면에 표시되는 단계를 따르면 된다.
-
- IT/바이오
-
아이폰·안드로이드 사용자 '인증 앱' 사용법은?
-
-
구글, 제미나이 1.5 프로 공개…"최대 100만개 토큰 처리"
- 구글은 15일(현지시간) 자체 개발한 멀티모달 인공지능(AI) 모델 제미나이 1.0 프로의 업데이트 버전 '제미나이 1.5 프로'를 공개했다. 이날 정보통신(IT)매체 더 버지는 구글은 비즈니스 도구, 개인 비서, 그리고 그 사이의 모든 것을 위한 도구로서 제미나이에 올인하고 있음을 분명히 밝혔으며, 그 계획을 강력하게 추진하고 있다고 전했다. 제미나이 시리즈는 학습 규모에 따라 울트라, 프로, 나노 등으로 구분되며, 이날 공개된 '제미나이 1.5 프로'는 구글의 이전 AI 모델 '제미나이 1.0 울트라'와 유사한 성능을 지닌 중형 멀티모달 모델이다. 이 모델은 텍스트, 이미지, 음성, 비디오 생성 능력을 갖추고 있다. 구글은 '제미나이 1.5 프로'가 기존 '1.0 프로' 모델에 비해 복잡한 정보를 동시에 처리하는 능력이 크게 개선되어, 보다 긴 문맥을 이해하는 데 뛰어난 역량을 보인다고 밝혔다. AI 모델이 한 번에 처리할 수 있는 정보의 양은 '콘텍스트 윈도우(context window)'로 정의되며, 이는 텍스트, 이미지, 비디오, 오디오, 코드 등을 포함한 다양한 형태의 정보를 의미하는 '토큰(token)'이라는 단위로 측정된다. 순다르 피차이 구글 CEO는 토큰에 대해 "약 10~11시간 분량의 동영상과 수만 줄의 코드에 해당한다"라고 간단하게 설명했다. 다시 말하면, 컨텍스트 윈도우는 AI 봇에게 모든 콘텐츠에 대해 한 번에 질문할 수 있음을 의미한다. 제미나이 1.5 프로는 최대 100만 개의 토큰을 처리할 수 있는 능력을 갖추고 있다. 이는 기존 '제미나이 1.0 프로' 모델이 처리할 수 있는 3만2000개의 토큰에 비해 현저히 향상된 규모다. 참고로 오픈AI의 GPT-4가 12만8000개를 처리할 수 있다. 이 모델은 1시간 분량의 비디오, 11시간 분량의 오디오 파일, 3만줄이 넘는 코드, 70만단어 이상의 텍스트 등 방대한 양의 정보를 한 번에 처리할 수 있는 능력을 가지고 있다. 예를 들어, 400페이지가 넘는 아폴로 11호 달 탐사 임무와 관련된 문서가 제공될 경우, 제미나이 1.5 프로는 문서 전체의 내용, 이미지 및 세부 정보를 통합적으로 이해하고 추론할 수 있다. 구글은 제미나이 1.5 프로가 미국 배우 버스터 키튼의 무성영화를 분석할 때, 영화의 구성과 사건뿐만 아니라 놓치기 쉬운 세부 내용까지 파악할 수 있다고 설명했다. 이 AI 모델은 문맥 기반 학습 능력이 탁월하여, 소멸 위기에 처한 언어인 칼라망(Kalamang)어의 문법서를 학습한 후, 사람과 유사한 수준에서 영어-칼라망어 번역 작업을 수행할 수 있다. 제미나이 1.5 프로는 '구글 AI 스튜디오'라는 개발자용 AI 개발 도구와 기업들이 AI 모델을 활용할 수 있는 '버텍스 AI' 플랫폼을 통해 프리뷰 버전으로 제공된다. 피차이는 또 "구글의 연구원들이 1000만 개의 토큰 콘텍스트 윈도우를 테스트 중이며, 이는 '왕좌의 게임' 시리즈 전체를 한꺼번에 볼 수 있는 분량"이라고 말했다. 그는 확대된 콘텍스트 윈도우가 비즈니스에 크게 유용할 것으로 보고 있다. 피차이는 "쿼리 창이 상당히 넓어진 것으로 생각하면 된다"면서 "다양한 개인적 콘텍스트와 정보를 포함시킬 수 있는 새로운 사용 사례가 가능해질 것"이라고 말했다. '쿼리(query)'는 데이터베이스, 검색 엔진, 정보 시스템 등에서 정보를 요청하기 위해 사용하는 질문이나 요청을 의미한다. 또한 피차이는 영화 제작자들이 영화 전체를 업로드하여 제미나이에게 평론가들의 의견을 물어보거나, 기업이 방대한 재무 기록을 분석하는 데 제미나이를 활용할 수 있는 가능성을 거론하면서 "이것은 우리가 달성한 가장 큰 혁신 중 하나라고 생각한다"라고 덧붙였다.
-
- IT/바이오
-
구글, 제미나이 1.5 프로 공개…"최대 100만개 토큰 처리"
-
-
오픈AI, 동영상 제작 AI '소라' 공개⋯텍스트로 동영상 제작
- 인공지능(AI) 챗GPT를 개발한 오픈AI가 15일(현지시간) 텍스트를 입력하면 동영상을 만들어주는 AI '소라(Sora)'를 공개했다. 이날 로이터통신 등 외신들에 따르면 오픈AI는 "사람들이 실제 상호작용이 필요한 문제를 해결하는 데 도움이 되도록 움직이는 물리적 세계를 이해하고 시뮬레이션할 수 있도록 AI를 교육하고 있다"고 밝히면서 '텍스트 투 비디오(Text to Video)' 모델인 소라를 공개했다. 오픈AI는 이날 블로그에 소라에 대해 "복수의 인물과 특정의 동작, 피사체와 배경의 정확한 디테일을 포함한 복잡한 장면을 표현하는 최장 1분간의 동영상을 빠르게 만들수 있다"고 설명했다. 소라는 최대 1분 길이의 동영상을 생성할 수 있고, 기존의 텍스트 투 비디오에 비해 시각적 품질이 뛰어나며, 프롬프트의 내용에 충실한 그림을 그려준다. 오픈AI는 '세련된 여성이 따뜻하게 빛나는 네온사인과 움직이는 도시 간판으로 가득한 도쿄 거리를 걷고 있습니다. 그녀는 검은색 가죽 재킷, 긴 빨간색 드레스, 검은색 부츠를 착용하고 검은색 지갑을 들고 있습니다. 선글라스와 빨간 립스틱을 착용하고 있습니다. 그녀는 자신감 있고 자연스럽게 걷습니다. 길은 축축하고 반사되어 화려한 조명이 거울 효과를 만들어 냅니다. 많은 보행자가 걸어갑니다'라고 상세한 프롬프트에 맞춰 만들어진 영상을 공개했다. 오픈AI에 따르면 전체 동영상을 한 번에 생성하거나 생성된 동영상을 확장하여 더 길게 만들 수 있다. 모델에 한 번에 여러 프레임을 예측할 수 있는 기능을 제공해 피사체가 일시적으로 시야에서 사라져도 동일하게 유지되도록 하는 까다로운 문제를 해결했다. GPT 모델과 마찬가지로 소라는 트랜스포머 아키텍처를 사용하여 뛰어난 확장 성능을 갖고 있다. 오픈AI에 따르면 동영상과 이미지를 패치라고 하는 작은 데이터 단위의 모음으로 표현했고, 데이터를 표현하는 방식을 통합해 이전보다 더 디퓨전모델을 잘 훈련시킬 수 있었다. 소라는 텍스트 설명만으로 동영상을 생성할 수 있을 뿐만 아니라 기존의 정지 이미지를 가져와서 동영상을 생성할 수도 있다. 또한 기존 동영상을 가져와서 확장하거나 누락된 프레임을 채울 수도 있다. 샘 올트먼 오픈AI 최고경영자(CEO)는 소셜미디아 X(옛 '트위트') 투고에서 "당초 제한된 수의 크리에이터에 제공된다"고 지적했다. 오픈AI는 또한 소라를 자사제품에 포함시키기 전에 안전성을 평가하는 전문가팀에 대한 접근을 허용했다.
-
- IT/바이오
-
오픈AI, 동영상 제작 AI '소라' 공개⋯텍스트로 동영상 제작
-
-
구글 제미나이, 인공지능 비서의 미래 경험
- 구글의 인공지능(AI) 챗봇 바드(Bard)가 최신 AI 모델 '제미나이(Gemini)'로 명칭을 바뀌어 인공지능(AI)비서 기능을 선보였다. 구글은 지난 8일(현지시간) 자사 블로그를 통해 이런 내용의 제미나이 에코시스템(생태계) 확대 방안을 발표했다. 지난 10일(현지시간) 더 버지(THE VERGE)에 따르면 구글(Google)의 새로운 인공지능 비서인 제미나이는 휴대폰에서 다른 앱을 열고 텍스트를 입력하는 번거로운을 해결주며, 이전에 바드라는 이름으로 알려진 인공지능 챗봇으로 구글 앱의 일부라고 소개했다. 구글은 자사의 모든 AI 제품 이름을 '제미나이'로 통합한다고 밝혔다. 또 구글 문서와 지메일, 시트, 슬라이드 등 구글 협업 소프트웨어 모음인 워크스페이스에 탑재된 AI 기능인 '듀엣 AI' 명칭도 제미나이로 바뀐다. 제미나이는 기존 구글 어시스턴트를 대체할 수 있으며, 타이머 설정, 날씨 알림뿐만 아니라, 복잡한 질문에 답변, 제안 제공, 이메일 읽기 등 다양한 작업을 수행한다. 제미나이는 단순한 정보 전달 도구를 넘어 사용자의 창의성을 촉진하는 영감의 원천이 되어 시, 노래, 코드, 대본 등 다양한 형식의 창작물을 만들어내는 것은 물론, 사용자의 아이디어를 구체화하고 실현하는 데 도움을 줄 수 있다. 또한 100개 이상의 언어를 번역할 수 있어 전 세계 사람들과 소통에 도움을 주며 외국어 공부를 하는 학생들에게 효과적인 학습 도구가 될 수 있다. 해외 여행객들에게 현지 정보를 얻고 의사소통하는 데 큰 도움이 될 것으로 기대된다. 제미나이는 인공지능 기술을 기반으로 자연스럽고 흥미로운 대화를 나눌 수 있다. 사용자는 어떤 주제든 질문하거나 이야기를 나눌 수 있으며, 제미나이는 적절한 답변이나 반응을 제공하며 대화를 이어나가는 데 능숙해 마치 오랜 친구와 대화하는 것처럼 편안하고 즐거운 경험을 할 수 있다. 하지만 제미나이는 아직 완벽한 인공지능 비서는 아니다. 상황 인식 능력이 부족해 사용자의 의도를 정확하게 파악하지 못하는 경우가 많다. 예를 들어, 사용자가 자전거를 타고 가는 곳에서 할 일을 추천해 달라고 요청하면 스쿠버 다이빙이나 카지노 도박 등 현실적으로 불가능하거나 상황에 맞지 않는 대답을 할 수 있다. 제미나이는 개발 초기 단계로, 현재는 사용자의 캘린더 접근이나 다른 애플리케이션과의 연동 기능에 제한이 있다. 그렇지만, 제미나이는 인공지능 비서 기술의 미래를 예시하는 중요한 개발로 여겨진다. 특히 구글 서비스와의 통합을 통해 사용자에게 제공되는 편리한 경험은, 정보 검색과 작업 실행 능력을 통해 인공지능 비서의 가능성을 시사한다. 인공지능 비서가 사용자의 일상에서 실질적인 도움을 제공하기 위해서는 사용자의 의도를 정확히 이해하고, 상황에 맞는 창의적 대응을 할 수 있으며, 다양한 기능을 제공해야 한다. 제미나이는 이 모든 측면을 아직 완전히 만족시키지는 못하지만, 인공지능 비서 기술의 진화 방향을 가리키는 중요한 사례로 평가된다.
-
- IT/바이오
-
구글 제미나이, 인공지능 비서의 미래 경험
-
-
삼성, 'AI폰 시대' 개막선언⋯AI 탑재 갤럭시 S24 시리즈 공개
- 삼성전자가 인공지능(AI) 기술이 탑재된 첫 스마트폰을 공개하고 'AI폰 시대'의 서막을 알렸다. 삼성전자는 17일(현지시간) 오전 미 캘리포니아주 새너제이 SAP 센터에서 '갤럭시 언팩 2024'를 열고 갤럭시 S24 시리즈를 공개했다. 기기 자체에서 AI를 구동하는 '온디바이스 AI'의 첫 모델인 갤럭시S24를 통해 새로운 프리미엄폰 시장을 열겠다는 전략이다. 공개 전부터 주목을 받은 온디바이스 AI 기능은 갤럭시S24의 가장 큰 차별화 포인트다. 데이터를 클라우드(서버)에 보내지 않고 기기에서 바로 AI가 연산을 처리하기 때문에 처리 속도가 빠르고 인터넷 연결 없이도 AI 서비스를 쓸 수 있다. 개인정보 보안에도 유리하다. 실시간 통역, 메시지 번역, 사진 편집 제안, 영상 슬로우 모션 재생 등에 AI 기능이 적용됐다. 노태문 삼성전자 MX(모바일경험) 사업부장(사장)은 "갤럭시S24 시리즈는 스마트폰 시대를 넘어 새로운 모바일 AI폰의 시대를 열 것"이라고 말했다. 갤럭시 S24에선 기기에 내장된 AI가 앱 같은 역할을 한다. 통화중 실시간 AI 통역 기능은 별도 앱을 다운받지 않아도 한국어·중국어·영어·힌디어·스페인어 등 13개 언어 통역을 바로 지원한다. 통화가 끝나자마자 모든 기록이 자동 삭제돼 외부 유출 가능성을 차단했다. 상대방 단말이나 통신사와 상관없이 전 세계 어디서나 사용 가능하다. 기존에 쓰던 문자·카카오톡·텔레그램 앱에 AI가 적용돼 13개 언어로 메시지를 번역할 수도 있다. 문장 스타일을 바꾸거나 철자·문법 오류 수정도 AI가 해준다. 삼성 노트 앱에서 글을 번역·요약 정리해주는 ‘노트 어시스트’와 녹음한 음성을 글로 변환해 요약해주는 '텍스트 변환 어시스트' 기능도 추가됐다. 구글과 협업한 '동그라미 검색(서클 투 서치·Circle to Search)'도 눈길을 끌었다. 웹 서핑을 하거나 인스타그램·유튜브를 하다가 궁금한 점이 생기면 화면에 동그라미를 그려 앱 이동 없이 바로 검색할 수 있다. 생성 AI가 정리한 다양한 정보가 제공되고, 추가로 대화하듯 검색할 수도 있다. 다만 이 기능은 인터넷 연결은 필요하다. 갤럭시S24에선 카메라 성능도 대거 업그레이드했다. 2·3·5·10배 줌을 모두 광학 수준의 고화질로 제공하는 '쿼드 텔레 시스템'을 시리즈 최초로 탑재했다. 전작 갤럭시S23울트라와 같은 100배 줌을 제공한다. 다만 AI를 활용해 화질을 대폭 개선한 덕분에 어두운 밤에 줌 기능을 써도 흔들림 없는 이미지를 얻을 수 있다고 한다. 사진 편집 기능도 AI를 활용해 공을 들였다. AI가 사진을 분석해 맞춤형 편집 도구를 제안하는 기능과 갤러리 내 영상을 꾹 누르면 슬로우 모션으로 재생되는 '인스턴트 슬로모' 기능이 새로 생겼다. 또 '생성 AI 편집'을 사용하면 AI로 잘려나간 배경화면을 채워넣어 사진을 편집할 수 있다. 생성 AI로 만든 모든 이미지에는 '워터마크'가 자동 표기된다. 6.8인치로 화면이 가장 큰 갤럭시S24울트라 모델엔 AI 사용성 극대화를 위해 퀄컴의 갤럭시용 스냅드래곤8 3세대 애플리케이션 프로세서(AP)를 탑재했다. 기본(6.2인치)과 플러스(6.7인치) 모델은 삼성이 자체 개발한 엑시노스 2400을 탑재했다. 엑시노스는 갤럭시S22 시리즈에서 게임 중 발열로 논란된 후 2년 만에 귀환했다. 삼성전자는 "이번 신제품에서는 전작보다 1.5~1.9배 커진 ‘베이퍼챔버’(냉각 장치)로 발열 문제를 줄이고 더 오랜 시간 안정적인 게임 플레이를 지원한다"고 설명했다. 국내 출시 가격은 기본과 플러스 모델이 각각 115만5000원, 135만3000원부터 시작한다(256GB 기준). 울트라 256GB 모델은 169만8400원으로 전작보다 9만9000원 올랐다. 오는 31일부터 전 세계 시장에 순차 출시하며 국내 사전 판매는 오는 19일부터 1주일간 진행한다.
-
- IT/바이오
-
삼성, 'AI폰 시대' 개막선언⋯AI 탑재 갤럭시 S24 시리즈 공개
-
-
바이두 주가 10% 폭락…AI 챗봇 '어니' 중국군 연계 보도에 투자심리 위축
- 중국 최대 검색업체 바이두(Baidu·百度)의 인공지능(AI) 챗봇 '어니(Ernie)'와 중국군과의 연계 가능성에 관한 보도가 나온 후, 바이두의 주가가 15일 홍콩 증시에서 10% 급락했다고 연합뉴스가 블룸버그를 인용하여 보도했다. 이날 홍콩 증시에서 바이두 주가는 1년여 만에 최대 폭으로 떨어졌다. 주가 폭락의 배경으로는, 홍콩 증시 거래자들 사이에서 인민해방군 전략지원군과 바이두 '어니 봇' 간의 물리적 연결 구축에 관한 홍콩 사우스차이나모닝포스트(SCMP)의 보도가 거론됐다. 그러면서 현재 지정학적 긴장을 고려할 때 미국이 인민해방군과 바이두의 협업을 축소하고자 제재 부과를 고려할 수 있다는 우려가 커졌다고 전했다. 싱가포르 투자은행 UOB 케이히안 홍콩법인의 스티븐 렁은 언론 인터뷰에서 "중국군과의 연계에 대한 보도 이후 바이두에 대한 제재 가능성에 대해 사람들이 우려하고 있다"고 말했다. 그는 "사람들은 미국 정부가 바이두에 대해 조치를 취할까봐 두려워하고 있다"고 했다. 또한 그는 "미중 간의 지속적인 긴장과 중국에 대한 전반적인 부정적인 심리로 인해 투자자들이 보도의 사실 여부에 관계없이 주식을 매도하고 있다"고 설명했다. 이전에 SCMP는 지난 12일 오후 중국 과학자들이 챗GPT와 같은 기술을 활용하여 실험적인 군사 AI 개발에 참여하고 있다고 보도했다. 보도에 따르면, 인민해방군 전략지원군은 바이두의 '어니'와 아이플라이테크(iFlyTek)의 '스파크(Spark)'를 활용한 자체 AI 시스템을 실험 중이라고 한다. SCMP는 중국군의 AI 프로젝트에 관한 논문이 지난달 중국어 저널에 실렸으며, 중국군이 공개적으로 상업적 거대언어모델 사용을 확인한 것은 이번이 처음이라고 보도했다. 이에 바이두는 다음 날인 13일 성명에서 "해당 연구 기관과의 연관성이나 파트너십이 전혀 없다"고 밝혔다. 또한 '해당 연구 프로젝트에 대해 모르며, 바이두의 거대언어모델(LLM)이 사용되었다면, 그것은 온라인에서 공개적으로 이용 가능한 버전일 것이라고 말했다. 바이두는 지난해 3월 중국 대형 기술기업 중 처음으로 AI 챗봇 '어니'를 출시했다. 같은 해 10월에는 '어니 4.0'을 발표하며 '이 챗봇의 일반적인 능력이 (오픈AI의 생성형 챗봇 챗GPT) GPT-4에 결코 뒤지지 않는다'고 강조했다. '어니'는 'Enhanced Representation through kNowledge Integration'의 약자로, 이는 지식 통합을 통해 향상된 표현을 제공한다는 의미를 담고 있다. 이 챗봇은 대규모 언어 모델을 기반으로 하며, 자연스러운 대화, 정보 검색, 텍스트 생성 등 다양한 기능을 수행할 수 있다. 어니봇은 주로 중국어 사용자를 대상으로 하며, 중국 내에서의 AI 기술 발전과 챗봇의 활용 가능성을 보여주는 예로 평가받고 있다. 미국은 현재 중국과 반도체 제재로 힘겨루기를 하고 있다. 미국의 중국에 대한 반도체 제재는 중국의 기술력 향상과 군사력 증강에 대한 우려를 반영한 조치다. 바이든 미국 대통령은 2021년 6월 미국 기업이 방위 산업이나 감시 기술 부문과 연계됐다고 의심되는 수십 개 중국 기업에 투자하는 것을 금지하는 행정명령을 발표한 바 있다. 지난 4일 연합뉴스가 전한 로이터통신에 따르면 미국 하원 중국특위 지도부가 조 바이든 행정부에 중국 인터넷 연결 모듈 제조업체 퀙텔(Quectel)을 중국 군사 업체 명단에 추가하는 방안을 검토할 것을 요청했다. 미국 재무부 명단에 포함되면 미국 기업들이 해당 업체의 상장 증권 매매를 할 수 없게 된다. 미국 하원 중국특위의 공화당 소속 마이크 갤러거 위원장과 라자 크리슈나무르티 민주당 간사는 이날 공개된 서한에서 퀙텔은 세계 최대의 무선통신 사물인터넷 모듈 공급업체로 현재 미국 내에서 시장 점유율을 높이고 있다면서 이 업체가 중국 군사 산업 기반에 기여할 수도 있다는 것을 시사하는 상당한 증거가 있다고 밝혔다. 이에 대해 퀙텔의 최고영업책임자 노르베르트 무러는 "우리 제품은 민간 목적으로만 설계됐고 미국의 국가 안보를 위협하지 않는다"면서 근거 없는 주장이라고 반박했다. 지난해 8월 갤러거 위원장과 크리슈나무르티 간사는 중국산 무선통신 모듈을 사용하면 중국에서 원격으로 미국 의료 장비와 자동차, 농기구에 접근, 통제할 수도 있다고 주장했다.
-
- IT/바이오
-
바이두 주가 10% 폭락…AI 챗봇 '어니' 중국군 연계 보도에 투자심리 위축
-
-
마이크로소프트, 윈도PC에 AI 실행 코파일럿 키 탑재
- 마이크로소프트(MS)는 4일(현지시간) 곧 출시될 윈도 PC의 키보드에 AI(인공지능) 챗봇을 바로 실행할 수 있는 코파일럿으로 불리는 키를 탑재할 것이라고 밝혔다. 이날 연합뉴스가 전한 로이터통신 등 외신들에 따르면 MS는 코파일럿 키가 부착된 서피스 태블릿PC 등에서 2월이후 이용가능하다고 밝혔다. MS는 이 코파일럿 키를 누르기만 하면 AI를 사용한 지원기능을 불러내 텍스트 요약과 가상회의 등 다양한 작업을 실행할 수 있다고 설명했다. 마이크로소프트가 1994년에 윈도우 시작 키를 추가한 이후 윈도 키보드 디자인에서 20년만에 처음 일어난 변화다. MS는 키보드의 스페이스바 오른쪽에 코파일럿 키가 추가된 윈도 11 탑재 컴퓨터를 선보인다고 밝혔다. 코파일럿 키가 추가된 MS의 서피스 컴퓨터는 9일부터 개최될 CES에서 선보일 예정이다. 코파일럿 키는 MS가 투자한 오픈 AI의 인공지능모델을 활용한다. 마이크로소프트는 지난해 11월 30일부터 윈도 10과 윈도 11이 설치된 컴퓨터에 코파일럿 기능을 체험판으로 제공하고 있다. 코파일럿 키는 윈도우 PC에서 최신 윈도우로 업데이트하면 사용할 수 있다. MS의 소비자 마케팅 최고책임자인 유수프 메흐디는 이 내용을 알리는 블로그에서 "올해가 AI PC의 해가 될 것"이라고 말했다. 이미 스마트폰 제조업체들은 최신 모델을 AI 휴대폰으로 광고하고 있다. MS는 지난 1년간 오픈AI의 AI 기술을 중심으로 윈도우, 오피스, 빙검색, 보안소프트웨어 등을 재정비해왔다. 마이크로소프트는 오픈AI에 130억 달러(16조9900억 원) 를 투자했다. 코파일럿 기능은 코파일럿 키가 없이 기존 장치에서도 사용이 가능하기 때문에 아직 PC 제조업체의 판매 증가로는 나타나지 않고 있다. MS는 여전히 운영체제에서 매출의 약 10%를 창출하고 있기 때문에 PC 운영체제 업그레이드와 관련한 조치는 매출 증가로 이어질 수 있다. 코파일럿 키 기능이 있는 키보드는 터치스크린 기반 서피스를 포함, 2월부터 다양한 윈도 11 탑재 PC에서 제공될 전망이다. 현재까지 MS의 서피스 컴퓨터외에 어떤 회사 제품군에 코파일럿 키가 포함되는지는 알려지지 않았다. MS는 PC 제조업체와의 라이선스 계약으로 PC 시장에서 강력한 지배력을 갖고 있다. 시장 조사 기관인 IDC에 따르면 전체 데스크톱 컴퓨터, 노트북, 워크스테이션 중 약 82%가 윈도우 운영체계를 실행하고 있으며 애플 운영체제는 9%, 구글은 6%가 조금 넘는다. 조사회사 카나리스는 AI지원기능을 탑재한 PC도입이 2025년이후에 가속화할 것으로 예상하고 있으며 코로나19 위기이후 PC시장의 회복을 뒷받침할 것으로 전망했다.
-
- IT/바이오
-
마이크로소프트, 윈도PC에 AI 실행 코파일럿 키 탑재
-
-
나만의 '맞춤형 챗GPT' 봇을 만들어 보세요
- 최근 인공지능(AI) 기술이 고도로 발전하면서, 나만의 챗 GPT를 구축하는 등 다양한 분야에서 인공지능 기술을 활용하고 있다. 미국 기술전문 매체 기즈모도(GIZMODO)에 따르면 오픈에이아이(OpenAI)가 인공지능 대화 챗봇 챗GPT에 맞춤형 지피티(GPT) 기능을 출시했다. 맞춤형 GPT는 기본 챗GPT 모델의 보다 집중적이고 구체적인 버전으로, 코딩이나 인공 지능에 대한 고급 지식을 사용하지 않고도 특정 목적을 위해 구축이 가능하다. 'GPT'는 제너러티브 프리-트레인드 트랜스포머(Generative Pre-trained Transformer)의 약자로, 생성을 의미하는 제너레이티브는 AI가 훈련된 것 외에 새로운 콘텐츠를 생성할 수 있는 능력을, 사전 훈련인 프리 트레인(Pre-trained)은 상당한 양의 자료에 대해 이미 훈련되었음을 나타낸다. 트랜스포머(Transformer)는 언어 이해에 능숙한 AI 아키텍처 유형이다. 챗GPT의 응답 스타일을 지정하는 것처럼, 맞춤형 GPT는 특정 성격을 가진 봇을 만들 수 있다. 또한 자신의 자료를 업로드하여 맞춤형 GPT의 지식 은행에 추가할 수 있다. 맞춤형 GPT는 항상 사용자가 업로드하는 데이터에 액세스할 수 있으며 웹을 전반적으로 탐색할 수 있다. 맞춤형 GPT는 현재 플러스(Plus) 및 엔터프라이즈(Enterprise) 사용자에게만 제공되지만 곧 모든 사람이 사용하게 할 예정이다. 또한 다른 사람들도 유용하다고 생각하는 경우 AI 봇 창작물을 판매할 수 있는 맞춤형 GPT 스토어를 열 계획이다. '나만의 GPT' 구축 시작하기 플러스 및 엔터프라이즈 계정이 있는 경우 챗GPT 웹 인터페이스의 왼쪽 탐색에서 몇 가지 예를 확인할 수 있다. 직접 만들 준비가 되면 상단의 GPT 만들기를 클릭한다. 크리에이트(Create)와 컨피규어(Configure)의 두 가지 탭 간에 전환할 수 있다. 크리에이트는 질문과 답변 루틴을 통해 GPT를 구축하는 데 사용되며, 컨피규어는 보다 신중한 GPT 제작에 사용된다. 이제 막 시작하는 경우 보다 사용자 친화적인 옵션이며 프로세스를 단계별로 안내하는 크리에이트를 사용하는 것이 가장 좋다. 크리에이트 탭을 선택하면 GPT 빌더 봇이 나타난다. 봇의 프롬프트에 응답하여 새 GPT가 수행할 수 있는 작업을 설명한다. GPT에 이름을 지정하고 이미지를 선택하라는 메시지가 표시되지만 이에 대한 제안도 받을 수 있다. 빌더의 프롬프트에 응답하면 GPT가 오른쪽의 미리보기 창에 몇 가지 예제 입력과 함께 형성되기 시작한다. 봇이 갖기를 원하는 특정 전문 분야와 봇이 길이와 복잡성 측면에서 제공하기를 원하는 답변의 종류에 대해 질문을 받을 수 있다. 빌드 프로세스는 만드는 GPT에 따라 다르다. GPT 사용의 장점 GPT는 챗GPT에 시장 조사나 레시피 아이디어 등 동일한 방식으로 작업을 완료하거나 동일한 주제를 다루도록 자주 요청하는 경우에 이상적이다. 생성한 GPT는 필요할 때마다 사용할 수 있으며 필요에 따라 계속 조정하고 사용자 지정할 수 있는 기본 쳇GPT 엔진에 액세스할 수 있다. GPT를 사용하면 다음과 같은 장점이 있다. 첫째, GPT를 사용하면 동일한 작업을 반복해서 수행하는 시간을 절약할 수 있다. 예를 들어, 시장 조사를 수행하는 경우 GPT를 사용하여 특정 제품이나 서비스에 대한 정보를 빠르고 쉽게 찾을 수 있다. 둘째, GPT는 방대한 양의 텍스트와 코드 데이터 세트에 대해 훈련되므로 정확한 정보를 제공할 가능성이 높다. 예를 들어, 레시피 아이디어를 찾는 경우 GPT를 사용하여 최신 트렌드와 인기 있는 재료를 기반으로 한 옵션을 찾을 수 있다. 셋째, GPT는 새로운 아이디어를 생성하는 데 사용할 수 있다. 예를 들어, 스토리 작가라면 GPT를 사용해 새로운 캐릭터나 줄거리를 생각해낼 수 있다. GPT 사용시 주의 사항 GPT를 사용할 때 다음 사항에 유의해야 한다. 먼저 GPT의 편향을 인식해야하는데 GPT는 훈련 데이터에 포함된 편향을 반영할 수 있다. 따라서 GPT에서 생성된 출력을 신중하게 검토하고 편향된 내용을 식별해야 한다. 다음으로 GPT의 오해 가능성을 인식해야한다. GPT는 때때로 사용자의 요청을 오해할 수 있기 떄문에 GPT에게 명확하고 간결한 질문을 하는 것이 중요하다. 마지막으로 GPT의 창의성의 한계를 인식하여 GPT에서 생성된 출력이 독창적이지 않을 수 있음을 인식해야 한다. GPT는 새로운 아이디어를 생성할 수 있지만 기존의 아이디어를 재구성하는 데 더 능숙하다. GPT는 다양한 용도로 사용할 수 있는 강력한 도구이나 사용 시 주의 사항을 염두에 두어야 한다. GPT는 아직 개발 중이지만 이미 다양한 분야에서 사용되고 있다. 앞으로 GPT가 어떻게 발전할지 기대된다.
-
- IT/바이오
-
나만의 '맞춤형 챗GPT' 봇을 만들어 보세요
-
-
메타, 언어 장벽 허무는 AI 심리스 공개
- 코로나19 이후 해외여행이 증가하면서 언어 장벽 해소에 대한 관심도 높아지고 있다. 이런 가운데 메타(Meta)가 모든 언어로 즉시 번역하는 AI인 '심리스(Seamless)'를 공개했다고 프랑스 전문 과학매체 푸투라(FUTURA)가 최근 보도했다. 심리스는 2초의 지연으로 100개 이상의 언어로 번역을 제공하며, 목소리의 표정까지 재현하여 대화의 맥락을 정확하게 전달한다. 언어 장벽 허물다 심리스는 언어의 장벽을 허물고 전 세계 사람들의 소통을 혁신할 잠재력을 가지고 있다. 여행을 할 때 언어의 장벽 없이 현지 사람들과 소통할 수 있고, 비즈니스 미팅에서 외국인과 원활하게 협의할 수 있으며, 외국어로 된 교육 자료를 쉽게 이해할 수 있다. 예를 들어, 한국을 여행하는 미국인 관광객이 길을 물어볼 때, 심리스를 사용하면 현지인이 한국어로 대답하더라도 영어로 즉시 번역해 들을 수 있다. 또한, 한국 기업이 외국 기업과 비즈니스 미팅을 할 때, 심리스를 사용하면 양측이 서로의 언어를 모른다고 해도 원활한 의사소통이 가능하다. 목소리 뉘앙스까지 재현 심리스는 목소리의 뉘앙스까지 재현하여 대화의 맥락을 정확하게 전달한다. 이는 대화의 의미를 이해하고 반응하는 데 도움이 된다. 예를 들어, 한국어로 "미안합니다"라고 말하는 사람은 사과하는 의미일 수도 있지만, 다른 의미일 수도 있다. 심리스는 목소리의 뉘앙스를 분석하여 정확한 의미를 파악할 수 있다. 딥러닝 기술 기반 심리스는 딥러닝 기술을 기반으로 한다. 딥러닝 기술은 컴퓨터가 인간의 뇌처럼 학습하고 사고할 수 있도록 하는 기술이다. 즉, 딥러닝 기술을 사용하여 언어의 의미와 목소리의 뉘앙스를 분석할 수 있다. 심리스는 다음과 같은 3단계를 통해 번역을 수행한다. 첫째, 언어 번역을 하는데 말하는 사람의 언어를 식별 한다. 둘째, 문장 번역하는데 시믈러스는 말하는 사람의 말을 텍스트로 변환하고 이를 번역한다. 셋째, 목소리 재현을 하는데 심리스는 번역된 텍스트를 말하는 사람의 목소리와 유사한 목소리로 재현한다. 2024년 출시 예정 심리스는 아직 일상 생활에서 사용할 수 있는 버전이 출시되지 않았지만, 2024년 출시를 목표로 하고 있다. 현재 심리스 익스프레시브(Seamless Expressive)라는 온라인 데모를 통해 목소리의 재현 기능을 테스트해 볼 수 있다. 이처럼 심리스는 언어의 장벽을 허물고 전 세계 사람들의 소통을 혁신할 잠재력을 가지고 있는 획기적인 기술이다. 그러나 심리스는 아직 개발 중이며, 완벽하지는 않다. 예를 들어, 복잡한 문장이나 은유적인 표현을 번역할 때 오역이 발생할 수 있다. 또한, 심리스는 아직 모든 언어를 완벽하게 지원하지는 않다. 향후 심리스는 인공 지능 기술의 발전에 따라 점점 더 개선될 것으로 기대된다. 심리스가 완성되면 여행, 비즈니스, 교육 등 다양한 분야에서 활용될 것으로 기대된다.
-
- IT/바이오
-
메타, 언어 장벽 허무는 AI 심리스 공개
-
-
메타 'X 대항마' 스레드 출시 5개월만에 유럽 진출
- 페이스북 모회사 메타플랫폼스는 14일(현지시간) 새로운 소셜미디어(SNS) '스레드(Threads)'를 유럽에서도 출시한다고 밝혔다. 메타 최고경영자(CEO) 마크 저커버그는 이날 플랫폼에 올린 게시글에서 스레드의 유럽 출시를 발표하고 "우리는 유럽의 많은 나라에서 스레드를 이용할 수 있도록 하고 있다"고 말했다. 옛 트위터 엑스(X)처럼 텍스트 기반인 스레드의 유럽 진출은 지난 7월 출시 이후 5개월 만이다. 메타는 당시 각종 규제 등으로 유럽연합(EU)지역에서는 스레드를 내놓지 않았다. 규정 준수를 위해 메타는 EU 지역의 스레드 이용자들에게는 게시물만 읽을 수 있는 선택권 등 여러 옵션을 제공했다. 일론 머스크 테슬라 CEO가 소유한 엑스(X) 대항마로 출시된 스레드의 유럽 출시는 X가 광고 수입에 어려움을 겪고 있는 가운데 나왔다. 머스크는 최근 X에 반유대주의 음모론을 담은 주장에 지지하는 글을 올렸다가 논란에 휘말렸다. 이에 IBM과 애플, 디즈니 등이 광고 중단을 선언했다. X의 올해 연간 광고 수입은 약 25억달러(약 3조2975억원)로 작년의 절반 수준에 그칠 것으로 예상되고 있다. 특히 메타는 유럽에서 스레드가 다른 SNS와 연결되는 '페디버스'(fediverse)를 테스트할 예정이라고 밝혔다. '페디버스'는 연방(federal)과 우주(universe)의 합성어로, 모든 SNS가 하나의 네트워크처럼 연결돼 상호 작용할 수 있는 시스템이다. 이메일처럼 서로 다른 SNS간 게시물을 주고받을 수 있으며, 각각의 SNS는 액티비티펍(ActivityPub)이라는 프로토콜로 상호 연결된다. 저커버그는 "스레드를 상호 운용 가능하게 만드는 것은 이용자들이 상호 작용하는 방식에 더 많은 선택권을 줄 것이며 콘텐츠를 더 많은 이들이 볼 수 있게 될 것"이라며 "나는 이것에 대해 매우 낙관적이다"라고 말했다. 스레드는 출시 5일 만에 가입자가 1억명을 넘었다. 그러나 현재 월간 활성 이용자는 1억명도 채 되지 않아 5억명을 웃도는 X에 크게 미치지 못한다. 저커버그는 지난 10월 스레드 이용자가 "향후 수년 내에 10억명에 이를 것"이라고 자신했다. 메타는 올 여름 출시 이후 웹 기반 앱, 팔로우 피드 및 검색 기능을 포함하여 플랫폼을 사용자에게 더욱 매력적으로 만드는 것을 목표로 스레드에 대한 새로운 기능을 추가했다.
-
- 산업
-
메타 'X 대항마' 스레드 출시 5개월만에 유럽 진출
-
-
구글 새 AI 제미나이, '인상적인' 시연 영상 조작 논란
- 구글이 '최고의 AI 모델'이라며 최근 공개한 '제미나이(Gemini)'의 인상적인 시연 영상이 조작 논란에 휘말렸다. 구글은 지난 7일 가장 성능이 뛰어난 AI 모델이라고 자랑하며 제미나이 출시를 발표하며 시연 영상을 공개했다. 그런데 이 시연 영상이 사전에 편집된 것으로 드러났고, 질문에 대한 답변도 기대에 미치지 못한다는 지적이 일고 있다. 미국 기술 전문 매체 테크크런치는 8일(현지시간) "구글의 새로운 AI 모델 '제미나이'가 어제 대대적으로 데뷔한 후 상반된 반응을 얻고 있다"며 가장 인상적인 제미나이 시연 영상이 사실상 조작된 것으로 밝혀지면서 구글 기술이나 진실성에 대한 사용자들의 신뢰가 떨어질 수도 있다"고 보도했다. 6분짜리 영상은 제미나이를 기반으로 한 챗봇이 사용자와 대화하면서 시각적인 그림과 물체를 인식하는 능력을 보여줬다. 사람이 종이에 펜으로 낙서에서 완성된 그림으로 진화하는 오리 스케치를 그리자 제미나이가 '새'임을 인식했고, 오리 옆에 물결 표시를 그리자 '오리'라고 답했다. 제미나이는 이어서 장난감에 대한 다양한 음성 질문에 응답하고, 그 다음에는 컵 바꾸기 게임에서 공을 추적하거나, 그림자 인형 제스처를 인식하거나, 행성 스케치를 재정렬하는 등의 기능을 시연했다. 수학 문제와 함께 오답을 낸 풀이 과정을 보여주자, 틀린 부분을 정확히 지적하고 올바른 수식도 내놓았다. 하지만 한 가지 문제가 있었다. 해당 영상은 실시간으로 이뤄진 것이 아니었다. 테크크런치는 "시연 영상은 실시간 반응이 아니라 실제로는 신중하게 조정된 텍스트 프롬프트와 정지 이미지의 연속이었으며, 실제 상호작용과는 달리 표현하기 위해 분명히 선택되고 (응답 시간이) 단축되었다"고 전했다. 예를 들어, 해당 영상의 2분 45초 부분에서 손이 조용히 일련의 제스처를 하는 것이 보여지며, 제미나이는 빠르게 '너 무슨 짓을 하는 거 알아! 가위바위보 하고 있잖아!'라고 응답했다는 지적이다. 이에 구글도 "시연은 실시간으로 진행되지 않고, 미리 준비된 이미지와 텍스트 프롬프트를 기반으로 제작됐다"며 "영상은 제미니가 멀티모달 기능으로 상호작용할 수 있다는 것을 예시적으로 묘사한 것"이라고 밝혔다. 구글은 7일 제미나이가 오픈AI의 최신 모델인 'GPT-4'보다 성능이 우수하다며 AI의 학습량에 따라 울트라, 프로, 나노의 3개 모델로 출시했다. 구글의 AI 챗봇 '바드'에 탑재된 가장 범용적인 프로그램은 제미나이 프로이다. 비즈니스 인사이더의 보도에 따르면, 사용자들은 제미나이 프로를 탑재한 바드가 올해의 오스카 시상식에서 남우주연상 수상자를 모르는 것처럼 보였다고 지적했다. 또한, 이 챗봇은 질문에 버벅거리는 것으로 보고되었다. 사용자들은 바드가 영어가 아닌 다른 언어로 답변을 요청했을 때 이를 제대로 이해하지 못하는 것 같다고 지적했다. 이 챗봇은 100여 개 언어로 서비스를 제공한다. 특히, 논란의 여지가 있는 주제에 대한 답변을 사실상 회피하는 경향이 있다. 예를 들어, 이스라엘과 팔레스타인 무장정파 하마스 간의 전쟁에 대한 최신 정보를 요청하자 '최신 정보를 얻으려면 구글 검색을 사용해보라'고 답변을 회피했다. 이는 챗GPT 프로와 마이크로소프트의 빙, 일론 머스크의 그록 등 실시간 정보를 제공하는 경쟁 챗봇들이 보다 상세한 답변을 제공하는 것과 대조적이라고 비즈니스 인사이더는 지적했다. 한편, 구글은 바드가 제공하는 답변이 다른 AI 챗봇과 마찬가지로 부정확한 정보를 포함할 수 있다고 경고하며, 사용자들에게 반드시 사실을 확인할 것을 당부했다. 제미나이의 세 가지 모델 중 인간과 비슷한 수준의 뛰어난 성능을 자랑하는 '울트라' 모델은 내년 초에 출시될 예정이다. 이에 따라, 구글이 챗GPT의 최신 언어 모델인 'GPT-4'와의 경쟁을 위해 제미나이를 성급하게 공개했다는 주장이 제기됐다. 구글 제미나이는 7일 갑작스런 공개전 외신에서는 영어 외 언어 처리 때문에 올해가 아닌 2024년 초에 공개될 예정이라는 출시 연기 소식이 있었다.
-
- IT/바이오
-
구글 새 AI 제미나이, '인상적인' 시연 영상 조작 논란
-
-
[퓨처 Eyes(14)] 메타버스, 과대광고의 실패인가, 부활신호인가?
- 현실과 가상을 연결한 가상 세계를 의미하는 메타버스는, 최근 몇 년 동안 빠르게 성장하고 있는 기술이다. 특히, 지난해 11월 출시된 오픈AI의 생성형 인공지능(AI) 챗GPT가 열풍을 일으키면서 메타버스에 대한 관심이 다시 높아졌다. 메타버스(metaverse)는 가상 혹은 초월을 의미하는 메타(meta)와 세계나 우주를 의미하는 유니버스(universe)를 합성한 신조어다. 기본적으로 집을 떠나지 않고도 학교에 가고, 직장에 출근하고, 게임을 하고, 콘서트를 보고, 쇼핑을 하는 등의 활동을 할 수 있는 온라인 세계를 의미한다. 영화 '매트릭스'의 거울 세계처럼 2차원의 텍스트와 이미지로 이루어진 인터넷이 현실로 다가온 것이다. 미국 IT 전문매체 쿼츠에 따르면 2022년 전 세계는 '메타버스'라는 단어를 배웠다. 메타버스는 현실과 인터넷의 경계가 모호해질 때 발생하는 현상을 가리키는 말이다. 메타버스의 개념은 1992년 출간된 닐 스티븐슨의 소설 '스노 크래시'에서 처음 등장했다. 소설 속 메타버스는 가상현실과 증강현실을 결합한 상위 개념으로서, 현실을 디지털 기반의 가상 세계로 확장해 가상 공간에서 모든 활동을 할 수 있게 만드는 시스템이다. 구체적으로 정치와 경제, 사회, 문화 전반적 측면에서 현실과 비현실이 공존하는 생활형, 게임형 가상 세계라는 의미로 폭넓게 사용한다. 이 책에서 말하는 메타버스는 가상 경제와 외부 기술을 통해 오프라인 세계와 통합된 고도로 맞춤화된 아바타와 강력한 경험 생성 도구를 통해 수백만 명이 동시에 접속할 수 있는 광활하고 몰입감 넘치는 가상 세계다. 다시 말해, 수천만 명의 활성 사용자를 보유한 플랫폼인 로블록스(Roblox)나 포트나이트(Fortnite)와 비슷하다고 볼 수 있다. 미국전기전자학회의 표준에 따르면 메타버스는 "지각되는 가상세계와 연결된 영구적인 3차원 가상 공간들로 구성된 진보된 인터넷"이라는 의미를 지닌다. 메타버스, 빛을 잃다 IT 전문 매체 게임즈비트(Games Beat)는 지난 12월 1일 페이스북이 메타(Meta)로 사명을 변경한 지 2년이 지난 지금, 공상과학 소설에 나오는 개념인 '메타버스'에 대한 짧지만 뜨거운 열광을 불러일으키며 차세대 기술 도약의 신호탄이 될 것처럼 보였던 '메타'는 이제 그 빛을 잃었다며 광대광고의 실패작으로 몰아갔다. 메타버스는 대부분의 기술 업계 종사자들에게 메타 이후 빛을 잃고 '인공 지능(AI)'이라는 단어가 붙은 모든 제품으로 대체된 것처럼 보인다고 게임즈비트는 지적했다. 약 2년 전에만 해도 메타버스는 IT 기술 집약체를 상징하는 화두의 중심에 있었다. 지난 2021년 11월 가상화폐 대장격인 비트코인이 약 6만9000달러로 사상 최고치를 기록하면서 메타버스와 NFT(대체 불가능한 토큰)도 덩달아 열풍을 일으켰다. 특히 세계 5대 정보기술통신 기업인 빅테크 중 하나인 메타(Meta, 구 '페이스북')는 2021년 10월 28일 현재 사명으로 변경했다. 2004년 설립된 이 회사는 당시 메타버스 육성을 신사업의 주요 목표로 본 것이 사명 변경의 주요인이었다. 게임즈비트는 메타 경영진이 이미 성공한 플랫폼에서 반복되는 메타버스에 대한 비전을 세우기보다는 이질적인 제품들을 뒤섞어 놓은 채로 메타의 비전을 세웠다며 메타의 사명이 잘못됐다고 전했다. 이어 심지어 2020년 IPO 신청서에서 스스로를 메타버스라고 표현하기도 했다고 꼬집었다. 또한 VR 헤드셋을 통한 원격 작업과 같은 대부분의 제품은 아직 검증되지 않은 상태이며, 내부 블라인드 설문조사에 따르면, 메타의 직원 대다수는 마크 저커버그가 메타버스의 의미를 직원들에게도 제대로 설명하지 않았다고 응답했다. 또 다른 IT전문 매체 쿼츠는 "메타버스의 경제는 과연 실재할까?"라고 반문했다. 가상 세계의 과대 광고는 AI의 과열로 식어가고 있다는 지적이다. 메타의 리얼리티 랩스(Reality Labs) 사업부는 2019년 설립 이래로 465억 달러(약 61조 원) 이상의 손실을 입었다. 메타는 투자자들에게 상황이 나아지기 전에 더 악화될 것이라고 이 매체는 경고했다. 대부분의 경우, 메타버스가 이미지화되고 활용되는 과정은 아직 시작되지 않았다. 정책과 거버넌스는 어떤 모습일지, 어린이는 어떻게 보호될지, 가상 신발의 실제 가치는 얼마인지 등 질문은 너무 많지만 해답은 충분하지 않다. 이러한 질문에 대한 답을 찾으려면 시간과 비용이 필요하다. 전문가들은 완전한 몰입형 가상 세계가 가능한지에 대해 의견이 분분하다. 하지만 '메타버스'가 과대광고라는 지적을 받으며 주춤거리는 동안 실제 메타버스 플랫폼은 계속 성장했다. 로블록스는 현재 월간 활성 사용자 수가 3억 명을 넘어 미국 전체 인구와 맞먹는 규모를 자랑한다. 포트나이트는 6년 만에 최고 사용량을 기록했다. 메타버스 시장의 성장은 여러 분야에서 나타나고 있다. 게임, 교육, 엔터테인먼트, 커머스, 소셜 등 다양한 산업에서 메타버스 기술을 활용한 신규 서비스와 제품이 출시되고 있다. 특히 노련하고 성공적인 게임 개발자들이 이끄는 새로운 메타버스 플랫폼의 물결이 새롭게 시작될 준비를 하고 있다. 메타버스 게임 선두주자인 플레이어블 월드(Playable Worlds)의 미국 게임 디자이너 라프 코스터(Raph Koster), 메타버스 경험에 일찍이 뛰어들어 성공을 거둔 미국 게임 디자이너 제노바 첸(Jenova Chen), 그랜드 테프트 오토(Grand Theft Auto) 프랜차이즈의 베테랑이 개발한 메타버스 플랫폼 선두주자 에브리웨어(Everywhere)가 메타버스 부활 신호탄의 주인공이다. 서울·두바이·산타모니카, 메타버스 선도 도시 그 가운데 한국의 서울, 아랍에미리트의 두바이, 미국의 산타모니카가 국제 메타버스 부문의 선도 도시로 선정됐다. 가젯360에 따르면 세계경제포럼(WEF)은 2030년까지 거의 700개 도시가 일종의 메타버스 인프라를 갖게 될 것으로 예상했다. 메타버스 부문은 점진적이기는 하지만 세계 여러 지역에서 성장과 채택의 조짐을 보이고 있다는 것이다. WEF는 메타버스를 탐구하는 도시의 이점을 나열하면서 이 가상 세계 생태계가 도시 인프라의 설계, 운영 및 유지 관리와 관련된 비용 절감을 가져오는 동시에 도시 인구가 기술 친화적이 되면 도시 지도자들이 '정치적 자본'을 확보하는 데 도움이 될 것이라고 말했다. 보고서는 "도시가 탈탄소화를 모색함에 따라 디지털 트윈 기술은 시뮬레이션, 계획 및 최적화를 통해 도시 설계를 향상시켜 도움을 줄 수 있다"라고 강조했다. 미국 산타모니카는 플릭(Flick)이라는 메타버스 지원 소셜 미디어 앱을 통해 사용자가 도시를 돌아다닐 수 있는 최초의 도시다. WEF 보고서는 "플릭플레이(FlickPlay)는 사람들이 실제 장소를 돌아다니며 희귀한 디지털 토큰을 찾도록 권장한다. 디지털 토큰은 수집한 다음 친구에게 자랑할 수 있는 희귀한 필터가 포함된 동영상을 잠금 해제하는 데 사용할 수 있다. 플릭 플레이는 여행이 적은 도시 지역으로 사람들을 이동시킴으로써 범죄를 줄이면서 새로운 경제 활동을 창출할 수도 있다"라고 설명했다. 두바이는 GDP 측면에서 세계 최고의 도시 중 하나가 될 것으로 예상되는 경제 성장 캠페인의 필수 부분으로 메타버스를 보고 있다. 두바이는 해당 부문에서의 입지를 강화하기 위해 블록체인 및 메타버스 부문에서 일하는 1000개 기업을 유치할 계획이다. 향후 7년 동안 두바이는 4만 명이 넘는 웹3(Web3) 전문가의 본거지가 되는 것을 목표로 하고 있다. WEF의 조사에 따르면 두바이 소비자의 50% 이상이 메타버스에서 콘텐츠를 만들고 수익을 창출하기를 기대한다고 보고서는 밝혔다. 60%의 소비자가 메타버스를 비즈니스 기회로 보고 있는 반면, 78%의 브랜드는 웹3에 더 많이 참여하기를 원한다. 보고서는 "두바이는 관광, 교육, 소매, 의료 및 원격 근무 분야에서 새로운 작업 방식을 향상시키기 위해 웹3 기술과 해당 애플리케이션을 개발할 것이다. 도시는 이를 어떻게 달성할 것인가? 혁신을 촉진하고 연구 개발을 늘리는 동시에 개발자, 콘텐츠 제작자 및 디지털 플랫폼 사용자가 메타버스에 관한 모든 것에 대한 교육 지원을 받을 수 있도록 지원함으로써 인재와 투자를 강화한다"라고 언급했다. 가젯360은 한국의 메타버스 성장은 전적으로 정부의 지원을 받고 있다고 전했다. 한국은 이미 국가 메타버스 생태계 개발에 1억 8000만 달러(약 2363억 원)를 투자했다. 메타버스 서울의 1단계에서는 주민들이 세계 최초의 도시 메타버스 앱을 다운로드하여 게임을 즐기고, 도시 명소를 경험하고, 일상적인 작업을 완료하는 데 사용할 수 있다. WEF 보고서는 "메타버스 서울 2단계에서는 2024년부터 국내 산업과 외국인 투자자를 연결하는 등 더 많은 서비스를 제공할 것이며, 마지막 단계에서는 가상 및 증강 현실 기술을 도시 인프라의 일상적인 운영에 통합할 것"이라고 밝혔다. 메타버스 적용 분야 교육 분야에서는 메타버스 플랫폼을 활용한 가상 학습 환경이 도입되고 있다. 대표적인 예로, 마이크로소프트의 홀로렌즈를 활용한 교육 솔루션 등이 있다. 이러한 솔루션은 이용자들이 가상 세계에서 실감 나는 학습 경험을 할 수 있도록 제공하고 있다. 엔터테인먼트 분야에서는 메타버스 플랫폼을 활용한 가상 콘서트와 팬미팅 등이 개최되고 있다. 대표적인 예로, BTS의 메타버스 콘서트 등이 있다. 이러한 콘서트는 이용자들이 가상 세계에서 아티스트와 함께 공연을 즐길 수 있도록 제공하고 있다. 커머스 분야에서는 메타버스 플랫폼을 활용한 가상 쇼핑몰과 가상 쇼룸이 등장하고 있다. 대표적인 예로, 네이버의 제페토를 활용한 가상 쇼핑몰이 있다. 이러한 쇼핑몰은 이용자들이 가상 세계에서 다양한 상품을 둘러보고 구매할 수 있다. 스태티스타(Statista)에 따르면 2022년 글로벌 메타버스 시장 규모는 655억 달러(약 86조 원)로 추산됐다. 올해 메타버스 시장은 820억 달러(약 107조 6500억 원)까지 성장할 것으로 예상된다. 2030년까지 9366억 달러(약 1229조 5684억 원)로 급증할 것으로 전망된다. 메타버스는 아직 초기 단계에 있지만, 위에서 살펴보았듯이 다양한 분야에서 큰 잠재력을 가지고 있다. 교육, 게임, 엔터테인먼트, 커뮤니케이션 등 다양한 분야에서 새로운 경험을 제공할 수 있으며, 가상과 현실을 연결하는 새로운 플랫폼으로서 사회, 경제, 문화에 큰 변화를 가져올 수 있다. 그러나, 메타버스의 가능성만큼이나 우려도 존재한다. 가상 세계에 몰입하면서 현실 세계와 단절될 수 있다는 우려가 있다. 또한, 사이버 폭력, 가상 자산의 불법 거래 등 다양한 문제점이 발생할 수 있다는 지적도 있다. 결국, 메타버스가 과대광고의 실패작이 될지, 새로운 기술의 가능성을 열어줄지는 아직 알 수 없다. 분명한 건 메타버스의 가능성을 최대한 활용하면서, 그로 인한 부작용을 최소화하기 위한 노력이 필요하다는 점이다.
-
- 포커스온
-
[퓨처 Eyes(14)] 메타버스, 과대광고의 실패인가, 부활신호인가?
-
-
구글, 차세대 AI '제미니' 출시 연기…영어 외 언어 처리 때문
- 구글이 차세대 인공지능(AI) 모델 '제미니(Gemini)' 출시를 내년으로 연기했다. 미국 경제매체 비즈니스 인사이더는 더 인포메이션을 인용해, 구글의 제미니는 영어가 아닌 다른 언어의 명령어를 처리하는 데 문제가 발생해 2024년 초로 출시가 미뤄졌다고 3일(현지시간) 보도했다. 제미니는 차세대의 AI이자 멀티모달 AI로, 다양한 형태의 데이터를 처리할 수 있다. 텍스트와 이미지뿐만 아니라 스케치나 서면 설명을 기반으로 웹사이트와 같은 다른 유형의 콘텐츠를 이해하고 생성할 수 있는 능력을 가지고 있다고 알려져 있다. 구글 제미니는 당초 올해 11월 출시될 예정이었다. 더 인포메이션은 이 결정에 대해 알고 있는 익명의 소식통 2명을 인용해, 구글 제미니가 다음 주 뉴욕, 워싱턴, 캘리포니아에서 열릴 예정이었던 미공개 출시 행사가 일부 영어가 아닌 프롬프트와 문의에 응답할 때 AI가 안정적으로 작동하지 않는다는 우려로 인해 2024년 초로 조용히 일정이 변경되었다고 보도했다. 비즈니스 인사이더는 구글 관계자가 자사의 논평 요청에 즉시 응답하지 않았다고 전했다. 제미니는 아직 일반에 공개되지는 않았지만, 훨씬 더 많은 컴퓨팅 파워를 활용하기 때문에 경쟁사인 오픈AI의 생성형 인공지능 GPT-4를 크게 능가하는 것으로 알려져 있다. 앞서 구글 부사장이자 바드(Bard) 및 구글 어시스턴트 매니저인 시시 하이오(Sissie Hsiao)는 제미니에 대해 "상당히 놀라운 것들을 봤다"고 말했다. 하이오는 "예를 들어, '케이크를 굽고 있어요, 3단 케이크를 아이싱하는 방법의 단계를 그림 3개로 그려주세요'라고 요청하면 제미니가 실제로 그 이미지를 생성한다"고 설명했다. 그는 "이것들은 완전히 새로운 이미지들이다. 인터넷에서 가져온 사진이 아니라, 이제는 텍스트뿐만 아니라 이미지로 인간과 대화할 수 있다"라고 덧붙였다. 구글은 이미 '바드(Bard)'라는 자체 생성형 AI 모델을 가지고 있지만, 오픈AI의 챗GPT는 지금까지 소비자 인지도 면에서 더 강세를 보였다. 하지만 분석가들은 제미니가 최종적으로 출시되면 이러한 상황이 변할 수 있다고 주장하고 있다. 구글 제미니는 구글 AI에서 개발한 대형 언어 모델(LLM)이다. 제미니는 1.6T 파라미터를 갖춘 트랜스포머 모델로, 텍스트와 코드의 방대한 데이터 세트에 대해 훈련됐다. 구글에 따르면 제미니는 100개 이상의 언어를 번역할 수 있다. 제미니는 시나 대본, 음악 작품, 이메일, 편지 등 다양한 창의적인 텍스트 형식을 생성할 수 있다. 그밖에 다양한 프로그래밍 언어로 코드를 생성할 수 있다. 이처럼 제미니는 대규모 언어 모델의 발전을 보여주는 중요한 기술로, 출시되면 다양한 방식으로 세상을 변화시킬 수 있을 것으로 기대된다.
-
- IT/바이오
-
구글, 차세대 AI '제미니' 출시 연기…영어 외 언어 처리 때문
-
-
웨어러블 AI 기기 스타트업 휴메인, AI 핀 출시
- 미국 실리콘밸리에 위치한 인공지능(AI) 스타트업 휴메인(Humane)이 옷 깃에 붙여 사용하는 웨어러블 AI 기기인 'AI 핀'을 출시했다고 일본 포브스(JAPAN Forbes)가 최근 보도했다. AI 핀은 명함 크기의 기기로, 옷에 핀으로 고정하여 사용할 수 있다. 지난 11월 9일 공개된 이 AI 핀은 카메라와 센서를 사용하여 주변 환경을 스캔하고 다양한 질문에 답했다. 주로 음성 명령으로 작동되지만, 사용자의 손바닥에 아이콘이나 텍스트를 투사할 수 있는 작은 프로젝터도 탑재되어 있다. 휴메인은 AI 핀의 컴퓨터 비전 기능을 강조했다. 스크린이 없이 음성과 터치를 통해 전화를 걸거나 문자를 보낼 수 있다. 아울러 AI 핀은 음식에 대한 영양가를 결정할 수 있는 기능과 음성으로 조작 가능한 번역 기능 등을 제공한다. 또한 이 AI 핀은 마이크로소프트와 오픈AI가 개발한 대규모 언어 모델(LLM), 퀄컴의 스냅드래곤 프로세서, 초광각 카메라 및 블루투스 연결 기능이 탑재되어 있다. 미국에서는 지난 11월 16일에 699달러(약 90만 원)에 출시됐으며 티모바일의 네트워크를 사용할 경우 월 24달러(약3만원)의 정보 이용료가 부과된다. 휴메인은 2018년, 전 애플 임원인 임란 초드리와 베사니 본조르노 부부가 스마트폰을 대체하기 위해 공동 설립한 스타트업이다. 초드리는 애플에서 아이폰의 스와이프 언락 기능 개발에 참여한 것으로 알려져 있으며, 본조르노는 첫 아이패드의 발매에 기여한 소프트웨어 엔지니어이다. AI 핀은 혁신적인 기능으로 주목받고 있지만, 일부 전문가들은 카메라가 프라이버시를 침해할 수 있다는 우려를 제기다. 이에 대해 휴메인은 사용 중임을 나타내는 '트러스트 라이트' 기능을 탑재하고 있으며, 마이크는 아마존이나 구글의 AI 어시스턴트(비서)와 마찬가지로 항상 켜져 있지 않으며 수동으로 활성화해야 한다고 설명했다. AI 핀은 출시 직후부터 다수의 투자자로부터 자금을 유치했다. 투자자로는 오픈AI의 전 CEO 샘 올트먼, 타이거 글로벌, 퀄컴 벤처 등이 포함되어 있다. 웨어러블 컴퓨팅 시장은 여러 가지 도전으로 진입이 어려운 시장으로 알려져 있다. 메타의 VR 헤드셋은 소수의 장치로 제한되어 있으며, 구글의 '구글 글래스'는 카메라의 프라이버시 침해 우려로 실패한 사례로 꼽힌다. 휴메인의 주요 경쟁자 중 하나는 창립자들의 이전 고용주인 애플이다. 애플은 지난 6월 강력한 혼합 현실(MR) 컴퓨팅을 위한 강력한 리얼리티 프로 헤드셋을 선보였다. 초드리와 본조르노는 AI핀 출시 발표에서 이 제품이 회사에 있어 시작일 뿐이라고 말했다. 휴메인은 향후 AI 핀을 더욱 발전시켜 다양한 웨어러블 AI 기기를 개발하고 출시할 계획임을 밝혔다. 한편, 휴메인은 우리나라 기업들과 다양한 협력을 맺고 있다. SK텔레콤과 함께 AI 핀의 한국 출시를 추진하고 있다. SK텔레콤은 AI 핀의 국내 판매와 마케팅을 담당할 예정이다. 또한, 휴메인은 LG전자와 AI 핀을 활용한 새로운 제품 개발을 협의하고 있다. 양사는 AI 핀을 활용한 스마트워치나 가전제품 등을 개발하는 방안을 검토하고 있다. 이외에도 삼성전자, 네이버, 카카오 등 국내 주요 기업과의 협력으로 AI 핀의 다양한 활용 가능성을 모색하고 있다. 휴메인은 웨어러블 AI 기기 시장에서 성공하기 위해서는 프라이버시 침해 우려를 해소하고, 웨어러블 기기의 사용 편리성을 높여야 할 것이다.
-
- IT/바이오
-
웨어러블 AI 기기 스타트업 휴메인, AI 핀 출시
-
-
AI 생성 논문을 전례 없는 정확도로 포착하는 '챗GPT 감지기'
- 인공지능(AI)이 인간의 능력을 넘어서면서 다양한 산업 분야에서 중요한 역할을 하고 있다. 하지만 이러한 AI의 능력이 다 유용한 것은 아닌 것 같다. 최근 한국은행의 보고에 따르면 의사, 회계사, 변호사와 같은 전문직의 업무 영역이 AI에 의해 위협받을 가능성이 제기됐다. 특히 교육계에서는 이 문제를 더욱 심각하게 받아들이고 있다. 자연과학, 응용과학, 의학 등의 분야에서 AI가 인간 대신 논문을 작성할 수 있게 되었다는 사실이 큰 우려를 낳고 있다. 그런데 이 같은 걱정을 앞으론 덜 수 있을 것 같다. 최근 국제 학술지 '네이처'는 캔자스 대학의 헤서 디자이어 교수와 그의 연구팀이 개발한 새로운 툴(도구)을 소개했다. 이 도구는 AI가 작성한 글을 분류할 수 있어, AI의 글쓰기 능력과 관련된 문제를 해결하는 데 도움이 될 것으로 기대된다. 최근에 개발된 새로운 AI 탐지 툴은 기존의 두 가지 AI 탐지기보다 우수한 성능을 자랑한다. 이 특화된 도구는 학술 출판사들이 AI 텍스트 생성기를 통해 만들어진 논문을 식별하는 데 큰 도움이 될 것으로 예상된다. 헤서 디자이어 교수는 이번 연구 결과가 AI 감지기 개발에 있어서의 중요한 진전을 보여준다고 언급했다. 이는 소프트웨어를 특정한 유형의 글쓰기에 맞게 조정함으로써 감지 능력을 강화할 수 있음을 시사한다. 문장 길이, 특정 단어 및 문장 부호 등으로 특징 디자이어 교수와 그의 연구팀은 챗GPT 탐지기를 '사이언스2(Science2)' 저널의 '퍼스펙티브(Perspective)' 기사에 적용한 사례를 소개했다. 이 탐지기는 기계 학습을 활용하여 글쓰기 스타일의 20가지 특성, 예를 들어 문장 길이의 변화, 특정 단어 및 문장 부호의 사용 빈도 등을 분석한다. 이를 통해 텍스트가 학술 과학자에 의해 작성되었는지, 아니면 챗GPT와 같은 AI에 의해 작성되었는지를 판별할 수 있으며, 이 연구는 높은 정확도를 달성했다고 보고됐다. 최근 진행된 연구에 따르면, 개발된 검출기는 미국 화학 학회(ACS)에서 발행한 10개의 화학 저널에서 나온 논문들의 서문 섹션을 분석하기 위해 특별히 교육을 받았다. 연구 팀은 논문의 서문 작성이 챗GPT를 사용할 경우 특히 쉽다는 점을 인지하고, 배경 문헌에 접근할 수 있는 상황에서 이 섹션을 선택했다. 연구원들은 이 도구를 효과적으로 교육하기 위해 100편의 인간이 작성한 서문을 사용했다. 이후, 그들은 챗GPT-3.5에게 ACS 저널의 스타일에 맞춰 200개의 서문을 작성하도록 요청했다. 이 중 100개는 논문의 제목을 도구에 제공하여 작성되었고, 나머지 100개는 논문의 초록을 기반으로 작성됐다. 실험 결과, 이 도구는 제목을 기반으로 한 챗GPT-3.5로 작성된 서문을 100% 정확도로 식별할 수 있었다. 반면, 논문 초록을 기반으로 작성된 서문의 경우, 정확도는 약간 낮은 98%로 나타났다. 이러한 결과는 동일한 저널에서 인간과 AI가 작성한 서문을 비교할 때 얻어졌다. 이 새로운 도구는 최신 버전인 챗GPT-4가 작성한 텍스트에서도 효과적으로 작동했다. 반면, AI 탐지기 ZeroGPT는 사용된 챗GPT 버전과 논문의 제목 또는 초록에서 생성된 소개에 따라 35~65%의 정확도로 AI가 작성한 소개를 식별하는 데 그쳤다. 또한, 챗GPT 제조사인 오픈AI가 제작한 텍스트 분류 도구의 성능 역시 높지 않았다. 이 도구는 AI로 작성된 소개를 찾아내는 데 약 10~55%의 정확도를 보였다. 이에 비해 새로운 챗GPT 탐지 도구는 훈련받지 않은 저널의 서문에서도 높은 성능을 발휘했다. 이 도구는 AI 탐지기를 혼동시키기 위해 다양한 프롬프트에서 생성된 AI 텍스트를 포착하는 데 성공했다. 하지만, 이 시스템은 과학 저널 기사에 특화되어 있어, 대학 신문의 실제 기사를 제시했을 때에는 인간이 작성한 것으로 인식하지 못하는 한계를 보였다. 학술 표절, 짧은 논문작성 기간 압박으로 탄생 베를린 응용과학대학교에서 학술 표절을 연구하는 컴퓨터 과학자인 데보라 웨버 울프는 학계에서 챗GPT의 사용이 증가하는 배경에 다른 문제들이 있다고 언급했다. 그녀는 많은 연구자들이 논문을 신속하게 작성해야 하는 압박을 받고 있으며, 이로 인해 논문 작성 과정이 과학의 중요한 부분으로 인식되지 않을 위험이 있다고 지적했다. 웨버 울프 교수는 AI 탐지 도구가 이와 같은 문제를 해결할 수 없다고 강조했다. 그녀는 이러한 도구들을 사회적 문제에 대한 '마법의 소프트웨어 솔루션'으로 여겨서는 안된다고 주장하며, 이는 더 넓은 사회적 맥락에서의 해결이 필요한 문제임을 시사했다.
-
- IT/바이오
-
AI 생성 논문을 전례 없는 정확도로 포착하는 '챗GPT 감지기'
-
-
'AI 선구자' 짐 켈러, "오픈소스와 비용 절감의 중요성" 강조
- 반도체 설계의 전설이자 '인공지능(AI) 선구자'로 불리는 짐 켈러 텐스토렌트 최고경영자(CEO)는 7일 "인공지능(AI)의 비용을 크게 줄이고 모든 구성 요소를 오픈소스화하여 혁신을 촉진해야 한다"며 '오픈소스'의 중요성을 강조했다. 켈러 CEO는 7일 삼성전자가 주최한 '삼성 AI 포럼 2023'에서 기조연설자로 나서, '자신만의 실리콘을 소유하라(Own Your Silicon)'를 주제로 "지난 20~30년 동안 오픈소스가 소프트웨어 개발의 핵심 동력이었다"고 말했다. 그는 애플의 'A칩', AMD의 '라이젠' CPU 등의 고성능 반도체 설계를 주도한 인물로, 현재 캐나다의 AI 반도체 스타트업인 텐스토렌트를 지휘하고 있다. 텐스토렌트는 현재 10억달러(1조3000억원)의 시장 가치를 가진 것으로 평가받고 있다. 2017년 시작된 삼성 AI 포럼은 AI와 컴퓨터공학 분야의 석학과 전문가들이 최신 연구 동향을 공유하고 미래의 혁신 전략을 논의하는 기술 교류의 장이다. 7회째를 맞은 올해는 약 1천 명이 참석한 가운데 열렸다. 켈러 CEO는 이날 강연에서 차세대 반도체 설계를 통한 AI 기술의 한계를 극복하는 방안을 제시했다. 켈러 CEO는 개방형 하드웨어 설계자산인 RISC-V(리스크 파이브)를 기반으로 한 하드웨어 구조 설계의 혁신을 통해 차세대 AI의 새로운 가능성을 주목했다. RISC-V는 축소 명령어 집합 컴퓨팅(RISC)을 기반으로 하는 반도체 개발에 필요한 모든 명령어 세트를 무료로 공개하는 개방형 표준 기술이다. 이 기술은 특정 기업이 소유권을 가지지 않아, 이를 활용한 소프트웨어가 개발되면 어떤 기업이든 이를 사용하여 무료로 반도체를 설계할 수 있다. 켈러 CEO는 "오픈소스의 가장 큰 장점은 여러 사람들이 자유롭게 수정하고 변경할 수 있다는 것이며, AI가 빠르게 발전하는 주요 이유 중 하나는 하드웨어 성능 향상과 오픈소스 개발의 결합에 있다"고 말했다. 그는 "향후 몇 년 이내에 대규모 교육을 통한 명령 실행 방식에서 문제를 인식하고 간단한 규칙을 적용해 작업을 처리하는 방식으로 변화가 이루어질 것"이라고 예측하며, "기술을 개방적으로 유지하는 것이 중요하다"고 특히 강조했다. 또한, AI 분야의 세계적 석학인 요슈아 벤지오 캐나다 몬트리올대 교수는 온라인 기조 강연에서, 대규모 언어 모델(LLM, Large Language Model)을 기반으로 한 AI 기술 발전이 연구자의 의도와 일치하지 않는 결과를 방지할 수 있는 안전한 AI 기계학습 알고리즘에 대해 소개했다. LLM은 방대한 양의 텍스트 데이터로 학습해 자연어를 이해하고 생성하는 능력이 뛰어난 언어 모델이다. 삼성전자 SAIT(구 종합기술원)는 '△ LLM과 산업용 AI의 변화(LLM and Transformation of AI for Industry) △ LLM과 시뮬레이션을 위한 초거대 컴퓨팅(Large-scale Computing for LLM and Simulation)'을 주제로 AI·CE(컴퓨터 공학, Computer Engineering) 분야 세부 세션을 각각 진행했다. AI 분야에서 세계적으로 우수한 신진 연구자를 발굴하기 위한 '삼성 AI 연구자상'에서는 미국 프린스턴 대학교의 제이슨 리 교수를 비롯한 5명의 연구자가 선정됐다. 제이슨 리 교수는 딥러닝, 강화학습, 최적화 등 AI 분야 이론과 응용 연구에 집중하고 있다. 해당 분야에서 우수 논문을 다수 게재해 전 세계 AI 연구 발전에 기여한 점이 높은 평가를 받았다. 경계현 삼성전자 대표이사 사장은 온라인으로 진행된 개회사에서 "생성형 AI 기술이 인류가 직면한 다양한 문제를 해결하는 혁신적인 수단으로 부상하고 있으며, 이에 따라 기술의 안전성, 신뢰성, 지속 가능성에 대한 심도 있는 연구가 필요하다"고 언급했다. 경 사장은 또한 "삼성전자는 고대역폭 메모리 칩을 포함한 AI 컴퓨팅 시스템의 핵심 부품을 통해 AI 생태계 강화에 계속해서 중요한 역할을 할 것"이라고 말하며, "이번 포럼이 AI와 반도체 기술을 통해 인류의 더 나은 미래를 모색하는 의미 있는 자리가 되기를 바란다"고 전했다. 삼성전자는 8일 서울R&D캠퍼스에서 삼성리서치 주관으로 '삼성 AI 포럼' 두 번째 날 행사를 진행한다. 비공개 행사로 진행되는 이 자리에서는 생성형 AI 기술의 발전 방향을 논의하고 관련 기술 동향을 공유할 계획이다.
-
- IT/바이오
-
'AI 선구자' 짐 켈러, "오픈소스와 비용 절감의 중요성" 강조
-
-
청각 장애인 위한 첨단 안경, 실시간 음성 자막 제공
- 영국 맨체스터에 사는 파울 셔틀워스(40세) 씨는 양쪽 귀에 심각한 청각 장애를 겪고 있다. 그러나 지난 2022년 크리스마스 때 받은 특별한 선물이 그의 생활에 변화를 가져다 주었다. 이 선물은 바로 라이브 캡션 기능이 있는 안경이다. 미국 과학 기술 매체 '사이언티픽 아메리칸(Scientific American)'에 따르면, 이 안경은 청각 장애인들이 대화에 더 쉽게 참여할 수 있게 도와주고 있다. 라이브 캡션 기술은 대화 중인 단어를 실시간으로 텍스트로 변환하여 안경 렌즈에 표시해주는 기능을 가지고 있다. 이로 인해 청각 장애인들이 일상 속에서 더 원활하게 의사소통을 할 수 있게 된다. 그러나 이 안경도 아직은 완벽하지 않아, 수화 통역사처럼 100% 정확한 번역을 제공하지는 못한다고 한다. 트랜스크라이브글라스(TranscribeGlass)의 공동 창업자인 톰 프리스키(Tom Pritsky)씨는 삼각한 양측성 난청을 겪고 있다. 그는 "이 안경은 대화 능력과 삶의 질을 크게 향상시켜준다"며, "보청기는 소리를 들려주지만, 명확하지 않고 일부 단어를 놓칠 때도 있다"고 말했다. 프리스키씨는 또한 "캡션과 자막이 있으면 대화를 계속 이해하고 빈틈 없이 따라갈 수 있어 큰 도움이 된다"고 덧붙였다. 2050년까지 청력 손실을 겪을 것으로 예상되는 약 25억 명의 사람들에게 이러한 라이브 캡션 안경은 큰 도움이 될 것으로 보인다. 라이브 캡션 안경은 음성 인식 기술의 발전과배터리 수명 향상으로 시장에 출시되기 시작했으며, 청력 손실이 있는 많은 사람들이 혜택을 받을 것으로 보인다. 구글 글라스 개발에 참여한 조지아공과대학교(Georgia Institute of Technology) 테드 스타너(Thad Starner) 교수는 "청력 손실을 겪고 있는 노인들이 이 안경을 사용하게 되면, 가족이나 친구들과의 사회적 연결망을 유지하고 강화할 수 있을 것"이라고 말했다. 프리스키는 "청각 장애나 난청이 있는 사람들은 오터(Otter)와 같은 앱을 사용해 대화를 기록할 수 있지만, 그 과정이 번거롭다"며, "시야에 실시간으로 캡션을 볼 수 있다면, 이는 커뮤니케이션 방식에 혁명을 일으킬 것"이라고 강조했다. 라이브 캡션 안경은 주로 안경 프레임, 마이크, 음성을 처리하는 온보드 컴퓨터, 배터리, 그리고 캡션을 디스플레이하는 기능으로 구성되어 있다. 엑스알에이아이 글라스(XRAI Glass)의 단 스카프 대표는 "음성 인식 소프트웨어의 발전이 이러한 기술의 현실화를 가능하게 했다"며 "이 기술을 적용할 수 있는 완벽한 하드웨어가 6개월 내에 출시될 것으로 보이며, 이제는 이 기술을 사용하려는 사용자를 찾는 것이 중요한 단계가 될 것"이라고 덧붙였다. 라이브 캡션 안경의 판매량은 기대에 비해 적었음에도 불구하고, 테드 스타너 교수는 기술의 중요한 발전을 강조하며 이를 긍정적으로 평가하고 있다. 그는 지난 30년 동안 다양한 기술적 실패를 겪었지만, 휴대용 배터리와 음성 인식 시스템의 업그레이드로 인해 라이브 캡션 안경이 곧 일반 가정에서 흔히 사용되는 기술이 될 것이라고 믿고 있다. 라자 쿠샬라가르(Raja Kushalnagar) 갤러뎃 대학교(Gallaudet University)의 정보 기술 프로그램 책임자이자 교수는 이 기술이 일상생활에 얼마나 큰 영향을 미치는지 직접 확인했다고 말했다. 그는 청각장애가 있는 아들과 대화하는 동안 이 기술의 효용성을 확인했다고 전했다. 쿠샬라가르 교수는 "예를 들어 부엌에서 요리를 하면서도 캡션을 읽을 수 있다"며 "이 기술 덕분에 걸으면서도 아들과 소통할 수 있게 되었다"고 덧붙였다. 라이브 캡션 안경이 청각장애인들에게 큰 도움을 주고 있지만, 아직 완벽한 해결책이라고는 할 수 없다. 특히 많은 사람이 있는 공간에서 배경 소음 때문에 캡션 소프트웨어가 정확한 대화를 포착하는 데 어려움을 겪고 있는 것이 그 예이다. 또한, 현재의 캡션 시스템은 화자의 정체성이나 감정, 억양 등을 정확하게 표현하지 못하는 문제도 있어, 통역사가 제공하는 맥락 전달과 비교된다. 이런 문제들이 앞으로 개선되어야 한다. 한편, 한국의 엑스퍼트아이엔씨는 청각장애인들을 위해 '씨사운드'라는 음성을 자막으로 변환해주는 안경을 개발했다. 이 안경은 AI STT(음성을 텍스트로 변환) 기술을 활용하여 92% 이상의 정확도로 한국어 음성을 자막으로 변환해준다.
-
- IT/바이오
-
청각 장애인 위한 첨단 안경, 실시간 음성 자막 제공
-
-
MS, 의료 지원 AI 도구 공개
- 마이크로소프트(MS)는 10일(현지시간) 의료 서비스용 인공지능(AI) 제품을 공개했다. MS는 미국 네바다주 라스베이거스에서 열린 헬스케어(HLTH) 2023 콘퍼런스에서 데이터 및 분석 플랫폼인 자사의 패브릭(Fabric) 내에 새로운 의료 서비스 전용 도구를 추가했다고 밝혔다. 이 도구는 전자 의료 기록과 이미지, 연구실 시스템, 의료 기기, 클레임 시스템 등 모든 정보를 결합해 의료 기관이 데이터를 표준화하고 손쉽게 이용할 수 있도록 지원한다. MS는 새로운 도구가 의료진이 데이터를 하나씩 검색하는 '시간 소모적인' 프로세스를 제거하는 데 도움이 될 수 있으므로 의료 제공자가 치료에 집중할 수 있다고 설명했다. 세계경제포럼(World Economic Forum)에 따르면 병원에서는 연간 50페타바이트(petabyte, pb)의 고립된 데이터를 생성한다. 이는 약 100억 개의 음악 파일에 해당한다. 많은 귀중한 통찰력이 담겨 있는 이 데이터의 97%는 사용되지 않는다. MS는 이 모든 데이터를 잘 활용하는 것이 환자의 삶과 의료 여정에 의미 있는 변화를 가져올 수 있는 임상과 운영상의 혁신을 여는 열쇠라고 강조했다. 의료용 패브릭은 시카고 통합 학술의료시스템인 노스웨스턴 메디슨(Northwestern Medicine)을 비롯해 캐나다의 아서 헬스(Arthur Health), 싱가포르 최대 공공 의료기관 네트워크인 싱헬스(SingHealth) 등 일부 의료 기관에서 시범 사용해 오고 있다. 노스웨스턴 메디슨의 최고정보책임자인 더그 킹(Doug King)은 "MS 기술은 우리가 살고 있는 방법과 환자를 돌보는 방법을 바꿀 것"이라며 더 많은 환자들을 진료하는 데 도움이 될 것으로 기대했다. MS는 또 환자 진료에 도움을 주는 생성형 AI 챗봇인 '애저(Azure) AI 헬스봇'도 출시할 예정이라고 밝혔다. 이 AI 챗봇은 미 식품의약국(FDA)과 같은 외부 기관의 데이터뿐만 아니라 의료 기관 자체 내부 데이터로부터 정보를 추출할 수 있다. 리니샤 바즈 MS 건강 및 생명 과학의 수석 제품 관리자는 챗봇을 사용하여 조직 내 직원이 특정 질병을 치료하는 방법, 내부 프로토콜 및 프로세스와 같은 질문을 할 수 있다고 말했다. 또 환자도 환자 포털 내에서 챗봇을 사용하여 자신의 증상과 의학 용어에 대해 명확하게 질문할 수 있다고 덧붙였다. 바즈는 언론 브리핑에서 "정말 중요한 것은 이 프로세스에 가드레일과 안전장치를 구축했다는 점"이라고 말했다. MS는 임상 문서와 메모 등과 같은 다양한 비정형 데이터 원본에서 중요한 의료 정보에 레이블을 지정하고 추출할 수 있는 '의료용 텍스트 분석(Text Analytics for health)'이라는 또 다른 솔루션을 발표했다. 바즈는 이 도구가 영어 외에 스페인어, 프랑스어, 이탈리아어, 독일어, 포르투갈어, 히브리어로도 출시될 예정이라고 전했다. 이를 통해 의료진이 특정 질병을 어떻게 치료하는지 내부 프로토콜과 프로세스에 대해 질문해 답을 얻을 수 있고, 환자들도 자신의 증상과 의료 용어에 대해 명확한 질문을 할 수도 있다고 MS는 설명했다. MS는 이와 함께 의사, 간호사 등이 더 많은 정보를 기반으로 의사 결정을 내리는 데 도움을 주는 '애저 AI 헬스 인사이트(Azure AI Health Insights)' 모델도 공개했다. 이 모델은 생성형 AI를 사용해 의료진에게 환자의 의료 기록에 대한 개요를 제공하고, 복잡한 의학 용어로 된 보고서를 환자가 더 잘 이해할 수 있는 언어로 풀어준다. 또 여러 보고서에서 발생할 수 있는 오류와 불일치를 식별해 의료진을 지원한다고 MS는 설명했다. 바즈는 "애저 AI에 포함된 마이크로소프트의 새로운 의료 서비스 도구가 환자 경험을 개선하고 임상의가 더 나은 치료를 제공하는 데 집중할 수 있도록 도울 것"이라고 말했다. MS 측은 새로운 솔루션은 10일부터 미리 보기로 사용할 수 있다고 밝혔다.
-
- IT/바이오
-
MS, 의료 지원 AI 도구 공개