검색
-
-
챗GPT, 음성↔텍스트 상호 변환...소통 능력 향상 기대
- 대화형 인공지능(AI) 서비스 챗GPT가 텍스트를 통해 사용자와 소통했던 단계를 벗어나 사진을 인식하고 음성을 텍스트로 변환하고, 텍스트를 다시 음성으로 합성할 수 있는 버전을 도입한다고 밝혀 이전보다 더 인간다운 모습을 보일 전망이다. 기술 과학 전문매체 기즈모도(GIZMODO)에 따르면, 챗GPT 제조사인 오픈AI는 챗GPT에 도입될 프로모션 비디오를 통해 사용자에게 이미지 인식 기능에 대해 선보이고 있다고 전했다. 예를 들어, 사용자가 챗GPT에게 자전거 좌석을 낮춰달라고 요청하면 챗봇은 먼저 모든 종류의 좌석을 낮추기 위한 일반적인 조언을 했다. 위의 사진에서 볼수 있듯이 처음 자전거 좌석을 사용하는 이용자가 자전거 좌석 캐치 주위에 원을 그린 후 더 자세한 도움을 요청하면, 챗GPT는 해당 볼트 유형을 인식하고 엘렌 렌치가 필요하다고 답했다. 이 시스템은 사용자 설명서와 공구 상자의 사진을 보고 올바른 크기의 렌치가 있는지도 확인할 수 있다고 기즈모도는 설명했다. 음성 인식 시스템 적용 물론, 이미지 인식은 많은 챗봇 서비스에서 실험한 것이 아니지만 음성 인식 시스템과 음성 합성에 대한 최신 기술을 보유하고 있다는 것이 오픈AI 측의 설명이다. 오픈AI는 챗봇의 새로운 음성 서비스를 사용자에게 소개하기 위해 '어머니가 챗GPT에게 특정 숲에 살고 있는 고슴도치에 대한 이야기를 자녀들에게 읽어 달라'고 요청하는 비디오를 공개했다. 비디오의 말투는 자연스러웠지만, 그림책의 캐릭터들이 각각의 고유한 목소리를 내지는 않았다. 캐릭터의 음성은 시스템에 라이선스를 부여한 성우의 목소리를 기반으로 하기 때문이다. 이는 일레븐랩스(ElevenLabs)와 같은 다른 AI 음성 합성과 유사하다. 해당 서비스는 처음에는 딥페이크(인공지능을 기반으로 활용한 인간 이미지 합성 기술)나 괴롭힘에 사용돼 비판을 받았다. 오픈AI는 자사의 첫 번째 음성 서비스가 챗GPT 음성 채팅에서만 적용된다고 밝혔고, 최근 새로운 팟캐스트 음성 번역 기능을 발표한 스포티파이(Spotify)에 음성 시스템 라이선스를 제공하고 있다. 이로써 스페인어, 프랑스어, 독일어로 인기 팟캐스터의 목소리를 모방할 수 있게 될 예정이다. 물론 이 새로운 기능은 챗GPT의 '플러스(Plus)' 또는 '엔터프라이즈(Enterprise)' 서비스 비용을 지불한 사용자에게만 제공되며 두 기능 모두 10월 중순께 iOS와 안드로이드(Android)에서 사용할 수 있게 된다. 챗GPT 웹 버전 사용자도 곧 이미지 기능을 이용할 수 있게 될 전망이다. 다만, 이 시스템은 프로모션 비디오에서 제안하는 것처럼 빠르거나 능숙하지는 않을 것으로 보인다. 과학 기술매체 와이어드(Wired)에 따르면, 챗GPT 시험용 버전을 기반으로 음성 인식이 응답하는 데 몇 초가 걸렸다. 이 매체는 이미지 시스템이 사진 속 사람을 식별하려고 시도하지 않을 것이며, 사생활을 어떻게 보호할지 두고 봐야 할 것이라고 지적했다. 오픈AI 대변인은 기즈모도에 "시간이 지나면서 점진적으로 개선하고 위험을 줄일 수 있는 세부 사항들을 다듬는 것이 중요하다"며 "이 새로운 기능을 최소화하기 위해 '레드팀'을 구성했다"고 밝혔다. 그러나 사용자들이 다시 한번 챗봇의 윤리적 경계를 넘어서는 것은 시간문제다. 챗GPT는 지난 2022년 11월 공개 직후 대대적으로 인기를 끈 이후 사용자 수가 감소했다. 이는 일부 사용자들이 오픈AI가 챗봇의 기능을 제한했다고 느꼈기 때문이다. 오픈AI는 피해를 최소화하고 챗봇 사용자들이 자유롭게 활용할 수 있는 윤리적 균형을 찾는 데 어려움을 겪고 있다. 한국어 개인정보 방침 제공 한편, 오픈AI는 지난 2023년 9월 비영어 국가 중 처음으로 한국어로 된 개인정보 처리방침을 제공하고 국내 이용자를 위한 개인정보 가이드라인을 마련했다. 회사 서비스를 통해 수집되는 개인정보를 추가로 이용하기 위한 조건과 아동의 기준이 상향된 것으로, 국내 이용자 687명의 개인정보 유출 건에 대한 개인정보보호위원회의 개선 권고 일환이다. 오픈AI가 대한민국 이용자로부터 수집한 개인정보를 활용하기 위해서는 먼저 수집된 개인정보의 추가적인 이용·제공이 당초 수집 목적과 관련성이 있어야 한다. 동시에 수집한 데이터를 추가로 이용·제공할 수 있다는 예측도 가능해야 한다. 또 대한민국 '아동'의 연령기준을 13세에서 14세로 상향했다. 이밖에도 '처리 위탁 및 국외 이전'의 기준을 마련하고 '개인정보 파기 절차 및 방법', '정보주체와 법정대리인의 권리', '연락처', '국내대리인'을 명시했다.
-
- IT/바이오
-
챗GPT, 음성↔텍스트 상호 변환...소통 능력 향상 기대
-
-
페덱스의 신형 AI로봇, 테트리스 연상 적재 신공 과시
- 매일 1500만 개 이상의 패키지를 처리하는 물류 대기업 페덱스(FedEx)가 최근 AI 기반의 양팔 로봇 '덱스(DexR)'를 선보였다. 이 로봇의 목적은 다양한 크기와 무게의 상자를 트럭에 테트리스처럼 효율적으로 적재하는 것이다. '덱스'는 페덱스 직원들에게 가장 어려운 작업인 화물의 트럭 적재를 자동화하기 위해 개발되었다. 기술 전문 매체 와이어드에 따르면, 이 로봇은 AI를 활용해 다양한 크기의 상자를 최대한 효율적으로 배치, 트럭 내부의 공간을 최대한 활용한다. 이는 결코 쉽지 않은 작업이다. 페덱스의 레베카 양(Rebecca Yang) 운영 및 첨단 기술 담당 부사장에 따르면, 패키지는 다양한 포장재, 크기, 모양, 무게로 제공돼 그 조합은 예측하기 어렵다. 로봇은 패키지를 감지하기 위해 카메라와 라이다(LiDAR, 일종의 레이저 광) 센서를 사용한다. 그리고 상자들을 효과적으로 배열해 안정적인 '벽'을 구성하고, 상자를 끊임없이 조정하여 미끄러짐이나 기타 문제에 대응한다. 양 부사장은 "몇 년 전 AI는 이처럼 복잡한 결정 과정을 처리하기엔 한계가 있었다"고 설명했다. 양팔 로봇 덱스는 현재 페덱스에서 광범위한 적용을 위한 예비 테스트를 거치고 있다. 챗GPT와 같은 생성형 AI 도구 덕분에 많은 산업이 AI가 거의 모든 작업을 수행할 수 있다고 인식하기 시작했다. 그렇지만, 예측하기 어려운 현실 세계에서 물체를 다루는 것은 알고리즘에게 여전히 큰 도전이다. 대다수의 산업용 로봇은 주로 반복적이고 극도로 정밀한 작업을 수행하기 위해 설계되었다. 반복 작업 위해 정밀 설계 로봇 공학은 지속적으로 발전하고 있으며, 현재 많은 기계들이 AI를 통해 물체를 인식하고 이를 처리하는 방법을 결정하고 있다. 이런 과정에서 알고리즘이 실제 로봇에 적용되기 전에, 시뮬레이션에서 오류를 최소화하며 훈련을 받을 수 있다. 하지만 시뮬레이션의 세계에서 현실로의 전환은 간단하지 않다. 개선된 알고리즘, 로봇 기계 학습에 대한 신선한 접근법, 그리고 발전된 하드웨어 및 센서 덕분에 고급 로봇의 실용적인 응용이 점점 확장되고 있다. 카네기 멜론 대학의 로보틱스 연구소장 매튜 존슨-로버슨은 "최근 1~2년 동안 AI와 머신러닝의 발전으로, 많은 사람들이 이를 '비용 절감 및 효율성 향상을 통한 수익성 있는 비즈니스 케이스로 활용할 수 있다'고 주장하고 있다"고 밝혔다. 자율주행 차량과 AI의 지속적인 발전에 대한 오랜 기간의 투자 덕분에 로봇이 더 다양한 작업장에서 활용될 수 있게 될 것이라고 존슨-로버슨은 지적했다. 그는 "현재 상업용 로봇 공학의 초창기에 불과하다고 볼 수 있다"라고 덧붙였다. 생성 AI 활용해 패턴 계산 페덱스 로봇은 캘리포니아 레드우드 시티에 본사를 둔 스타트업인 덱스터리티(Dexterity)가 페덱스를 위해 개발했다.덱스터리티는 창고 운영을 위한 다양한 AI 기반 로봇 시스템 개발을 전문으로 하는 기업이다. 페덱스의 로봇은 캘리포니아 레드우드 시티에 위치한 스타트업 덱스터리티(Dexterity)가 개발했다. 덱스터리티는 창고 자동화를 위한 AI 기반 로봇 시스템의 전문 개발업체이다. 사미르 메논(Samir Menon) 덱스터리티의 최고경영자(CEO)는 페덱스를 위해 제작된 로봇이 생성 AI를 활용하여 다양한 유형의 상자를 적절히 쌓을 수 있도록 설계되었다고 밝혔다. 이 AI는 상자를 인식하고, 그것을 잡는 과정에도 활용된다. 그렇지만 메논은 이러한 시스템을 구축하기 위해서는 신중한 엔지니어링 작업이 필요하다고 강조했다. 로봇이 상자를 적재할 때마다, 포스 피드백을 통해 패키지의 정확한 배치를 확인한다. 더불어 카메라와 깊이 센서로 로딩 된 물품을 스캔하여 기존의 모델과의 일치성을 점검한다. 일치하지 않을 경우, 로봇은 현재 작업 상태에 맞춰 적재 전략을 수정한다. 온라인 쇼핑의 대표 기업인 아마존의 성장과 함께, 패키지 처리는 로봇 개발에서 혁신적인 핵심 분야로 부상했다. 아마존은 현재 제품을 보다 효율적으로 관리하고 처리하기 위해 수천 대의 첨단 로봇을 운영하고 있다. 트럭 내부는 다양한 상자를 적재해야 하는 제한된 공간이다. 이것은 로봇이 창고에서 수행하는 일반적인 선택 작업보다 "더 큰 도전"이라고 매사추세츠 공과대학(MIT)의 AI와 로봇 공학 전문가 풀킷 아그라왈(Pulkit Agrawal) 교수는 지적했다. AI로봇 활용으로 실업 우려 확산 로봇이 다양한 업무를 수행하는 시대가 급속히 다가오면서, AI 기반 로봇 활용의 증가로 인한 실업에 대한 우려가 커지고 있다. 미국의 자동차 공장 노동자들의 연속적인 파업은 전기차와 자율 주행과 같은 급변하는 기술 트렌드와 연관되어 있다. 페덱스의 양 부사장은 이 로봇이 완벽하진 않지만, 결국 숙련 노동자와 동등한 속도로 트럭에 화물을 적재할 수 있을 것이라고 전망했다. 페덱스는 이미 버크셔 그레이의 기술을 활용해 일부 시설에서 소포 분류 작업을 수행 중이다. 이 기술에 대해 회사는 2022년에만 약 2억 달러를 투자했다. 양 부사장은 페덱스가 몇 대의 로봇을 언제 도입할지에 대해 구체적으로 밝히지 않았다. 로봇의 신뢰성 관련 데이터는 아직 수집 단계에 있다. 그럼에도 덱스터리티의 로봇 기술은 다른 영역에도 적용될 전망이며, 페덱스는 로봇을 통해 더욱 다양한 업무를 처리하고자 한다. 그는 "이것은 우리에게 큰 전환점이며, 다가오는 세대가 우리의 업무 방식을 향상시키는 것을 목격하게 되어 기쁘다"고 말했다.
-
- IT/바이오
-
페덱스의 신형 AI로봇, 테트리스 연상 적재 신공 과시
-
-
AI 워터마크, 뚫기 쉽다⋯보안 강화 촉구
- 디지털 워터마크는 다양한 분야에서 활용되는 보안 기술로, 우표부터 현금, 이미지까지 폭넓게 적용되며 그 핵심 역할은 정보의 신뢰성 확보와 위조 방지에 있다. 최근 '엔가제트(engadget)' 매체에 따르면 디지털 워터마크의 취약점에 대한 우려가 커지고 있다. 인공지능(AI)을 활용한 딥 페이크와 생성 예술 등의 확산으로 인해 디지털 워터마크의 중요성이 갈수록 커지고 있다. 특히 AI로 만들어진 콘텐츠를 정확히 식별하고, 해당 콘텐츠가 실제로 AI에 의해 생성됐는지 확인하는 것이 중요한 과제로 부상했다. 이러한 워터마크는 AI에 의한 콘텐츠의 오용을 방지하는 목적으로 이미지 등에 적용되기도 한다. 딥 페이크나 허위 정보의 생성이 급증하자 이를 방어하고 정보의 신뢰성을 보장하기 위해 많은 기업들이 워터마크 기술의 개발에 힘쓰고 있다. 구체적으로 오픈AI, 메타, 아마존 등 주요 기업들이 이러한 문제점에 대응하기 위한 워터마킹 기술 개발에 앞장서고 있다. 메릴랜드 대학교(UMD)의 컴퓨터 과학 연구팀은 워터마크의 추가나 제거에 관한 연구를 수행했다. UMD의 쇼헤이 페이지(Soheil Feizi) 교수는 와이어드(Wired)와의 인터뷰에서 현재 신뢰할 수 있는 워터마킹 응용 프로그램이 없다는 연구 결과를 얻었다고 밝혔다. 실제로, AI를 사용하지 않고 이미지에 가짜 워터마크를 추가하는 것은 상대적으로 간단한 일이었다. 반면, 워터마크를 완전히 제거하는 것은 여전히 복잡한 작업으로 판명되었다. 일부 연구진은 워터마크를 거의 완전히 제거하기 어렵게 만드는 기술의 개발에 힘쓰고 있으며, 이런 기술은 제품의 도난 감지에도 활용될 전망이다. 캘리포니아 대학교 산타 바바라 캠퍼스와 카네기 멜론 대학교의 연구팀은 디지털 워터마크의 제거 방법에 대한 공동 연구를 진행했다. 이 연구에서는 디지털 워터마크를 쉽게 제거할 수 있다는 사실을 확인했다. 두 가지 주요 워터마크 제거 방법, 즉 파괴적 접근과 건설적 접근이 탐색되었다. 파괴적 접근은 워터마크를 이미지의 일부로 간주하고 이를 조정하여 제거하는 방식인데, 이 과정에서 이미지 품질이 떨어질 수 있다. 반면, 건설적 접근은 워터마크를 유지한 채로 제거하는 복잡한 방법을 취한다. 이 연구는 디지털 워터마크의 취약성을 드러내면서 그 개선의 필요성을 부각시켰다. 디지털 워터마킹 기술은 지속적으로 발전해야 하며, 특히 AI가 잠재적으로 잘못된 정보를 만들어내어 사회에 혼란을 줄 수 있기 때문에, AI 생성 콘텐츠의 식별 도구와 기술의 발전이 필요하다.
-
- IT/바이오
-
AI 워터마크, 뚫기 쉽다⋯보안 강화 촉구
-
-
일본 벤처기업, '지렁이 근육' 모방 배관검사 로봇 개발
- 일본 중앙대 출신의 벤처기업 '솔라리스'가 배관의 깊은 곳까지 접근 가능한 지렁이 근육을 모방한 로봇 '수하'를 선보였다. 기술 전문 매체 와이어드에 따르면 이 로봇은 얇고 유연한 초음파 센서를 갖추고 있어 배관 내부의 노후화된 부분을 정밀하게 파악할 수 있다. 배관은 공장 설비나 도시 인프라에서 중요한 역할을 하는데, 내부의 노후화나 열화가 진행되면 큰 사고로 이어질 수 있다. 따라서 깊숙한 곳까지 정확하게 검사하는 것이 중요하다. 검사 목적으로 배관을 일시적으로 잘라내면 내부를 육안으로 확인할 수 있지만, 시간이 오래 걸리기 때문에 실용성이 떨어진다. 현재는 파이버스코프를 이용해 내부를 확인하는 방식이 주를 이루지만, 깊은 곳까지 완벽하게 검사하기에는 한계가 있다. 외부에서 밀어 넣는 힘만으로는 파이버스코프가 커브에 막혀 깊은 곳까지 도달할 수 없는 문제가 있었다. 솔라리스가 개발한 '수하(Sooha)'는 지렁이의 움직임을 모방한 로봇으로, 깊은 배관 내부까지 접근이 가능하다. 특히 '인공 근육' 기술을 활용하여 지렁이처럼 연동운동을 구현, 배관 내부의 좁은 공간에서도 움직일 수 있다. 지렁이 모방 '인공 근육' 로봇 수하의 가장 큰 특징은 지렁이의 이동 매커니즘을 모방한 것이다. 좁은 공간에서 효과적으로 움직일 수 있어, 배관과 같은 한정된 공간에서의 움직임에 최적화되어 있다. '연동운동'이라고 불리는 지렁이의 이동 메커니즘은 근육의 마디마디가 연결된 몸이 부분적으로 수축과 팽창을 반복하는 동작을 조합한 것이다. 지렁이가 움직일 때는 먼저 몸의 앞쪽 마디가 수축한다. 그 다음 앞쪽의 마디가 늘어나는 것과 거의 동시에 뒤쪽의 마디가 수축한다. 그러면 수축한 마디보다 뒤쪽에 있는 마디 전체가 앞으로 당겨진다. 이런 일련의 동작을 반복하면서 지렁이는 점차 앞으로 나아간다. 연동운동을 모방하기 위해 '수하'에 구현된 것은 고무 튜브를 이어 붙인 '인공 근육'이다. 이 인공 근육은 로봇 본체와 마찬가지로 나카무라 교수의 연구 성과에 기반하고 있다. 솔라리스 인공 근육의 마디는 공기가 주입되면 마디의 측면만 부풀어 오른다. 반면 세로축은 팽창하지 않도록 고정되어 있다. 따라서 측면이 팽창하는 힘에 의해 종축이 마디의 중앙으로 당겨지면서 인공근육 마디가 수축하게 된다. 수하의 앞부분에서 뒷부분으로 갈수록 인공근육의 수축을 순차적으로 반복함으로써 연동운동을 모방하고 있다. 이 로봇은 나카무라 타로(中村太郎) 교수의 연구를 바탕으로 개발됐다. 지난 2023년 7월 '울트라 수하(Ultra Sooha)'라는 초음파 센서가 탑재된 콘셉트 모델을 공개하며 주목받았다. 이번에 공개된 로봇은 배관 검사 뿐만 아니라 다양한 산업 분야에서 활용 가능성을 보이고 있다.
-
- IT/바이오
-
일본 벤처기업, '지렁이 근육' 모방 배관검사 로봇 개발