• 생명공학 스타트업 프로플루언트, 단백질 언어 모델로 유전자 편집 연구 발표
  • "AI로 설계된 크리스퍼(CRISPER)에 의한 인간 게놈의 성공적 첫 편집"
유전자 편집 이미지 네이처.jpg
유전자 편집 복합체의 3D 모델. 이미지=네이처 via Science Photo Library

 

이제 생성형 인공지능(AI) 기술을 이용해 컴퓨터 키 하나만 누르면 유전자 편집 도구를 만들 수 있는 길이 열리게 됐다고 네이처가 보도했다. 지금까지는 유전자 가위라고 알려진 크리스퍼(CRISPR) 유전자 편집 시스템을 발견하기 위해 온천, 이탄 습지, 분변, 심지어는 요구르트에 이르기까지 모든 미생물을 탐색해야 했다.

 

생명공학 스타트업 프로플루언트(Profluent)는 수백만 개의 단백질 서열을 훈련한 생성형 AI 기술(단백질 언어 모델)을 적용해 크리스퍼 유전자 편집 단백질을 설계하는 방법을 발표했다. 

 

캘리포니아 버클리에 소재한 프로플루언트의 알리 마다니 최고경영자(CEO)는 “챗GPT와 같은 생성형 AI 기술을 사용해 크리스퍼와 같은 복잡한 시스템을 설계하는 것이 가능하다는 것을 보여주었다”고 밝혔다. 

 

이 연구 결과는 생뮬학 온라인 프리프린트 서버 'bioRxiv' 사이트에 실렸다. 게시글에서는 "온전한 기계 학습으로 설계된 단백질에 의한 인간 게놈의 최초의 성공적인 편집"이라고 적고 있다.

 

크리스퍼 설계를 위한 생성형 AI는 단백질이나 게놈 서열 형태의 방대한 생물학적 데이터를 훈련받는다. 이 '사전 훈련' 단계를 통해 AI 모델은 ‘어떤 아미노산이 함께 결합되는지’ 등 유전자 서열에 대한 지식을 쌓게 된다. 이 정보는 완전히 새로운 단백질 서열 생성과 같은 작업에 적용될 수 있다.

 

프로플루언트 연구팀은 종전에 자사가 개발한 '프로젠(ProGen)'이라는 단백질 언어 모델을 사용해 새로운 항균 단백질을 개발했다. 그 후 박테리아와 고세균 등 단세포 미생물이 바이러스를 방어하기 위해 사용하는 수백만 개의 다양한 크리스퍼 시스템을 학습시켜 프로젠 차기 버전을 만들었다. 진보한 크리스퍼 시스템을 개발하기 위함이었다.

 

크리스퍼 유전자 편집 시스템은 단백질뿐만 아니라 표적을 지정하는 RNA 분자로도 구성돼 있기 때문에, 연구팀은 이러한 '가이드 RNA'를 설계하기 위한 또 다른 AI 모델도 개발했다. 연이어 신경망을 사용해 자연에서 발견되는 수십 개의 서로 다른 단백질 계열에 속하는 수백만 개의 새로운 크리스퍼 단백질 서열을 설계했다.

 

AI가 설계한 크리스퍼가 올바른 유전자 편집자라는 사실도 확인됐다. '가이드 RNA'를 인간 세포에 삽입했을 때 의도한 표적을 정확하게 절단했다는 것. 확인 결과 실험실에서 널리 사용되는 크리스퍼-카스9(CRISPR-Cas9)에 속하는 단백질만큼 표적 DNA 서열을 절단하는 데 효율적이었다. 오히려 잘못된 위치에서 절단하는 횟수가 훨씬 적었다.

 

한편 캘리포니아 스탠포드 대학의 컴퓨터 생물학자 브라이언 히 교수와 캘리포니아 팔로알토에 소재한 Arc연구소가 이끄는 연구팀도 단백질과 RNA 서열을 모두 생성할 수 있는 AI 모델을 개발했다. EVO라고 불리는 이 모델은 박테리아와 고세균의 8만 개 게놈과 기타 미생물 서열(3000억 개의 DNA)에 대해 훈련받았다. EVO가 설계한 일부 크리스퍼-카스9 시스템의 예상 구조는 천연 단백질의 구조와 유사했다. 이 연구 역시 bioRxiv 사이트에 게시됐다.

    

마다니는 AI가 설계한 유전자 편집 도구가 기존 크리스퍼보다 의료 부문 응용에 더 적합할 수 있다고 기대했다. 프로플루언트는 AI 생성 크리스퍼를 테스트하기 위해 유전자 편집 치료법을 개발하는 회사와의 파트너십도 추진하고 있다. 편집 기술의 정밀도를 높이고 맞춤형 디자인으로 발전시킨다는 계획이다.

전체댓글 0

비밀번호 :
메일보내기닫기
기사제목
챗GPT 등 생성형 AI 기술 이용, 유전자 가위 '크리스퍼' 제작 길 넓힌다
보내는 분 이메일
받는 분 이메일