- 스탠퍼드대, 박테리아 유전체 학습 AI 'Evo' 개발…자연계에 없는 단백질 생성 성공
인공지능(AI)이 박테리아 유전체 데이터를 학습해 지금껏 알려지지 않은 새로운 단백질을 만들어내는 데 성공했다.
미국 스탠퍼드대 연구팀은 박테리아 유전자 배열이 특정 기능을 중심으로 군집한다는 점에 착안해 '에보(Evo)'라는 새로운 AI 게놈 언어모델을 개발했다.
연구 결과는 국제학술지 네이처(Nature) 최신호(2025년 11월 20일자)에 실렸다.
연구팀은 박테리아 유전체 수백만 건을 학습시켜, 염기서열의 규칙성과 유전자 간 상관관계를 인식하도록 했다. 에보는 대형 언어모델(LLM)처럼 특정 염기서열을 입력받으면 그다음 염기를 예측하고, 그 결과를 기반으로 새로운 유전자 조합을 생성한다.
팀은 기존 단백질의 일부분을 입력하자 에보가 나머지 서열을 80~85% 정확도로 완성하는 능력을 확인했다. 더 나아가 완전히 새로운 유전자를 생성하도록 훈련하자, 실험 결과 생성된 단백질 중 일부가 실제 생물학적 기능을 수행했다.
예를 들어 연구팀은 박테리아 독소 유전자를 입력한 뒤 이에 대응하는 항독소 유전자를 생성하도록 에보를 훈련시켰다. 테스트 결과, 생성된 항독소 중 절반이 실제 독성을 완화했고, 두 종류는 박테리아의 생장을 완전히 회복시켰다. 이들 항독소는 기존 단백질과 25% 미만의 유사도를 보여 '자연계에 존재하지 않는 단백질'로 평가됐다.
또한 연구진은 CRISPR 시스템을 억제하는 단백질 생성 실험에서도 17%가 실제 기능을 수행했으며, 일부 단백질은 기존 구조 예측 소프트웨어가 해석하지 못할 정도로 새로운 형태를 보였다.
스탠퍼드대 연구팀은 "Evo는 단백질의 3차원 구조를 고려하지 않고도 유전자 수준에서 기능적 단백질을 만들어낼 수 있음을 보여줬다"며 "이는 진화가 작동하는 핵심 단계인 '핵산 수준'에서 단백질 생성을 재현한 사례"라고 설명했다.
이번 연구는 AI가 단백질 설계뿐 아니라 유전자 진화 과정을 이해하고, 생물학적 창조력을 확장할 수 있는 가능성을 열었다는 점에서 주목받는다. 다만 연구진은 "포유류처럼 복잡한 유전체에는 적용이 쉽지 않다"며 "현재 단계에서는 박테리아 수준의 단순한 유전자 구조에서만 실험적으로 검증됐다"고 밝혔다.
이번 성과는 AI가 단백질 구조 예측(알파폴드) 단계에서 나아가, 생명체의 새로운 진화 가능성을 탐색하는 '유전체 기반 단백질 생성 시대'를 열었다는 평가를 받고 있다.





