알림·뉴스

국내외 기사

"실패한 데이터로 최적 AI 신약개발 솔루션 만든다"
국내
  • 작성자
  • 작성일자
  • 조회70

출처: 의학신문

[원문바로가기]


"실패한 데이터로 최적 AI 신약개발 솔루션 만든다"

제약사 적극적인 참여 필수…병원·연구소 등과 협업 예정
K-MELLODDY 사업단 김화종 단장


[의학신문·일간보사=김정일 기자] “제약사들이 창고에 쌓아두고 있는 실패한 데이터가 많이 모여야 최적화된 AI 신약개발 솔루션을 만들 수 있습니다.”

연합학습 기반 신약개발 가속화 프로젝트(K-MELLODDY) 사업단 김화종 단장<사진>을 만나 프로젝트의 핵심 과제, 향후 계획 등을 들었다.

 

K-MELLODDY는 과학기술정보통신부와 보건복지부가 공동으로 올해부터 2028년까지 5년간 348억원을 투입해 연합학습 기반 ADMET(Absorption, Distribution, Metabolism, Excretion, Toxicity) 예측 모델인 FAM(Federated ADMET Model) 개발을 목표로 하고 있다.

연합학습(Federated Learning) 기술은 각 기관이 보유한 데이터를 한 곳으로 모으지 않고 개별 기관에서 AI를 학습시키는 기술로 정보 유출 위험이 거의 없어 민감정보의 ‘보호’와 ‘활용’이 동시에 가능하다.

김 단장은 “최적의 ADMET 모델을 빨리 도입하는 것이 중요하다. 연구하고 기다릴 시간이 별로 없다”며 “유럽에서 진행된 프로젝트는 제약사간 이뤄졌다면 우리는 제약사는 물론 병원, 연구소 등과 협력할 것”이라고 밝혔다.

김화종 단장은 프로젝트 성공을 위한 핵심사항으로 제약사들의 적극적인 참여를 꼽았다.

그는 “신약개발은 임상에 갈 때까지 비용이 굉장히 많이 들어가는데 실패한 데이터는 사용하지 않는다”며 “AI는 무조건 실패한 데이터가 많아야 한다. 실패한 데이터를 어디에 쓰냐고 할 수 있지만 이를 통해 신약 후보물질을 찾을 수 있다. 제약사들이 창고에 쌓아놓고 있는 실패한 데이터를 내놓게 하는 게 가장 큰 관건”이라고 밝혔다.

김 단장은 제약사 등의 데이터 보안 문제와 관련해서는 “K-MELLODDY는 데이터를 모으지 않는다. 데이터의 물리적인 이동이 전혀 없다”며 “검증된 기관만 들어오는 연합학습 모델이기 때문에 해킹은 걱정할 일이 아니다. 암호화도 계속한다”고 밝혔다.

그는 “예를 들어 기존에는 양에게 풀을 뜯어다 먹였다면, K-MELLODDY는 양을 풀이 있는 곳을 데려와 먹이는 것”이라고 설명했다.

또한 데이터 신뢰성 검증과 관련해서는 “데이터 오류는 여러 측면에서 생긴다. 이같은 노이즈는 피할 수 없다”면서도 “글로벌 모델을 갔다오면 똑똑해지고, 이를 맞춤형으로 바꾸는 과정이 필요하다. 많은 데이터가 모여야 노이즈로 처리할 수 있다”고 말했다.

김화종 단장은 기업들의 참여 동기 부여에 대해선 “앞으로는 AI를 쓰지 않고는 신약개발을 못한다”며 “여기 참여하면 같이 갈 수 있는 기회가 생기지만, 참여하지 않으면 기회가 생기지 않는다”고 말했다.

김 단장은 “모든 사업이 많은 대상을 놓고 하기는 어렵다. 제약사 등 20곳 범위 내에서 뽑을 계획”이라면서도 “우선 많은 기업이 참여해야 한다”고 강조했다.

K-MELLODDY 사업단은 이달 중 세부사업 공고 후 사업단 홈페이지 구축, 설명회 개최, AI 분야 의견수렴 회의 등을 예정하고 있다. 이어 오는 6월 세부 사업자를 선정하고 이르면 7월부터 1차년도 과제를 시작한다.

프로젝트는 크게 △플랫폼 구축 △데이터 공급·활용 △AI 모델 개발 등으로 구분되고, 세부과제로는 △연합학습 기반 FAM 운영 플랫폼을 구축하는 ‘플랫폼 구축 및 개발 1개 과제 △제약사, 병원, 연구소 등에 대한 데이터 공급 및 FAM을 활용한 ‘데이터 공급·활용 20개 과제’ △FAM 솔루션과 응용 모델을 개발하는 AI 모델 개발 15개 과제로 구성된다.