💻 본업(컴공생) 이야기/연구 이야기

[약물 추천, AI 논문 정리 #1-1] 기존 모델의 한계와 SafeDrug의 등장 배경

st오리🐥 2025. 3. 22. 15:15
728x90
반응형
SMALL

https://real-st-ory.tistory.com/35

 

의료 AI의 핵심, '약물 추천'이란 무엇인가?

"병원에서 받은 약, 누가 골랐을까?" 병원에 가면 우리는 진단을 받고, 바로 처방전을 받는다.그런데 그 약은 누가, 어떤 기준으로 고른 걸까? 더보기1. 누가 약을 '선택'하나? → 의사 🩺환자가

real-st-ory.tistory.com

 

 

약물 추천이 뭐지?? 의료 AI가 뭐지?? 싶으신 분들이 마음의 문을 열고 논문을 읽을 수 있도록

배경이나, 의료 AI의 일부를 가볍게 소개한 글이니, 의료 ai 논문이 너무 훅 들어온다 !!

 

하시는 분들은 위 포스팅을 먼저 읽어보시는 걸 추천드립니다 !!

 


 

 

SafeDrug은 약물 추천 AI 모델로, 기존 모델들이 고려하지 못한 "약물 분자 구조"와 "부작용(DDI)"을 명시적으로 모델링합니다.  
이 글에서는 SafeDrug이 등장하게 된 배경과 기존 약물 추천 시스템의 한계점을 정리합니다.

 

 

저는 의료 AI의 [SafeDrug: Dual Molecular Graph Encoders for Recommending Effective and
Safe Drug Combinations -Chaoqi Yang , Cao Xiao , Fenglong Ma , Lucas Glass and Jimeng Sun]

 

https://www.ijcai.org/proceedings/2021/0514.pdf

 

 

=>  ai 약물 추천에 관한 safe drug 모델에 관련한 짧은 논문을 읽기(= 공부하기) 시작했습니다.

 

 

논문 자체는 짧지만, 영어로 된 논문을 읽고, 꼼꼼하게 쉽게 이해하기 위해  정리하다보면 글이 길어질 것으로 예상되어, 

 

 

논문 구성의

0~1) 초록과 서론
2) 관련 연구
3) 문제정의 (수식 포함)
4) Safe Drug Model (4.1~4.4)
5) 실험
6) 결론

 

로 나누어 글을 정리해보려고 합니다.

 

하나도 모르는 제가, 하나부터 공부해 나가는 과정을 기록할 것이기에 

가능한 쉽게 정리할 것을 약속합니다,, ㅎㅎ

 

 

그리하여 이번 글은 0~1) 초록과 서론 (1) 이 되겠습니다.

기존 모델의 한계와 SafeDrug의 등장 배경을 다룬 후, SafeDrug 모델의 핵심 아이디어를 정리하며 서론을 마무리 할 것입니다.

 

 

시간이 없어서 요약만을 보고 싶은 분들을 위해, 아~주 간단하게 정리한 요약본입니다!

↓↓↓

📌 SafeDrug 논문 | 초록 & 서론 핵심 요약

병원에서 약을 AI로 추천해준다면, 어떤 기준으로 약을 고를까?

기존 AI는 전자건강기록(EHR)을 기반으로 복잡한 건강 상태를 가진 환자에게 약을 추천했지만,
다음과 같은 중요한 한계가 있었다:
- 약물의 "분자 구조 정보"를 고려하지 않아 약 자체의 특성과 부작용을 반영하지 못함
- "약물 간 상호작용(DDI)" 을 명시적으로 다루지 않아, 위험한 조합을 피하기 어려웠음

이러한 한계를 해결하기 위해 등장한 모델이 바로 "SafeDrug"이다.  
SafeDrug은 이러한 한계점을 극복하고자 분자 구조와 DDI를 고려한 새로운 방식의 모델을 제안한다.

➡️ SafeDrug의 핵심 구조 및 작동 원리는 다음 포스트(1-2)에서 다루겠습니다!

 


 

 

 

논문 원본 <이 포스팅에서 다루는 분량>

 

검정색 글씨는 논문을 1차 번역한 것, 파란 글씨는 내가 조금 더 이해할 수 있도록 문장을 정리한 것.

 

 

 

0. Abstrack

 

약물 추천은 의료를 위한 AI의 필수 작업입니다. 

기존 연구들은 전자 건강 기록에 기반하여 복잡한 건강 상태를 가진 환자들을 위한 약물 조합 추천에 집중해왔습니다. 

그러나 이들 연구는 다음과 같은 한계점이 있습니다: 

 

AI가 환자에게 적절한 약을 골라주는 것은 의료 분야에서 아주 중요한 것이다.

그동안의 연구들은 병원에 저장된 환자의 진료 기록(EHR)을 바탕으로, 건강 상태가 복잡한 환자에게 어떤 약 조합이 좋을지 추천하는 데 집중해왔다.  그러나 이런 연구들에는 다음과 같은 문제점들이 있었다.

 

 

(1) 약물 분자 구조와 같은 중요한 데이터가 추천 과정에서 활용되지 않았습니다. 

(2) 약물 간 상호작용(DDI)이 암시적으로 모델링되어, 이는 최적이 아닌 결과로 이어질 수 있습니다. 

 

(1) 지금까지 대부분의 추천 시스템에서, 약물이 어떤 분자 구조로 이루어져 있는지에 대한 중요한 정보가 제대로 활용하지 않았다.

(2) 약물 간의 부작용이나 충돌(DDI)은 간접적으로 처리했기 때문에, AI가 정확하고 안전한 약 조합을 고르기 어렵고, 비효율적인 결과가 나올 가능성이 충분했다. 

 

** DDI 간접적 처리 : 예) 추천된 약 조합이 실제로 환자 기록에 있었던 조합이면 그걸 좋은 것으로 학습함

→이때 그 조합이 DDI 위험이 있더라도 모델은 그걸 고려하지 않음.

 

이러한 한계점을 해결하기 위해, 우리는 약물의 분자 구조를 활용하고 DDI를 명시적으로 모델링하는 DDI 제어 가능한 약물 추천 모델인 SafeDrug를 제안합니다. 

 

이 문제를 해결하기 위해 우리는 약물의 분자 구조를 직접 분석하고, 약물 간의 부작용을 명확하게 고려할 수 있는

AI 모델 ‘SafeDrug’를 만들었다. 

 

SafeDrug는 전역 메시지 전파 신경망(MPNN) 모듈과 지역 이분 학습 모듈을 갖추고 있어, 약물 분자의 연결성과 기능을 완전히 인코딩합니다. SafeDrug는 또한 추천된 약물 조합에서 DDI 수준을 효과적으로 제어하기 위한 제어 가능한 손실 함수를 사용합니다. 

벤치마크 데이터셋에서 우리의 SafeDrug는 DDI를 19.43% 감소시키고 추천된 약물 조합과 실제 처방된 약물 조합 간의 자카드 유사성을 2.88% 개선하는 결과를 보였습니다. 또한, SafeDrug는 이전의 심층 학습 기반 접근법보다 훨씬 적은 매개 변수를 요구하여, 약 14% 가량 빠른 훈련과 추론 속도에서 약 2배의 속도 향상을 이끌어냅니다.

 

SafeDrug는 약물의 전체적인 구조(MPNN)와 부분적인 기능(지역 인코더)를 모두 잘 파악할 수 있어서, 약물이 어떻게 구성돼 있고 어떤 작용을 하는지 정확히 분석할 수 있다.

더보기

 1) 약물은 '분자 구조'로 되어 있다.

  • 모든 약물은 화학 분자 구조를 가지고 있음.
  • 이 구조는 원자(노드)들과 화학 결합(엣지)으로 이루어진 그래프(graph) 형태.
  • 이 분자 구조에 따라 약이 어떤 기능을 하는지, 어떤 부작용이 생길 수 있는지가 결정된다.

2) 약물의 '전체적인 구조' → MPNN (Message Passing Neural Network)

MPNN이 하는 일:

  • 약물의 전체 분자 구조를 하나의 그래프로 보고,
  • 각 원자(노드)들이 서로 어떤 방식으로 연결되어 있는지를
    여러 단계(hop)로 정보를 주고받으며 분석함.

중요한 이유?

  • 약의 작용은 특정 원자 하나만으로 결정되지 않음.
    분자 전체의 구조적 맥락 속에서 결정됨.
  • 예) A-B-C라는 분자에서 A와 C가 연결되어 있지 않아도, B를 통해 간접적으로 영향을 줄 수 있음.
  • MPNN은 이걸 잘 포착함 → 전체적인 약물의 물리·화학적 특성 파악 가능

3) 약물의 '부분적인 기능' → 지역 인코더 (Substructure Encoder)

지역 인코더가 하는 일:

  • 하나의 약물을 작은 부분 구조(서브그래프)들로 쪼개서 분석함.
  • 이 작은 구조들(예: 작고 반복되는 기능성 그룹들)은 종종 특정한 약리 작용을 나타냄.

예)

  • 특정 서브구조는 항염 작용,
  • 다른 서브구조는 간 독성 유발

중요한 이유?

  • 약물 전체를 분석하는 것도 중요하지만,
    실제 효능/부작용은 특정 부위의 구조에서 나오는 경우가 많음.
  • 그래서 부분 구조를 따로 뽑아내어, 세밀하게 기능을 분석하는 것도 매우 중요함.

 

SafeDrug는 약물 조합을 추천할 때, 부작용이 생기지 않도록 DDI를 효과적으로 제어하는 학습 방법(loss function)을 함께 사용한다.

실험을 통해, SafeDrug는 DDI를 기존보다 약물 부작용을 19.43% 넘게 줄였고, 실제로 병원에서 쓰인 약 조합과 AI가 추천한 약 조합이 더 비슷해지는 결과도 얻었다. (유사성 2.88% 개선) 게다가 SafeDrug는 이전 접근법보다 더 적은 매개변수를 요구하여, 약 14% 빠른 훈련과 추론 속도로 2배 속도 향상을 이끌어 냈다.

 


 

1. 서론
현재의 풍부한 건강 데이터, 예를 들어 장기적인 전자 건강 기록(EHR)과 웹에서 이용 가능한 방대한 생물의학 데이터는 연구자들과 의사들이 임상 결정 지원을 위한 더 나은 예측 모델을 구축할 수 있도록 합니다. 그중에서도 효과적이고 안전한 약물 조합을 추천하는 것은 특히 복잡한 건강 상태를 가진 환자를 돕기 위한 중요한 작업입니다. 약물 조합 추천의 주요 목표는 환자의 건강 상태에 기반하여 특정 환자에게 안전한 약물 조합을 개인 맞춤형으로 제공하는 것입니다. 이전의 약물 추천 모델들은 현재의 병원 방문에만 기반하는 사례 기반 모델이었습니다. 결과적으로 새로 진단받은 고혈압 환자는 만성적으로 조절되지 않는 고혈압을 앓고 있는 다른 환자와 동일하게 치료 받을 가능성이 높습니다. 이러한 한계는 추천의 안전성과 유용성에 영향을 미칩니다. 

 

현재는 병원 기록(EHR)이나 웹에서 얻은 방대한 생물의학 데이터를 통해, 의사나 연구자들이 보다 더 환자들을 위해 적합한 결정을 할 수 있도록 하는 AI 예측 모델을 만들 수 있다. 특히 여러 질병을 가진 환자에게 잘 맞는 안전한 약 조합을 추천하는 건 정말 중요한 일이다.

이 약물 추천의 핵심 목표는 환자의 상태에 딱 맞는 약 조합을 안전하게 골라주는 것이다. 기존 모델은 환자가 병원에 온 시점에만 집중해서 약을 추천하는 방식이었다. 그래서 이제 막 고혈압 진단을 받은 사람도, 오랫동안 고혈압을 앓은 환자와 똑같은 약을 받는 경우가 생겼다. 이는 약물추천의 유용성와 안정성을 떨어뜨리는 요인 중 하나이다.

 

이 문제를 극복하기 위해, [Le et al., 2018; Shang et al., 2019]와 같은 장기적인 방법이 제안되었습니다. 이들은 장기적 환자 이력 내의 시간적 종속성을 활용하여 보다 개인화된 추천을 제공합니다. 그러나 이들 또한 다음과 같은 한계점에 직면해 있습니다.

 

이를 해결하기 위해, [Le et al., 2018; Shang et al., 2019] 와 같은 이전 연구들은, 환자의 지난 건강 이력들을 활용하는 것을 제안했다. 

환자의 과거 치료 이력을 통해,  시간이 흐름에 따라 어떻게 변화했는지를 반영하여 더 개인화된 약을 추천하기 위함이다.

그러나 이들 또한 다음과 같은 한계점을 맞닥뜨렸다.


 

-기존 연구의 한계점-

 

부족한 약물 인코딩 (Inadequate Medication Encoding): 기존 연구들은 약물을 원-핫 인코딩 방식으로 표현하려고 합니다. 각 약물은 (이진) 단위로 간주되어, 약물의 의미 있는 분자 그래프 표현이 약물의 효능 및 안전성 프로필과 같은 중요한 약물 특성을 인코딩하고 있다는 점을 무시합니다. 또한, 분자의 하위 구조는 기능성과 상관관계가 있습니다. 이러한 지식은 약물 추천의 정확성과 안전성을 개선하는 데 유용할 수 있습니다.

 

문제는 기존 연구들이 약물을 단순히 0과 1로만 구분하는 코드로 표현하는 원-핫 인코딩 방식을 사용했다는 것이다. 

약물의 의미있는 분자 그래프 표현이 약물의 효능이나 안전성, 프로필과  같은 중요한 특성이 고려되어야 하는데, 각 약물이 이진단위로 간주되어버려서 전혀 고려되지 못하고 있다. 

약(분자)의 작은 구조 하나하나는 어떤 기능을 하는지와 깊은 관련이 있다. 따라서 분자 구조 정보를 잘 활용하면, 더 정확하고 안전한 약 추천이 가능해진다.


암시적이고 비제어 가능한 DDI 모델링 (Implicit and Non-controllable DDI Modeling): 일부 기존 연구들은 약물 간 상호작용(DDI)을 지식 그래프(KG)와 같은 부드럽거나 간접적인 제약 조건을 통해 모델링합니다. 이러한 DDI의 암시적 처리는 최종 추천에서 제어 불가능한 비율 또는 최적이 아닌 추천 정확도를 초래합니다.

기존에는 암시적이고 비제어 가능한 DDI 모델링으로 일부 기존 연구는 약물 간 부작용(DDI)을 직접 반영하지 않고, 간접적으로만 고려하였다. 그래서 이러한 암시적 처리로 인해 AI가 정확하게 통제하지 못하고, 위험한 약 조합을 추천하는 등 최적이 아닌 추천 정확도를 초래하였다.

더보기

"부드러운 모델링(soft modeling)"이란?

어떤 것을 정확한 수치나 규칙으로 '강하게' 제한하지 않고,
간접적인 연결이나 확률 기반의 관계로 처리하는 방식

예) 지식 그래프에서 DDI를 soft하게 모델링하면?

  • “A약과 B약은 ‘관계 있음’이라고 연결되어 있어.”
  • “이 관계는 위험할 수도 있고, 아닐 수도 있어.”
  • 즉, 명확하게 위험하다고 판단하진 않고, 그냥 관련이 있는 정도로 인식함.

DDI에서의 문제 ⚠ 

  • 부작용을 직접적으로 유발하는, 아주 중요한 안전 이슈임.
  • DDI를 잘못 다루면 생명을 위협할 수 있음
    • 예: 심장약 + 항생제 → 심장 박동 이상
    • 항혈전제 + 해열진통제 → 위장 출혈 위험 증가

 soft modeling이 위험한 이유?

문제점 설명
간접성 “이 약과 저 약은 관련 있어” 수준 → 실제 위험도 파악이 불가능
비제어성 DDI 위험이 높아도, 모델이 추천을 막을 방법이 없음
목표 조절 불가 예: “DDI 비율을 10% 이내로 줄여야 해!” 같은 명확한 제약 설정이 불가

✅   => SafeDrug은 ‘명시적 제어’를 한다 !!

(뒤에서 다룰 내용)

  • SafeDrug은 PID 제어기에서 영감 받은 loss function을 써서
    → 추천 과정 중 DDI가 기준을 넘으면 벌점(패널티)를 부여함
    → 학습 과정에서 DDI를 줄이는 방향으로 유도

ㄴ> 부작용 위험 있는 조합은 자동으로 피하고, 목표 DDI 수준(예: 5% 이하) 같은 제한도 줄 수 있음!

 

 

여기까지 '약물 추천'에서의 기존 연구들의 한계와 Safe Drug의 등장 배경이다.

 

이처럼 기존 연구들은 약물의 구조적 정보나 DDI를 제대로 활용하지 못해, 정확도와 안정성 측면에서 한계를 보였다.
이러한 문제를 해결하기 위해,  SafeDrug은 약물의 분자 구조와 DDI를 명시적으로 고려한 새로운 접근을 제안한다.  

 


 

 

너무 글이 길어진 관계로  SafeDrug이 등장하게 된 배경은 여기까지!
다음 글에서는 SafeDrug이 실제로 어떤 구조를 갖고 있고, 약물 추천을 어떻게 수행하는지 구체적으로 살펴보겠습니다.

 

728x90
반응형
LIST