
Molecular property prediction (분자 속성 예측)은,
화합물(분자)의 구조를 바탕으로 그 분자가 가지는 물리적, 화학적, 생물학적 특성을 예측하는 것이다. 신약 개발, 소재 탐색, 독성 평가 등 다양한 분야에서 쓰이고 있다.
1) 무엇을 예측할까?
즉, 분자 속성(Moleculer property)이라는 것은 무엇을 말하는가?

2) 어떻게 예측할까?
1. 입력 (분자 표현)
: SMILES, 분자 그래프, 분자 지문(Morgan fingerprint), 3D 구조 등
2. 모델 (기계 역학습/딥러닝)
: 랜덤 포레스트, XGBoost, GNN(Graph Neural Network), Transformer 기반 모델 등
3. 출력 (예측 결과)
1) 분류(Classification): 이 분자가 독성이 있는가? (Yes/No)
2) 회귀(Regression): 이 분자의 logP 값은 얼마인가?
Prediction of Physicochemical Properties (물성 예측)이란,
물질(특히 분자나 화합물)이 갖는 물리적 또는 물리화학적 특성을 계산적 방법(= 모델)으로 예측하는 작업이다.
→ 실험 없이 분자의 구조만 보고, 그 물질의 성질을 예측하는 것이 목적.
1) 예측하려는 것, 즉 물성이란 무엇인가?

2) 어떻게 예측할까?
1. 입력 (분자 구조)
: SMILES, 분자 그래프, 3D 좌표
2. 모델
1) 전통적 모델 - QSAR, Random Forest, SVM
2) 딥러닝 - GNN, Transformer, ChemBERTa 등
3. 출력
1) 끓는점 = 234.5°C
2) LogP = 1.8
3) 용해도 = low / high (분류)
분자 특성 예측은 물성 뿐 아니라 약리적, 전자적, 생물학적 특성을 포함하지만, 물성 예측은 물리적 성질에만 집중한 예측으로, 모든 물성은 분자 특성이다.

'💻 본업(컴공생) 이야기 > 의료 데이터 공부 이야기' 카테고리의 다른 글
🧬 분자 핑거프린트(Finger Print)란? (2) | 2025.07.15 |
---|---|
[의료 데이터 🩺] 4. Risk Stratification (위험 계층화), Part 1 (1) (13) | 2025.02.03 |
[의료 데이터 🩺] 2-3. Clinical Care/Data (0) | 2025.02.03 |
[의료 데이터 🩺] 1. What makes Healthcare Unique? (20) | 2025.01.23 |