Autodidact / 방법론 해설
GWAS POST-ASSOCIATION WORKBENCH

GWASFine-Mapping

GWAS peak를 “가장 작은 P값의 SNP”에서 멈추지 않고, LD 안에 묶인 후보 variant들의 posterior inclusion probability, 95% credible set, functional prior, colocalization, cross-ancestry 근거로 압축해 실험 우선순위를 정하는 과정입니다.

Lead ≠ causalindex SNP는 보고용 표지일 뿐, 실제 기능 variant와 다를 수 있습니다.
PIP각 후보가 causal일 posterior probability를 분배합니다.
95% CSPIP를 큰 순서로 더해 95%가 되는 최소 후보 집합입니다.
association peak LD topology posterior priority
Locus view: association, LD, PIP
점 높이 = -log10(P), 점 크기 = PIP, 색 = causal 후보와의 LD r²
rs?lead SNP by association
rs?highest PIP candidate
0 variants95% credible set size
0.00credible set mean r²
high LD / high PIP
moderate LD
low LD proxy
functional annotation
secondary signal

variant

후보를 선택하면 posterior, LD, annotation 근거가 표시됩니다.

해석

Fine-mapping은 정답 확정이 아니라 실험 우선순위를 줄이는 확률적 압축입니다.

Paper atlas
0 papers shown

출간 논문에서 본 다섯 가지 전개 방식

아래 사례는 “처음 어떤 신호를 발견했는가”, “그 신호를 어떻게 좁히고 분석했는가”, “그 뒤 생물학적 주장으로 어떻게 전개했는가”의 흐름으로 읽습니다. 좋은 fine-mapping 논문은 PIP 하나로 끝나지 않고, LD, ancestry, eQTL, reporter assay, CRISPR 같은 서로 다른 증거층을 이어 붙입니다.

Nature 2010LDL-C / SORT1

1p13 locus: association peak에서 rs12740374 기능 변이로

Musunuru et al.은 LDL-C와 MI에 강하게 연관된 1p13 신호를 “가장 작은 P값”이 아니라 regulatory mechanism으로 풀어낸 고전적 사례입니다.

찾은 출발점
유럽계 대규모 GWAS에서 1p13이 LDL-C 최강 locus였고, 여러 SNP가 긴 LD 안에서 비슷하게 유의했습니다.
분석
아프리카계 약 9,000명에서 LD가 깨지는 점을 이용해 rs12740374를 가장 강한 후보로 좁혔고, 간 eQTL, luciferase single-SNP switching, EMSA/ChIP로 minor allele이 C/EBP 결합 부위를 만든다는 것을 확인했습니다.
전개
“비코딩 SNP가 SORT1 간 발현을 바꾼다”에서 멈추지 않고, AAV8 Sort1 과발현과 siRNA knockdown으로 VLDL secretion과 LDL-C 변화를 보여 주며 variant → TF binding → gene expression → lipid phenotype의 사슬을 제시했습니다.
Nature 2016SCZ / C4

MHC locus: SNP fine-mapping으로 안 보이던 C4 구조변이

Sekar et al.은 조현병 MHC 신호가 단순 SNP나 HLA allele이 아니라 C4 structural haplotype과 C4A brain expression으로 설명된다는 방향으로 분석을 뒤집었습니다.

찾은 출발점
PGC 조현병 GWAS에서 MHC가 가장 강했지만, 수백 개 유전자와 복잡한 LD 때문에 표준 SNP 해석으로는 원인을 고르기 어려웠습니다.
분석
ddPCR와 trio phasing으로 C4AL/C4AS/C4BL/C4BS 구조 haplotype reference를 구축하고, 이를 28,799 cases / 35,986 controls에 impute했습니다. 예측 C4A expression이 p=3.6e-24로 연관됐고, C4 구조 allelic series가 risk ordering을 설명했습니다.
전개
이후 postmortem brain에서 C4A가 조현병에서 높고, C4 단백질이 synapse에 위치하며, C4 결핍 마우스에서 retinogeniculate pruning이 흐트러지는 것을 보여 “과도한 complement-mediated pruning”이라는 병리 모델로 확장했습니다.
Transl Psychiatry 2020ASD / DDHD2

SPARK ASD: lead SNP가 아니라 rs7001340이 regulatory 후보

Matoba et al.은 family-based GWAS와 MPRA를 연결해, 새로운 chr8 ASD locus의 기능 후보와 target gene을 분리했습니다.

찾은 출발점
SPARK 6,222 case-pseudocontrol pairs에서 rs60527016 chr8 locus가 genome-wide significant였고, iPSYCH-PGC meta-analysis로 ASD common-variant 신호를 확장했습니다.
분석
chr8 300 kb LD block의 98 credible SNP를 MPRA로 테스트했습니다. 가장 강한 allelic regulatory effect는 index SNP가 아니라 37 kb 떨어진 rs7001340이었고, risk allele T가 reporter expression을 낮췄습니다.
전개
fetal/adult brain eQTL에서 rs7001340 risk allele이 DDHD2 expression 감소와 같은 방향을 보였고, postmortem ASD cortex에서도 DDHD2 downregulation이 확인되어 distal regulatory variant → DDHD2 misregulation이라는 해석으로 발전했습니다.
Nat Genet 2024MDD / ancestry

Major depression: ancestry LD diversity가 credible set을 줄임

Meng et al.은 특정 한 변이의 실험 검증 대신, 다중 ancestry GWAS가 fine-mapping 해상도 자체를 어떻게 바꾸는지에 초점을 맞췄습니다.

찾은 출발점
기존 MDD GWAS가 유럽계에 치우쳐 있었기 때문에, 21개 diverse cohort와 유럽계 자료를 합쳐 345,389 cases / 1,469,702 controls 규모의 meta-analysis를 수행했습니다.
분석
22,941,580 SNP를 분석해 169 loci와 53 novel associations를 찾고, 155 significant loci에 multi-ancestry Bayesian fine-mapping을 수행했습니다. 99% credible set median은 유럽계 단독 65.5 variants에서 multi-ancestry 30 variants로 줄었습니다.
전개
저자들은 “더 큰 N”만이 아니라 “다른 LD 구조”가 proxy를 분리한다는 점을 강조했고, TWAS, FUMA, MAGMA, HiC-MAGMA, eQTL/pQTL colocalization으로 PCDH9, TMEM106B 등 gene prioritization까지 이어 갔습니다.
Cell 2025MPRA / psychiatric

Cross-disorder MPRA: fine-mapping과 실험 신호의 불일치

Lee et al.은 psychiatric GWAS loci에서 통계적 credible set과 MPRA emVar가 겹치지만 완전히 같지는 않다는 점을 대규모로 보여 줍니다.

찾은 출발점
PGC cross-disorder GWAS의 136 loci에서 p<1e-5 변이 17,841개를 골라 human neural progenitors MPRA에 넣었습니다.
분석
13,311 QC-passing variants 중 683 emVars를 찾았고, FINEMAP/SuSiE/CAVIAR credible set과 비교했습니다. 6,805 credible-set variants는 emVar가 아니었고, 반대로 438 emVars는 세 fine-mapping 결과 어디에도 없었습니다.
전개
RERE rs301804와 DCC rs4513167/rs4614799는 eQTL/ABC/chromatin-contact로 target을 예측한 뒤 hiPSC-neuron CROP-seq로 검증했습니다. 결론은 “fine-mapping은 기능 검증 후보를 줄여 주지만, regulatory readout은 독립 증거층”이라는 쪽입니다.
방법 선택 매트릭스
fine-mapping 결과를 읽을 때 반복해서 확인할 질문입니다.
상황먼저 볼 것위험 신호
summary statistics만 있음SuSiE-RSS, FINEMAP, ABF와 ancestry-matched LD referenceLD reference mismatch, allele flip, imputation 품질 차이
credible set이 너무 큼cross-ancestry meta, larger N, functional prior, secondary signal check긴 LD block, 낮은 정보량, locus boundary가 너무 좁거나 넓음
eQTL colocalization이 있음PP(H4), tissue/cell-state relevance, SuSiE-coloc multi-signal 구조H3와 H4 혼동, GTEx bulk tissue context 부족, PP4 낮음을 부정 증거로 과해석
functional prior가 강함annotation source, disease-relevant cell type, prior sensitivity틀린 세포형 annotation이 posterior를 과신하게 만듦
mechanism까지 주장MPRA, allele editing, CRISPR perturbation, animal/cellular phenotype통계적 fine-mapping만으로 causal mechanism을 확정하는 주장