autodidact study map

자폐 유전체 코호트 아틀라스

자폐 스펙트럼 장애(ASD) 연구에서 자주 만나는 코호트, 유전체 분석 층위, 표현형 측정, 유전적 기여도를 한 페이지에서 이어 봅니다. “어떤 코호트에서, 어떤 변이를, 어떤 표현형과 엮어 해석하는가”를 먼저 잡은 뒤 논문 데이터베이스로 들어갑니다.

먼저 보는 코호트 지도

ASD 유전체 연구의 결과는 “누구를, 어떤 방식으로 모았는지”에 크게 좌우됩니다. 같은 ASD라도 simplex 가족, multiplex 가족, 병원 기반 코호트, 웹 모집 코호트, 국가 레지스트리는 각자 잘 답하는 질문이 다릅니다.

cohort logic
simplex trio / quad

새로 생긴 de novo 변이를 찾기 좋음

부모와 자녀, 때로는 비진단 형제를 함께 시퀀싱합니다. SSC처럼 한 가족에 ASD 자녀가 한 명인 구조에서는 부모에게 없던 새 변이가 아이에게 생겼는지 직접 볼 수 있습니다.

multiplex family

가족 안에서 물려받은 위험을 보기 좋음

AGRE, iHART처럼 ASD가 여러 명 있는 가족은 inherited rare variant, polygenic background, 형제 간 유전적 차이 비교에 강합니다.

registry / case-control

common variant와 PRS에 유리함

iPSYCH/PGC, Swedish/PAGES처럼 수만 명 이상의 사례-대조군 또는 인구 레지스트리는 효과가 작은 SNP들을 많이 모아 SNP heritability와 PRS를 추정합니다.

ancestry-aware cohort

한 인구집단의 답을 모두에게 일반화하지 않기

K-ARC, GALA, Japanese WES 같은 비유럽 코호트는 유럽 중심 결과가 다른 조상 배경에서도 통하는지, 또 새로운 유전자와 변이가 드러나는지 확인합니다.

1. 모집가족 구조, 진단 기준, 조상 배경, 함께 나타나는 형질 기록이 정해집니다.
2. 표현형ADOS, ADI-R, IQ, Vineland, 언어/발달 이력처럼 여러 축을 측정합니다.
3. 유전체array, WES, WGS, CNV/SV, STR, PRS 같은 분석 층위를 고릅니다.
4. 통계GWAS, TADA, burden, pTDT, category-wide association, family-relative 모델을 씁니다.
5. 해석진단 전체 평균인지, 표현형 하위축인지, 가족 배경을 제거한 효과인지 구분합니다.

표현형 측정은 “심한 정도” 하나가 아닙니다

유전체 신호는 진단명 하나보다 사회성, 언어, 인지, 적응행동, 반복행동, 발달 이정표, 함께 나타나는 형질 같은 여러 표현형 축에서 더 선명해질 때가 많습니다.

phenotypes
ADOS / CSS

관찰 기반 핵심 ASD 특성

훈련된 평가자가 사회적 상호작용, 의사소통, 제한적/반복 행동을 직접 관찰합니다. Calibrated Severity Score는 연령과 언어 수준 차이를 줄여 비교하려는 지표입니다.

ADI-R

보호자 면담 기반 발달 이력

초기 발달, 사회성, 의사소통, 반복행동을 보호자 면담으로 복원합니다. 현재 상태뿐 아니라 유아기부터의 궤적을 잡는 데 유용합니다.

SRS / SCQ / AQ

연속적인 자폐 특성 점수

진단 여부만 보지 않고 사회적 의사소통과 반복행동 특성이 어느 정도인지 점수화합니다. 가족 구성원과 일반 인구의 broad autism phenotype을 볼 때도 쓰입니다.

IQ / DQ / NVIQ

인지와 발달 수준

언어 IQ, 비언어 IQ, 발달지수는 유전 신호와 강하게 얽힙니다. de novo 고영향 변이는 ASD 핵심 특성보다 IQ와 발달지연 쪽에 더 강하게 보일 수 있습니다.

Vineland / VABS

일상 적응 기능

의사소통, 일상생활, 사회화, 운동 기능을 봅니다. 실제 생활에서 얼마나 도움을 필요로 하는지와 연결되며 CNV/희귀 변이 영향 해석에 자주 쓰입니다.

milestones / co-occurrence

언어, 운동, 함께 나타나는 형질

첫 단어, 보행, 퇴행, 발작, ADHD, 수면, GI 문제, 운동 협응 등은 ASD 안의 생물학적 하위축을 찾는 단서가 됩니다.

읽는 법: 표현형은 “나쁘다/좋다”보다 어떤 축이 어느 방향으로 달라지는지가 중요합니다. Warrier 2022, Antaki 2022, Litman 2025, Kim 2025 WFSD 계열 연구는 ASD 진단 평균보다 표현형 축과 가족 배경을 분리해서 봅니다.

유전적 조성: 작은 효과가 많은가, 큰 효과가 드문가

ASD 유전학에는 common SNP, rare de novo coding variant, CNV/SV, inherited rare variant, noncoding WGS, STR, sex/ancestry 효과가 함께 놓여 있습니다. 숫자는 코호트와 모델에 따라 달라지므로 “대략 어느 층위가 무엇을 설명하는가”로 읽는 편이 안전합니다.

genetic architecture
common SNP / PRS

효과는 작지만 매우 많음

개별 SNP의 효과는 약합니다. 그래서 수천-수만 개 변이를 합쳐 PRS로 봅니다. Grove 2019는 18,381 cases/27,969 controls에서 5개 genome-wide loci와 SNP heritability 약 11%를 보고했습니다.

variance모델별 약 11%에서 common variation 49.4%까지 다르게 추정
use진단 위험, age at diagnosis, core-feature heterogeneity
rare de novo coding

드물지만 변이 하나의 영향이 큼

부모에게 없는 PTV/damaging missense가 아이에게 생긴 경우입니다. ASC/Satterstrom 2020은 102개 ASD risk gene(FDR <= 0.1)을, Zhou 2022는 통합 분석에서 60개 exome-wide significant gene을 제시했습니다.

contributionWGS 연구에서 de novo 기여 30-39%, low-risk simplex 52-67% 추정
phenotypeIQ, adaptive behavior, milestones와 강하게 연결
CNV / SV

유전체 조각의 삭제/중복

Sebat 2007은 de novo CNV가 sporadic ASD 10.2%, control 1.0%에서 보인다고 보고했습니다. 16p11.2, 7q11.23 duplication, NRXN1, SHANK2 같은 큰 구조 변이는 해석 단위가 유전자 하나보다 큽니다.

effectpenetrance와 표현형 범위가 크며 ID/DD와 겹침
contributionrecurrent de novo CNV가 대략 5-10% ASD risk에 기여
inherited rare / two-hit

가족 배경과 함께 쌓이는 위험

multiplex 가족에서는 물려받은 희귀 변이와 polygenic background가 중요해집니다. MSSNG 연구는 affected sibling pair의 69.4%가 서로 다른 ASD-relevant mutation 조합을 가질 수 있음을 보였습니다.

modelburden, transmission, co-occurrence, family-relative deviation
meaning같은 가족, 같은 진단이어도 유전 경로가 다를 수 있음
WGS noncoding / STR

exome 밖의 조절 변이와 반복서열

WGS는 promoter, conserved noncoding element, chromatin interaction, short tandem repeat expansion을 봅니다. Turner 2016은 regulatory de novo candidate가 약 10% families에 있을 수 있음을 제안했고, Trost 2020은 17,231 genomes에서 repeat expansion 층위를 열었습니다.

effect개별 해석은 어렵지만 세포형/조절맥락과 연결 가능
assayWGS, STR caller, CWAS/category-wide tests
sex / ancestry

누가 표본에 들어왔는지가 결과를 바꿈

여아 ASD에서 더 높은 mutational burden을 보고한 연구들이 있고, X chromosome 분석에서는 20개 loci의 59개 significant variant가 제시됐습니다. GALA는 4,717명의 ASD admixed American/Latin American 참여자에서 35개 gene(FDR < 0.05)을 보고했습니다.

whyfemale protective effect, ascertainment, ancestry LD가 섞임
cohortsK-ARC, GALA, Japanese WES, SPARK multi-ancestry

증거 레이어

하나의 논문은 common, coding, phenotype처럼 여러 레이어에 동시에 속할 수 있습니다.

타임라인

가족 리소스와 array CNV에서 multi-ancestry sequencing, 표현형 분해 유전학으로 이동한 흐름입니다.

코호트 x 증거 매트릭스

셀 값은 이 아틀라스 안에서 해당 코호트와 레이어를 동시에 다룬 출판 논문 수입니다.

대표 코호트

통합 분석에서는 표본이 서로 겹칠 수 있으므로 규모는 독립 표본 수가 아니라 보고된 맥락으로 읽어야 합니다.

출판 연구 테이블

행을 클릭하면 오른쪽에서 코호트, assay, 규모, 발견 요약을 볼 수 있습니다.

Year Paper Cohort Assay Layers Main finding