autodidact · joonan-lab learning guide

새 주제를 한 페이지로
스스로 익힌다

본 페이지는 고려대 인간유전체 연구실(https://joonanlab.github.io/)에 온보딩 하는 학생들을 위해, 그리고 새로운 주제를 공부하기 위해 만든 사이트입니다. 유전학, 오믹스 인공지능 모델, 생물학에 대한 기초를 다룹니다.

Autodidact는 그리스어 αὐτός(스스로)와 διδακτός(배운)에서 온 말입니다. 낯선 연구 주제를 자기 속도로 질문하고, 만지고, 다시 설명하며 익히는 태도를 뜻합니다.

가상세포

단일세포 시퀀싱이 인간 뇌를 어떻게 그려내는지(atlas)에서 출발해, 그 위에 학습되는 foundation model이 어떤 어휘로 셀을 다루는지(scFM), RNA·protein·DNA·structure·spatial까지 묶는 멀티모달 파운데이션 모델로 어떻게 확장되는지까지. 가상세포(Virtual Cell)를 만드는 흐름을 atlas → scFM → 멀티모달 세 카드로 따라갑니다.

atlas · timeline

인간 뇌 단일세포 시퀀싱 연구 지도

BrainSpan부터 BICCN, MERFISH, multiome, aging, Tri-IPC, cortical regionality까지 인간 뇌 single-cell/single-nucleus sequencing 연구를 연대별 발견과 셀타입 의미로 정리한 한글 학습 지도입니다. 그래픽 요약, 논문 타임라인, 하위 셀타입 quick map, regional-specific 발견 매트릭스, 검색 가능한 카탈로그를 포함합니다.

페이지로 들어가기
foundation model

싱글셀 파운데이션 모델

scBERT(2022)부터 Tahoe-x1·scPRINT-2·Geneformer V2(2025-26)까지 scRNA-seq 기반 가상세포 파운데이션 모델 (scFM)의 4년 가속을 한 페이지로. 기초 개념(scRNA-seq·transformer·토큰화·foundation model) → 토큰화 전략 풍경 → 모델 비교 테이블(파라미터·corpus·context·objective·license) → HEIMDALL 토크나이저 분해(FG×FE×ORDER) → Reality Check 시리즈(Kedzierska·Csendes·Wei·Bereket) → Virtual Cell 비전.

페이지로 들어가기
multimodal · methodology

멀티모달 파운데이션 모델 — 레이어, 토큰, 패턴

single-cell·protein·DNA·structure·spatial을 한 모델로 묶는 방법론을 한 페이지로. layer math(Transformer·VAE·Discrete Diffusion) 수식, 토큰화 전략(rank·bin·projection·LLM-text·cCRE·perturbation·structure) 인터랙티브, single-modal vs multimodal-only 태스크 비교, 아키텍처 패턴(Concatenation·WNN·Joint VAE·Dual-aligned VAE·UnitedNet·scGPT·CLIP-style·DPLM-2·Geometric DL) 다이어그램 switcher, 2024–2026 트렌드(scaling laws·token unification·perturbation atlases·CLIP·virtual cell), 모델 카탈로그와 논문 검색을 포함합니다.

페이지로 들어가기

DNA 언어 모델

DNA 언어 모델은 염기서열을 읽는 모델에서 출발하지만, 실제 변이 해석은 splice site, exon-intron boundary, regulatory sequence까지 이어집니다. 이 트랙은 genomic language model의 attention 직관과 스플라이싱 메커니즘, 이소폼, 변이 예측 모델을 한 흐름으로 묶어 읽습니다.

attention lens

gLM Attention Lens — genomic language model은 DNA에서 무엇을 보는가

DNABERT, DNABERT-2, Nucleotide Transformer, GROVER, Enformer, HyenaDNA, Caduceus, ARSENAL을 중심으로 tokenization, self-attention, long-range regulatory context, reverse-complement prior, nucleotide dependency map을 비교하는 학습용 인터랙티브입니다.

페이지로 들어가기
mechanism · spliceosome

스플라이싱 메커니즘 — 스플라이소좀과 두 단계 반응

GU-AG·AT-AC·GC-AG splice site consensus, 5'SS·BP·PPT·3'SS 네 요소, U1~U6 snRNP 조립 순서(E→A→B→Bact→C→C*→P), 두 단계 트랜스에스터화(lariat 형성 → exon ligation), U2-type vs U12(minor) spliceosome, recursive splicing을 인터랙티브 다이어그램으로 익힙니다.

페이지로 들어가기
isoform · NMD · therapeutics

스플라이싱과 이소폼 다양성 — exon skipping부터 NMD까지

Exon Skipping(~40%)·Alt 5'/3' SS(~25%)·Intron Retention(~15%)·MEE(~5%) 유형 비교, ESE/ESS/ISE/ISS 조절 요소, DSCAM 38,016 이소폼 조합, SMN2 exon 7 skipping과 SMA 기전, NMD 55 nt 규칙과 EJC, ataluren PTC readthrough, ASO/SSO 치료 전략을 다룹니다.

페이지로 들어가기
ACMG · ClinGen · variant scoring

스플라이싱 변이 분류 — ACMG/ClinGen 기준과 임상 워크플로우

PVS1·PS3·PM2·PP3·BS3·BP7·BA1 기준, SpliceAI delta score 임계값(0.2/0.5/0.8), 동의어 변이·인트로닉 변이의 ESE/ESS 효과, canonical splice site와 deep intronic 분류 흐름, RNA assay 증거 통합, 임상 분류 시뮬레이터를 한 페이지에 모았습니다.

페이지로 들어가기
SpliceAI · AbSplice · CADD-Splice

스플라이싱 AI 모델 — SpliceAI, AbSplice, CADD-Splice 비교

SpliceAI(DS_AG·DS_AL·DS_DG·DS_DL 4개 delta score), AbSplice(Wagner et al. 2023 Nat Genet 55:107, 조직별 이상 스플라이싱 확률), CADD-Splice(Rentzsch et al. 2021 Genome Medicine, PHRED 스케일 통합 점수)를 중심으로 아키텍처, 학습 데이터, 출력 해석, 임상 적용 범위를 비교합니다.

페이지로 들어가기
interactive viz · foundation model

게놈 파운데이션 모델 진화 지도

게놈 파운데이션 모델의 아키텍처 계보(Transformer→SSM→Hybrid), 토큰화 전략, 적용 범위 확장, 예측→설계 스펙트럼, gLM vs Activity Predictor의 수렴 흐름을 인터랙티브 차트로 탐색합니다.

페이지로 들어가기

유전학

Common SNP에서 rare variant까지, GWAS peak를 causal variant로 좁히는 fine-mapping, tandem repeat의 motif·copy-number·context 해석, genetic variant의 functional effect를 측정하는 MPRA·perturbation assay, RNA-seq count에서 DEG를 찾는 negative-binomial 모델까지. 통계 모델과 실험 readout이 어디서 신호를 잡고 어디서 막히는지를 조작해보며 익힙니다.

methodology · 방법론

유전 연관분석 방법 — GWAS, TADA, Burden, SKAT, CWAS

Common SNP, de novo variant, rare coding burden, rare noncoding CWAS, SKAT/SKAT-O, GLMM/REGENIE, LDSC/S-LDSC, MAGMA, PRS가 각각 어떤 신호를 포착하는지 설명하는 한글 인터랙티브. 대립유전자 빈도 / 효과 크기 지형도, 방법 선택기, GWAS·희귀변이·TADA 직관 콘솔, 분석 워크플로우, 핵심·예시 출처 링크를 포함합니다.

페이지로 들어가기
interactive · locus plot

GWAS Fine-Mapping — PIP, Credible Set, Functional Prior

GWAS peak를 causal variant 후보로 좁히는 과정을 조작형 locus plot으로 풀어둔 한글 인터랙티브. LD block 폭, GWAS 정보량, 기능 prior, ancestry LD 다양성, secondary signal을 바꾸며 PIP와 95% credible set이 어떻게 움직이는지 확인하고, SuSiE/FINEMAP/PolyFun/colocalization/MPRA/cross-ancestry 문헌 지형까지 이어서 읽을 수 있습니다.

페이지로 들어가기
MPRA · perturbation · saturation editing

Variant Effect Measurement — MPRA와 Perturbation Methods

genetic variants의 effect를 어디서 측정하는지 정리한 한글 인터랙티브. MPRA/lentiMPRA, native QTL, CRISPRi/a와 deletion scanning, Perturb-seq/CROP-seq, MAVE/DMS/SGE, base·prime editing, in silico mutagenesis와 foundation model을 assay ladder로 비교하고, 연구 질문별 추천 stack과 claim strength, 문헌 지도를 함께 봅니다.

페이지로 들어가기
STR · VNTR · expansion

Tandem Repeat Atlas — motif, expansion, technology

tandem repeat을 motif, copy number, genomic context, sequencing technology까지 함께 움직이며 이해하는 한글 인터랙티브. STR/VNTR, repeat expansion, short-read genotyping, EHdn/STRling outlier screen, TRGT/TRExplorer/vclust long-read resolution, ASD·disease-locus 해석과 문헌 지도를 한 화면에서 비교합니다.

페이지로 들어가기
RNA-seq · DEG · pseudobulk

RNA-seq DEG와 Pseudobulk 분석 — count에서 조건 효과까지

RNA-seq differential expression의 원리를 초보자용 수식과 시뮬레이터로 익히는 한글 인터랙티브. count matrix, size factor, negative binomial dispersion, log2FC, Wald test, FDR, DESeq2/edgeR/MAST, single-cell pseudo-replication, donor 단위 pseudobulk, batch/confounder 체크리스트와 문헌 지도를 함께 봅니다.

페이지로 들어가기
ACMG/AMP · ClinGen · variant interpretation

ACMG/AMP 변이 해석 가이드라인 — Criteria와 ClinGen 적용

2015 ACMG/AMP guideline의 evidence criteria를 pathogenic direction과 benign direction으로 나누어 정리한 한글 인터랙티브. ClinGen criterion-specific guidance, VCEP/CSpec 적용 순서, PP3/BP4 computational cutoff, SpliceAI decision tree를 함께 확인합니다.

페이지로 들어가기

ASD 유전학과 인간 조직 모델

ASD 유전학 연구의 코호트, 표현형, 유전적 조성을 먼저 정리하고, 이어서 오가노이드가 어떤 세포원과 배양 로직으로 인간 조직 모델을 만드는지 연결해서 읽습니다.

cohort atlas · ASD genetics

자폐 유전체 코호트 아틀라스

AGRE, SSC, SPARK, ASC, iPSYCH/PGC, MSSNG, K-ARC, GALA 등 대표 ASD 코호트를 유전체 증거 레이어별로 탐색합니다. 앞부분에서 simplex/multiplex 코호트 구조, ADOS·ADI-R·SRS·Vineland·IQ 같은 표현형 측정, common SNP/PRS·de novo coding·CNV/SV·STR·noncoding WGS·sex/ancestry 효과의 의미와 대략적 기여도를 먼저 잡습니다.

페이지로 들어가기
interactive viz · ASD genetics

ASD 유전 아키텍처 인터랙티브 맵

공개 문헌에서 정리한 ASD 유전학 연구를 바탕으로 변이 유형별 기여도, 발견 타임라인, 유전자 네트워크 수렴, 성별 차이, 기술 해상도 진화를 인터랙티브 차트로 탐색합니다.

페이지로 들어가기
interactive viz · brain enhancer

ASD 뇌 인핸서 조절 지도

ASD 관련 뇌에서 인핸서와 조절 요소가 어떻게 달라지는지 살펴봅니다. 기술-해상도 진화, 조절 요소 규모, 세포유형별 신호, 수렴 증거를 인터랙티브 차트로 탐색합니다.

페이지로 들어가기
database · organoid methods

오가노이드 연구 지도

뇌, 신장, 간, 폐/기도, 장, 망막, 심장, NAM/방법론 연구를 논문 단위 데이터베이스로 탐색합니다. 입문 섹션에서 오가노이드의 정의, adult stem cell vs hESC/hiPSC vs patient iPSC, Matrigel/BME·suspension·ALI·assembloid·organ-on-chip 배양 방식, identity·maturity·function·reproducibility 평가 기준을 먼저 확인합니다.

페이지로 들어가기

암 멀티오믹스와 분해생물학

암은 단백질을 만드는 문제이기 전에 분해의 문제다. E3 리가아제와 DUB가 substrate를 잘못 고르는 순간, 종양 단백질이 안정화되거나 종양억제자가 사라진다. 멀티오믹스 — 게놈·전사체·프로테옴·인산화체·유비퀴티놈 — 가 함께 등장해야 보이는 신호를, 유비퀴틴 기초 개념과 암 해석 흐름으로 정리합니다.

ubiquitin × cancer · multi-omics

유비퀴틴 × 암 — 분해 코드와 멀티오믹스

유비퀴틴-프로테아좀 시스템(UPS) 기초부터 사슬 코드(K48·K63·M1·K11·K6·…), 종양억제 vs 종양촉진 E3 리가아제 아틀라스(MDM2·VHL·BRCA1·CRBN·SKP2…), DUB 아틀라스(USP7·BAP1·USP22·CYLD), 멀티오믹스 레이어 시뮬레이터(RNA→단백질→인산화→유비퀴틴화 분기 시나리오), 암 기전 축(cell cycle·p53·DDR·hypoxia·ERAD·autophagy·mitophagy·immune), PROTAC·분자글루 메커니즘, 헷갈리는 개념 비교, 학습 카드를 한 페이지에 담은 한글 인터랙티브.

페이지로 들어가기
spatial transcriptomics × cancer · L-R analysis

암 × 공간전사체 읽기 지도

Visium, Visium HD, Xenium, MERSCOPE 등 RNA 기반 공간전사체 플랫폼이 암 조직에서 어떻게 쓰이는지 정리한 인터랙티브 시각화입니다. 플랫폼별 샘플 규모, 공간 해상도, 유전자 패널, L-R (리간드-수용체) 분석 도구와 주요 L-R pair의 관계를 함께 봅니다.

페이지로 들어가기
cancer proteogenomics · MS/PTM

암 단백체·PTM 읽기 지도

인간 암 proteogenomics 연구에서 proteome, phosphoproteome, acetylome을 어떤 단위로 측정하는지 읽는 한글 학습 지도입니다. TMT/iTRAQ/DIA 정량 전략, IMAC·TiO2·K-ac enrichment, Orbitrap 계열 장비 선택, peptide·protein group·phosphosite·acetylsite 단위 차이를 함께 읽습니다.

페이지로 들어가기
cancer proteogenomics · CPTAC · multi-omics markers

CPTAC 암 멀티오믹스 마커 랜드스케이프

Clinical Proteomic Tumor Analysis Consortium (CPTAC) 의 Cell / Cancer Cell 핵심 논문 10편을 종합한 인터랙티브 시각화. 9가지 암종(대장·신장·자궁내막·폐선·유방·소아뇌·교모세포종·췌장·폐편평·난소)에서 단백체·인산화체·아세틸화체·당단백체 정량 규모, 치료 타겟 마커, PTPN11/Rb 인산화/면역 아형 같은 교차 암종 패턴을 원문 PDF 기반 수치로 비교합니다.

페이지로 들어가기

다음 트랙 (작성 중)

coming soon