Tandem repeat · STR · VNTR · expansion
Tandem repeat은 왜 variant calling 밖으로 자꾸 새는가
Tandem repeat은 motif가 몇 번 반복되는지만의 문제가 아니다. 같은 `CAG`라도 coding exon, intron, enhancer, splice-proximal region, mobile-element 안에서 전혀 다른 allele이 된다. 이 페이지는 motif, copy number, context, sequencing technology를 함께 움직이며 어떤 질문에 어떤 repeat method가 필요한지 보여준다.
HipSTR, GangSTR, lobSTR는 많은 known STR loci를 cohort scale로 genotype한다. Strength는 breadth와 sample size다. Weakness는 read length 밖 allele, stutter, motif composition, flanking complexity다. Association result는 catalog/QC와 함께 읽어야 한다.
ExpansionHunter Denovo와 STRling은 read length를 넘는 expansion signal이나 outlier를 찾는다. Cohort burden과 candidate discovery에는 강하지만, size threshold, batch, ancestry control, exact boundary가 claim을 제한한다. Locus-level allele sequence는 추가 검증이 필요하다.
TRGT, TRGT-denovo, vclust, pangenome/graph methods는 motif mixture, interruptions, haplotype, variation cluster를 직접 읽는다. Disease-locus interpretation과 complex VNTR에는 필수적이지만, 비용, coverage, catalog subset, representation mismatch가 새 제약이 된다.