스플라이싱은 pre-mRNA에서 intron을 잘라내고 exon을 이어 붙이는 과정입니다. splice site, branch point, polypyrimidine tract가 어떻게 읽히는지부터 스플라이소좀 조립, 두 단계 반응, major·minor spliceosome의 차이까지 차례로 따라갑니다.
스플라이소좀이 인트론을 정확히 인식하려면 네 가지 cis-acting 서열 요소가 필요합니다. 이 신호들은 각각 특정 snRNA와 단백질에 의해 인식됩니다.
스플라이소좀의 4가지 핵심 신호만으로는 스플라이싱 결과를 완전히 예측할 수 없습니다. RNA 결합 단백질(RBP)이 결합하는 보조 서열 요소가 스플라이싱 효율과 대안 스플라이싱을 미세 조정합니다.
엑손 안쪽의 SR 단백질 결합 서열입니다. 인접 스플라이스 부위가 더 잘 쓰이게 해 엑손 포함을 늘립니다. ESE가 변이로 깨지면 엑손 스킵으로 이어질 수 있습니다.
엑손 안쪽의 hnRNP 결합 서열입니다. 스플라이싱을 억제해 엑손 제외를 유도합니다. 변이가 새 ESS를 만들거나 ESE를 깨뜨리면 엑손 스킵이 생길 수 있습니다.
인트론 안쪽의 enhancer/silencer입니다. 딥 인트로닉 변이가 ISS를 깨거나 새 ISE를 만들면 cryptic exon이 활성화될 수 있습니다. SpliceAI 같은 AI 모델이 주로 겨냥하는 영역입니다.
스플라이싱은 두 번의 SN2 트랜스에스테르화(transesterification) 반응으로 이루어집니다. 에너지 소비 없이(ATP 불필요) 인산이에스테르 결합의 위치만 바뀝니다.
분지점(BP) 아데노신의 2'-OH가 친핵체로 작용하여 5' 스플라이스 부위의 인산이에스테르 결합을 공격합니다.
유리된 5' 엑손의 3'-OH가 친핵체로 작용하여 3' 스플라이스 부위를 공격합니다.
대부분의 인트론 처리. U1, U2, U4, U5, U6 snRNP + 수백 종 단백질. GT-AG 규칙.
소수의 특수 인트론 처리. U11, U12, U4atac, U6atac, U5 snRNP. AT-AC 또는 GT-AG 규칙. 신경계·발달 유전자에 집중.
| 특성 | Major (U2-type) | Minor (U12-type) |
|---|---|---|
| snRNP 구성 | U1, U2, U4, U5, U6 | U11, U12, U4atac, U6atac, U5 |
| 5'SS 컨센서스 | GU|RAGU |
AU|AUCCUU (AT-AC) 또는 GU|AUCC |
| 3'SS 컨센서스 | YAG| |
AC| (AT-AC) 또는 AG| |
| 분지점 컨센서스 | YNYURAY (약한 컨센서스) | UCCUURAY (강한 컨센서스) |
| 인트론 수 (인간) | ~200,000+ | ~700–800 |
| 관련 질환 | 다양한 스플라이싱 질환 | MOPD1, Roifman syndrome (RNU4ATAC 변이) |
| 속도 | 빠름 (수 분) | 느림 (major보다 느림) |
대부분의 스플라이싱은 전사가 끝난 뒤가 아니라, RNA 중합효소 II가 DNA를 읽는 동안 함께 일어납니다. 그래서 전사 속도와 스플라이싱 결과는 서로 맞물려 있습니다.
포유류에서 엑손은 상대적으로 짧고(평균 ~150 nt), 인트론은 매우 깁니다(수 kb). 스플라이소좀은 인트론 전체를 한꺼번에 잡기보다 엑손 단위로 양쪽 스플라이스 부위를 인식합니다.
매우 긴 인트론(>100 kb)에서 보이는 단계적 스플라이싱입니다. 중간 "RS 부위"를 거치며 인트론을 순차적으로 제거합니다. DSCAM, NRXN1 같은 신경계 유전자에서 자주 보입니다.