Autodidact · cancer MS/PTM atlas
human cancer · proteogenomics

암 proteogenomics에서 단백체와 PTM은 무엇을 보여주는가

Genome과 RNA는 종양의 설계도와 전사 상태를 보여주지만, 기능 상태는 단백질 abundance와 PTM에서 갈라지는 일이 많습니다. 이 자료에서는 proteome, phosphoproteome, acetylome을 나눠 읽고, TMT/iTRAQ/DIA 정량 전략, IMAC·TiO2·K-ac enrichment, Orbitrap 계열 장비가 연구 질문과 어떻게 맞물리는지 정리합니다. protein group, peptide, phosphosite, acetylsite는 단위가 다르므로 순위표처럼 비교하지 않습니다.

작성자: 정하은  ·  멀티오믹스 암 연구 정리  ·  업데이트: 2026-05-10

이 페이지에서 먼저 잡을 감

읽고 나면 “어떤 논문이 있었다”를 넘어서, 암 proteogenomics 논문이 왜 proteome·phosphoproteome·acetylome을 함께 쓰는지와 그 수치를 어떻게 읽어야 하는지 설명할 수 있어야 합니다.

learning target 01

측정 레이어를 질문으로 번역하기

Proteome은 abundance와 subtype, phosphoproteome은 kinase activity와 pathway state, acetylome은 chromatin/metabolic regulation의 단서로 읽습니다.

what is measured
learning target 02

MS workflow가 count를 만든다는 감 잡기

TMT/iTRAQ/DIA, fractionation, IMAC/TiO2, K-ac enrichment, Orbitrap 장비, search/FDR 기준이 identification 규모를 함께 결정합니다.

why this method
learning target 03

큰 숫자를 좋은 연구로 바로 읽지 않기

protein group, phosphosite, acetylsite, peptide는 서로 다른 단위입니다. 단일 cohort와 pan-cancer compendium, tumor cohort와 perturbation study도 분리해서 봐야 합니다.

how to interpret counts

분석 프레임은 이렇게 잡기

연구별 수치를 비교하기 전에, 측정 항목·MS 방법·count 단위를 먼저 분리해 읽습니다.

STEP 1

측정 항목을 생물학 질문으로 바꿔 읽기

  • Proteome: RNA 변화가 실제 protein abundance로 이어지는가?
  • Phosphoproteome: 어떤 kinase pathway가 켜져 있는가?
  • Acetylome: chromatin/metabolic regulation이 보이는가?
논문 제목에 proteogenomic이라고 쓰여도 실제 핵심은 “무슨 측정 항목이 어떤 질문을 푸는가”입니다.
STEP 2

Methods에서 label, enrichment, instrument를 찾기

  • TMT/TMTpro/iTRAQ는 cohort 비교 설계
  • IMAC/TiO2는 phosphosite를 보기 위한 enrichment
  • K-ac IP는 acetylated peptide를 보기 위한 enrichment
식별 수는 biological truth라기보다 workflow의 산물입니다. 방법을 모르면 숫자를 잘못 읽기 쉽습니다.
STEP 3

count는 단위별로 따로 해석하기

  • protein group 수와 phosphosite 수는 같은 단위가 아님
  • phosphosite는 하나의 protein에서 여러 개 나올 수 있음
  • acetylsite는 연구 수와 coverage가 훨씬 적음
“phospho가 protein보다 많다”는 이상한 일이 아니라 site-level biology를 보는 자연스러운 결과입니다.

해석 규칙: 숫자보다 먼저 봐야 하는 것

암 proteogenomics 논문을 읽을 때 반복해서 필요한 해석 기준입니다. 각 논문을 같은 틀로 읽기 위해 레이어, workflow, count 단위, PTM 보정을 먼저 정리합니다.

1. Proteogenomics는 mutation catalog가 아니라 functional state를 읽는 방식입니다

암 유전체 연구는 어떤 mutation, copy-number alteration, transcript change가 있는지를 잘 보여주지만, 그 변화가 실제 단백질 abundance와 pathway activity로 이어지는지는 별도 층에서 확인해야 합니다. CPTAC-style 연구들은 그래서 genome/RNA와 MS-based proteome·phosphoproteome을 붙여서 읽습니다.

Mertins 2016 breast cancer, Dou 2020 endometrial carcinoma, Gillette 2020 LUAD, Cao 2021 PDAC 같은 연구는 공통적으로 “유전체 이벤트가 protein abundance와 signaling state에서 어떻게 드러나는가”를 묻습니다. 따라서 protein identification count는 단순히 많이 찾았다는 수치가 아니라, downstream phenotype을 읽기 위한 좌표계의 크기입니다.

Proteomeprotein abundance. subtype, CNV dosage, pathway abundance를 읽는 기본 레이어.
Phosphoproteomesite-level activity. kinase signaling, druggable node, pathway activation을 읽는 레이어.
AcetylomeK-ac regulation. chromatin, metabolism, stress response를 선택적으로 깊게 보는 레이어.

2. Identification count는 “생물학적 크기”가 아니라 workflow가 남긴 흔적입니다

논문마다 protein group, quantified protein, phosphosite, phosphopeptide, acetylsite, acetylated peptide가 서로 다른 단위로 보고됩니다. 그래서 phospho 70,000과 protein 12,000을 같은 축에서 “더 많다/더 좋다”로 읽으면 안 됩니다. phosphosite는 하나의 protein에서 여러 위치가 나올 수 있고, enrichment와 site localization 기준에 따라 수가 크게 달라집니다.

비교 가능한 것같은 연구군 안에서 비슷한 workflow, 비슷한 count unit, 비슷한 FDR/localization 기준을 쓴 경우의 상대적 규모.
비교하면 위험한 것pan-cancer compendium의 aggregate feature count와 단일 cohort acquisition count, 또는 protein group과 phosphosite를 직접 순위화하는 비교.
논문에서 먼저 찾을 문장“identified”, “quantified”, “phosphosites”, “class I sites”, “protein groups”, “acetylated lysine sites”처럼 count 단위를 정의하는 문장.
표에 남겨야 할 caveatinstrument 미확인, supplement 필요, aggregate compendium, cell-line perturbation처럼 count 해석 조건이 달라지는 경우.

3. MS workflow는 sample → label → fractionation → enrichment → search 순서로 읽습니다

암 proteogenomics 연구에서 반복되는 큰 흐름은 TMT/iTRAQ multiplexing, high-pH or bRPLC fractionation, IMAC/Fe-NTA/TiO2 phosphopeptide enrichment, anti-K-ac enrichment, Orbitrap 계열 LC-MS/MS, MaxQuant/Spectrum Mill/Philosopher류 search입니다. 방법 이름을 외우는 것보다 “왜 이 단계가 필요한가”를 따라가는 게 더 중요합니다.

  • TMT/TMTpro/iTRAQ: 여러 tumor sample을 같은 실험 batch 안에서 상대정량하기 위한 labeling 전략입니다. cohort subtype 비교에 강하지만 reference channel과 batch design을 봐야 합니다.
  • Fractionation: peptide mixture 복잡도를 낮춰 더 많은 feature를 식별합니다. count는 늘 수 있지만 instrument time과 batch burden도 커집니다.
  • IMAC/Fe-NTA/TiO2: low-abundance phosphopeptide를 농축해 kinase signaling을 site 단위로 볼 수 있게 합니다.
  • K-ac enrichment: acetylated lysine peptide를 선택적으로 잡아 acetylome을 만들지만 샘플량과 antibody specificity 부담이 큽니다.
  • Orbitrap 계열: Q Exactive, HF/HF-X, Fusion/Lumos가 반복적으로 등장하지만, 장비명만으로 count가 결정되지는 않습니다.

4. PTM 신호는 protein abundance와 분리해서 생각해야 합니다

PTM-aware cancer proteomics wiki에서는 “phosphosite 변화가 진짜 modification-specific regulation인지, 아니면 total protein abundance가 함께 변해서 생긴 효과인지”를 핵심 질문으로 잡습니다. 같은 protein이 두 배 많아지면 그 protein에서 나온 phosphopeptide도 같이 늘어날 수 있습니다. 그래서 kinase activity나 pathway activation을 말하려면 site signal과 protein abundance의 관계를 같이 봐야 합니다.

이 관점은 pan-cancer proteomics나 kinase inference에서 특히 중요합니다. phosphoproteome은 activity layer로 강력하지만, protein-normalized interpretation 없이 단순 phosphosite abundance만 읽으면 protein expression 변화와 signaling rewiring을 섞어버릴 수 있습니다.

연구 질문별로 무엇을 측정하나

버튼을 눌러 연구 질문을 바꾸면 필요한 오믹스, 대표 방법, 먼저 볼 논문 유형이 바뀝니다.

측정 레이어
대표 MS 방법
먼저 볼 논문

논문들을 함께 보면 보이는 학습 포인트

개별 논문 하나만 읽으면 보이지 않지만, 여러 연구를 나란히 놓으면 반복해서 보이는 패턴입니다.

synthesis 01

Proteogenomics의 중심 질문은 “DNA/RNA 변화가 단백질 상태로 번역되는가”입니다

대부분의 tumor cohort 연구는 mutation, copy-number, RNA abundance를 protein abundance와 연결합니다. 따라서 protein count는 단순 검출량이 아니라 downstream phenotype을 읽기 위한 기본 좌표입니다.

genome → RNA → proteinsubtype
synthesis 02

Phosphoproteome은 abundance가 아니라 activity를 보려는 레이어입니다

phosphosite 수가 큰 연구들은 kinase signaling, pathway activation, druggable node를 찾는 데 초점이 있습니다. 같은 protein abundance라도 phosphorylation state가 다르면 해석이 달라집니다.

kinase activitypathway state
synthesis 03

Acetylome은 “있으면 좋은 추가 레이어”가 아니라 비용이 큰 선택 레이어입니다

acetylome까지 포함한 연구는 적습니다. 샘플량, enrichment, antibody specificity, fractionation 부담이 커서 cohort-wide 기본값이 되기 어렵고, 그래서 포함된 연구는 별도로 읽을 가치가 큽니다.

K-ac enrichmentcoverage gap
synthesis 04

Identification count는 연구 성능표가 아니라 workflow의 흔적입니다

TMT/iTRAQ/DIA, fraction 수, enrichment 방식, instrument, search/FDR 기준이 모두 count를 바꿉니다. 숫자가 크다고 항상 더 좋은 연구라는 뜻은 아니며, 어떤 biological question에 충분한 coverage인지가 중요합니다.

workflow-dependentFDR
synthesis 05

CPTAC류 대형 cohort와 perturbation study는 같은 표에서 분리해 읽어야 합니다

대형 tumor cohort는 환자 간 heterogeneity와 subtype을 보고, cell-line perturbation은 inhibitor나 조건 변화에 따른 signaling/PTM 변화를 봅니다. count가 비슷해도 질문이 다릅니다.

tumor cohortperturbation
synthesis 06

Pan-cancer 통합 연구는 count보다 harmonization을 먼저 봐야 합니다

여러 암종과 source study를 합친 pan-cancer 분석은 공통 driver와 pathway를 찾는 데 강하지만, sample prep과 instrument가 섞입니다. 그래서 raw count 비교보다 통합·보정 전략이 핵심입니다.

pan-cancerharmonization

논문을 읽는 순서: 한 편을 볼 때 체크할 4단계

여러 연구를 같은 방식으로 읽기 위한 practical reading order입니다.

check 01

연구 단위

patient cohort인지, tumor/normal paired cohort인지, pan-cancer compendium인지, cell-line perturbation인지 먼저 분리합니다.

check 02

측정 레이어

global proteome만 있는지, phosphoproteome이 있는지, acetylome이나 glycoproteome 같은 추가 PTM layer가 있는지 확인합니다.

check 03

MS workflow

TMT/iTRAQ/LFQ/DIA, fractionation, IMAC/TiO2/K-ac enrichment, Orbitrap 장비, search pipeline을 순서대로 적습니다.

check 04

count caveat

identified와 quantified를 구분하고, protein group/site/peptide 단위를 유지하며, supplement 확인이 필요한 값은 표시합니다.

실전 독해: Methods와 Results를 연결하는 법

논문을 펼쳤을 때 아래 순서대로 표시하면, 이 연구가 무엇을 잘 측정했고 어떤 해석은 조심해야 하는지 빠르게 보입니다.

READ 1

Methods에서 실험 설계를 먼저 표시합니다

  • sample: tumor cohort, matched normal, cell line, perturbation 여부
  • label: TMT/TMTpro/iTRAQ, LFQ, DIA 중 무엇인지
  • depth: fractionation, enrichment, instrument, search engine/FDR
결과의 count와 biological claim은 이 설계 안에서만 해석됩니다.
READ 2

Results의 count 단위를 원문 그대로 보존합니다

  • protein group인지 quantified protein인지 구분
  • phosphosite, phosphopeptide, class I site를 구분
  • acetylsite와 acetylated peptide를 섞지 않기
수치를 표준화하려고 단위를 억지로 맞추면 오히려 틀린 비교가 됩니다.
READ 3

마지막에 biological claim과 다시 연결합니다

  • subtype 주장이면 proteome/RNA/CNV 연결을 확인
  • kinase 주장이면 phosphosite와 kinase inference 기준 확인
  • drug target 주장이면 perturbation 또는 vulnerability 근거 확인
좋은 학습은 “숫자를 외우는 것”이 아니라, 측정법이 어떤 주장까지 허용하는지 판단하는 것입니다.

연구 흐름에서 먼저 볼 것

연도별 논문 수보다 중요한 것은 어떤 연구 질문이 커지고, 어떤 MS/PTM 레이어가 그 질문에 붙기 시작했는지입니다.

trend 01

단일 암종 atlas에서 clinical cohort 확장으로 이동

breast, lung, pancreas 같은 대표 암종뿐 아니라 glioblastoma, cervical, ampullary adenocarcinoma 등으로 연구 대상이 넓어지는 흐름이 보입니다. 다만 개별 논문의 claim은 원문에서 확인되는 범위 안에서 해석해야 합니다.

clinical expansion
trend 02

Pan-cancer는 count 경쟁보다 harmonization이 핵심

여러 CPTAC/암종 연구를 합치는 분석에서는 몇 개를 더 식별했는가보다, 서로 다른 sample prep, instrument, search pipeline을 어떻게 보정하고 같은 좌표계에 놓았는지가 중요합니다.

harmonization
trend 03

PTM layer는 therapy mechanism 쪽으로 더 가까워짐

phosphoproteome은 kinase signaling과 pathway state를, acetylome은 chromatin·metabolic regulation 관련 단서를 해석하는 레이어로 쓰입니다. perturbation이나 drug-response 연구에서는 PTM 변화가 mechanism 해석의 근거가 되지만, total protein abundance와 단위 차이를 함께 확인해야 합니다.

PTM mechanism

Identification count는 이렇게 읽기

숫자 자체보다 단위와 workflow를 같이 봅니다. 원문에서 count 단위와 근거 문장이 확인되는 값만 비교하고, supplement 확인이 필요한 값은 같은 축에 올리지 않습니다.

Proteome

보통 protein group 또는 quantified protein 수입니다. tumor subtype, copy-number dosage, pathway abundance를 해석할 때 기본 레이어입니다.

protein group

peptide count를 protein count처럼 읽으면 안 됩니다.

Phosphoproteome

phosphosite 또는 phosphopeptide 수입니다. kinase signaling을 보기 위해 enrichment가 필요하고, site localization 기준이 중요합니다.

site level

protein보다 숫자가 큰 것은 site 단위이기 때문입니다.

Acetylome

acetylated lysine site 또는 acetylated peptide 수입니다. coverage가 낮지만 chromatin/metabolic state 해석에 중요합니다.

lysine site

cohort study와 cell perturbation study를 구분해서 봐야 합니다.

Interactive plot: 식별 규모와 MS 조건 같이 보기

레이어를 바꾸면 해당 omics의 identification count가 원문 근거와 함께 확인된 연구만 막대로 표시됩니다. 막대를 누르면 count 단위, MS 방법론, 장비, 근거 문장을 함께 확인할 수 있습니다.

대표 수치 benchmark

모든 논문을 펼치기보다, 먼저 규모감을 주는 대표 연구만 보여줍니다. 표기는 Protein / Phospho / Acetyl 순서입니다.

2019 · Mun et al.Gastric cancer9,625 protein groups / 28,944 phosphopeptides / —

iTRAQ labeling, global proteome profiling, sequential IMAC phosphopeptide enrichment, and lectin-based N-glycopeptide enrichment.

2023 · Li et al.Pan-cancer CPTAC15,699 / 110,274 / —

Integrated CPTAC mass-spectrometry proteomic and phosphoproteomic data

2022 · Zhang et al.Pan-cancer15,439 / 199,284 / —

Integrated processed LC-MS/MS proteomic and phosphoproteomic datasets from CPTAC/public studies

2016 · Mertins et al.Breast cancer15,369 / 62,679 / —

iTRAQ 4-plex; global proteome plus phosphopeptide enrichment

Phosphoproteome high-coverage 예시

signaling 연구를 읽을 때 먼저 볼 만한 phosphosite 규모입니다.

2022 · Zhang et al.Pan-cancer199,284 phosphosites

Integrated processed LC-MS/MS proteomic and phosphoproteomic datasets from CPTAC/public studies

2023 · Li et al.Pan-cancer CPTAC110,274 phosphosites

Integrated CPTAC mass-spectrometry proteomic and phosphoproteomic data

2020 · Dou et al.Endometrial carcinoma73,212 phosphosites

TMT-10; bRPLC fractionation; IMAC phosphopeptide enrichment; acetyl-lysine enrichment

2021 · Satpathy et al.Lung squamous cell carcinoma68,674 phosphosites

TMT-11; serial proteome/phosphoproteome/acetylproteome workflow; K-GG ubiquitylproteome subset

Acetylome 포함 연구 예시

acetylome은 적게 등장하므로 포함 연구를 따로 보는 편이 좋습니다.

2021 · Satpathy et al.Lung squamous cell carcinoma15,186 acetylsites

TMT-11; serial proteome/phosphoproteome/acetylproteome workflow; K-GG ubiquitylproteome subset

2020 · Gillette et al.Lung adenocarcinoma13,480 acetylsites

TMT-10; global proteome, IMAC phosphoproteome, acetylproteome; Spectrum Mill processing

2020 · Dou et al.Endometrial carcinoma10,862 acetylsites

TMT-10; bRPLC fractionation; IMAC phosphopeptide enrichment; acetyl-lysine enrichment

2020 · Krug et al.Breast cancer9,869 acetylsites

TMT-10 multiplexing with a common reference; high-pH reversed-phase fractionation; Fe3+-NTA/IMAC phosphopeptide enrichment; anti-acetyl-lysine antibody enrichment for acetylpeptides.

대표 논문으로 읽기

숫자만 나열하지 않고, 어떤 질문 때문에 어떤 레이어가 붙었는지 예시로 읽습니다.

Dou 2020 · Endometrial carcinoma

12,153 protein · 73,212 phospho · 10,862 acetyl

TMT-10, bRPLC, IMAC phosphopeptide enrichment, acetyl-lysine enrichment를 함께 쓴 예시입니다. proteome, phosphoproteome, acetylome이 모두 있어 mutation/RNA/protein/PTM 연결을 넓게 볼 수 있습니다.

읽을 포인트: acetylome이 들어간 cohort study는 드물기 때문에, 단순 count보다 왜 K-ac layer를 추가했는지를 먼저 봅니다.

Gillette 2020 · LUAD

10,165 protein · 65,103 phospho · 13,480 acetyl

global proteome, IMAC phosphoproteome, acetylproteome을 나눠 acquisition하고, Q Exactive HF-X와 Orbitrap Fusion Lumos를 레이어별로 사용한 예시입니다.

읽을 포인트: therapeutic vulnerability를 말할 때 abundance layer와 signaling/PTM layer가 어떻게 서로 다른 근거를 주는지 봅니다.

Zhang 2022 · Pan-cancer compendium

15,439 protein · 199,284 phospho · aggregate

단일 acquisition 실험이 아니라 processed LC-MS/MS proteomic/phosphoproteomic datasets를 통합한 pan-cancer scale 예시입니다.

읽을 포인트: 가장 큰 phosphosite count처럼 보이지만, 핵심은 실험 깊이 경쟁이 아니라 여러 암종을 통합해 subtype/pathway를 비교하는 harmonization입니다.

Satpathy 2021 · Lung squamous cell carcinoma

68,674 phospho · 15,186 acetyl

serial proteome/phosphoproteome/acetylproteome workflow와 K-GG ubiquitylproteome subset까지 포함된 PTM-rich study입니다.

읽을 포인트: phospho와 acetyl을 함께 보면 signaling과 regulatory state가 분리되어 보이지만, protein total과 site count의 단위 차이를 계속 유지해야 합니다.

Ramberger 2024 · Multiple myeloma

~10,000 protein · ~50,000 phospho

TMTpro 16-plex, high-pH fractionation, IMAC phosphopeptide enrichment, Q Exactive HF-X가 보이는 최신 cohort 흐름입니다.

읽을 포인트: 2024 이후 연구는 희귀/혈액암/치료 취약성 쪽으로 corpus가 확장되며, phosphoproteome이 therapeutic opportunity 해석과 더 가까워집니다.

Zhao 2025 · HCT116 perturbation

6,147 protein · 6,213 phospho · 185 acetyl

TMTpro 16-plex, TiO2 phosphopeptide enrichment, acetylated peptide enrichment를 kinase inhibitor 처리 세포주에 적용한 perturbation 예시입니다.

읽을 포인트: cohort atlas와 직접 count 경쟁을 시키지 말고, inhibitor가 signaling/PTM state를 어떻게 바꾸는지 보는 실험으로 분리합니다.

MS 방법론을 연구 질문에 연결하기

버튼을 누르면 방법론별 강점, count 해석, 주의점, 이 방법이 필요한 연구 질문이 한 표 안에서 바뀝니다.

01 sampletumor / NAT / cell lineFFPE, fresh frozen, tumor purity, cohort 규모가 coverage를 좌우합니다.
02 digestprotein → peptide대부분 trypsin digestion 후 peptide 단위로 LC-MS/MS에 들어갑니다.
03 labelTMT · iTRAQ · LFQ · DIA상대정량, label-free, DIA 전략에 따라 비교 가능성이 달라집니다.
04 fractionbRPLC / high-pH RP복잡도를 낮춰 더 많은 peptide를 식별하지만 instrument time이 늘어납니다.
05 enrichIMAC · TiO2 · K-ac IPPTM peptide는 abundance가 낮아 enrichment가 핵심입니다.
06 searchFDR · localizationdatabase search와 site localization 기준이 최종 count를 결정합니다.

단백체 데이터가 만들어지는 원리: 원문 Methods에서 반복되는 순서

이 카탈로그의 Methods에서 반복되는 핵심은 MS가 “완성된 단백질 하나”를 직접 세는 장비가 아니라, 시료 단백질을 peptide로 잘라 LC-MS/MS에서 peptide spectrum을 얻고, database search와 FDR 기준을 거쳐 protein group 또는 site count로 되돌려 읽는다는 점입니다. 그래서 protein count, peptide count, phosphosite count, acetylsite count를 한 단위처럼 섞으면 안 됩니다.

1. digest: protein을 peptide로 바꾼다대부분의 proteomics workflow는 단백질을 peptide로 절단한 뒤 LC-MS/MS에 넣습니다. Mun 2019에서 156,135는 peptide 수이고 9,625는 protein group 수였던 것처럼, peptide count와 protein count는 서로 다른 단위입니다.
2. label: 여러 샘플을 같은 실험 안에서 비교한다TMT/TMTpro/iTRAQ는 샘플별 peptide에 tag를 붙여 한 번의 multiplexed run에서 상대정량합니다. Dou 2020, Gillette 2020, Satpathy 2021, Cao 2021, Zhao 2025 등에서 TMT 계열 설계가 반복됩니다.
3. reference channel: plex 사이를 이어준다여러 TMT plex를 쓰는 cohort에서는 common reference 또는 bridge/reference channel이 중요합니다. Satpathy 2021 Methods 정리에서는 22개 TMT-11 plex와 common reference를 통해 proteome/phosphoproteome/acetylproteome 정량을 연결한 점이 확인됩니다.
4. fractionation: 복잡도를 낮춰 더 깊게 본다bRPLC, high-pH reversed-phase fractionation은 peptide mixture를 나눠 한 번에 들어가는 복잡도를 줄입니다. Dou 2020의 bRPLC, Krug 2020의 high-pH reversed-phase fractionation처럼 count depth와 instrument time을 함께 바꾸는 단계입니다.
5. PTM enrichment: modified peptide를 잡는다Phosphoproteome은 IMAC, Fe-IMAC, TiO2 같은 phosphopeptide enrichment가 반복되고, acetylome은 anti-acetyl-lysine antibody 또는 PTMScan K-ac enrichment가 반복됩니다. enrichment가 없으면 global proteome 신호에 묻혀 site-level PTM을 충분히 보기 어렵습니다.
6. search/FDR/localization: 최종 count를 정한다MS/MS spectrum은 database search를 거쳐 peptide/protein/site로 할당됩니다. Mun 2019는 MS-GF+와 protein-level FDR를, Huang 2022는 site probability cutoff를, 여러 CPTAC-style 연구는 site localization 또는 VM-site polishing을 count 해석의 조건으로 남깁니다.

분석할 때 이 원리가 왜 중요한가

Subtype이나 pathway 분석을 할 때 “단백질이 많이 검출됐다”는 말만으로는 충분하지 않습니다. 같은 cohort라도 global proteome은 abundance 좌표를 만들고, phosphoproteome은 phosphorylation site 좌표를 만들고, acetylome은 lysine acetylation 좌표를 만듭니다. downstream 분석에서 protein abundance와 PTM abundance를 연결하려면, 각 값이 protein group인지 peptide인지 site인지 먼저 확인해야 합니다.

  • Proteome 분석: RNA/protein correlation, CNV dosage, subtype abundance를 보려면 protein group 또는 quantified protein 단위를 씁니다.
  • Phosphoproteome 분석: kinase activity나 pathway activation을 말하려면 phosphosite/phosphopeptide 단위와 localization 기준을 확인합니다.
  • Acetylome 분석: chromatin/metabolic regulation을 해석할 때도 acetylsite와 acetylated peptide를 구분하고, enrichment antibody와 coverage 차이를 함께 봅니다.
  • Count 비교: 같은 10,000이라도 protein group 10,000과 phosphosite 10,000은 의미가 다릅니다. 단일 cohort acquisition과 pan-cancer processed compendium도 직접 순위화하지 않습니다.

TMT / TMTpro

여러 샘플을 한 번에 상대정량하는 cohort proteomics의 주력 방식

강점
tumor cohort 간 subtype/pathway 비교에 좋고 protein/phosphosite coverage가 큼
주의
ratio compression과 batch/reference design 확인

iTRAQ

초기 CPTAC/대형 proteogenomic atlas에서 보이는 multiplex labeling

강점
2016년 전후 초기 proteogenomics 연구를 이해하는 기준점
주의
최신 TMTpro 연구와 직접 count 서열화하지 않기

LFQ / DIA

label 없이 많은 샘플을 반복 측정하거나 DIA로 재현성을 높이는 전략

강점
clinical cohort, FFPE 확장, biomarker 검증에 유리
주의
missing value, library/search strategy, normalization 확인

IMAC / TiO2

phosphopeptide를 농축해 kinase signaling을 site 단위로 보는 방법

강점
drug response, pathway activation, kinase-substrate 해석에 강함
주의
class I site, localization probability, FDR 확인

K-ac enrichment

acetylated lysine peptide를 농축해 acetylome을 보는 방법

강점
chromatin regulation, metabolism, stress response 단서 제공
주의
antibody specificity와 샘플량 부담 확인

Orbitrap 계열 장비

Fusion/Lumos, Q Exactive/HF/HF-X가 암 proteogenomics에서 자주 쓰이는 MS platform

강점
high-resolution MS/MS와 TMT/PTM workflow에 널리 사용
주의
장비명만 말고 LC gradient, fraction 수, search 기준 같이 보기

이 페이지를 만든 핵심 연구 카탈로그

아래 카탈로그는 이 페이지의 정리에 사용된 연구입니다. 정량 benchmark와 plot은 검증 완료 항목만 사용하고, 나머지는 후속 확인 대상으로 남깁니다.

논문을 읽을 때 확인할 것

암 MS/PTM multiomics 논문을 볼 때 반복해서 묻는 기준입니다.

이 연구는 무엇을 측정했나?proteome, phosphoproteome, acetylome 중 어떤 레이어가 있고, 각 레이어가 abundance, signaling, regulation 중 무엇을 겨냥하는지 확인합니다.
왜 그 MS 방법을 썼나?TMT/iTRAQ/DIA, fractionation, IMAC/TiO2, K-ac enrichment, Orbitrap 장비 선택이 sample 수와 질문에 어떻게 맞물리는지 봅니다.
identification count는 어디까지 믿나?protein, site, peptide 단위를 섞지 않고, 원문에서 확인된 값과 supplement 확인이 필요한 값을 구분합니다.
다음에 어떤 논문을 읽을까?subtype atlas, kinase signaling, acetylome/PTM-rich study, pan-cancer compendium, perturbation study 중 자신의 질문에 맞는 진입점을 고릅니다.