측정 레이어를 질문으로 번역하기
Proteome은 abundance와 subtype, phosphoproteome은 kinase activity와 pathway state, acetylome은 chromatin/metabolic regulation의 단서로 읽습니다.
what is measuredGenome과 RNA는 종양의 설계도와 전사 상태를 보여주지만, 기능 상태는 단백질 abundance와 PTM에서 갈라지는 일이 많습니다. 이 자료에서는 proteome, phosphoproteome, acetylome을 나눠 읽고, TMT/iTRAQ/DIA 정량 전략, IMAC·TiO2·K-ac enrichment, Orbitrap 계열 장비가 연구 질문과 어떻게 맞물리는지 정리합니다. protein group, peptide, phosphosite, acetylsite는 단위가 다르므로 순위표처럼 비교하지 않습니다.
읽고 나면 “어떤 논문이 있었다”를 넘어서, 암 proteogenomics 논문이 왜 proteome·phosphoproteome·acetylome을 함께 쓰는지와 그 수치를 어떻게 읽어야 하는지 설명할 수 있어야 합니다.
Proteome은 abundance와 subtype, phosphoproteome은 kinase activity와 pathway state, acetylome은 chromatin/metabolic regulation의 단서로 읽습니다.
what is measuredTMT/iTRAQ/DIA, fractionation, IMAC/TiO2, K-ac enrichment, Orbitrap 장비, search/FDR 기준이 identification 규모를 함께 결정합니다.
why this methodprotein group, phosphosite, acetylsite, peptide는 서로 다른 단위입니다. 단일 cohort와 pan-cancer compendium, tumor cohort와 perturbation study도 분리해서 봐야 합니다.
how to interpret counts연구별 수치를 비교하기 전에, 측정 항목·MS 방법·count 단위를 먼저 분리해 읽습니다.
암 proteogenomics 논문을 읽을 때 반복해서 필요한 해석 기준입니다. 각 논문을 같은 틀로 읽기 위해 레이어, workflow, count 단위, PTM 보정을 먼저 정리합니다.
암 유전체 연구는 어떤 mutation, copy-number alteration, transcript change가 있는지를 잘 보여주지만, 그 변화가 실제 단백질 abundance와 pathway activity로 이어지는지는 별도 층에서 확인해야 합니다. CPTAC-style 연구들은 그래서 genome/RNA와 MS-based proteome·phosphoproteome을 붙여서 읽습니다.
Mertins 2016 breast cancer, Dou 2020 endometrial carcinoma, Gillette 2020 LUAD, Cao 2021 PDAC 같은 연구는 공통적으로 “유전체 이벤트가 protein abundance와 signaling state에서 어떻게 드러나는가”를 묻습니다. 따라서 protein identification count는 단순히 많이 찾았다는 수치가 아니라, downstream phenotype을 읽기 위한 좌표계의 크기입니다.
논문마다 protein group, quantified protein, phosphosite, phosphopeptide, acetylsite, acetylated peptide가 서로 다른 단위로 보고됩니다. 그래서 phospho 70,000과 protein 12,000을 같은 축에서 “더 많다/더 좋다”로 읽으면 안 됩니다. phosphosite는 하나의 protein에서 여러 위치가 나올 수 있고, enrichment와 site localization 기준에 따라 수가 크게 달라집니다.
암 proteogenomics 연구에서 반복되는 큰 흐름은 TMT/iTRAQ multiplexing, high-pH or bRPLC fractionation, IMAC/Fe-NTA/TiO2 phosphopeptide enrichment, anti-K-ac enrichment, Orbitrap 계열 LC-MS/MS, MaxQuant/Spectrum Mill/Philosopher류 search입니다. 방법 이름을 외우는 것보다 “왜 이 단계가 필요한가”를 따라가는 게 더 중요합니다.
PTM-aware cancer proteomics wiki에서는 “phosphosite 변화가 진짜 modification-specific regulation인지, 아니면 total protein abundance가 함께 변해서 생긴 효과인지”를 핵심 질문으로 잡습니다. 같은 protein이 두 배 많아지면 그 protein에서 나온 phosphopeptide도 같이 늘어날 수 있습니다. 그래서 kinase activity나 pathway activation을 말하려면 site signal과 protein abundance의 관계를 같이 봐야 합니다.
이 관점은 pan-cancer proteomics나 kinase inference에서 특히 중요합니다. phosphoproteome은 activity layer로 강력하지만, protein-normalized interpretation 없이 단순 phosphosite abundance만 읽으면 protein expression 변화와 signaling rewiring을 섞어버릴 수 있습니다.
버튼을 눌러 연구 질문을 바꾸면 필요한 오믹스, 대표 방법, 먼저 볼 논문 유형이 바뀝니다.
개별 논문 하나만 읽으면 보이지 않지만, 여러 연구를 나란히 놓으면 반복해서 보이는 패턴입니다.
대부분의 tumor cohort 연구는 mutation, copy-number, RNA abundance를 protein abundance와 연결합니다. 따라서 protein count는 단순 검출량이 아니라 downstream phenotype을 읽기 위한 기본 좌표입니다.
genome → RNA → proteinsubtypephosphosite 수가 큰 연구들은 kinase signaling, pathway activation, druggable node를 찾는 데 초점이 있습니다. 같은 protein abundance라도 phosphorylation state가 다르면 해석이 달라집니다.
kinase activitypathway stateacetylome까지 포함한 연구는 적습니다. 샘플량, enrichment, antibody specificity, fractionation 부담이 커서 cohort-wide 기본값이 되기 어렵고, 그래서 포함된 연구는 별도로 읽을 가치가 큽니다.
K-ac enrichmentcoverage gapTMT/iTRAQ/DIA, fraction 수, enrichment 방식, instrument, search/FDR 기준이 모두 count를 바꿉니다. 숫자가 크다고 항상 더 좋은 연구라는 뜻은 아니며, 어떤 biological question에 충분한 coverage인지가 중요합니다.
workflow-dependentFDR대형 tumor cohort는 환자 간 heterogeneity와 subtype을 보고, cell-line perturbation은 inhibitor나 조건 변화에 따른 signaling/PTM 변화를 봅니다. count가 비슷해도 질문이 다릅니다.
tumor cohortperturbation여러 암종과 source study를 합친 pan-cancer 분석은 공통 driver와 pathway를 찾는 데 강하지만, sample prep과 instrument가 섞입니다. 그래서 raw count 비교보다 통합·보정 전략이 핵심입니다.
pan-cancerharmonization여러 연구를 같은 방식으로 읽기 위한 practical reading order입니다.
patient cohort인지, tumor/normal paired cohort인지, pan-cancer compendium인지, cell-line perturbation인지 먼저 분리합니다.
global proteome만 있는지, phosphoproteome이 있는지, acetylome이나 glycoproteome 같은 추가 PTM layer가 있는지 확인합니다.
TMT/iTRAQ/LFQ/DIA, fractionation, IMAC/TiO2/K-ac enrichment, Orbitrap 장비, search pipeline을 순서대로 적습니다.
identified와 quantified를 구분하고, protein group/site/peptide 단위를 유지하며, supplement 확인이 필요한 값은 표시합니다.
논문을 펼쳤을 때 아래 순서대로 표시하면, 이 연구가 무엇을 잘 측정했고 어떤 해석은 조심해야 하는지 빠르게 보입니다.
연도별 논문 수보다 중요한 것은 어떤 연구 질문이 커지고, 어떤 MS/PTM 레이어가 그 질문에 붙기 시작했는지입니다.
breast, lung, pancreas 같은 대표 암종뿐 아니라 glioblastoma, cervical, ampullary adenocarcinoma 등으로 연구 대상이 넓어지는 흐름이 보입니다. 다만 개별 논문의 claim은 원문에서 확인되는 범위 안에서 해석해야 합니다.
clinical expansion여러 CPTAC/암종 연구를 합치는 분석에서는 몇 개를 더 식별했는가보다, 서로 다른 sample prep, instrument, search pipeline을 어떻게 보정하고 같은 좌표계에 놓았는지가 중요합니다.
harmonizationphosphoproteome은 kinase signaling과 pathway state를, acetylome은 chromatin·metabolic regulation 관련 단서를 해석하는 레이어로 쓰입니다. perturbation이나 drug-response 연구에서는 PTM 변화가 mechanism 해석의 근거가 되지만, total protein abundance와 단위 차이를 함께 확인해야 합니다.
PTM mechanism숫자 자체보다 단위와 workflow를 같이 봅니다. 원문에서 count 단위와 근거 문장이 확인되는 값만 비교하고, supplement 확인이 필요한 값은 같은 축에 올리지 않습니다.
보통 protein group 또는 quantified protein 수입니다. tumor subtype, copy-number dosage, pathway abundance를 해석할 때 기본 레이어입니다.
peptide count를 protein count처럼 읽으면 안 됩니다.
phosphosite 또는 phosphopeptide 수입니다. kinase signaling을 보기 위해 enrichment가 필요하고, site localization 기준이 중요합니다.
protein보다 숫자가 큰 것은 site 단위이기 때문입니다.
acetylated lysine site 또는 acetylated peptide 수입니다. coverage가 낮지만 chromatin/metabolic state 해석에 중요합니다.
cohort study와 cell perturbation study를 구분해서 봐야 합니다.
레이어를 바꾸면 해당 omics의 identification count가 원문 근거와 함께 확인된 연구만 막대로 표시됩니다. 막대를 누르면 count 단위, MS 방법론, 장비, 근거 문장을 함께 확인할 수 있습니다.
모든 논문을 펼치기보다, 먼저 규모감을 주는 대표 연구만 보여줍니다. 표기는 Protein / Phospho / Acetyl 순서입니다.
iTRAQ labeling, global proteome profiling, sequential IMAC phosphopeptide enrichment, and lectin-based N-glycopeptide enrichment.
Integrated CPTAC mass-spectrometry proteomic and phosphoproteomic data
Integrated processed LC-MS/MS proteomic and phosphoproteomic datasets from CPTAC/public studies
iTRAQ 4-plex; global proteome plus phosphopeptide enrichment
signaling 연구를 읽을 때 먼저 볼 만한 phosphosite 규모입니다.
Integrated processed LC-MS/MS proteomic and phosphoproteomic datasets from CPTAC/public studies
Integrated CPTAC mass-spectrometry proteomic and phosphoproteomic data
TMT-10; bRPLC fractionation; IMAC phosphopeptide enrichment; acetyl-lysine enrichment
TMT-11; serial proteome/phosphoproteome/acetylproteome workflow; K-GG ubiquitylproteome subset
acetylome은 적게 등장하므로 포함 연구를 따로 보는 편이 좋습니다.
TMT-11; serial proteome/phosphoproteome/acetylproteome workflow; K-GG ubiquitylproteome subset
TMT-10; global proteome, IMAC phosphoproteome, acetylproteome; Spectrum Mill processing
TMT-10; bRPLC fractionation; IMAC phosphopeptide enrichment; acetyl-lysine enrichment
TMT-10 multiplexing with a common reference; high-pH reversed-phase fractionation; Fe3+-NTA/IMAC phosphopeptide enrichment; anti-acetyl-lysine antibody enrichment for acetylpeptides.
숫자만 나열하지 않고, 어떤 질문 때문에 어떤 레이어가 붙었는지 예시로 읽습니다.
TMT-10, bRPLC, IMAC phosphopeptide enrichment, acetyl-lysine enrichment를 함께 쓴 예시입니다. proteome, phosphoproteome, acetylome이 모두 있어 mutation/RNA/protein/PTM 연결을 넓게 볼 수 있습니다.
읽을 포인트: acetylome이 들어간 cohort study는 드물기 때문에, 단순 count보다 왜 K-ac layer를 추가했는지를 먼저 봅니다.
global proteome, IMAC phosphoproteome, acetylproteome을 나눠 acquisition하고, Q Exactive HF-X와 Orbitrap Fusion Lumos를 레이어별로 사용한 예시입니다.
읽을 포인트: therapeutic vulnerability를 말할 때 abundance layer와 signaling/PTM layer가 어떻게 서로 다른 근거를 주는지 봅니다.
단일 acquisition 실험이 아니라 processed LC-MS/MS proteomic/phosphoproteomic datasets를 통합한 pan-cancer scale 예시입니다.
읽을 포인트: 가장 큰 phosphosite count처럼 보이지만, 핵심은 실험 깊이 경쟁이 아니라 여러 암종을 통합해 subtype/pathway를 비교하는 harmonization입니다.
serial proteome/phosphoproteome/acetylproteome workflow와 K-GG ubiquitylproteome subset까지 포함된 PTM-rich study입니다.
읽을 포인트: phospho와 acetyl을 함께 보면 signaling과 regulatory state가 분리되어 보이지만, protein total과 site count의 단위 차이를 계속 유지해야 합니다.
TMTpro 16-plex, high-pH fractionation, IMAC phosphopeptide enrichment, Q Exactive HF-X가 보이는 최신 cohort 흐름입니다.
읽을 포인트: 2024 이후 연구는 희귀/혈액암/치료 취약성 쪽으로 corpus가 확장되며, phosphoproteome이 therapeutic opportunity 해석과 더 가까워집니다.
TMTpro 16-plex, TiO2 phosphopeptide enrichment, acetylated peptide enrichment를 kinase inhibitor 처리 세포주에 적용한 perturbation 예시입니다.
읽을 포인트: cohort atlas와 직접 count 경쟁을 시키지 말고, inhibitor가 signaling/PTM state를 어떻게 바꾸는지 보는 실험으로 분리합니다.
버튼을 누르면 방법론별 강점, count 해석, 주의점, 이 방법이 필요한 연구 질문이 한 표 안에서 바뀝니다.
이 카탈로그의 Methods에서 반복되는 핵심은 MS가 “완성된 단백질 하나”를 직접 세는 장비가 아니라, 시료 단백질을 peptide로 잘라 LC-MS/MS에서 peptide spectrum을 얻고, database search와 FDR 기준을 거쳐 protein group 또는 site count로 되돌려 읽는다는 점입니다. 그래서 protein count, peptide count, phosphosite count, acetylsite count를 한 단위처럼 섞으면 안 됩니다.
Subtype이나 pathway 분석을 할 때 “단백질이 많이 검출됐다”는 말만으로는 충분하지 않습니다. 같은 cohort라도 global proteome은 abundance 좌표를 만들고, phosphoproteome은 phosphorylation site 좌표를 만들고, acetylome은 lysine acetylation 좌표를 만듭니다. downstream 분석에서 protein abundance와 PTM abundance를 연결하려면, 각 값이 protein group인지 peptide인지 site인지 먼저 확인해야 합니다.
여러 샘플을 한 번에 상대정량하는 cohort proteomics의 주력 방식
초기 CPTAC/대형 proteogenomic atlas에서 보이는 multiplex labeling
label 없이 많은 샘플을 반복 측정하거나 DIA로 재현성을 높이는 전략
phosphopeptide를 농축해 kinase signaling을 site 단위로 보는 방법
acetylated lysine peptide를 농축해 acetylome을 보는 방법
Fusion/Lumos, Q Exactive/HF/HF-X가 암 proteogenomics에서 자주 쓰이는 MS platform
아래 카탈로그는 이 페이지의 정리에 사용된 연구입니다. 정량 benchmark와 plot은 검증 완료 항목만 사용하고, 나머지는 후속 확인 대상으로 남깁니다.
암 MS/PTM multiomics 논문을 볼 때 반복해서 묻는 기준입니다.