蛋白质基因组(Proteogenomics)技术

技术原理

蛋白质基因组学(Proteogenomics)属于蛋白质组和基因组研究交叉领域。基于质谱的蛋白质组学,要求对应物种的已知蛋白质序列库。对于很多非模式生物,已知蛋白质序列很少或几乎没有。转录组测序 (RNA-Seq) 作为一项新一代高通量测序技术,能在全基因组范围内以单碱基分辨率鉴定并定量某一样品中的所有转录本,将其理论翻译,构建蛋白质序列库,即可以进行蛋白质学质谱搜索。

应用领域 -

尤其适合无已知蛋白质序列物种的蛋白质组研究

技术优点

  • 转录组测序具有单碱基分辨率、无偏性、高覆盖度等优势

  • 尤其适用于无已知蛋白序列物种的蛋白质组研究

  • 能够鉴定到新蛋白质、新蛋白质亚型以及氨基酸突变等

样品要求

  • 提取物 ≥100 μg(蛋白质)
    ≥1 μg(total RNA)
  • 细胞 ≥10^7 个
  • 组织 ≥100 mg (动物组织)
    ≥10 mg (植物组织)
  • 体液 ≥500 μL (血清、血浆)
    ≥25 mL(尿液)
    ≥5 ml(唾液、脑脊液等体液)

可选仪器

  • Illumina HiSeq 4000
  • Obitrap Fusion Lumos
  • Obitrap Fusion
  • Q Exactive HF
  • Q Exactive Plus
  • Q Exactive
  • Triple TOF 6600
  • Triple TOF 5600

技术流程

一、转录组测序。样本RNA提取,文库构建,上机测序和生物信息学分析。利用转录组测序获取的转录本序列理论构建蛋白质序列,用于蛋白质组质谱数据的搜索。
二、蛋白质组质谱实验。样本提取蛋白质,蛋白质经过还原,封闭后蛋白酶酶切(通常为trypsin),肽段混合物液相分离后,进行MS/MS质谱检测。然后对质谱仪产出的数据进行蛋白质组鉴定及生物信息学分析。

数据分析内容

  • 测序数据质量评估
  • 基因表达分析
  • 转录本重构
  • 蛋白质序列库构建
  • 质谱数据质量评估
  • 数据库鉴定数据统计
  • 多样本间分类统计、聚类分析(适用于样本数大于3)
  • GO (Gene Ontology) 富集分析
  • KEGG Pathway通路富集分析
  • 蛋白质相互作用(PPI)网络分析
  • 蛋白质组和转录组关联性整合分析

参考文献

Wu, P., Zhang, H., Lin, W., Hao, Y., Ren, L., Zhang, C., ... & He, F. (2014). Discovery of novel genes and gene isoforms by integrating transcriptomic and proteomic profiling from mouse liver. Journal of proteome research, 13(5), 2409-2419.