蛋白质测序数据类型解析

212 阅读2分钟

蛋白测序通常指的是确定蛋白质的氨基酸序列。这涉及对蛋白质的氨基酸进行排序,以确定它们在蛋白质中的确切顺序。蛋白测序的数据结果可以描述为以下数据类型:

1、氨基酸序列:

这是蛋白质测序的主要输出,表示为一个由20种标准氨基酸单字母代码组成的字符串。例如,一个小的蛋白片段可能有序列“MGSDKI”.

20221219-2930-Edman%E6%B5%8B%E5%BA%8F%E7%A0%94%E7%A9%B6%E6%A1%88%E4%BE%8B.jpg

图1

2、质谱图数据:

如果使用质谱法进行蛋白质测序,会获得一个质谱图,显示了不同的质荷比和相对强度。这可以帮助确定氨基酸片段的质量和组成。

20221219-7863-image-%E4%BB%8E%E5%A4%B4%E6%B5%8B%E5%BA%8F.jpg

图2

3、覆盖图或映射:

这显示了已经确定序列的蛋白质片段是如何映射回到整个蛋白质的。这可以帮助研究者了解已经确定了多少的蛋白质序列以及还有哪些区域尚未确定。

20221219-3038-%E8%82%BD%E6%AE%B5%E8%A6%86%E7%9B%96%E7%8E%873.png

图3

4、置信度得分:

对于每个确定的氨基酸位置,可能会有一个置信度得分,表明该位置的氨基酸标识的确信程度。

5、其他注释:

可能包括已知的翻译后修饰、亚单位信息、已知的结构域等。

通常,氨基酸序列数据可以存储在简单的文本格式中,如FASTA格式。而质谱图数据通常会保存在专门的格式中,如.mzML、.mzXML或.raw格式。

延伸阅读

蛋白测序

蛋白质N/C端测序

生物制药N/C端测序

基于Edman降解的蛋白质N端测序

蛋白全序列测定

蛋白从头测序