| Formula | Ion | Calcd Mass | Found Mass | Recalcd Mass | Dev(Calcd) (ppm) | Dev(Recalcd) (ppm) | Error |
|---|
错误描述:纯文本“Error”,无额外说明。
根本原因:
molmass.Formula 解析,如包含非法字符(例 C12H-O)、元素顺序混乱等。Calcd Mass(理论质量)或计算出的 Recalcd Mass(校准后质量)不是有效浮点数,如包含字母(例 300.123a)、缺失小数点等。错误描述:“未找到分子式”,即 No formula found。
根本原因:
PDF文本中该HRMS条目仅包含离子类型(Ion)和质量数据(Calcd Mass、Found Mass),但未包含可被正则 r'C\d+(?:H\d+|F\d+)(?:[A-Z][a-z]?\d*|\[\d+[A-Z][a-z]*\d*])*[+-]?' 匹配的分子式,可能因文本缺失分子式或分子式格式超出匹配范围。
错误描述:
Typo (Calcd,Found):理论质量与实测质量存在单个字符差异(排除最后两位)。Typo (Calcd,Recalcd):理论质量与校准后质量存在单个字符差异(排除最后两位)。根本原因:
PDF文本中质量数据存在输入错误(如人工录入时多输/少输一个数字)或OCR识别错误(如将 3 识别为 5),导致质量数据仅单个字符偏差(例 300.1234 vs 300.1254)。
错误描述:
Transposed digits (Calcd,Found):理论质量与实测质量存在相邻数字颠倒。Transposed digits (Calcd,Recalcd):理论质量与校准后质量存在相邻数字颠倒。根本原因:
PDF文本中质量数据存在“相邻数字颠倒”的输入错误(如将 1234 写成 1324)或OCR识别时将相邻数字混淆(如 2 和 3 位置颠倒),导致质量数据仅相邻数字偏差(例 300.1234 vs 300.1324)。
错误描述:“质量是按阳离子计算的,实际为阴离子”,即 Mass was calculated for cation。
根本原因:
计算 Recalcd Mass(校准后质量)时,代码默认按阳离子(电荷为正)处理,但实际离子为阴离子(如 ion_charge == "-" 或离子类型含 M-,例 [M-H]-),导致质量偏差约一个电子质量(阴离子需加电子质量,阳离子需减电子质量,电荷判断错误引发偏差)。
错误描述:
Molecular weight error:理论质量等于“带电荷分子式的分子量”(未除以电荷数)。Molecular weight error (neutral):理论质量等于“中性分子式的分子量”(未加/减电荷对应的质量)。Molecular weight error (neutral+1):理论质量等于“中性分子式分子量+1”(可能误加 13C 同位素质量)。Molecular weight error (neutral+23):理论质量等于“中性分子式分子量+23”(可能误加钠元素质量 22.98977)。Molecular weight error (Formula+Na):理论质量等于“原分子式加钠的分子量”(可能误将钠离子峰按分子峰计算)。根本原因:
PDF中的 Calcd Mass(理论质量)计算逻辑与代码预期不符:代码预期理论质量是“离子的精确质量”(需除以电荷数,例 [M+Na]+ 需用分子质量+钠质量后除以1),但实际PDF中的理论质量是“分子的分子量”(未处理电荷或额外元素,例直接用分子质量作为 [M+Na]+ 的理论质量)。
错误描述:
Add X Y to formula:需给分子式添加 X 个 Y 元素(例 Add 1 H-atom to formula)。Remove X Y from formula:需从分子式移除 X 个 Y 元素(例 Remove 2 O-atoms from formula)。根本原因:
PDF中提取的分子式与实际离子的分子式存在“元素数量差异”:
[M+H]+,但提取的分子式为 C12H24O(少1个H),导致校准质量偏小,误差为正,提示添加元素。[M-O]+,但提取的分子式为 C12H24O2(多1个O),导致校准质量偏大,误差为负,提示移除元素。错误描述:以 +/- 开头的浮点数(保留4位小数),例 +0.0052、-0.0031。
根本原因:
误差来源不属于上述任何已知类型,可能原因包括:
error_dictionary 未包含该偏差对应的元素或特殊情况(例未添加某元素的同位素质量)。