法医SNP分型与应用规范-SF/Z JD0105003-2015(2015年11月20日发布实施)
1 范围
本技术规范规定了法庭科学 DNA实验室用微测序法进行法医 SNP分型的要求及结果判断标准(采用微测序法作为 SNP分型技术的说明见附录 A)。
本技术规范适用于法庭科学采用 SNP进行个体识别和亲缘关系鉴定两个领域。
2 规范性引用文件
下列文件对于本技术规范的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本技术规范。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本技术规范。
GA/T 382-2014 法庭科学DNA实验室建设规范
GA/T 383-2014 法庭科学DNA实验室检验规范
GA/T 965-2011 法庭科学DNA亲子鉴定规范
CNAS-CL08:2013 司法鉴定/法庭科学机构能力认可准则
CNAS-CL28:2014司法鉴定/法庭科学机构能力认可准则在法医物证 DNA鉴定领域的应用说明
SF/Z JD0105001-2010 亲权鉴定技术规范
3 术语和定义 下列术语和定义适用于本技术规范。
3.1 单核苷酸多态性 Single nucleotide polymorphisms(SNPs)
指人群中正常个体基因组的单个碱基的变异,且最小等位基因频率大于 1%。
3.2微测序法 minisequencing technique
指基于引物延伸原理进行单个碱基序列分析的技术,也称引物延伸法。基本原理是在紧邻已知 SNP位点的上游设计引物,在仅有 ddNTP存在条件下进行测序反应时,延伸反应在延长一个碱基时终止,然后通过检测 ddNTP标记物的特征确定延伸单个碱基的种类。
3.3 SNaPshot方法 SNaPshot assay
是一种基于荧光标记 ddNTP单碱基延伸原理用于 SNP分型的微测序技术。同一反应体系中若含有针对不同 SNP的等位基因特异性引物,而它们 5’端长度不同,则可实现多个 SNP同步分析。
3.4 匹配概率 probability of matching(Pm)
指一名与案件没有关系的随机个体纯粹由于机会与检材分型结果一致的概率。
3.5 似然率 likelihood(LR)
是评估遗传分析提供证据强度的指标。数值上似然率是两个条件概率的比值。在个人识别时两个条件概率的假设分别是,现场检材是嫌疑人所留(原告假设)和现场检材是一个与案件无关的随机个体所留(被告假设)。似然率提供了基于术语“支持”的简单约定,以便根据一定数据来支持一种假设,排斥另一种假设。
4 检验程序
4.1检材的提取和保存按照 GA/T383-2014中的要求进行。
4.2 DNA提取与定量分析按照 GA/T 383-2014中的要求进行。
4.3 SNP分型
4.3.1 采用基于微测序的 SNaPshot方法进行 SNP分型。分型方法包括: PCR扩增、引物延伸反应和电泳分型。
4.3.2 PCR扩增
4.3.2.1 PCR扩增试剂、仪器、反应体系及循环参数:按照 GA/T383-2014中的要求进行。
4.3.2.2 在法医学领域应用 SNP进行个人识别和亲缘关系鉴定时,本规范建议可在以下 SNP中选择:
a)【常染色体 SNP】
1) 二等位 SNP: rs740910、rs1490413、rs1335873、rs1979255、rs1493232、rs2040411、rs1528460、rs717302、 rs251934、rs8037429、rs891700、rs901398、rs873196、rs964681、rs737681、rs1463729、 rs1360288、rs1382387、rs1413212、rs2056277、rs2107612、rs1015250、rs1005533、rs729172、 rs10495407、rs1357617、rs719366、rs1031825、rs733164、rs938283、rs2111980、rs1886510、 rs914165、rs354439、rs763869、rs2076848、rs1024116、rs1355366、rs735155、rs1454361、 rs727811、rs917118、rs2831700、rs907100、rs1029047、rs2046361、rs722098、rs876724、 rs2016276、rs826472、rs2830795、rs1028528。
2) 三等位 SNP: rs1630312、rs3091244、rs2069945、rs6001030、rs140676、rs356167、rs941454、rs10045、 rs3743842、 rs2298556、 rs3816662、 rs2307223、 rs10811897、 rs17287498、 rs385780、 rs11141033、rs4540055、rs3812847、rs2032582、rs2278786。
b)【非常染色体 SNP】
1) Y染色体 SNP: rs11096433、M145、rs9306845、rs9786479、rs17276358、rs2075640、M134、M88、M95、 rs16980426、rs17323322、M122、rs13447354、M89、rs9786707、M15、rs16980711、M9、 rs17316592、rs17276345。
2) X染色体:rs2056688、rs2128519、rs1534285、rs763056、rs1373592、rs993010、rs1557054、rs1243792、 rs925178、rs1207480、rs1936313、rs1977719、rs1372687、rs1857602、rs985425、rs933315、 rs2190288、rs1991961、rs1931662、rs149910、rs1573704、rs1340718、rs1930674、rs1339597、 rs1981452。
3) 线粒体 SNP: 709、1719、1736、3010、3394、3970、4216、4883、5147、5417、5460、6392、6455、 8584、8701、9090、10397、10398、11914、12705、13708、13928、14318、14783、15487、 16519。
注:在上述 SNP基础上可增加文献报道且经验证的其它 SNP,以提高检测的系统效能。
4.3.3引物延伸反应扩增产物使用核酸外切酶(Exo)和虾碱性磷酸酶 (SAP)进行纯化。在 Exo和 SAP酶处理后的PCR产物中加入SNP的单碱基延伸引物、 SNaPshot mix进行单碱基引物延伸反应,反应完成后,通过向产物中加入 SAP来消化未结合的荧光素标记的 ddNTP。
4.3.4电泳分型使用遗传分析仪,对 PCR产物进行毛细管电泳分析,数据分析可使用为观测峰的颜色和片段长度范围涉及的 Genotyper或 GeneMapper ID等软件进行 SNP分型。具体步骤按照仪器或软件操作手册进行。
5 SNP分型结果分析
5.1分型结果的说明
5.1.1 峰的位置与 SNP遗传标记 5’端加尾的长度有关,表示相互区别的不同位点。纯合子以单峰形式出现,杂合子通常以不同颜色峰显示。
5.1.2 峰的颜色表示所选择的SNP的核苷酸信息,四种脱氧核糖核苷酸标记不同颜色的染料: A(绿色), G(蓝色), C(黄色,为了达到更好的视觉效果,通常显示为黑色), T(红色)。因此,在电泳图谱中出现一个绿色峰,表明一个 A(ddATP)通过聚合酶结合在 SNP上。
5.2分型结果的基本要求
5.2.1确认内标峰高阈值大于 100相对荧光单位,且每一内标峰标定正确。
5.2.2确认已知阳性参照物的分型结果正确,阴性参照物无等位基因峰。
5.2.3样本分型图谱清晰,且峰高大于 100相对荧光单位。
5.3拔起峰的分析
5.3.1拔起峰(pull up峰)指含有荧光染料的单碱基延伸反应产物从一个光谱通道扩散到另一个通道的结果在电泳图谱中的呈现。
5.3.2每一种荧光染料都有不同波长的最大发射光谱,而当某一荧光染料过多造成 matrix去颜色叠加不能正常工作,会出现拔起峰的现象
5.3.3当一个样本的 SNP分型图谱中,与主峰处于同一纵轴线的其他所有颜色上均有相应的吸收峰时,判断为拔起峰,通常由于超高峰所致。
5.3.4拔起峰可通过减少扩增时的样本 DNA量、减少扩增循环数、减少单碱基延伸反应产物、重建光谱校正等来消除。
5.4等位基因丢失的分析
5.4.1当 PCR扩增或单碱基延伸反应的模板在引物结合区发生突变,阻碍引物结合,会导致扩增失败或引物延伸失败,无法检测到模板 DNA中本身存在的一个等位基因。
5.4.3考虑有等位基因丢失可能时,需更换 DNA序列不同的引物进行重新检测。
5.5非特异峰的分析
5.5.1 PCR引物去除不全:表现为在电泳图谱上出现的片段长度为比 PCR引物长度多 1个碱基的产物,为 Exo酶对 PCR引物消化不全,可加大 Exo酶量消化后去除。
5.5.2 ddNTP去除不全:未经消化的 ddNTP常出现在大于70bp的位置,超量的ddNTP也会出现在较短片段位置,为SAP对未结合的荧光素标记的 ddNTP消化不完全所致,可通过加大 SAP量消化后去除,由于 ddNTP是荧光素标记的,该原因导致的额外峰也称为染料峰。
5.5.3荧光污染:由于抗菌素、维生素、多环芳香族化合物、荧光助色物质、各种纺织染料等有荧光,导致出现非特异峰也称荧光污染峰,通常比较宽,拥有较宽的荧光光谱范围,可通过有机提取法去除。
5.5.4其它:还有由气泡、尿素结晶或电压波动引起的非特异峰称为伪峰,通常尖耸且出现在四种颜色的相同位置,没有重复性。
6 SNP分型结果表示
分型结果的描述: SNP检验结果以表格的形式列出,标明检材或样本的编号、 SNP名称及等位基因分型。等位基因以 A、C、G、T表示,等位基因间以“/”分隔;纯合子只标出 1个;未得到分型或无法明确判定分型的标为“-”。
7 SNP分型结果应用
7.1补充个人识别鉴定 STR基因座被广泛应用于 DNA数据库建立和实际案件鉴定的个体识别。当犯罪现场提取的物证为降解检材时, SNP分型结果可作为补充鉴定应用于个体识别,即通过比较案发现场收集到的法医物证检材与嫌疑人的 SNP遗传标记,判断前后两次或多次出现的个体是否为同一个体。若两份检材的 SNP分型不同,可判断两份检材不是来自同一个体;若 SNP分型相同,则称为两份检材的 SNP分型匹配,即不能排除两份检材来自同一个体。
7.2 辅助亲缘关系鉴定当 STR系统的分型结果不足以确定某些复杂亲缘关系时, SNP可以作为补充鉴定的遗传标记。常染色体 SNP符合孟德尔遗传规律,即子代的等位基因一个来自于父亲,一个来自于母亲。在有争议的父母和孩子三份样本所检测的多个 SNP分型结果中,孩子的一对等位基因分别在有争议父母的基因型中找到来源时,不排除该有争议父母为孩子的生物学父母。 Y染色体、X染色体和线粒体SNP可在某些特殊的亲缘关系鉴定中作为补充鉴定的遗传标记使用。
8 SNP分型结果评估
8.1个人识别
8.1.1 匹配。两份检材所检测的多个 SNP均相同时判断为匹配。两份检材遗传标记分型匹配有两种可能的原因:①两份检材来自同一个体;②两份检材不是来自同一个体,理论上可能来自群体中的一名随机个体,仅仅因其遗传标记碰巧相同而出现了匹配。此时可以通过计算匹配概率来估计一个理论上的随机个体碰巧匹配的可能性有多大。匹配概率按附录 B计算,似然率按附录 C计算。
8.1.2 不匹配。在排除拔起峰、等位基因丢失、非特异峰等前提下,两份检材在所检测的 SNP中有两个及以上不同时判断为不匹配。
8.1.3 两份检材在所检测的 SNP中只有一个不同时,不能排除两份检材来自同一个体,需增加检测更多 SNP。增加检测更多 SNP后,两份检材在所检测的 SNP中有两个及以上不同时判断为不匹配。
8.2 亲子鉴定
SNP作为亲子鉴定的补充遗传标记。累积非父排除概率和累积父权指数按 GA/T 965-2011或 SF/Z JD0105001-2010中的要求计算。对于不符合遗传规律的 SNP,PI取值可为 0.00001.
8.3 SNP与 STR的同时使用
当 SNP与 STR同时使用时,或多个 SNP同时使用时,需有证据表明 SNP与 STR是相互独立的,或 SNP之间是相互独立的。不能证明相互独立时按单倍型计算。
附录A(规范性附录)-有关本规范采用微测序法作为SNP 分型技术的说明
由于SNP 不具有与STR 相当的多态信息量,实际案件中DNA 样本量往往又十分有限,所以法医SNP 检测方法必须具有同时检测多个SNP 的能力。微测序法能同时复合分析多个SNP,符合这一要求。微测序方法更重要的优点是可直接用于当前绝大多数法医DNA 实验室的多色荧光电泳检测设备上,包括310、3130 和3500 等基因分析仪。现有实验室无需新增设备即可开展检验。这种技术灵敏度高,被证实应用于案件样本相当有效。其他方法需要添加特殊设备,不需添加设备的通量又较低。
本技术规范仅规定了法庭科学DNA 实验室用微测序法进行法医SNP 分型的要求及结果判断标准,其他方法可参照本规范。
附录B(规范性附录)-随机匹配概率计算
在法医物证学范畴内,随机匹配概率是指一名与案件没有关系的随机个体纯粹由于机会与检材分型结果一致的概率。计算公式为:
Pr (E|Hd) = 1×P(X)
式中随机匹配概率(E|Hd),竖线右边为条件,左边为事件,P(X)为人群中这种DNA 图谱的频率,以频率估计概率,即为发现这种DNA 图谱的理论概率。随机匹配概率越小,遇到这种个体的可能性越小,支持现场检材是嫌疑人留下的假设。
附录C(规范性附录)-似然率计算
似然率基于两个假设,一个现场检材是嫌疑人所留(原告假设)和现场检材是一个与案件无关的随机个体所留(被告假设),计算公式为:
LR= Pr(E/Hp)/ Pr(E/Hd)
式中(Hp)现场检材是嫌疑人所留(原告假设),(Hd)现场检材是一个与案件无关的随机个体所留(被告假设),Pr(E|Hp)为原告假设Hp 条件下获得证据DNA 图谱的概率,Pr(E|Hd)为被告假设Hd 条件下获得证据DNA 图谱的概率。统计学上似然率在数值上超过1,支持原告假设(Hp);反之,如果小于1,则支持被告假设(Hd)。在法医个人识别实践中,当似然率在数值上超过全球人口总数时,表明证据有足够强度支持原告假设。