自2015年ACMG针对基因变异的解读整体框架出台后,在医学遗传分析角度需要能快速的从全外或全基因组的数据中找出可疑的致病变异来进行进一步的医学解读,以提供精准诊断参考。
序祯达基于最新科学依据,配合自主研发和验证的解读分析软件与验证分析流程,提供医学遗传方面的专业解读,有助于提高医学解读变异评级的精准度,为疾病的分子诊断提供全面、科学的帮助指导。
01 数据挖掘 与精准医学的探索利器
生信技术人员会通过不同的逻辑来应用各种数据库提供给医学人员专业的解读变异信息。借助部分自动化流程时可以过滤掉不必要评级的变异(提升效率),但在避免过滤掉可能成为(疑似)致病变异的时候,会导致医学解读人员无法得知变异的存在(降低过滤流程所导致的假阴性)。因此,利用公用数据库收集各类信息及文献,并使用这些信息解读与评级时,需要生信分析与医学人员对数据库充分理解后才可能达到无缝接轨的流程。
在ACMG最初的解读框架中推荐了几个数据库给从事医学遗传分析人员收集相关信息,其中ClinVar及HGMD是现在大多数医学遗传解读人员所使用的数据库。在此针对此两个数据库的部分功能或内容做个简单说明,让生信与医学解读的从业人员能快速的理解此两个数据库的应用场景,便于理解数据库用于自动化流程的开发及自动化应用的局限性。
02 ClinVar及HGMD 页面信息意义
ClinVar是一个收集了大量基因变异信息的公用数据库,数据库内容包含了各种基因变异类型(如错义、无义突变或是拷贝数变异等)的搜索功能与个别基因变异相关的疾病表型以及各种变异在基因组、不同转录本上的信息或是过去采用的命名等信息。如果初学者想知道特定基因或基因组区段有哪些已知变异种类,可以先进入该数据库地址后(https://www.ncbi.nlm.nih.gov/clinvar/),在搜索框内输入目标基因后可查询出其所收集的变异列表,点击特定的变异,可呈现出该变异的信息(图2)。
以HBB的一个从5’-UTR到CDS的第92个核苷酸缺失变异为例,目前该变异的评级为1星的致病变异,这意味着目前只有一个代表的上报者认定为该变异是致病的。然而该提交单位不一定是按照ACMG的框架来定义评级的,因此往往当有多个提交单位出现时,评级会出现不一致的情况。
在应用的过程中,生信需注意有这类注释的变异可能会被设计的生信流程过滤掉,而医学遗传分析人员避免直接采用ClinVar的致病评级,需要按照ACMG的框架及规则,解读与此变异有关的所有文献证据,才可基于这些证据的组合给出变异评级,所以ClinVar上的文献会是医学遗传分析人员需要重点关注的部分。
另一方面,HGMD是由QIAGEN所开发出来的公用变异数据库(图3),可通过搜索基因名找出目标变异的信息相关文献数据集。由于HGMD是企业开发的数据库,所以不对外提供免费及时的变异信息,一般学术单位所使用的免费版信息会滞后2-3年(仅提供约20万个变异),商用版则提供超过30万个变异的信息。
然而HGMD所提供的临床变异评级分类不同于ClinVar的方式,分成了DM(被HGMD的学者评定为能直接导致疾病),DM?(曾被HGMD的学者评定为能直接导致疾病,但后来发现有相反证据的变异),DP(被认定为与疾病相关的多态),FP(体外实验认定影响功能的变异)等分类方式。
一般HGMD的评级分类与ACMG的框架无关,因此虽然生信人员得确保HGMD的DM或DM?的变异不要被过滤掉外,还需要把HGMD提供的文献基于ACMG的框架或ClinGen所制定的特定指南优化来将致病变异评级。
当一个变异同时在ClinVar被评为P/LP【致病/疑似致病】且HGMD被标记为DM时,仅仅是说明该变异被2个数据库同时收录,并不是代表其必然可以被评为致病或疑似致病变异,也不代表其有更多致病证据,毕竟致病证据的强弱始终得由医学解读人员基于与该变异的相关文献内容来判断证据的强度。
因此对于生信人员来说,重点在于利用这些数据库在注释后提供给医学解读人员相关变异减少错漏,医学解读人员可以先行阅读ClinVar及HGMD所提供的文献来先明确致病证据而后再找其他的文献证据,以避免证据未收集全而导致当前评级不精确的问题。
03 变异数据库可提供自动化逻辑 筛选必要解读变异
前面提到的ClinVar中有针对各自变异致病/良性评级的信息,并且可通过其提供的星级来判断各机构对该评级评判一致性的可信度。一般来说,3星以上的变异是有ACMG的医学遗传专家评级过的变异。在设计自动化流程中,3星以上的ClinVar的P/LP变异对生信来说是必须设计为完全保护的变异,而3星级以上的B/LB【良性/疑似良性】。原则上若经过人群频率验证为高频变异后,是可以作为排除的变异。
基于这个特性强化自动化过滤所设计的生信流程,可以让医学解读人员透过生信人员的流程设计来加快解读的效率的,而这类的信息往往也需要生信人员与医学解读人员对各数据库内容的意义达到一定的了解程度,才能共同设计的流程。
由于各种数据库的变异信息收集的方式不同,所以里面的变异内容也有差异,因此各数据库功能上无法相互取代。对于设计过滤流程的生信人员来说,虽然无需理解全部的ACMG证据框架,但需要与医学解读人员一起把各数据库所代表的意义加以整合,从上万的全基因组或全外显子变异列表。
基因科技门户GeneTechCn.com精选文章《医学解读“基石”,利用数据库辅助遗传病诊断的自动化应用》文中所述为作者独立观点,不代表基因科技门户立场。如若转载请注明出处:https://www.genetechcn.com/877.html