多基因组可视化-数控滚圆机滚弧机张家港电动液压滚圆机滚弧机折
作者:lujianjun | 来源:欧科机械 | 发布时间:2019-06-22 10:39 | 浏览次数:

面向多基因组的研究,以建模多个体关系和比较个体差异为主要研究内容。多基因组可视化可以帮助研究者依据多个体关系,有目的地分析、比较多基因组之间的差异。多个基因组遗传变异层面的比较,因为变异数量巨大、并且绝大部分变异并无信息性,故而很难在有限的显示空间内可视化。本文根据多基因组可视化的需求,分析了多基因组可视化的数据降维策略,提出了基于LDA模型及KL散度的多基因组相似度求解方法,建立了基于MDS算法的多基因组可视化降维方法,并使用千人基因组第三阶段的基因组变异数据,验证上述方法的可靠性。 。人类基因组之间有高达99.9%的相似性,个体基因组一般被表示为相对于一个标准的参考基因组的一组变异信息。因此基因组可以表示为许多变异的集合,对于基因组而言,这些变异只有分子位置上的顺序关系,语义关联上的顺序关系可以被忽略。而根据不同的问题背景,该基因组可能具有不同的属性,如不同人群多基因组可视化-数控滚圆机滚弧机张家港电动液压滚圆机滚弧机折弯机倒角机、超级人群,或者疾病-正常、疾病的不同亚型等等。本文以属于不同人群的多个基因组为例,应用LDA模型计算多基因组的相似程度   本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanji.name,本例中,个体的基因组事实上可能是多个人群的混合,如混血。图1显示了多基因组相似度计算问题的数据与LDA模型术语间的映射关系。本文根据先验知识的变异预筛选策略能够使多基因组相似度计算问题的规模降低到LDA模型的求解算法能够求解的范围内,并更好地识别有意义的人群-变异关系和基因组相似特征变异。图1多基因组相似度计算问题的数据与LDA模型术语的映射关系Fig.1M一般的LDA模型解类似,人群(多基因组的子类别)的相似度以及多个个体基因组之间的相似度可以使用Kull-back-LeiblerDivergence,即KL散度(KL距离)[7]来刻画,由于KL散度的不对称性,也可以使用对称KL散度,即KL散度的算术平均数、几何平均数、调和平均数,或者JS散度(Jene)及其平方根[8-9],本文将使用JS散度的平方根作为两个个体基因组之间的相似性度量。根据LDA模型的基本理论,使用变分贝叶斯期望最大化(VBEM)算法,可以迭代求解人群分布向量。VBEM算法引入变分参数γ和φ,简化了原来由于θ、z和w的条件关系而难以求解的概率图模型。指定了简化的可优化下界的函数后,即需寻多基因组可视化-数控滚圆机滚弧机张家港电动液压滚圆机滚弧机折弯机倒角机   本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanji.name