系统简介
提出蛋白质二级结构智能预测系统模型------复合金字塔模型。其中KAAPRO方法以数据挖掘(知识发现)为主体,采用基于KDD*过程模型Maradbcm算法以及关联规则分类D-CBA方法。KAAPRO方法所取得关联规则在一定程度上揭示了氨基酸物化属性对蛋白质二级结构的影响关系,从而提高了预测的精度。其中Maradbcm算法挖掘意外规则的特性对纯度较高的α蛋白质库与β蛋白质库进行关联规则的挖掘,由此获得的挖掘结果是精化的规则。D-CBA关联分类方法使用可信度与支持度的测度作为一个复合型度量来进行蛋白质关联分类。该项研究取得生物信息学领域国际性难题------蛋白质2级结构预测精度的国际领先地位,通过开放服务器产生重要国际影响,并得国际著名学府与学者的高度评价与合作。
系统机理
提出了多层递阶、逐步求精的蛋白质二级结构智能预测模型构造技术,此模型融合了原创型KAAPRO方法、新型同源性分析方法、改进型SVM方法等;打破了传统的单一物化属性分析或单一结构序列分析的技术线路,而是采取了结构序列分析与物化属性分析相结合的优选线路,确保了模型整体的优化与预测精度的同时具有更好的普适性;采用高起点的alpha/beta库挖掘;并以领域知识与背景知识贯穿;能够很好地对偏alpha/beta型蛋白质的二级结构进行预测。
获奖专利
已经获得 “一种基于关联分析与关联分类的蛋白质二级结构预测技术”、“一类蛋白质二级结构智能预测模型构造技术”等多项发明专利。
联系方式
联系人:杨炳儒,谢永红
联系人邮箱:bryang_kd@126.com,xieyh@sina.com