题目:蛋白质相互作用数据可信性评价及其在蛋白质相互作用预测中应用
作者:李明辉
摘要:目前确定蛋白质相互作用的高通量实验方法具有高假阳性和假阴性的问题,导致蛋白质相互作用数据库中存在很多噪声。
这不仅为生物学家在采用这些数据进行科学研究带来不便,而且也为计算学家在开发基于数据驱动的相互作用预测方法带来不便,
因此,评价蛋白质相互作用数据的可信性具有很重要的作用。这里采用多种方法对相互作用的可信性进行评价,包括确定相互作用
的实验方法的种类、蛋白质的亚细胞位置、蛋白质的功能类别、基因表达之间的相关性、生物文献挖掘等方法,最后为每个相互
作用给出一个综合的可信性评价指标。把数据可信性应用到目前已有的相互作用预测方法中,采用了基于样本加权的学习方法,
使已有的相互作用预测的性能有了很大的提高。