集成改进KNN算法预测蛋白质亚细胞定位
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

中央高校基本科研业务费专项资金 (No. KYZ201668),江苏省自然科学基金 (No. BK2012363),国家科技支撑计划 (No. 2015BAK36B05) 资助。


Prediction of protein subcellular locations by ensemble of improved K-nearest neighbor
Author:
Affiliation:

Fund Project:

Fundamental Research Funds for the Central Universities (No. KYZ201668), Natural Science Foundation of Jiangsu Province (No. BK2012363), National Science and Technology Support Program Project (No. 2015BAK36B05).

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    基于Adaboost算法对多个相似性比对K最近邻 (K-nearest neighbor,KNN) 分类器集成实现蛋白质的亚细胞定位预测。相似性比对KNN算法分别以氨基酸组成、二肽、伪氨基酸组成为蛋白序列特征,在KNN的决策阶段使用Blast比对决定蛋白质的亚细胞定位。在Jackknife检验下,Adaboost集成分类算法提取3种蛋白序列特征,3种特征在数据集CH317和Gram1253的最高预测成功率分别为92.4%和93.1%。结果表明Adaboost集成改进KNN分类预测方法是一种有效的蛋白质亚细胞定位预测方法。

    Abstract:

    Adaboost algorithm with improved K-nearest neighbor classifiers is proposed to predict protein subcellular locations. Improved K-nearest neighbor classifier uses three sequence feature vectors including amino acid composition, two dipeptide and pseudo amino acid composition of protein sequence. K-nearest neighbor uses Blast in classification stage. The overall success rates by the jackknife test on two data sets of CH317 and Gram1253 are 92.4% and 93.1%. Adaboost algorithm with the novel K-nearest neighbor improved by Blast is an effective method for predicting subcellular locations of proteins.

    参考文献
    相似文献
    引证文献
引用本文

薛卫,王雄飞,赵南,杨荣丽,洪晓宇. 集成改进KNN算法预测蛋白质亚细胞定位[J]. 生物工程学报, 2017, 33(4): 683-691

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-10-18
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2017-03-31
  • 出版日期:
您是第位访问者
生物工程学报 ® 2024 版权所有

通信地址:中国科学院微生物研究所    邮编:100101

电话:010-64807509   E-mail:cjb@im.ac.cn

技术支持:北京勤云科技发展有限公司