基于LPP-RF的基因表达数据分类
摘要: 为提高随机森林算法在基因表达数据分类方面的性能,提出基于局部保持映射的随机森林算法。对每棵决策树的所有节点,通过局部保持映射,将节点数据映射到新的属性空间中,选取第一个属性为最佳分裂属性。与传统随机森林算法相比,该算法缩短了决策树的构建时间,增加了决策树之间的差异性,明显提高了分类准确率。在9个标准基因表达数据集的对比实验结果表明,该算法性能优于传统随机森林算法,对基因表达数据中类不平衡导致正类样本准确率低的问题有一定改善。 (共7页)
开通会员,享受整站包年服务