数据挖掘取样方法研究.pdf

所属栏目:计算机软件及计算机应用

【日期】:2011-01-15
【关键词】:数据挖掘;;均匀取样;;偏倚取样;;数据流;;概要数据结构
【摘要】:取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取样算法分类框架.在指出了均匀取样局限性的基础上阐述了某些应用场景中选用偏倚取样方法的必要性,综述了取样技术在数据挖掘领域的应用研究与应用发展,最后对数据流挖掘取样方法面临的挑战和发展方向进行了展望.


科技文档


医学文档


实用文档