当前位置:首页 > 科技文档 > 软件 > 正文

基于关联分析数据挖掘的Hadoop脏数据动态清理

计算机仿真 页数: 5 2025-10-15
摘要: Hadoop系统中的内存持久化场景增加了元数据开销,使得数据集中易于混入离群点,在降低缓存命中率的同时无法均衡调整数据管理粒度,导致脏数据清理效果不佳,为此,基于关联分析数据挖掘,对Hadoop脏数据动态清理方法展开研究。通过Apriori关联规则算法提取脏数据特征量,对脏数据频繁项集进行分析;引入支持度自适应更新策略,采用局部离群点检测算法剔除K-means聚类离群点,基于改... (共5页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报