数据挖掘

75 阅读1分钟

数据挖掘是计算机领域研究的热点问题。

由于存在大量数据,可以广泛使用需要这些数据转换成有用的信息和知识,获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制和科学探索。

数据挖掘就是指从数据库的大量数据中揭示出隐含的潜在价值的信息的过程,数据挖掘基于人工智能、机器学习、模式识别等,高度自动化分析企业的数据,作出归纳性推理,帮助决策者调整市场策略,作出正确决策。

数据挖掘的步骤主要有定义问题,建立数据挖掘库,分析数据,准备数据,建立模型,评价模型和实施。数据挖掘分为有指导的数据挖掘和无指导的数据挖掘,类似于有监督和无监督学习。数据挖掘的任务主要有分类、估值、预测、相关性分组、聚类。经典的算法有神经网络、决策树、遗传算法。

数据挖掘存在隐私问题,可能涉及国家安全和商业机密,必须受到规范,适当使用。