数据仓库出现在20 世纪80 年代中期,它是一个面向主题的、集成的、非易失的、时变的数据集合,数据仓库的目标是把来源不同的、结构相异的数据经加工后在数据仓库中存储、提取和维护,它支持全面的、大量的复杂数据的分析处理和高层次的决策支持。
数据仓库使用户拥有任意提取数据的自由,而不干扰业务数据库的正常运行。
数据挖掘是从大量的、不完全的、有噪声的、模糊的及随机的实际应用数据中, 挖掘出隐含的、未知的、对决策有潜在价值的知识和规则的过程。一般分为描述型数据挖掘和预测型数据挖掘两种。
描述型数据挖掘包括数据总结、聚类及关联分析等,预测型数据挖掘包括分类、回归及时间序列分析等。其目的是通过对数据的统计、分析、综合、归纳和推理, 揭示事件间的相互关系,预测未来的发展趋势,为企业的决策者提供决策依据。