实用标准文案 数据挖掘技术综述 随着计算机、网络技术的发展,获得有关资料非常简单易行。但 对 数量大、涉及面宽的数据,传统统计方法无法完成这类数据的分析。 因 此,一种智能化的、综合应用各种统计分析、数据库、智能语言来 分析庞 大数据资料的“数据挖掘” (Date Mining )技术应运而生。本 文主要介 绍了数据挖掘的基本概念以及数据挖掘的方法; 本文对数据 掘的应用及其发展前景也进行了描述。 随着信息技术迅速发展,数据库的规模不断扩大,从而产生了大 量 的数据。激增的数据背后隐藏着许多重要的信息, 人们希望能够对 其行 更高层次的分析,以便更好地利用这些数据。为给决策者提供一 个统一的 全局视角,在许多领域建立了数据仓库。但大量的数据往往 使人们无法辨 别隐藏在其中的能对决策提供支持的信息, 而传统的查 询、报表工具无法满足挖掘这些信息的需求。因此,需要一种新的数 据分 析技术处理大量数据,并从中抽取有价值的潜在知识,数据挖掘 (Data Mining )技术由此应运而生。数据挖掘技术也正是伴随着数 据仓库技术的 发展而逐步完善起来的数据挖掘是指从数据集合中自 动抽取隐藏在数据中 的那些有用信息的非平凡过程, 这些信息的表现 形式为:规则、概念、 规律及模式等。
它可帮助决策者分析历史数据 及当前数据,并从中发现隐 藏的关系和模式,进而预测未来可能发生 的行为。数据挖掘的过程也叫知 识发现的过程, 它是一门涉及面很广 的交叉性新兴学科,涉及到数据 库、人工智能、数理统计、可视化、 并行计算等领域。数据挖掘是一种新 的信息处理技术,其主要特点是 精彩文档 实用标准文案 对数据 库中的大量数据进行抽取、转换、分析和其他模型化处理,并从 中 提取辅助决策的关键性数据。数据挖掘是 KDD( Knowledge Discovery in Database )中的重要技术,它并不是用规范的数据 库查询语言(如 SQL 进 行查询,而是对查询的内容进行模式的总结 和内在规律的搜索。传统的查 询和报表处理只是得到事件发生的结果, 并没有深入研究发生的原因,而 数据挖掘则主要了解发生的原因, 并 且以一定的置信度对未来进行预 测,用来为决策行为提供有利的支持。 数据挖掘的研究融合了多个不同学科领域的技术与成果, 使得目 前的数据挖掘方法表现出多种多样的形式。 从统计分析类的角度来说, 统计分析技术中使用的数据挖掘模型有线形分析和非线形分析、 回归 分析、逻辑回归分析、单变量分析、多变量分析、时间序列分析、最 近序 列分析、最近邻算法和聚类分析等方法。
利用这些技术可以检查 那些异常 形式的数据,然后,利用各种统计模型和数学模型解释这些 数据,解释隐 藏在这些数据背后的市场规律和商业机会。知识发现类 数据挖掘技术是一 种与统计分析类数据挖掘技术完全不同的挖掘技 术,包括人工神经元网 络、支持向量机、决策树、遗传算法、粗糙集、 规则发现和关联顺序等。 传统的统计学为数据挖掘提供了许多判别和回归分析方法, 常用 的有贝叶斯推理、回归分析、方差分析等技术、贝叶斯推理是在知道 新的 信息后修正数据集概率分布的基本工具, 处理数据挖掘中的分类 问题, 回归分析用来找到一个输入变量和输出变量关系的最佳模型, 在回归分析 中有用来描述一个变量的变化趋势和别的变量值的关系 的线性回归,还有 精彩文档 实用标准文案 用来为某些事件发生的概率建模为预测变量集的对 数回归、统计方法中的 方差分析一般用于分析估计回归直线的性能和 自变量对最终回归的影响,是许多挖掘应用中有力的工具之一。 关联规则是一种简单大数据可视化技术综述,实用的分析规则,它描述了一个事物中某 些 属性同时出现的规律和模式,是数据挖掘中最成熟的主要技术之一。 它是 由 R Agrawal 等人首先提出的,最经典的关联规则的挖掘算法 是 Apriori,该算法先挖出所有的频繁项集,然后,由频繁项集产生 关联规 则,许多关联规则频繁项集的挖掘算法都是由它演变而来的, 关联规则在 数据挖掘领域应用很广泛适合于在大型数据集中发现数 据之间的有意义关 系,原因之一是它不受只选择一个因变量的限制, 关联规则在数据挖掘领 域最典型的应用是购物篮分析。
大多数关联规 则挖掘算法能够无遗漏发现隐藏在所挖掘数据中的所有关联关系, 所 挖掘出的关联规则量往往非常巨大, 但是,并不是所有通过关联得到 的 属性之间的关系都有实际应用价值,对这些关联规则进行有效的评 价,筛 选出用户真正感兴趣的,有意义的关联规则尤为重要。 聚类分析
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。