博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Data Mining 概念
阅读量:4331 次
发布时间:2019-06-06

本文共 626 字,大约阅读时间需要 2 分钟。

 

数据挖掘概念:

            数据挖掘是在大型数据库中、自动的发现有用信息的过程。

            然、

            这个有用只是一个感性的东西。比如我们从表中索引一行数据、这个算不上数据挖掘。因为它依赖的是数据的明显特征。

数据挖掘基本步骤:

                      

第一步:

        预处理、把没有加工的数据转换为合适的数据格式。

                 1、融合来自多个数据源的数据。

                 2、清洗数据以消除噪声和重复的观测值。

                 3、选择与当前任务相关的记录与特征。

                 由于数据收集与存储的方式多种多样、数据预处理可能是最费时的一步。

第二步:

         数据挖掘、

                    1、要解决可伸缩性(要求算法不只是适用于小数据量、也要适应海量的数据量)

                    2、高维性(要求算法适应高特征性-----如有几千个属性)

                    3、杂种数据与复杂数据(要求算法适应复杂的数据对象)

                    4、数据所有权与分布

                    5、非传统分析(不是通过假话演绎的方式)

 

第三步:

         后处理、

 

-------------------------------------------------------------------------------------------------------------------------------------------------------

数据挖掘利用了数学中的:

                               统计、抽样、估计、假验证。

数据挖掘利用了人工智能中的:

                                     模式识别、机器学习的搜索算法。

 

转载于:https://www.cnblogs.com/JiangLe/p/4011932.html

你可能感兴趣的文章
设计模式那点事读书笔记(3)----建造者模式
查看>>
ActiveMQ学习笔记(1)----初识ActiveMQ
查看>>
Java与算法之(2) - 快速排序
查看>>
Windows之IOCP
查看>>
机器学习降维之主成分分析
查看>>
CTP2交易所成交回报
查看>>
WebSocket & websockets
查看>>
openssl 升级
查看>>
ASP.NET MVC:通过 FileResult 向 浏览器 发送文件
查看>>
CVE-2010-2883Adobe Reader和Acrobat CoolType.dll栈缓冲区溢出漏洞分析
查看>>
使用正确的姿势跨域
查看>>
AccountManager教程
查看>>
Android学习笔记(十一)——从意图返回结果
查看>>
算法导论笔记(四)算法分析常用符号
查看>>
ultraedit激活
查看>>
总结(6)--- python基础知识点小结(细全)
查看>>
亿级曝光品牌视频的幕后设定
查看>>
ARPA
查看>>
JSP开发模式
查看>>
我的Android进阶之旅------>Android嵌入图像InsetDrawable的使用方法
查看>>