“中国式”的数据挖掘
——试读《数据挖掘技术(第3版)》有感
两年前的五月,我“被老师安排”了毕业论文题。《企业电子商务平台客户细分初探和实现》,还记得那个晚上,我盗取别人的VPN账号,去知网下载论文。那种ctrl+c ctrl+v的快感,会让你迷失,迷失到一篇论文,误以为这么容易就堆砌出来。当然,论文老师很快联系上我,说了一大堆的脏话,引论跟正文没有关系……。那年我也在考研,那种排山倒海的压力,让我无法适从。早上复习,晚上去图书馆翻书,翻书主要的目的是翻看目录,目录可以让你更快了解这类知识的要点(这也是数据挖掘的一个核心思想)。
我记得老师在初评大会上,对我的论文说了一句话:“你认真写好综述先吧,论文可以重写了。”我说:“老师,怎么可以拿到优秀论文?”“你是不可能的,你慢慢写吧”。同组的人员,有一个同学抽到微博类的研究,我心里嘀咕着,我怎么没有抽到更好的呢?
就因为老师这句话,我顶住各种压力。我每天翻阅很多客户细分的书籍,为了拿到优秀论文,我甚至做了一个大胆的决定,直接把我当时打理的商城网站,做了一些功能。这功能就是对客户的行为进行了客户细分。结果当然我拿了那年的优秀论文,我从来没有办不到的事。
好了,先分享一下,我对数据挖掘的一些认识。理所当然,我打开试读pdf的《数据挖掘技术(第3版)》。老规矩,我先看它的目录。那些词条,让我觉得很亲切,因为以前写论文,对这些词,有过了解。
这本书的知识点很全面,是很多学习数据挖掘的经典。但问题就出在它是本经典,中国式的三个字,又套上头上去了,中国式的数据挖掘,就是一个条条框框,当某一个数据到点后,科研人员把一堆数字比对,计算,最后教条思维是数据挖掘的最大敌人。
很多人在PPT上列出一大堆数据,很多人在生产调整时,常用统计学去预测各种需要的数据。但你有想过这都是西方国家的东西吗?那种水土不服性,会让你厌恶传统的知识,空无乏味。
浏览了一下案例,这些案例都算是经典,感觉中国式的数据挖掘,需要通过理论学习,然后用实际经验,问问自己到底要得到什么数据,要用什么数学工具实现。这才是重点。
相关推荐
本书图文并茂,示例丰富,第3版从190段代码和164幅图表增加至205段代码和220幅图表,对C语言的基础知识进行了彻底剖析,内容涉及数组、函数、指针、文件操作等。对于C语言语法以及一些难以理解的概念,均以精心绘制...
09金融联考复习全书——辅导讲义(试读版)
真正的带书签高清文字版 第3版,本书只供试读,大家如果觉得不错,请购买原版! ●久负盛名的Python入门经典 ●中文版累计销量200000+册 ●针对Python 3全新升级 本书包括Python程序设计的方方面面:首先从Python的...
手机游戏开发全书——部分章节试读.pdf
算法之美——隐匿在数据结构背后的原理(C++版)试读样章
真正的带书签高清文字版 第3版,本书只供试读,大家如果觉得不错,请购买原版! ●久负盛名的Python入门经典 ●中文版累计销量200000+册 ●针对Python 3全新升级 本书包括Python程序设计的方方面面:首先从Python的...
NULL 博文链接:https://webmaster.iteye.com/blog/2092746
NULL 博文链接:https://webmaster.iteye.com/blog/2020351
百度推广——搜索营销新视角试读样章之第五章案例
内容简介: 这本书是一本专门介绍实时扫描的防毒软件、虚拟磁盘、硬盘还原、硬盘透明加密、 文件透明加密、防火墙、反外挂、反窃取密码等软件的Windows 内核...术书。这本书的读者需要有C 语言的基础。 作者: 楚狂人
NULL 博文链接:https://webmaster.iteye.com/blog/2040119
本书包括 Python程序设计的方方面面:首先,从 Python的安装开始,随后介绍了 Python的基础知识和基本概念,包括列表、元组、字符串、字典以及各种语句;然后,循序渐进地介绍了一些相对高级的主题,包括抽象、异常...
包括文件、内存结构以及构成Oracle数据库和实例的底层进程,利用具体示例讨论了一些重要的数据库主题,同时分析了数据库中的物理结构,如表、索引和数据类型,并介绍采用哪些技术能最优地使用这些物理结构。...
NULL 博文链接:https://webmaster.iteye.com/blog/2077436
NULL 博文链接:https://webmaster.iteye.com/blog/2102830
《响应式Web设计实践》试读干货,响应式——适应浏览器的不同——Web设计实践
Python高手之路 试读版 PDF电子书下载 带书签目录,注意,是试读版本