`
noaighost
  • 浏览: 38810 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

“中国式”的数据挖掘 ——试读《数据挖掘技术(第3版)》有感

阅读更多

“中国式”的数据挖掘

                               ——试读《数据挖掘技术(3)》有感

两年前的五月,我“被老师安排”了毕业论文题。《企业电子商务平台客户细分初探和实现》,还记得那个晚上,我盗取别人的VPN账号,去知网下载论文。那种ctrl+c ctrl+v的快感,会让你迷失,迷失到一篇论文,误以为这么容易就堆砌出来。当然,论文老师很快联系上我,说了一大堆的脏话,引论跟正文没有关系……。那年我也在考研,那种排山倒海的压力,让我无法适从。早上复习,晚上去图书馆翻书,翻书主要的目的是翻看目录,目录可以让你更快了解这类知识的要点(这也是数据挖掘的一个核心思想)。

我记得老师在初评大会上,对我的论文说了一句话:“你认真写好综述先吧,论文可以重写了。”我说:“老师,怎么可以拿到优秀论文?”“你是不可能的,你慢慢写吧”。同组的人员,有一个同学抽到微博类的研究,我心里嘀咕着,我怎么没有抽到更好的呢?

就因为老师这句话,我顶住各种压力。我每天翻阅很多客户细分的书籍,为了拿到优秀论文,我甚至做了一个大胆的决定,直接把我当时打理的商城网站,做了一些功能。这功能就是对客户的行为进行了客户细分。结果当然我拿了那年的优秀论文,我从来没有办不到的事。

好了,先分享一下,我对数据挖掘的一些认识。理所当然,我打开试读pdf的《数据挖掘技术(3)》。老规矩,我先看它的目录。那些词条,让我觉得很亲切,因为以前写论文,对这些词,有过了解。

这本书的知识点很全面,是很多学习数据挖掘的经典。但问题就出在它是本经典,中国式的三个字,又套上头上去了,中国式的数据挖掘,就是一个条条框框,当某一个数据到点后,科研人员把一堆数字比对,计算,最后教条思维是数据挖掘的最大敌人。

很多人在PPT上列出一大堆数据,很多人在生产调整时,常用统计学去预测各种需要的数据。但你有想过这都是西方国家的东西吗?那种水土不服性,会让你厌恶传统的知识,空无乏味。

浏览了一下案例,这些案例都算是经典,感觉中国式的数据挖掘,需要通过理论学习,然后用实际经验,问问自己到底要得到什么数据,要用什么数学工具实现。这才是重点。

0
2
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics