俗话说:“做事先做人,靠谱先知谱”,在学习认识大数据的时候我们不仅要学习他们的基本概论,其实大数据的几个常用逻辑我们也是要知晓的,这好比生活中的常识,但是往往会产品一些常识性的误解,借此机会慧都大数据为大家分享6个大数据逻辑知识,科普几个常见的逻辑错误。
1、靠谱的结果,依赖于靠谱的数据和靠谱的分析过程。
在大数据的背景下,这个结论是不是仍然成立?我认为仍然成立。数据量多了,可以滤除随机干扰、可以找到更多的佐证、可以打造更加完整、严密的逻辑链。如此可以。
2、任何未经认真研究的结果,都不能保证靠谱。
“春运期间,有个记者在很多辆火车上问:大爷、大娘、小伙子、小姑娘,你们都买到票了吗? 当他发现大家都买到了票。于是认为:春运火车票很好买”。这个段子告诉我们:离开正确的分析方法,数据多并不能得到正确的结论。
3、数据的相关性可以提供线索,但不能作为靠谱的结论。
大数据的迷人之处,在于相关性分析能够给我们提供一些意想不到的视角,并让我们得到意想不到的结果。但是,好的发现往往是可遇不可求的。
4、如果你的工作不需要太靠谱,大数据分析是个不错的选择。
给出“推荐”往往就是一个不需要太靠谱的事情。采纳不采纳推荐结果才是重要的。是否采纳数据分析的推荐结果,与事情的重要性有关:随便买点小商品是可以的,可能让你倾家荡产的事情恐怕就没那么简单了。
5、如果你的工作要求结论必须靠谱,就必须把主要精力放在数据质量和分析方法上。
数据质量不仅是数据的精度,关键是数据的相关背景要完整。比如,数据是怎么得到的、影响数据的因素有哪些等等。获取数据的时候就要想到:这些数据的一个重要作用是用来证伪的。如果数据的质量不好,就既不能证明、也不能证伪:只能似是而非。
6、得到一个靠谱的结论,可能要比得到一万个相关性都难。
得到相关的结论就像随便吹牛,得到靠谱的结论就像弄个科学发现。难度当然不可同日而语。
看完了以上6个大数据逻辑,是不是觉得之前对大数据存在很多误解,正如《数据思维》的作者王汉生说到:“数据分析不准确是常态,数据分析准确是变态”,我们应正确的认识到这一点,不用过分神话它。
正如文章讲的我们应该把精力放在数据质量和分析方法上,例如慧都大数据就是通过从数据采集、数据准备、数据建模、可视化分析的端到端的解决方案,保证数据质量的同时提供定制化的大数据算法与建模,为您提供更加可靠的数据分析,探索数据应用价值,通过洞察数据的应用价值,让决策更智能。
欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们将帮您转接大数据专业团队,并发送相关资料给您!
发表评论