大数据时代读书心得大全(16篇)
教育是培养人才的基础,对一个国家的发展至关重要。如何提升自己的领导力,成为一个优秀的领导者?了解他人的总结经验,可以帮助我们更好地进行自我总结。
大数据时代读书心得篇一
大数据时代成为炙手可热的话题。笔者在这说明信息和数据,只是试图首先说明信息、数据的关系和不同,也试图说明,为什么信息时代转变为了大数据时代?大数据时代带给了我们什么?下面是本站小编为大家收集整理的大数据时代。
欢迎大家阅读。
这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。
《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。
下面来重点介绍《大数据时代》这本书的主要内容。
《大数据时代》开篇就讲了google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了20xx年美国的h1n1的爆发地与传播方向以及可能的潜在患者的事情。google的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。同时google的预测与政府数据的相关性高达97%,这也就意味着google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。
接下来,维克多又通过了ibm追求高精确性的电脑翻译计划的失败与google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼近事物的原貌。
之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。
无论如何,大数据时代将会到来,不管我们接受还是不接受!
我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被引诱的对象。所以说,小心你在网上留下的痕迹。
我喜欢这本书是因为它给我展现了一个新的世界。
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。
近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。
当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!
《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。
可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!更何况还有两个更可怕的事情。
其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。
还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。
所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。
在《大数据时代》一书中,大数据时代与小数据时代的区别:1、思维惯例。大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。作者语言绝对,却反思其本质区别。数据的更多、更杂,导致应用主意只能尽量观察,而不是倾其所有进行推理?这也是明智之举2、使用用途。小数据停留在说明过去,大数据用驱动过去来预测未来。笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。3、结构。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化数据的方法,处理结果与未来进行验证。4、分析基础。大数据是在互联网背景下数据从量变到质变的过程。笔者认为,小数据时代也即是信息时代,是大数据时代的前提,大数据时代是升华和进化,本质是相辅相成,而并非相离互斥。
数据未来的故事。数据的发展,给我们带来什么预期和启示?银行业天然有大数据的潜质。客户数据、交易数据、管理数据等海量数据不断增长,海量机遇和挑战也随之而来,适应变革,适者生存。我们可以有更广阔的业务发展空间、可以有更精准的决策判断能力、可以有更优秀的经营管理能力„„可以这些都基于数据的收集、整理、驾驭、分析能力,基于脱颖而出的创新思维和执行。因此,建设“数据仓库”,培养“数据思维”,养成“数据治理”,创造“数据融合”,实现“数据应用”才能拥抱“大数据”时代,从数据中攫取价值,笑看风云变换,稳健赢取未来。
大数据时代读书心得篇二
“大数据”概念早在1980年就有国外的学者提出,可是最近几年才广泛受到大家的关注。当“大数据”这个概念传到中国的时候,瞬间引起了轰动。随即,各种有关“大数据”的资料和书籍充斥的我们的视野。随意打开某个电子商务平台图书类页面,在搜索框中搜索“大数据”三个字,就会出现好多本有关“大数据”的书籍。可是,有一个很有趣的现象就是:几乎所有的平台上,出现的第一本关于“大数据”的书籍一定是《大数据时代》。一点进去,这本书推荐栏里的第一句话就是:迄今为止全世界最好的一本大数据专著。同时,为这本书做推荐的都是各行业的精英领袖。所有“大数据”方面的书籍也是这本书销量最高,评价最好。
我从来不会因为哪本书畅销和很多人推荐就盲目跟风的去看一本书。因为我知道通常在这种情况下选择一本书,整个阅读的体会和感受是无法遵从自己的内心的,整个过程都很容易夹杂着别人对这本书的感受。所以通常我读书的节奏大多都是跟不上“潮流”的,但往往经过风雨洗礼之后沉淀下来的都是精华。坦白讲,阅读这本书的初衷并不是因为我想从书中获取到多少大数据方面的精华,只是很想知道对于这么一个很直白的名词,作者是怎么写出这么厚的一本书的。这种初衷或许很无知和幼稚,可就是这种“愚蠢”的好奇心,让我更透彻的看到书中的精华。
在看《大数据时代》这本书之前,我的所有读后感都是集中在书籍给了我什么思考。对于这本书的读后感,除了观点碰撞之外,我还会加上大部分个人看这本书的体会。因为这本书,已经完全让我模糊了大多数人口中的“全世界最好的书”是一种什么标准。也许《大数据时代》真的无法承载那么高的赞美!
大数据时代的入门书。
看完这本书,我随意调查了一些阅读过这本书并且给这本书绝对好评的朋友。询问他们这本书好在哪里?大多数的回答是说《大数据时代》这本书让对大数据一无所知的他们了解了大数据这个概念,同时通过很多案例说明原来大数据能有这么大的用处,影响会有这么大!仅此而已。我看完这本书最大的感受是这本书分为上、下两部分。前120多页为上部分,后120多页为下部分。之所以说《大数据时代》是一本关于大数据的入门书,是因为这本书用了前面120多页的篇幅反复的强调大数据的出现对社会发展影响很大,并且要人们转变小数据时代惯有的思想。所以整本书的前半部分就强调大数据时代的三个转变:1、大数据利用所有的数据,而不再仅仅依靠一小部分数据,不再依赖于随机采样。2、大数据数据多,不再热衷于追求精确性,也不再期待精确性。3、大数据时代不再热衷于寻找因果关系,而是追求相关关系。所以整个上半部分没什么可详说的。我们重点聊聊本书的后半部分。
既然一直都在强调大数据对我们的意义,总要有具体体现。整本书中,我感触最大的一个案例就是某公司通过分析大数据发现:新品发布的时候,旧一代的产品可能会出现短暂的价格上涨。因为人们在心理上就认为新产品的推出,旧产品就会便宜,从而就会提高购买量。这个发现和我们平常的心理是完全违背的,而且如果不用数据来证明,直接讲道理给大家可能还是无法相信。这就是大数据对我们很多传统思维的颠覆。一旦涉及到思维的改变,往往就会引起整个社会的大变动。
大数据这个概念的出现,让大数据逐渐发展形成一条价值链。在这条价值链上,数据本身、技能和思维是最重要的环节。随着互联网技术的发展,越来越多的公司都能收集到大量的数据,这些数据也会越来越公开。可是在这些公司中,不是所有的公司都有从数据中提取价值或者用数据催生创新思想的技能。于是就会出现以下两种公司,一种是掌握了专业技能但不一定拥有数据或者提出数据创新性用途才能的公司,另一种就是拥有超前思维,懂得怎样挖掘数据的新价值的创新公司。短时间内,我们可能会感觉拥有创新思维,懂得挖掘出数据新价值的大数据思维是最重要的。可是等到产业成熟之后,所有人都知晓了大数据的意义,所有人便开始挖掘自己的大数据思维。同时,随着科技的进步,掌握大数据技术的也将成为常态。所以到后来,整个价值链的核心环节还是回到了数据本身。而到那时候,大数据的公开性也就越来越小。
在大谈完大数据对人类发展的积极意义之后,作者也考虑到大数据时代的风险。这一部分是作者脑洞大开的精彩之处,同时也是最荒谬的一部分。书中说大数据时代将要惩罚未来犯罪,这样可以在嫌疑人在可能犯罪之前就把犯罪行为给防止。这样的社会,大数据俨然已经延伸到了我们每个人生活的点滴。几乎我们在生活中所做的一切都在大数据的“监控”之下,我想到那时候,别说我们每个人的隐私已经没有的了,严重一点可以说是我们可能连人都不算了。在我们人的社会属性中,自由权利是一项很重要的指标。通过大数据惩罚人的未来犯罪已经否定了人的自由选择能力和人的行为责任自负。同时,由于数据是永久保存,大数据预测也是通过每个人之前的数据来判断,所以大数据同样也否定了人的求善心理。还有,从现在各种大数据预测的结果来看,很多发言人都说大数据不是百分百的准确。所以利用大数据来判断人的行为发展已经违背了大数据不追求精确性的特征,这也是书中自相矛盾的地方。
对于一个新事物,如果能让大家了解这个事物并且对此产生兴趣,这已经算是一本不错的入门书了。
从小到大,鸡汤对于我们来说一直都挺珍贵的。身体虚弱了,喝点鸡汤能够补充营养。心灵受伤了,看点心灵鸡汤可以鼓舞人心。可是近几年,人们生活水平提高了,营养富余,鸡汤已经不是人们补营养的期待了。同样,心灵鸡汤也是如此。
心灵鸡汤其实是一个很虚伪的东西。很多人都被心灵鸡汤诱人的外表给迷惑。在我看来,心灵鸡汤很大的一个特征就是:立人的志,但是就不告诉你实现志的方法。很多人每次在失意的时候就喜欢看心灵鸡汤,希望能得到慰藉。看完后也觉得醍醐灌顶,感觉整个世界都亮了。但又有几个人想过喝完这些鸡汤之后你除了看似重拾梦想,你还获得了什么?你知道怎么去做吗?《大数据时代》就是这样一本书。整本书从头到尾都在向读者讲述大数据的意义,当然期间也会用相应的案例来证明大数据确实有这样的能力。但是,整本书从没有涉及到技术层面的问题。或许对于大数据这种依靠互联网技术的新事物,即使向读者讲技术,也没有几个人看得懂,可是整本书没有一点关于大数据思维的技能引导。给出的案例中只有少数案例向读者讲述了这个公司为什么要利用大数据来解决这种问题,大多数都只是告诉读者国外某家公司运用大数据得出了某种结论。同时,在本书中文译作者写的序里,强调自己翻译这本著作的一大优点是可以结合国内的案例来分析书中的理论,结果,看到最后一页都没有看到一个国内企业关于大数据运用的案例。
之所以我称之为“心灵鸡汤”,还有一个原因就是作者在书中大讲特讲的大数据的作用,事实上按照现在的经济发展水平和社会文明发展程度是很难实现的。书中很多时候的理论都是要建立在社会各项文明都发展健全的基础上才能实现。
大数据的“传销手册”
看到这个标题,大家可能会觉得我夸大其词,受到如此多人好评的书怎么是“传销手册”呢?对于这个表达,我只想说两点:1、此说法仅代表我个人观点,是否认同是个人问题。2、此说法主要针对本书的上部分。
我们都知道传销组织在发展下线的前期是要花大力气去培训的,也就是洗脑。而对于一个陌生又很难以理解的事物,最好的“洗脑”方式就是重复。《大数据时代》这本书就是运用这种方式,前半部分为了让读者能够接受“大数据”这个概念,作者反反复复提醒读者大数据不是随机采样、不追求精确和不寻找因果关系。同时用很多看似很通俗易懂其实看完后还是不知道说了什么的案例来让人信服大数据的作用。书中的后半部分虽然也是用这种方式来感染读者,可后半部分中作者的畅想和对大数据的威胁分析还是对读者有一些实质意义的,所以后半部分的“传销”影响就不是很重要。
大数据时代是未来的趋势,这谁都不会否认。大数据改造了我们的生活,改变着我们的世界。不管它是以一种什么样的姿态面向世界,它都没有错,因为大数据只是一种工具。但当人类开始质疑甚至恐惧大数据的时候,人类就该思考自己是否利用好这个好工具了。
大数据时代读书心得篇三
《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。这本书最大的优点就在于作者利用上百个例子来对大数据的方方面面做了详细解说,让外行也很容易理解。结构上,作者通过大数据时代的思维变革、商业变革和管理变革三个角度依次阐述,条理清晰。
所谓"大数据",按作者的说法,就是"所有数据"。随着计算机运算速度和存储能力的发展,收集数据变得越来越简单,储存数据的成本越来越低。在过去,由于技术限制,人们做统计时只能收集有限的数据做样本,其中要考虑随机样本的选择,努力减小因样本问题出现的误差;统计结果往往不能重复使用,造成数据利用率低。而现在则可以做到"样本=总体"。数据的增多带来不可避免的精确性问题。"小数据"时代,一个样本的错误就可以造成对总体估计的失败,幸运的是,"大数据"时代对精确性不再那么要求苛刻——也无法要求太严格——数据的数量足以弥补这一缺陷。在对思维变革这一部分的阐述中,最重要也是全书的核心观点就是大数据时代,我们应该从追求"因果关系"的旧思维方式向追求"相关关系"转变。在我看来,这实际上是通过大数据来透视一种事物的发展趋势,而很多精确学科领域依然需要探寻"因果关系"解决更有针对性的问题,所以,这局限了这一转变只能在特定的领域发生。作者自己也说,"大数据的相关性将人们指向了比探讨因果关系更有前景的领域。"。
大数据时代的数据获取方式是多种多样,数据形式也是千变万化,任何文字、行为、万物都可以被数据化后用来分析。对这些数据的利用,不仅要考虑到其初次使用价值,更要放眼它未来可能的用途以提高数据的利用率。当然数据并不是无限使用,时效、环境的变化肯定会对数据提出新的要求,所以数据的折旧也是应当考虑的。这又引出了对数据这一无形资产的估值可能性。对于facebook,twitter这样的公司来说,数据就是他们的核心,如何在资产负债表上给他们一个公正的体现正是我们需要考虑的。
大数据时代的价值链由三部分构成,我把它们简化为"生产—分析—使用"三个环节,这对应书中的三种类型公司:第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。在大数据早期,技能和思维最有价值,但作者认为,最终,大部分的价值还是必须从数据本身来挖掘。这是假定了一个成熟的市场,人人都了解了大数据的用途。
对于普通人来说,大数据时代最关心的还是隐私问题。不知不觉中,个人的一举一动都暴露在政府甚至私人企业之下,还面临潜在的泄露风险。对此,作者提出了使用者承担责任的解决办法,而不是过去那种流于形式的使用授权。大数据甚至能预测一个人的犯罪动机,这给监管者带来的难题是,预测一个人要犯罪,惩罚还是不惩罚?在这点上,社会达成"个人仅需对行为而非动机负责"的共识非常重要。
大数据时代的风险控制靠的是"算法师",类似会计师一样的职业,对大数据的准确度或有效性进行鉴定。这能在一定程度上防止数据滥用的发生和数据独裁。当今的法律亦需对大数据监管进行修订补充。
当代大数据发展主要由科技公司推动,相信在不久的将来更多的传统领域会意识到大数据的重要性。但我们也应该保持清醒,大数据并不是万能药,对某些领域或环节,使用大数据是一种简单且实用的选择;但对某些领域,盲目使用大数据只会适得其反。
大数据时代读书心得篇四
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。
近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。
当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!
《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。
可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!更何况还有两个更可怕的事情。
其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。
还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。
所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。
大数据时代读书心得篇五
文中清晰的阐述了大数据的基本概念和特点,并列出明确的观点。不管对于产业实践者,还是对于政府和公众机构,都非常具有价值。作者将本书分为3个部分。第一部分提出了大数据时代处理数据理念上的三大转变:抽样等于全体;要效率不要绝对精确;要相关不要因果;第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后一部分,作者描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。
本书观点掷地有声,作者观念高屋建瓴,从很多实例和经验中萃取普适性观念。例子详实丰富,囊括了进百个学术和商业实例。
引言提出了大数据将给生活、工作于思维带来重大的变革。一个例子是20__年h1n1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与20__年、20__年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。此外,我联想到原淘宝董事长马云通过大量数据分析得出20__年经济疲弱,为其商家提前做好迎接经济危机提供了时间缓冲。(补充并清晰描述详细)关于大数据在商业领域的应用,farecast公司是一个成功的典型范例。该公司由奥伦·埃齐奥尼创办,利用机票的销售数据来预测未来的机票价格,旨在帮助用户在购买机票方面做出预测,并对机票价格走势预测的可信度标示出来供消费者查考。farecast系统利用近十万亿条价格记录预测的准确度达75%,使得使用farecast票价预测工具购买机票的旅客,平均每张机票节约50美元。而处理如此多的数据离开了大数据技术将无法进行。
也正是由于我们进入了一个前所未有的信息化时代,人们拥有了如此多的数据,才提供给我们利用大数据的分析处理手段,创造新的价值。也许有人以为我们大数据时代的还未来临。其实大数据技术早已渗透到我们中间,它被应用在垃圾邮件的过滤,新浪微博技术平台,谷歌翻译以及输入文字的自动纠错等。
文中提出的一个观点是,预测是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行预测、矫正。只是进入了大数据时代人们掌握的数据爆炸性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。
关于不是随机样本而是整体数据中。作者指出了随机取样是小数据时代用最少的数据获取最大价值的做法。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义。乔布斯成为世界上第一个对自身所有dna和肿瘤dna进行排序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然最后难免死于癌症但这种获得所有数据而不是仅样本的方法将他的生命延长了几年。同样,从事跨境汇款业务的xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。
作者同时也指出随着数据使用的越来越多,其得出的结果并一定能越来越精确,毕竟数据不能保证百分之百的正确,特别是大数据时代各种结构化与非结构化类型的数据聚集在一起难免导致结果的不太精确。大数据时代要求我们重新审视精确性的优劣。作者特别举了谷歌翻译成功的例子。谷歌翻译之所以优于ibm的candide系统并不是因为它拥有更好的算法机制。和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(其语库来自于未经过滤的网页内容,会包含一些不完整的句子、拼写错误、语法错误以及其他各种错误)。
在不是因果关系,而是相关关系的篇章中。作者指出在大数据时代往往知道是什么要比知道为什么来的更实在。作者列举了林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表,从以前广为人事的啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于其策略的帮助。建立在相关关系分析法基础上的预测是大数据的核心。aviva保险公司利用几百种生活方式的数据,如爱好、长浏览网页等间接的预测出哪些人更可能患高血压、糖尿病和抑郁症。ups国家快递公司通过使用预测性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了大数据在预测方面的优势。
本书第二部分讲的是大数据时代的商业变革。
作者用莫里绘制导航图的例子告诉我们,远在信息数字化之前,对数据的运用就已经开始了。莫里利用大量的人力去分析多年保存的航海记录,他从这些大量的数据中获取到新的利用价值。绘制的图表帮助商人节约一大笔钱,使年轻的海员们间接获取了成千上万名经验丰富的航海家的指导。日本先进工业技术研究所越水重臣教授通过安装压力传感器将人屁股特征数据化,进而形成对乘客身份的特征识别。这项技术为汽车防盗系统提供了方案。公司,致力于为顾客预测商品的价格,通过收集处理海量的价格信息,预测准确率高达77%,帮助顾客在购买一个产品时节约了大约100美元。r部门通过分析来自210个国家的15亿信用卡用户的650亿条交易记录,分析得出商业发展和客户消费趋势,如通过分析发现如果一个人下午四点左右给汽车加油的话,他很可能在接下来的一个小时内去购物或者去餐馆吃饭,且在这一小时里大约花费35到40美元。商家正可以利用这个分析结果,在加油的小票背面附加上附近商店的优惠券。
这些例子都证明了大数据蕴藏着巨大的商业价值。根据提供价值的不同来源,大数据价值链包括三大构成部分。包括第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。比如说,沃尔玛和pop-tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。第三种是基于思维的公司。皮特.华登,jetpac的联合创始人,就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行照片来为人们推荐下一次旅行目的地。对于某些公司来说,数据和技能并不是成功的关键。挖掘数据的新价值的创新思维才是这些公司脱颖而出的优势所在。
大数据成为许多公司竞争力的来源,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。如今的核心竞争力在于快速而廉价地进行大量的数据存储和处理。当然公司要根据自己的情况进行调整。大数据向小数据时代的赢家以及那些线下大公司(如沃尔玛、联邦快递、宝洁公司、雀巢公司、波音公司)提出了挑战。同时,大数据也为小公司带来了机遇。大数据也将会影响国家竞争力。当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,但这个优势很难持续。随着技术的发展,西方世界在大数据技术的优势将会慢慢消失。对于大公司而言,好消息是大数据技术可以加剧优胜劣汰。一旦公司掌握了大数据,它不但可能超过对手还可能遥遥领先。
文章第三部分讲了大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。包括如数据的收益的处理问题以及数据中用户资料的隐私和决策过程带来的影响。作者在保护个人隐私方面提出了几种想法。一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。作者同时也指出了这两种方式的难度。一方面收集到的数据可能会被后续的多次利用。另一方面,匿名化会在数据收集越来越多和数据的相互结合关联使用时变得无效。作者列列举电影《少数派报告》的情节说明越来越依赖数据时,大数据可能将我们禁锢在可能性之中。当然通过分析犯罪的常发地与常发时间,合理安排警力会对治安防范提供不小的帮助。作者还指出不能尽信数据的分析结果,因为不能保证获取分析结果来源的数据准确性。大数据在给我们生活提供便利的同时,也让隐私保护的法律手段失去了作用。我们必须杜绝对数据的过分依赖。
在高速迈进大数据时代的同时,人类信息管理准则需要重新定位,这将带动社会核心价值观的转变。大数据时代,对原有规范的修修补补已经不足以抑制大数据带来的风险。保护个人隐私就需要对个人数据处理器对其政策和行为承担更多责任。同时必须重新定义公正的概念,以确保人类行为的自由。作者提出了解决这些问题的方向。如个人隐私保护方面,可以让使用者承担更多的社会责任。将责任从民众转移到数据使用者有很多意义,也有充分的理由。因为他们更清楚将如何使用数据且是数据应用最大的受益者。关于公正方面简单的讲就是个人可以并应为他们的行为而非倾向负责。就像公司有内部会计和外部审计人员一样,大数据时代,公司将设置专门的人员--内部和外部算法师对大数据活动进行监督。还有可能出现第三方的机构对大数据行为进行监督和衡量。作者甚至考虑到对大数据存在的垄断情况进行分析并在反垄断反面给了建议。最后结语中作者提出大数据提供给人们的只是参考答案,提醒我们在利用这个工具时要铭记人类的作用是无法完全替代的。
大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个国家如此,对于一个企业亦是如此。在如此快速的到来的大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。公司的规划中,也需充分考虑到大数据对于公司的未来发展所带来的机遇和挑战。对于掌握大量数据的公司,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?比如国内目前的社交网站,购物网站等都掌握了用户的大量的数据信息。在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给其他企业或个人带来价值。
大数据时代读书心得篇六
4月13日下午,在湖南大学东楼205参加了关于《大数据时代》的读书交流活动。通过相互交流学习,使我更深层次的理解了大数据时代的利与弊,机遇和挑战。在写心得体会前,我想再重新审视一下关于大数据的历史沿革和现实意义。
首先,最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。大数据作为云计算、物联网之后又it行业又一大颠覆性的技术革命。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。企业内部的经营交易信息、物联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业it架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。如何盘活这些数据资产,使其为国家治理、企业决策乃至个人生活服务,是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。
其次,进入20xx年,大数据(bigdata)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。正如《纽约时报》20xx年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”
最后,随着云时代的来临,大数据(bigdata)也吸引了越来越多的关注。著云台的分析师团队认为,大数据(bigdata)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像mapreduce一样的框架来向数十、数百或甚至数千的电脑分配工作。“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用g或t来衡量。大数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张dvd;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……,截止到20xx年,数据量已经从tb(1024gb=1tb)级别跃升到pb(1024tb=1pb)、eb(1024pb=1eb)乃至zb(1024eb=1zb)级别。国际数据公司(idc)的研究结果表明,20xx年全球产生的数据量为0.49zb,20xx年的数据量为0.8zb,20xx年增长为1.2zb,20xx年的数量更是高达1.82zb,相当于全球每人产生200gb以上的数据。而到20xx年为止,人类生产的所有印刷材料的数据量是200pb,全人类历史上说过的所有话的数据量大约是5eb。ibm的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了20xx年,全世界所产生的数据规模将达到今天的44倍。
首先,谈谈大数据带给生活的转变。大数据已经是信息产业发展的必然趋势,可以说,大数据现在已经开始慢慢渗透入我们的生活,如:现在流行的打车软件、三维立体化社区的建立、某些从事生产销售的行业利用大数据来优化规模和实现利益最大化。而我们很多人对大数据还很陌生,只是被动的适应着大数据给生活带来的改变。大数据时代是以云计算为基础的,所以,要实现大数据,相关的很多的硬件设备都要更新换代,信息处理系统、信息传输系统、信息反馈系统、信息决策系统都将面临新的挑战,相关产业都要重新调整产业结构,在那时,可以夸张的说,信息就是黄金,信息就是石油。大数据时代的到来会解放更多的劳动生产力,势必将会更加加剧生产力过剩的现状,社会两极分化现象会更加明显,掌握不了信息资源,很难再翻身,要防止信息垄断带来的可怕局面。大数据时代的到来会使人们的生活节奏急速加快,信息的时效性决定了它的流通速率,人们的生活节奏要跟上信息流通的速率,就不得不加快自己的节奏,人们会越来越忙,到那时,就像现在的日本,可能想找个人听你说说话,真的是一件很难的事。
第二,关于数据管理的看法。大数据时代,数据管理是一件很重要的工作,如何才能避免自己的数据被非法窃取、丢失和被盗?我的看法是,人防、技防、物防一体化。人防,即我们要从思想上牢固树立信息安全防范的意识,不主动泄露信息,要管理好自己身边的信息设备;技防,就是要运用软件来管理和处理数据,经常检查更新数据库,定时查杀电脑病毒,确保电脑状况安全;物防,就是重要的数据一定要备份保留,而且应当做到备份与原始文件是物理隔离,无关的信息应当及时删除,减轻硬盘的压力。
三、怎么保护自己的隐私。隐私,顾名思义,就是不愿意让别人看到的东西,所以,在大数据时代,更要管理好自己的隐私,以免对自己和家人造成麻烦和损失。越是隐私的信息,越要远离网络,不要再公开的社交网络储存和展示个人图片、资料等信息,免得被非法人士采用和窃取。建议还是用纸质的日记代替电脑日记,避免信息传播范围太大,管理好自己的日记本。研发一种新的硬件连接器,总是以随机码来保护自己真实ip地址,提高网络安全的可靠性,加强对联网信息的管理和保护。
不论我们情不情愿,大数据时代都会到来,现实社会是我们高喊着走向大数据时代,其实大数据时代已经向我们走来,所以与其被动接受,不如主动学习,从中找到自己的出路,成为大数据时代的建设者和受益者。
大数据时代读书心得篇七
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观点,也就是大数据的精髓在于我们分析信息时的三个转变,这三个转变将改变我们的理解和组建社会的方法。并且作者将生活,工作思维的大变革和这几个方面紧紧联系在一起。
第三个改变是不是因果关系而是相关关系,在大数据时代,我们更需要了解一个东西是什么,而不是为什么,要找到关联无,通过一个良好的关联物的相关关系可以帮助我们捕捉预测未来。
这三个方面是大数据时代所给我们带来的思维上的改变,所谓思路决定出路,思路有了创新,有了拓展,相应的社会也就会有很大的变化。紧接着第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。
这本书给我感触最深的.就是这三个转变,或者说是三个观点,可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。
首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。
这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。
第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像candide那样精确地翻译每一句话,它谷歌翻译之所以优于ibm的candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。
而在阅读这本书时,发现这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究他们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于他们策略的帮助。
一句话,知道是什么就够了,不用知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。比如说,在科学研究领域,你需要知其然也需要知道其所以然,找到事件发生的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来治疗癌症,但是你治疗癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断哪里出现了问题。
过度依赖所带来的后果。也用《少数派的报告》这部电影来说明如果痴迷于数据会导致我们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,我们将被禁锢在大数据的可能性之中。所以书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。
在这个信息爆炸的时代,大数据给人类社会的方方面面带来了巨大的变革,这是社会发展的潮流,不可逆转,我们只有顺应这种潮流,把握住大数据时代变革的思想,才能在时代潮流中成为佼佼者,在思维上思路上略高一筹,才能在行动中占得先机!
大数据时代读书心得篇八
对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的。话题,钟情于务虚的观点。新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。
一、人们研究与分析某个现象时,将使用全部数据而非抽样数据。
二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。
三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。
面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。
大数据时代读书心得篇九
这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。
《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。
下面来重点介绍《大数据时代》这本书的主要内容。
《大数据时代》开篇就讲了google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了20xx年美国的h1n1的爆发地与传播方向以及可能的潜在患者的事情。google的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。同时google的预测与政府数据的相关性高达97%,这也就意味着google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。
接下来,维克多又通过了ibm追求高精确性的电脑翻译计划的失败与google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼近事物的原貌。
之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。
无论如何,大数据时代将会到来,不管我们接受还是不接受!
我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被引诱的对象。所以说,小心你在网上留下的痕迹。
我喜欢这本书是因为它给我展现了一个新的世界。
大数据时代读书心得篇十
有人说现在是读图时代,除去小说、心灵鸡汤以外,现在的畅销书基本都有图片,这本书是一个特例(书里唯一的图是出品方湛庐文化做的)。
首先尝试解析一下作者的三大观点,这三大观点是大数据业者很喜欢引用的三句话:
1不是随机样本,而是全体数据。
我想所有人都能意识到对全体数据的分析优于对随机样本的分析,但在现实中我们经常拿不到全体数据:一是对象的特性:比如炸弹的威力,你不可能把所有炸弹都炸掉来得到全体数据;二是数据的收集方法,每一种方法都有适用的范围,不太可能包罗万象;三是数据分析的角度,战斗机只能统计到飞回来的飞机上的弹孔,而坠毁的则无法统计,沃德通过分析飞回来的战斗机得出来最易导致坠毁的薄弱点;四是处理能力跟不上,就像以前的天气预报太离谱是因为来不及算那些数据。“采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物”,作者显然只关注了一部分原因。
从语言的理解上看,什么是全体数据,究竟是“我们需要的所有数据”,还是“我们能收集到的所有数据”,书中的很多商业案例中,处理的只是“我们能收集到的所有数据”,或者说是“我们认为的全体数据”。人对自然的认识总是有限的,存在主义认为世界没有终极的目标。书中举例“farecast使用了每一条航线整整一年的价格数据来进行预测”,而“整整一年”就是一个采样,或者是“我们需要的所有数据”。
从历史的角度看,国外的托勒密建亚历山大图书馆唯一的目的是“收集全世界的书”,实现“世界知识总汇”的梦想,国内的乾隆汇编四库全书,每个收集的过程都有主观因素在里面,而他们当时都认为可以收集全部的书籍,到最后,我们也没有得到那个梦中的全体。
2不是精确性,而是混杂性。
由此衍生出一个问题,大数据的品质如何控制:一、本身就不要求精确,但是不精确到何种程度是需要定义的,否则就乱套了,换个角度,如果定义了容错度,那符合条件的都是精确的(或者说我这句话还是停留在小数据时代?这里的逻辑我没有理顺)。就像品质管理大师克劳斯比提出过零缺陷理论,我一直觉得是一个伪命题,缺陷是一定存在的,就看如何界定了;二、大量非结构化数据的处理,譬如说对新闻的量化、情感的分析,目前对非sql的应用还有巨大的进步空间。
“一个东西要出故障,不会是瞬间的,而是慢慢地出问题的”。“通过找出一个关联物并监控它,我们就能预测未来”。这句话当然是很认同,但不意味着我们可以放弃精确性,只是说我们需要重新定义精确度。之于项目管理行业,如果一个项目出了严重的问题,我们相信,肯定是很多因素和过程环节中出了问题,我们也失去了很多次挽救的机会。而我们一味的`容忍混杂性的话,结果显然是不能接受的。
3不是因果关系,而是相关关系。
这是本书对大数据理论的最大的贡献,也是最受争议的地方。连译者都有点看不下去了。
相关关系我实在是太熟了,打小就学的算命就是典型的“不是因果关系,而是相关关系”。算命其实是对趋向性的总结,在给定条件下,告诉你需要远离什么,接近什么,但不会告诉你为什么那样做。
我们很多时候都在说科学,然而,什么是科学,没有人能讲清楚。我对科学的认识是:一、有一个明确的范围;二、在这个范围内树立一个强制正确的公理;三、有明确的推演过程;四可以复制。科学的霸道体现在把一切不符合这四个条件的事物都斥为伪科学、封建迷信,而把自己的错误都用不符合前两条来否决。从这个定义来看,大数据不符合科学。
混沌学理论中的蝴蝶效应主要关注相关关系。它是指对初始条件敏感性的一种依赖现象,输入端微小的差别会迅速放大到输出端,但能输出什么,谁也不知道。
人类一旦放弃了对因果关系的追求,也就放弃了自身最优秀的品质:意志力。很多人不愿意相信算命是担心一旦知道了命运,就无法再去奋斗。即使我相信算命,也在探求相关关系中的因果要素。我放弃第一份工作的原因之一是厌倦了如此确定的明天:一个任务发出去,大概能预测到哪些环节会出问题,只要不去follow,这些环节十有_会出问题。
解析完这三大观点,下面是我对大数据理论的一些疑惑。大数据是目前风行的反馈经济中的重要一环,在金融、互联网行业的应用最为广泛,而这些行业都是大家所认为的高薪领域。很多时候我就在想,所谓无形的手所产生的趋势究竟是不是无形的。比如几家公司强推一个概念,说这是趋势,不久就真的变成趋势了。我们身边活生生的例子就是天猫的双十一和京东的618,一个巨头开路,无数人跟风,自然就生造出购物节,至于合理不合理,追究的意义也不大,因为很多事情是没有可比性的。这和没有强制控制中心的蜂群思维又不一样。
1数据独裁。个人意志将受制于集体意志,个人的自由在哪里?用大数据预测来惩罚人的行为又确定的违反了无罪推定的原理。
2所有数据都来源于过去,大数据分析出来的确定性结果是否意味着我们在重复过去?拉普拉斯的决定论已经被认为是错误的,爱因斯坦也说过“上帝不会跟宇宙玩骰子”,但霍金不同意这句话。
大数据时代读书心得篇十一
在看《大数据》之前,我只知道社会越来越数字化了,看完之后,才觉悟到:人类将迎来一个新的时代。
数字化已经把我们带入一个信息时代,大数据却把我们卷进了一场科技风暴之中,这本书中,作者为我们开启了一个更包容更广阔的新时代,大数据把社会的方方面面融合在了一起,曾经看似因果联系紧密的事物,可能变得不再那么重要;毫无关联的事物,可能隐藏着重要的信息,从科技、商业,到医疗、政治、教育、文化,大数据一概席卷囊括,它改变着我们的传统思维,为这个时代注入了新鲜的血液,就像作者书中所说:“这项技术终将改变我们所居住的星球上的许多东西。”
大数据最显著的影响是对于电子商务,通过大数据,最先洞察出潜在市场的,也必然最先占领市场。而电子商务对实业的冲击又是势不可挡,可见,掌握了大数据就主导了市场,拥有了先进的科技才能拥有坚实的竞争力。在医疗方面,曾经的非典时期,就是一个很好的例证,正是有大数据的预测功能,才使疫情得到了控制。在更小的方面,他也同样改变着我们的生活,书中提到美国著名计算机专家奥伦·埃齐奥尼发明了飞机机票价格预测软件,就是利用大数据造福我们生活的很好例子。
大数据不仅节省了时间,提高了效率,更将人类带入一个新的文明阶段。从分析因果总结经验,转变为搜集数据预测未来;由原来的滞后性变为现在的预见性——大大提高了人类认识世界、改造世界的能力,变被动为主动。大数据为我们掀开了历史新纪元,不敢想象它将会为我们带来什么,或许会出现新奇的生活方式,从未有过的职业,闻所未闻的商业模式,百家争鸣的文化高峰;也或许会解开更多未解之谜,探索到宇宙之外的秘密。总之,毫无疑问的是,大数据为我们带来的未来是超乎想象的。
这本书中作者提到最多的是:改变我们的传统思维,摒弃精确性转向宏观。从总结因果转向预测。这个世界正以惊人的速度向前发展,数据大爆炸的波及范围远超乎我们的想象,单纯靠人类的主观判断力是多么的有限,大数据早晚会取而代之这一现象,这必将影响我们的生活和工作,我们也只有认清这种趋势,改变思维,调整步伐,紧跟时代才行。即使不能与时代同步,也尽量做到避免固步自封,认识大数据、利用大数据趋利避害,为我们的生活造福!
大数据时代读书心得篇十二
这两年,大数据,云计算的思想就像小苹果的音乐一样,传的到处都是,每一个公司不管是互联网公司还是传统企业,都标榜自己的大数据。
1、实体物联网与虚拟物联网。
曾几何时,物联网的概念闹得风生水起,庞大的物联网能够让世间大量的物体,都能够被检测并联网,包括了人、车、房等一切能够被联网的物体,这些物体都能够以种方式被感知他的存在,并对其信息记录在案,以供使用。在若干年前,这还是一种看似遥不可及的事物,要对每个物体都贴上一个所谓的rfid的标签,显得不切实际。如今,随着手机的大量使用,人类本身也被加入了物联网中。为什么要物联网?是为了获取什么?要知道物联网获取了什么,只需要看看在一个物体在没有加入物联网与加入物联网之后,我们多出了哪些东西便能够知晓。那么,很明显,我们需要通过某种方式来获取该物体的信息,这种存储下来的信息,就叫做——数据。
物联网产生的数据是实体的物品之间的信息,而现在的互联网上,占最大数据量的,是虚拟物品,或者叫做网络虚拟物品。由于网络物体是直接寄生于网络,具有能够方便的接入网络的特征,因此,在获取实体物体信息还有一定难度的时期,占有很大优势。但今后实体的物联网产生的数据量一定会不断增加,或许,能够超越网络上的物物相连数据量。
网络的广泛使用,使得信息的产生于传遍变得容易,每个接入网络的人都以一定的角色存在,都是网络的信息的创造者。对于所产生的信息而言,每个接入网络的人又身兼多角,对于网络服务商,他是网络使用者的角色;对于门户网站而言,他是使用的用户;对于社交网站而言,我们则扮演一个虚拟或者真实的网络角色;对于浏览器而言,他是一系列的浏览网页、一些列鼠标动作的角色…不同的角色取决于对方需要从我们的行为中获取哪些信息。将网络上各种角色看成是虚拟的物体,那么,这种虚拟物体构成的虚拟物联网便产生了巨大的数据量。经历过一直以来缺乏信息获取渠道的日子,现在,既然信息获取变得如此容易,那么,必然迎来信息量暴增的时代——大数据时代。
2、思维的转变。
技术的改变,使得我们思维方式也要随之发生变化。在过去的小数据时代,由于获取信息、存储信息、整理信息都是费时费力的活,我们只能精打细算,捉摸着如何以最小的代价、最快的方式来收集尽可能准确的信息。之所以会有抽样统计的方式,是受技术所限,无法获得全体的样本,或者就算获取了也无法在合理的时间内进行处理。由于信息获取代价大,使得我们不得不在获取信息前,就把一切都想清楚,才能够着手处理。这就像在计算机出现的初期,使用纸袋来编码的时期,一次出错的代价太大,所以人们不得不在输入前将代码验证过无数遍之后才敢输入到机器中。而现代计算机让编码的效率大大提升,这才使得人们能够创造出更加强大的软件。人们不需要在着手编码前就对代码过分深思熟虑,因为机器会帮助你解决一些问题。因此,那些担心由于获取数据太方便,进行数据处理、分析代价太小而使人们变得懒惰或者做事欠考虑的家伙,真是杞人忧天。历史上,技术的进步都会提升人类的生产力,但却没有让人们变得懒惰,因为与此同时,欲望也随之增长。人类只会变得更伟大。
因此,大数据时代,这个数据更加全面的时代,我们可以涉足一些之前由于缺乏数据而无法涉及的领域,例如——预测。这是一个令人兴奋的领域,但其实这个领域早有苗头,而且大家都是受益者。我们平时使用的输入法中的智能联想功能,能够根据我们之前输入的文字,来预测我们接下来有可能输入的文字,以节省我们的输入时间。这种算法里,没有人工智能,而只有人们大量的输入习惯的统计,通过大量数据的统计来预测,是一个统计学的方式而非加入了特有的规则或者逻辑。这便引出了在大数据时代,对于信息处理的一种重要方式,基于统计,得出不同个体的相关关系,却无需了解其因果关系,而我们则受益于相关关系。这种方式,看似有些投机取巧,却能够在关键时刻令我们处于优势地位。我们已经习惯了先知道某些事物的因果逻辑,继而推断出相应的结果。但世间总会有一些令人无法用合理的逻辑进行解释的现象,若通过大数据分析,我们能够跳过逻辑阶段直接享用某些一些结果(沃尔玛的啤酒加尿布案例),岂不乐哉。当然,严密的逻辑永远是值得尊敬的。
3、互联网的黏性。
在经历过了从广度上通过新花样来吸引用户的时代,由于技术的提高,一个创业者在一个新的领域开辟的东西很容易被其他人所复制。在这个时候,深度很重要。特别是购物网站、微薄、门户网站这类信息量大的网站,越是了解一个用户,优势就越大。所以,在技术已经不是最重要的因素的时代,如何增加用户的黏性、忠诚度便是首要的。通过用户之前的信息,来推测用户的喜好,给用户推荐相应的信息或物品。当你越了解一个用户,而别人却不了解时,这个用户就越离不开你。微薄中有他的智能排序功能、新闻门户中有“今日头条”应用,各类购物网站有他的推荐算法(但这个纯粹为了增加消费而非增加用户黏性),都能够根据用户之前的浏览、偏好来给出相应的推荐。这些的基础,都是拥有用户的行为记录,否则,都无从谈起。
在手机这个拼硬件的时代,单纯靠硬件来取胜已经很难了。硬件靠组装、软件靠安卓,手机厂商已经变得没有核心竞争力。而三星为了增加用户黏性,所做的便是为用户提供更加贴心的服务,不仅做手机,还做平台,将用户的各类数据记录在他的平台中,而这数据,必将大有作为。然后,如果哪天,三星也出智能体重计、智能手表这类产品,那么也不稀奇了。各类数据同步、整合,为使用者提供各方面贴心的服务,很酷吧。
各行各业,都在疯狂的抓紧时机,获取数据,拥有足量的数据,那一切就变得皆有可能。
大数据时代读书心得篇十三
舍恩伯格的《大数据时代》被人推崇为最佳书籍,今年安泰读书会的重头戏。虽然主讲人最后放了个香港大黄鸭般的鸽子,但现场讨论氛围依旧非常热烈——而且还是在没几个人读完的情况下,也就意味着——大数据对我们的影响,已经深入到生活的方方面面。这本书对这个大规模产生、分享和应用数据的新的大时代进行了阐述和厘清,作者围绕“要全体不要抽样、要效率不要绝对精确、要相关不要因果”三大理念,通过数十个商业和学术案例,剖析了万事万物数据化和数据复用挖掘的巨大价值。
无处不在的大数据:各种云计算,谷歌的神通,亚马逊的推送,天涯人肉,微博万能等等等等,我们掌握了新的工具,也获取了以前从未有过的各种信息。大数据拉近了我们与现实的距离,“地球村”变成了“地球屋”,仿佛所有人所有事物都触手可及,而这些牛逼哄哄的互联网巨头就在客厅展示着世界的每一寸光景。如作者所言“大数据开启了一次重大时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们看清微生物一样,大数据要改变的是,我们的生活方方面面以及理解世界的方式”。比如,谷歌通过全球搜索分析,比国际疾病控防中心更早更准地预测了流感爆发。
然而,事实真的是这样吗?首先,从应用角度出发,低廉的运算能力和存储空间,让以前的样本分析显得非常简陋——一些从全体数据挖掘出来,忽略精确而从大量数据的简单算法得出来的结论颠覆了常识。但个人觉得,这只是统计学的终极目标——并没有非常大的跨越,可能终结了回归分析,有效性验证等手段,但依旧还是统计。而革命性在于关注相关关系而非因果关系。现场讨论从神学角度挑战了因果关系的不可能——或者说人类用简单思考的逻辑来定义因果,以及用之前小数据演绎出大概率事件来推导因果,都是不正确的。真正的因果关系应该属于上帝的范畴,人类如果真的完全掌握之后,会统治整个宇宙。
但我觉得,无需从神学观点来讨论,而可以借鉴量子力学对经典力学的颠覆——在原子层面上,经典力学会失效——那么在大数据层面上,普通的抽样调查直观反映会失效。而且从量子力学角度是很难推导经典力学的公式,那么从现在的惯有思维,也难以推导出大数据的因果关系。同时现场有讨论,是否计算机可以精确地模拟每个原子,然后完整地展现微观到宏观的化学反应细节?我觉得首先是计算能力不足,其次即便设定原子的运动条件真的正确,计算结果未知但宏观结果我们却已经知道——牛顿的经典力学足以应付日常绝大部分情况了。好比切西瓜,究竟刀头的铁原子和西瓜的有机分子如何作用,真的重要吗?回归到商业领域,如果我们可以提高相关性的准确度,从而提高投入效率,那就已经足够了。本来一个产品受到一半客户喜欢,但如果通过大数据挖掘到更好的定位,有百分之八十的客户喜欢,那么价值已经非常可观了。
大数据时代的社会伦理——很大的命题,但重点都在讨论如何保护个人隐私。因为手机越来越智能,网络越来越快,个人的信息也越来越透明——隐形几乎完全不可能。我想说的是,作为硬币的另外一面,我们无法舍弃:互联网只不过是让人与人之间碎片的关系得以统一,其实各种人肉和信息只不过是坊间传闻的升级罢了。当我们住在拥挤的小区,三公里走完一圈的县城,半小时散步完的村落,人和人之间有隐私吗?现在只不过是把这个范围放大到了一个地球而已。硬币的一面是人和人之间有沟通的需要,去团结对抗世界的未知,那么另外一面就是隐私的缺乏。与其说是要在大数据时代保护自己的信息不被泄露,不如站起来维护自己和他人的隐私,从法律和道德的角度来尊重人与人之间的权利。在一个互相尊重的环境下,你可以穿热裤,他也可以穿长裙走上街头;在一个互相践踏的社会中,人人都得带着面具生活。
在思维变革部分,作者讲述的重点是:样本=总体,我们需要对全部数据的占有和分析;因此,数据缺乏时代的精确性不必执迷,接受混杂基于大数据的简单算法比小数据的复杂算法更有效;样本推断的因果关系不重要了,知道“是什么”的相关关系,或者结果就可以了。对于我自己最受用的是什么呢?是大数据的产业链。产业链包括大数据平台、大数据技术提供方、大数据理念提供方。我认为大数据平台是整个产业链条的核心,没有数据,再好的技术和理念都会是无米之炊。那么大数据平台在当前的中国社会有哪些呢?所有的互联网公司,物联网公司,物流,快消品等等,实际上任何公司都是数据平台公司,只不过之前没有好好的利用数据,而更多的是用经验来管理公司和迎合客户需求。现在不一样了,我们完全可以用数据来驱动公司管理和客户管理,毕竟数据是不会骗人的。
大数据帮助我们把未来的迷雾拨开了一点,但好比《沉重的肉身》当中讨论的,更多的选择权并不能带给人幸福——因为知道自己不能做不能得到的也更多了。解决工作模式,生存意义,幸福之道等问题,关键还是看自己如何看待和使用这些新式工具以及新结论。引用《神探伽利略》里面的台词:可被重复的,一定有道理存在。那么现在重复的越来越多,更需要保持探索和敬畏之心,人才不会迷路。
大数据时代读书心得篇十四
大数据时代的到来,给人们的生活、工作、学习等方方面面带来了巨大的变革。信息爆炸和海量数据的涌现,使得人们既感到兴奋也感到困惑。为了更好地适应这个新时代,我观看了《大数据时代第集》这部纪录片,对于大数据时代带来的影响有了更深入的理解和体会。
第一段:纪录片揭示数据充斥我们生活的方方面面。
《大数据时代第集》的开场,向观众展示了一个庞大而精密的数据收集系统。从各个环境中,包括手机定位、购物产生的交易记录、社交媒体上的消息等,都不断产生并被收集起来。这使得我们的生活无时不在与数据相交,几乎人人都成为数据的生成者与被生成者。
第二段:大数据对商业和消费者的影响。
大数据不仅为商业带来了前所未有的机遇,也为消费者带来便利。通过对海量数据的分析,企业可以更好地了解市场趋势和消费者的行为模式,从而调整产品策略和市场推广方案。例如,纪录片中提到了亚马逊利用大数据优化仓储和物流,从而提高了交易效率和客户满意度。消费者也因此受益,他们可以通过推荐算法等技术获得更符合个人需求的产品和服务。然而,大数据也为消费者带来了隐私泄露和信息滥用的风险。
第三段:大数据在社会管理中的应用。
纪录片进一步揭示了大数据在社会管理中的广泛应用。政府通过对交通数据、公共卫生数据等的深度分析,可以更好地制定交通规划和疫情防控策略。大数据还帮助警察从海量监控视频中找到犯罪线索,提高了犯罪侦查的效率。然而,大数据的应用也带来了一些争议,例如在抗击新冠疫情过程中,社交媒体上的大数据分析被用于实名制和处罚非法外出等措施,引发了个人隐私权和公共安全之间的权衡和讨论。
第四段:个人隐私保护的重要性。
大数据时代的到来,使得个人隐私保护变得愈发重要。纪录片中提到了欧盟制定的《通用数据保护条例》,旨在加强对个人数据的保护。我们也需要在日常生活中保护好自己的个人信息,不随意泄露给他人。同时,社会各界也应加强法律法规的制定和监管力度,确保大数据应用的合理性和合法性。
纪录片最后提到了大数据时代对个人发展和教育的影响。大数据使得人才需求不再仅仅停留在专业技能层面,数据科学和数据分析技能成为了追求职业发展的热门方向。在教育方面,大数据也可以为学生提供个性化的学习和教学方案,促进学生的全面发展。
总结:
《大数据时代第集》这部纪录片给我带来了对大数据时代的全新认识。大数据的涌现为商业、消费者、社会管理和个人发展等带来了巨大的机遇和挑战。我们需要认识到大数据的广泛应用并保护好个人隐私,同时也应关注大数据在社会中的不公正应用,并寻找解决之道。只有合理应用和平衡发展,才能使大数据更好地为社会进步和个人发展作出贡献。
大数据时代读书心得篇十五
世界正迈入大数据、云计算的时代,人类朝着数据化、数字化的方向发足狂奔,我们原有的科学、技术、工作和生活方式正在被信息技术所改写,很多科学领域会被大数据技术所替代,也会崛起很多新兴科学家和职业,譬如数据科学家、数据中间商等。大数据会颠覆很多的产业和行业,甚至一夜之间就能变换运营模式,因为在大数据面前,人类不会再向以前那样追寻着“为什么”,更多的是在样本和概率面前做着商业决策的调整,“快”和“实用”更能满足大众的需求。
数据之大,漫无边际,无穷无尽,包含着我们人类的一呼一吸,一举一动。处在大数据帝国的前夜,眺望星空,这是个最好的时代,因为数据时代转折的重要性,不亚于黑猩猩站立起来行走划时代,很多科幻片里的场景会出现在我们的日常;这也会是个最坏的时代,因为人类最终会为此走向哪里,只有苍穹能知道!
当我们拥有海量数据时,绝对的精准不再是我们追求的主要目标,我们乐于接受数据的纷繁复杂,也只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。
大数据时代读书心得篇十六
如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。
一读。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。“大数据的简单算法比小数据的复杂算法更有效。”更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。“不是因果关系,而是相关关系。”不需要知道“为什么”,只需要知道“是什么”。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出“不是因果关系,而是相关关系。”这一论断时,他在书中还说道:“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。”[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可“量化”,大数据的定量分析有力地回答“是什么”这一问题,但仍然无法完全回答“为什么”。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节“掌控”中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
再读。
概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4v特点:数量(volume)、速度(velocity)、品种(variety)和真实性(veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”[ii]其实,概念的界定要看研究者从哪个角度来研究它而定。
科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。”[iii]舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里谈到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”[iv]用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。
问题是研究的价值基点,“大数据”不是舍恩伯格研究的问题,而是研究对象,他研究的是数据处理和信息管理问题,同时也讨论信息安全和网络伦理问题,还引发哲学上的思考,哲学史上争论不休的世界可知论和不可知论转变为实证科学中的具体问题。可知性是绝对的,不可知性是相对的。“大数据”之所以为大是因它引发人类生活、工作和思维的大变革,从这个意义上来看,《大数据时代》的意义不仅在于它讨论了若干重大问题,而且对研究者开出了一个问题清单,从而引发更多人来探讨这些有趣的问题。
《大数据时代》实际上主要是一本讨论数据挖掘的书,数据挖掘与数据分析是不同的概念,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。而数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据挖掘主要运用计算机来进行处理,而数据分析既要用计算机也要人工分析,是计算机科学与人文价值判断的统一结合。换言之,《大数据时代》并不是一本讨论大数据所有问题的书。
《大数据时代》也是一本讨论互联网发展的书,从数字化到数据化,同时有浓厚的未来学色彩。当文字变成数据,我们进入了互联网;当方位变成数据,我们进入了物联网;当沟通变成数据,我们进入了下一代互联网。一切可量化,万物皆数据,正是当今互联网世界的真实写照。面对于这样的世界及世界的未来,在《大数据时代》出现最多的词是“思维”和“方法”,因此也可以把这本书视为思维科学应用研究的书。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
三读。
今年国庆节前一天,中共中央政治局们来到中关村搞集体学习,调研、讲解、讨论创新驱动发展战略。包括、在内的七位全部出动来到中关村,这是历史上没有过的,百度、联想和小米的负责人,有了一次直面最高层汇报工作的机会。雷军和柳传志,讲解的都是本公司的各种情况,李彦宏则没有讲百度的广告业务发展得如何好,而是讲起了大数据。在讲解中,李彦宏认为大数据有两个重要价值,一是促进信息消费,加快经济转型升级;二是关注社会民生,带动社会管理创新。这些价值也是目前党和国家领导人最为重视的,可见《大数据时代》既有理论价值也有现实意义。
当今大数据正在影响着新闻传媒业,大数据新闻、大数据营销、舆情分析、受众(用户)研究……数据分析师变身新闻编辑,大数据正改变新闻生产流程、大数据在创造传媒新业态。“不妨想象一下,随着数据的进一步增加,坐拥用户资源的新媒体们完全有能力通过数据挖掘,分析用户癖好,向电视台定制一部电视剧甚至向好莱坞定制一部电影。到那个时候,电视台一如那些家电厂商们,曾经产业链的上游‘王者’,将彻底成为一个产业链最低端的内容代工厂。”[v]然而,情形也远没有人们想象的那么乐观,李彦宏指出目前多数所谓的大数据公司其实还是空壳子,因为数据还没有完全开放。他认为必须在政府层面上推动才能真正实现大数据的开发与利用。我在讨论大数据时代的舆情监测与预警时说道:“经典自由主义传播学说对媒体的定位:秉持公正、客观立场的媒体被称为代表公众监督政府行为的‘看门狗’。其实,媒体既是公众利益也是国家利益的‘看门狗’。要看好门就要瞭望、洞察社情民意,传统媒体信息反馈渠道单一,视野、人力十分有限。而开放互动的新媒体平台却大有可为。作为公共信息发布平台的微博可以成为政府及时了解社情民意,从而选择正确治理路径的‘导盲犬’。”[vi]遗憾的是目前我国的数据平台还没有完全开放,真正的大数据时代还没有到来。
与国内不少教科书写法的专著相比,国外的书写得更有趣,尤其是大学者写的,不仅视野开阔,而且能够深入浅出。《大数据时代》不到22万字,却有上百个学术和商业的实例,丰富翔实的例子让读者感到通俗易懂,深奥的理论看起来也不费劲。这恐怕与舍恩伯格既是学者也是专家,既有理论又有实践有关。反观我们些学者故弄玄虚而示高明,实际上是把读者拒之门外。我觉得优秀的科学家也应该是一个科普作家,优秀的学者也应该是一个不错的传播者。当然国外学术著作也有一个翻译问题,这本书译得还不错。此外,《大数据时代》还附有不少it界名流的推荐意见,虽是出版商的发行所为,对解读此书也不无益处。
除了《大数据时代》,舍恩伯格还有一本《删除》也值得一读。要研究大数据不能只读一本书,该书译者周涛教授还推荐了三部国内出版的大数据方面的专著:《证析》、《大数据》、《个性化:商业的未来》。相比《大数据时代》的宏大视野,这些书就大数据某一局部问题给出深刻的介绍和洞见。我也推荐读一读中国工程院李国杰院士和中科院计算所副总工程学旗合写的文章《大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考》。
虽说开卷有益,但是由于每个人的时间精力有限,对于一个研究者来说,不读什么书甚至比读什么书更重要。我认为书有三种:有用的书,主要是应用类的专业书;无用的书,主要是形而上的思想类;无字的书,人间百态,社会现实。可偏重但不应偏废。对于学生来讲这三类“书”都该读一些,对于研究者则要读哪些解决关键问题的书,《大数据时代》就是这样一部书。当然,并非第一个读者都是研究大数据的,但进入大数据时代,还有什么东西与数据完全没有关系呢?麦肯锡全球研究机构认为,未来十年里有12项对经济发展产生重大影响的技术,其中包括三项新媒体技术:移动互联网、物联网和云计算。这三项新媒体技术都与大数据密切相关,而这些新媒体新技术的发展都影响着当今的新闻传播业。阅读此书至少给我们研究新闻传播学带来一些启迪。我觉得一本书的价值不在于让你顶礼膜拜,而是引发广泛而深入的讨论。
“凡是过去,皆为序曲。”读完此书,我们对大数据的认识才刚刚开始。