《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì)(通用22篇)
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇1
大數(shù)據(jù)這個(gè)詞一直存在但我們很少在這個(gè)時(shí)代前能有所耳聞,在我讀了維克托寫的大數(shù)據(jù)之后,我明白了在更早的年代之所以不流行這個(gè)詞是因?yàn)槿藗兿矚g感性的思考而不是拿數(shù)據(jù)理性的分析。究其原因,一方面是數(shù)據(jù)量小,另一方面是人們的思想落后。然而隨著信息時(shí)代的到來(lái)和云技術(shù)的發(fā)展,大數(shù)據(jù)逐漸成為一個(gè)可靠的參考標(biāo)準(zhǔn),以及大數(shù)據(jù)在諸多領(lǐng)域做出的貢獻(xiàn)足以證明他在這個(gè)時(shí)代的重要地位。
維克托在書(shū)中例舉了大量有關(guān)美國(guó)在這半個(gè)世紀(jì)信息開(kāi)發(fā)技術(shù)創(chuàng)新的典型案例,從側(cè)面向我們闡述了大數(shù)據(jù)在諸多領(lǐng)域的不同作用,例舉其在醫(yī)學(xué)方面的作用,在不久之前,你也許可能還會(huì)聽(tīng)到兩個(gè)醫(yī)生對(duì)于一個(gè)醫(yī)學(xué)問(wèn)題爭(zhēng)論的喋喋不休,……公說(shuō)公有理婆說(shuō)婆有理……,但怎么說(shuō)都是建立在“我認(rèn)為”的主觀臆斷之上,幸運(yùn)地是,大數(shù)據(jù)的出現(xiàn)給幫助醫(yī)生在問(wèn)題上給予一個(gè)正確的指向,通過(guò)云端和千千萬(wàn)萬(wàn)的數(shù)據(jù),可以更清楚還原問(wèn)題的直觀事實(shí)。
這樣的例子在生活中也數(shù)不勝數(shù),其力量存在于人們無(wú)形的生活中,卻有形的幫助人們解決了在經(jīng)濟(jì),科學(xué),人文方面的各種問(wèn)題,通過(guò)整合混沌的信息,分析加工我們就能很好的了解自己所處的世界并駕馭在時(shí)代的前沿。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇2
書(shū)名中的時(shí)代二字讓我陷入了深深的誤區(qū),big data就只是大數(shù)據(jù)而已。讀完全書(shū),也沒(méi)有發(fā)現(xiàn)作者有說(shuō)大數(shù)據(jù)會(huì)引領(lǐng)一個(gè)時(shí)代的觀點(diǎn),我們知道當(dāng)今是一個(gè)數(shù)字化、信息化的時(shí)代,但絕不還是大數(shù)據(jù)的時(shí)代。但大數(shù)據(jù)的重要性不嚴(yán)而喻,生活、工作、學(xué)習(xí)中許多有關(guān)大數(shù)據(jù)的例子的確離我們很近,我們甚至就是眾多大數(shù)據(jù)的一部分。那大數(shù)據(jù)對(duì)我這樣一名工科大學(xué)生有什么用,對(duì)于我這一名國(guó)防生又什么用呢,這樣的一本書(shū)是否能夠更好的幫助我在未來(lái)的工作崗位上博得頭籌,取得一番成績(jī)!還有為了接觸、利用大數(shù)據(jù)并防范大數(shù)據(jù)所帶來(lái)的弊病,我又該怎么做呢?書(shū)中有這樣一句話:大數(shù)據(jù)是一種資源,也是一種工具。大數(shù)據(jù)為我們提供暫時(shí)的幫助,以便等待更好的方法和答案出現(xiàn)。這也提醒我們?cè)谑褂眠@個(gè)工具的時(shí)候,應(yīng)當(dāng)懷有謙恭之心,銘記人性之本。
所說(shuō)的謙恭之心和人性之本都強(qiáng)調(diào)了人在大數(shù)據(jù)時(shí)代的重要性。我們才是數(shù)據(jù)之源,我們才應(yīng)是數(shù)據(jù)的受益者。當(dāng)我還沒(méi)讀完思維變革這一部分的時(shí)候,我就在思考這樣的思維變革對(duì)我會(huì)有著怎樣的影響?參加過(guò)兩次數(shù)學(xué)建模競(jìng)賽的我,在兩次的參賽過(guò)程中,學(xué)會(huì)了許多數(shù)據(jù)處理和數(shù)學(xué)建模方法。數(shù)學(xué)模型所具有的對(duì)事件或數(shù)據(jù)的描述性、預(yù)測(cè)性、說(shuō)明性是與大數(shù)據(jù)完全不同的。大數(shù)據(jù)下的思維變革不再追求數(shù)據(jù)的準(zhǔn)確性和因果關(guān)系。如果我在數(shù)學(xué)建模提出一種產(chǎn)生某個(gè)結(jié)果的原因,我是需要明明白白地把其他因素的影響一一剔除。我記得在參加比賽最后關(guān)頭寫論文的時(shí)候,對(duì)于所研究的問(wèn)題,我們必須在前面把各種變量給寫進(jìn)去,然后再有選擇性的在可接受的條件下忽略掉很多變量的影響,但我們?cè)诤芏鄷r(shí)候卻給不出一個(gè)剔除這個(gè)因素的理由。可如果你不能排除掉其它的因素的影響,整個(gè)的數(shù)學(xué)模型建立及計(jì)算過(guò)程就會(huì)太復(fù)雜甚至是不能得出一個(gè)結(jié)果。但是在大數(shù)據(jù)時(shí)代,一個(gè)結(jié)論是可以通過(guò)足夠多的數(shù)據(jù)得出來(lái)的,不需要明白其中的為什么。如果真是這樣,我只覺(jué)得我需要思維上的變革,可我做不到,我接受不了事物與事物之間的黑盒子。這離我太遙遠(yuǎn)。
可我又不敢在此時(shí)否認(rèn)自己將來(lái)的工作與大數(shù)據(jù)的相關(guān)性,書(shū)中第三部分——大數(shù)據(jù)時(shí)代的管理變革中就舉到一個(gè)羅伯特。麥克納馬拉的例子,他是五角大樓"統(tǒng)計(jì)控制隊(duì)"中一名精英,這個(gè)隊(duì)伍讓之前不知道飛機(jī)備用零件種類、數(shù)量和放置位置的軍方在制定了綜合清單之后,為部隊(duì)節(jié)省下了36億美元。而我的專業(yè)就是飛行器動(dòng)力,我很清楚我國(guó)航空發(fā)動(dòng)機(jī)的研究制造水平是深深限制了空軍力量的發(fā)展。在夏季學(xué)期去黎明航空發(fā)動(dòng)機(jī)廠實(shí)習(xí)的時(shí)候,許多講解的師傅都會(huì)強(qiáng)調(diào)一點(diǎn),發(fā)動(dòng)機(jī)的每一個(gè)零件上都是有標(biāo)號(hào)的。零件的工藝卡片上會(huì)記錄其每一個(gè)工序的加工時(shí)間、地點(diǎn),加工、組裝、調(diào)試人員等的資料,這些卡片將會(huì)一直保存下去。這不僅能夠方便維修和更換,在出現(xiàn)事故之后,還可以追根溯源,查出事故的原因。我當(dāng)時(shí)就在想還好這東西產(chǎn)量不是很高,一臺(tái)渦扇發(fā)動(dòng)機(jī)僅僅葉片數(shù)量就是數(shù)千了。這樣的大數(shù)據(jù)肯定還可以好好利用,幫助我們?nèi)グl(fā)現(xiàn)科技研發(fā)和制造生產(chǎn)中矛盾與不足,并做出改進(jìn)。但航空發(fā)動(dòng)機(jī)的發(fā)展需要的更多的是技術(shù)的積累,特別是關(guān)鍵技術(shù)的實(shí)驗(yàn)數(shù)據(jù)我們還有著很大的缺失。我們不能像BAT這些互聯(lián)網(wǎng)巨頭可以輕松收集數(shù)據(jù),航空發(fā)動(dòng)機(jī)的技術(shù)積累需要一代代人在理論、實(shí)驗(yàn)上的積累,才有可能在這種大數(shù)據(jù)的支撐下做出真正屬于自己的航空發(fā)動(dòng)機(jī)。
這種積累利用方法可能與書(shū)中作者所說(shuō)的利用大數(shù)據(jù)進(jìn)行預(yù)測(cè)、創(chuàng)新相比起來(lái)不是足夠高端,但是新的方法需要人去摸索,我也愿意成為這樣的第一人,我也堅(jiān)信大數(shù)據(jù)能夠給這樣一個(gè)領(lǐng)域帶來(lái)另一片天空。只是在航空發(fā)動(dòng)機(jī)的領(lǐng)域我們是不能只停留在"是什么"這一步的!精心策劃數(shù)據(jù)的因果關(guān)系研究和控制實(shí)驗(yàn)很有必要。
最后,我提出一個(gè)疑問(wèn),那就是大數(shù)據(jù)能不能創(chuàng)造出另一個(gè)畢加索呢?
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇3
《大數(shù)據(jù)時(shí)代》是英國(guó)維克托·邁爾—舍恩伯格教授的著作,這本書(shū)也被尊為國(guó)外大數(shù)據(jù)研究的先河之作。這本書(shū)最大的優(yōu)點(diǎn)就在于作者利用上百個(gè)例子來(lái)對(duì)大數(shù)據(jù)的方方面面做了詳細(xì)解說(shuō),讓外行也很容易理解。結(jié)構(gòu)上,作者通過(guò)大數(shù)據(jù)時(shí)代的思維變革、商業(yè)變革和管理變革三個(gè)角度依次闡述,條理清晰。
所謂"大數(shù)據(jù)",按作者的說(shuō)法,就是"所有數(shù)據(jù)"。隨著計(jì)算機(jī)運(yùn)算速度和存儲(chǔ)能力的發(fā)展,收集數(shù)據(jù)變得越來(lái)越簡(jiǎn)單,儲(chǔ)存數(shù)據(jù)的成本越來(lái)越低。在過(guò)去,由于技術(shù)限制,人們做統(tǒng)計(jì)時(shí)只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機(jī)樣本的選擇,努力減小因樣本問(wèn)題出現(xiàn)的誤差;統(tǒng)計(jì)結(jié)果往往不能重復(fù)使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來(lái)不可避免的精確性問(wèn)題。"小數(shù)據(jù)"時(shí)代,一個(gè)樣本的錯(cuò)誤就可以造成對(duì)總體估計(jì)的失敗,幸運(yùn)的是,"大數(shù)據(jù)"時(shí)代對(duì)精確性不再那么要求苛刻——也無(wú)法要求太嚴(yán)格——數(shù)據(jù)的數(shù)量足以彌補(bǔ)這一缺陷。在對(duì)思維變革這一部分的闡述中,最重要也是全書(shū)的核心觀點(diǎn)就是大數(shù)據(jù)時(shí)代,我們應(yīng)該從追求"因果關(guān)系"的舊思維方式向追求"相關(guān)關(guān)系"轉(zhuǎn)變。
在我看來(lái),這實(shí)際上是通過(guò)大數(shù)據(jù)來(lái)透視一種事物的發(fā)展趨勢(shì),而很多精確學(xué)科領(lǐng)域依然需要探尋"因果關(guān)系"解決更有針對(duì)性的問(wèn)題,所以,這局限了這一轉(zhuǎn)變只能在特定的領(lǐng)域發(fā)生。作者自己也說(shuō),"大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。"
大數(shù)據(jù)時(shí)代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬(wàn)物都可以被數(shù)據(jù)化后用來(lái)分析。對(duì)這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價(jià)值,更要放眼它未來(lái)可能的用途以提高數(shù)據(jù)的利用率。當(dāng)然數(shù)據(jù)并不是無(wú)限使用,時(shí)效、環(huán)境的變化肯定會(huì)對(duì)數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應(yīng)當(dāng)考慮的。這又引出了對(duì)數(shù)據(jù)這一無(wú)形資產(chǎn)的估值可能性。對(duì)于這樣的公司來(lái)說(shuō),數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負(fù)債表上給他們一個(gè)公正的體現(xiàn)正是我們需要考慮的。
大數(shù)據(jù)時(shí)代的價(jià)值鏈由三部分構(gòu)成,我把它們簡(jiǎn)化為"生產(chǎn)—分析—使用"三個(gè)環(huán)節(jié),這對(duì)應(yīng)書(shū)中的三種類型公司:第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價(jià)值,但作者認(rèn)為,最終,大部分的價(jià)值還是必須從數(shù)據(jù)本身來(lái)挖掘。這是假定了一個(gè)成熟的市場(chǎng),人人都了解了大數(shù)據(jù)的用途。
對(duì)于普通人來(lái)說(shuō),大數(shù)據(jù)時(shí)代最關(guān)心的`還是隱私問(wèn)題。不知不覺(jué)中,個(gè)人的一舉一動(dòng)都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風(fēng)險(xiǎn)。對(duì)此,作者提出了使用者承擔(dān)責(zé)任的解決辦法,而不是過(guò)去那種流于形式的使用授權(quán)。大數(shù)據(jù)甚至能預(yù)測(cè)一個(gè)人的犯罪動(dòng)機(jī),這給監(jiān)管者帶來(lái)的難題是,預(yù)測(cè)一個(gè)人要犯罪,懲罰還是不懲罰?在這點(diǎn)上,社會(huì)達(dá)成"個(gè)人僅需對(duì)行為而非動(dòng)機(jī)負(fù)責(zé)"的共識(shí)非常重要。
大數(shù)據(jù)時(shí)代的風(fēng)險(xiǎn)控制靠的是"算法師",類似會(huì)計(jì)師一樣的職業(yè),對(duì)大數(shù)據(jù)的準(zhǔn)確度或有效性進(jìn)行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨(dú)裁。當(dāng)今的法律亦需對(duì)大數(shù)據(jù)監(jiān)管進(jìn)行修訂補(bǔ)充。
當(dāng)代大數(shù)據(jù)發(fā)展主要由科技公司推動(dòng),相信在不久的將來(lái)更多的傳統(tǒng)領(lǐng)域會(huì)意識(shí)到大數(shù)據(jù)的重要性。但我們也應(yīng)該保持清醒,大數(shù)據(jù)并不是萬(wàn)能藥,對(duì)某些領(lǐng)域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡(jiǎn)單且實(shí)用的'選擇;但對(duì)某些領(lǐng)域,盲目使用大數(shù)據(jù)只會(huì)適得其反。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇4
信息時(shí)代的到來(lái),我們感受到的是技術(shù)變化日新月異,隨之而來(lái)的是生活方式的轉(zhuǎn)變我們這樣評(píng)論著的信息時(shí)代已經(jīng)變?yōu)樵?jīng)。如今,大數(shù)據(jù)時(shí)代成為炙手可熱的話題。筆者在這說(shuō)明信息和數(shù)據(jù),只是試圖首先說(shuō)明信息、數(shù)據(jù)的關(guān)系和不同,也試圖說(shuō)明,為什么信息時(shí)代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時(shí)代?大數(shù)據(jù)時(shí)代帶給了我們什么?
信息和數(shù)據(jù)的定義。維基百科解釋:信息,又稱資訊,是一個(gè)高度概括抽象概念,是一個(gè)發(fā)展中的動(dòng)態(tài)范疇,是進(jìn)行互相交換的內(nèi)容和名稱,信息的界定沒(méi)有統(tǒng)一的定義,但是信息具備客觀、動(dòng)態(tài)、傳遞、共享、經(jīng)濟(jì)等特性卻是大家的共識(shí)。數(shù)據(jù):或稱資料,指描述事物的符號(hào)記錄,是可定義為意義的實(shí)體,它涉及到事物的存在形式。它是關(guān)于事件之一組離散且客觀的事實(shí)描述,是構(gòu)成信息和知識(shí)的原始材料。數(shù)據(jù)可分為模擬數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)兩大類。數(shù)據(jù)指計(jì)算機(jī)加工的“原料”,如圖形、聲音、文字、數(shù)、字符和符號(hào)等。從定義看來(lái),數(shù)據(jù)是原始的處女地,需要耕耘。信息則是已經(jīng)處理過(guò)的可以傳播的資訊。信息時(shí)代依賴于數(shù)據(jù)的爆發(fā),只是當(dāng)數(shù)據(jù)爆發(fā)到無(wú)法駕馭的狀態(tài),大數(shù)據(jù)時(shí)代應(yīng)運(yùn)而生。這是否是《大數(shù)據(jù)時(shí)代》一書(shū)所未曾闡述的背景材料?
在《大數(shù)據(jù)時(shí)代》一書(shū)中,大數(shù)據(jù)時(shí)代與小數(shù)據(jù)時(shí)代的區(qū)別:
1、思維慣例。大數(shù)據(jù)時(shí)代區(qū)別與轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說(shuō)只要知道“是什么”,而不需要知道“為什么”。作者語(yǔ)言絕對(duì),卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉。
2、使用用途。小數(shù)據(jù)停留在說(shuō)明過(guò)去,大數(shù)據(jù)用驅(qū)動(dòng)過(guò)去來(lái)預(yù)測(cè)未來(lái)。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無(wú)關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測(cè)未來(lái)。
3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來(lái)創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來(lái)進(jìn)行驗(yàn)證。
4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過(guò)程。筆者認(rèn)為,小數(shù)據(jù)時(shí)代也即是信息時(shí)代,是大數(shù)據(jù)時(shí)代的前提,大數(shù)據(jù)時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來(lái)的故事。數(shù)據(jù)的發(fā)展,給我們帶來(lái)什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)?蛻魯(shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長(zhǎng),海量機(jī)遇和挑戰(zhàn)也隨之而來(lái),適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營(yíng)管理能力可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉(cāng)庫(kù)”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時(shí)代,從數(shù)據(jù)中攫取價(jià)值,笑看風(fēng)云變換,穩(wěn)健贏取未來(lái)。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇5
“除了上帝,任何人都必須用數(shù)據(jù)來(lái)說(shuō)話!薄@是《大數(shù)據(jù)》中出現(xiàn)的讓人印象深刻的一句話,也是全書(shū)力圖傳遞的信息。在數(shù)字信息時(shí)代,數(shù)據(jù)和空氣一樣遍布生活,對(duì)于有些人來(lái)說(shuō),數(shù)據(jù)無(wú)意義,而對(duì)于有些人來(lái)說(shuō),數(shù)據(jù),即真相。
美國(guó)是《大數(shù)據(jù)》的主角,全書(shū)通過(guò)講述美國(guó)半個(gè)多世紀(jì)信息開(kāi)放、技術(shù)創(chuàng)新的歷史,以別開(kāi)生面的經(jīng)典案例——設(shè)“前所未有的開(kāi)放政府”的雄心、公共財(cái)政透明的曲折、《數(shù)據(jù)質(zhì)量法》背后的隱情、全民醫(yī)改法案的波瀾、統(tǒng)一身份證的百年糾結(jié)、街頭警察的創(chuàng)新傳奇、美國(guó)礦難的悲情歷史、商務(wù)智能的前世今生、數(shù)據(jù)開(kāi)放運(yùn)動(dòng)的全球興起,以及云計(jì)算、Facebook和推特等社交媒體、Web3·0與下一代互聯(lián)網(wǎng)的未來(lái)圖景等等,為讀者一一細(xì)解數(shù)據(jù)創(chuàng)新給公民、政府、社會(huì)帶來(lái)的種種挑戰(zhàn)和變革。
透過(guò)全書(shū),一個(gè)立體的美國(guó)及美國(guó)人民的思想呈現(xiàn)在我們面前——美國(guó)人民執(zhí)著于個(gè)人隱私的保護(hù),卻又不遺余力地推動(dòng)著政府信息的透明與公開(kāi)。
讀完此書(shū),對(duì)生活中的數(shù)據(jù)及數(shù)據(jù)處理突然有了很大的興趣。如果有一天,處處以數(shù)據(jù)說(shuō)話,那么,政治、制度、生活將更加清明,事故將降到最低點(diǎn)。
作為信息技術(shù)教師,是有必要閱讀此書(shū)的!有慧根的教師將能從書(shū)中挖掘出信息技術(shù)特有的文化以及能用于教學(xué)的鮮活案例。
每天能用來(lái)閱讀的時(shí)間很少,總是要等到夜深疲倦時(shí)才有空打開(kāi)書(shū)本,總是在眼睛極不舒服的情況下堅(jiān)持閱讀,《大數(shù)據(jù)》就這樣在堅(jiān)持中溶入我的思想……
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇6
去年的“云計(jì)算”炒得熱火朝天的,今年的“大數(shù)據(jù)”又突襲而來(lái)。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數(shù)據(jù)”來(lái)了。于是乎,各企業(yè)的CIO也將熱度紛紛轉(zhuǎn)向關(guān)注“大數(shù)據(jù)”來(lái)了。有一張來(lái)自《程序員》微博的漫畫很形象。我覺(jué)得這張圖,很真實(shí)地反映了現(xiàn)實(shí)中小企業(yè)云計(jì)算,大數(shù)據(jù)的現(xiàn)狀。
不過(guò)話又還得說(shuō)回來(lái),《大數(shù)據(jù)時(shí)代》是本好書(shū)。
當(dāng)然,很多IT知名人士也大力推薦,寫了好多讀后感來(lái)表述對(duì)這本書(shū)的喜歡沒(méi)看此書(shū)之前,對(duì)所謂大數(shù)據(jù)的概念基本上是一頭霧水,雖則有了解關(guān)注過(guò)現(xiàn)在也比較火熱的BI,覺(jué)得也差不多,可能就是更多的數(shù)據(jù),更細(xì)致的數(shù)據(jù)分析與數(shù)據(jù)挖掘。看過(guò)此書(shū)后,感覺(jué)到之前的想法,只能算是中了一小半吧—。巨量的數(shù)據(jù),而另一前:著眼于數(shù)據(jù)關(guān)聯(lián)性,而非數(shù)據(jù)精確性,或許才是大數(shù)據(jù)與現(xiàn)時(shí)BI的不同,不僅僅是方法,更多的時(shí)思想方法。不過(guò)坦白講,到底是數(shù)據(jù)的關(guān)聯(lián)性重佳,還是數(shù)據(jù)的精確性更好,還真的需要時(shí)間來(lái)檢驗(yàn)一下,至少?gòu)默F(xiàn)在的數(shù)據(jù)分析方法來(lái)論,更多的傾向于數(shù)據(jù)的精確性。
看完此書(shū),我心中的一些問(wèn)題:
1、什么是大數(shù)據(jù)?
查了查百度百科,是這樣定義的:大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Veracity這個(gè)好像是IBM的定義吧。
以個(gè)人的觀點(diǎn)來(lái)看:數(shù)據(jù)海量,存儲(chǔ)海量都是大數(shù)據(jù)的基本原型吧。
2、大數(shù)據(jù)適合什么樣的企業(yè)?
誠(chéng)然,大數(shù)據(jù)的前提是海量的數(shù)據(jù),只有擁有巨量的數(shù)據(jù)資源,方能從中查找出數(shù)據(jù)的關(guān)聯(lián)性,才可以讓通過(guò)專業(yè)化的處理,讓其為企業(yè)產(chǎn)生價(jià)值。針對(duì)電信運(yùn)營(yíng),互聯(lián)網(wǎng)應(yīng)用這樣海量用戶的數(shù)據(jù)的大企業(yè),也是在應(yīng)用大數(shù)據(jù)的道路上擁有得天獨(dú)厚的條件,但是針對(duì)中小企業(yè)呢?銷售訂單數(shù)據(jù)?若非百年老店,估計(jì)數(shù)據(jù)也是少得可憐,能用的可能只有消費(fèi)者數(shù)據(jù)了吧。貌似大多數(shù)廠商,用來(lái)舉例的也就是消費(fèi)都購(gòu)買行為分析為最多。
同樣,在公共事業(yè)類的政府機(jī)構(gòu),大數(shù)據(jù)的作用也許也能很好的發(fā)揮。反而感覺(jué)在大多數(shù)中小型企業(yè)應(yīng)用大數(shù)據(jù),似乎有點(diǎn)大題小作。書(shū)中說(shuō):大數(shù)據(jù)是企業(yè)競(jìng)爭(zhēng)力。誠(chéng)然,數(shù)據(jù)是一個(gè)企業(yè)的核心無(wú)形資源(利用得好的話),但是否所有的數(shù)據(jù),或都換則方式說(shuō):所有的企業(yè)都以大數(shù)據(jù)為競(jìng)爭(zhēng)力,是否真的合適么?是否在中小企業(yè)中,會(huì)顯示得小題大做呢?
3、大數(shù)據(jù)帶來(lái)的影響
當(dāng)一波又一波的IT技術(shù)熱潮源源不斷地向我們鋪面而來(lái)的時(shí)候,你甚至都沒(méi)有做好準(zhǔn)備,你都要開(kāi)始迎接它所給你帶來(lái)的影響了。經(jīng)過(guò)物聯(lián)網(wǎng),云計(jì)算的推波助瀾下,大數(shù)據(jù)開(kāi)始登場(chǎng)了。但它到底給我們帶來(lái)了什么呢?
1)預(yù)測(cè)未來(lái)書(shū)中以Google成功預(yù)測(cè)了未來(lái)可能發(fā)生流感的案例來(lái)開(kāi)篇,表明通過(guò)大數(shù)據(jù)的應(yīng)用,可以為我們的生活起一個(gè)保駕護(hù)航的指向標(biāo)。實(shí)質(zhì)很簡(jiǎn)單,技術(shù)改變世界。
2)變革商業(yè)大數(shù)據(jù)所帶來(lái)的商機(jī),同時(shí)會(huì)衍生出一系列與大數(shù)據(jù)相關(guān)的商業(yè)機(jī)遇與商業(yè)模式,數(shù)據(jù)的潛在價(jià)值會(huì)源源不斷地發(fā)揮作用可以容易想到的是未來(lái)有專門的數(shù)據(jù)收集,數(shù)據(jù)分析,數(shù)據(jù)生成的一條數(shù)據(jù)產(chǎn)業(yè)鏈產(chǎn)生。影響的,當(dāng)然是IT公司
3)變革思維書(shū)中所說(shuō):因?yàn)橛泻A康臄?shù)據(jù)作基礎(chǔ),未來(lái),我們可能更關(guān)注數(shù)據(jù)的相關(guān),而非精細(xì)度。對(duì)這條,本人還是持保留意見(jiàn)的。
如今說(shuō)起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說(shuō)就OUT了。而且人云亦云的居多,不少談?wù)撜呱踔吝沒(méi)有認(rèn)真讀過(guò)這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時(shí)代》。維克托·邁爾舍恩伯格何許人也?他現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人。他的咨詢客戶包括微軟、惠普和IBM等全球企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔(dān)任多國(guó)政府高層的智囊。這位被譽(yù)為:大數(shù)據(jù)時(shí)代的。預(yù)言家“的牛津教授真牛!那么,這位大師說(shuō)的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進(jìn)行一場(chǎng)思想上的對(duì)話。
舍恩伯格分三部分來(lái)討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。
在第一部分”大數(shù)據(jù)時(shí)代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個(gè)觀點(diǎn):
一、更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對(duì)于第一個(gè)觀點(diǎn),我不敢茍同。
一方面是對(duì)全體數(shù)據(jù)進(jìn)行處理,在技術(shù)和設(shè)備上有相當(dāng)高的難度。另一方面是不是都有此必要,對(duì)于簡(jiǎn)單事實(shí)進(jìn)行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?
我曾與香港城市大學(xué)的祝建華教授討論過(guò)。祝教授是傳播學(xué)研究方法和數(shù)據(jù)分析的專家,他認(rèn)為一定可以找到一種數(shù)理統(tǒng)計(jì)方法來(lái)進(jìn)行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個(gè)觀點(diǎn)中所說(shuō)的相關(guān)關(guān)系,我理解他說(shuō)的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機(jī)樣本不限于目標(biāo)數(shù)據(jù),還包括目標(biāo)以外的所有數(shù)據(jù)。我認(rèn)為大數(shù)據(jù)分析不能排除隨機(jī)抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點(diǎn),我認(rèn)為這是對(duì)他第一個(gè)觀點(diǎn)很好的補(bǔ)充,這也是對(duì)精準(zhǔn)傳播和精準(zhǔn)營(yíng)銷的一種反思!贝髷(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效!案哂泻暧^視野和東方哲學(xué)思維。對(duì)于舍恩伯格的第三個(gè)觀點(diǎn),我也不能完全贊同。”不是因果關(guān)系,而是相關(guān)關(guān)系。“不需要知道”為什么“,只需要知道”是什么“。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時(shí)代人們只關(guān)心因果關(guān)系,對(duì)相關(guān)關(guān)系認(rèn)識(shí)不足,大數(shù)據(jù)時(shí)代相關(guān)關(guān)系舉足輕重,如何強(qiáng)調(diào)都不為過(guò),但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來(lái)?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價(jià)值。如今不少學(xué)者為了闡述和傳播其觀點(diǎn)往往語(yǔ)出驚人,對(duì)舊有觀念進(jìn)行徹底的否定。
世間萬(wàn)物的復(fù)雜性多樣化并非非此即彼那么簡(jiǎn)單,舍恩伯格也是這種二元對(duì)立的幼稚思維嗎?其實(shí)不然,讀者在閱讀時(shí)一定要看清楚他是在什么語(yǔ)境下說(shuō)的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說(shuō)舍恩伯格在提出”不是因果關(guān)系,而是相關(guān)關(guān)系!斑@一論斷時(shí),他在書(shū)中還說(shuō)道:”在大多數(shù)情況下,一旦我們完成了對(duì)大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時(shí),我們就會(huì)繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’!癧i]由此可見(jiàn),他說(shuō)的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語(yǔ)境下的,是在數(shù)據(jù)挖掘中的選項(xiàng)。
大數(shù)據(jù)研究的一大驅(qū)動(dòng)力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時(shí)代的商業(yè)變革。舍恩伯格認(rèn)為數(shù)據(jù)化就是一切皆可”量化“,大數(shù)據(jù)的定量分析有力地回答”是什么“這一問(wèn)題,但仍然無(wú)法完全回答”為什么“。因此,我認(rèn)為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價(jià)值,這是毫無(wú)疑問(wèn)的。舍恩伯格在討論大數(shù)據(jù)的角色定位時(shí)仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒(méi)有把它置于整個(gè)社會(huì)系統(tǒng)里,但他在第二部分大數(shù)據(jù)時(shí)代的管理變革中討論了這個(gè)問(wèn)題。
在風(fēng)險(xiǎn)社會(huì)中信息安全問(wèn)題日趨凸顯。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)”掌控“中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個(gè)問(wèn)題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語(yǔ)中所道:”大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類的作用依然無(wú)法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考的答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來(lái)!爸x謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學(xué)回到人文社科。由此推斷,《大數(shù)據(jù)時(shí)代》不是最終答案,也不是標(biāo)準(zhǔn)答案,只是參考的答案。
此外,在閱讀此書(shū)之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識(shí)和基本概念,比如說(shuō)什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來(lái)就比較好懂了。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇7
現(xiàn)在已經(jīng)進(jìn)入到了二十一世紀(jì)了,當(dāng)今社會(huì)已經(jīng)擺脫了上個(gè)世紀(jì)的那種消息滯后的時(shí)代了,我們最應(yīng)該感謝的就是科學(xué)的進(jìn)步為我們帶來(lái)了這么多便利。與此同時(shí),科學(xué)的進(jìn)步還為我們帶來(lái)了“大數(shù)據(jù)”這個(gè)讓人類減少了很多工作量的東西。
在這個(gè)學(xué)期的名著導(dǎo)讀課上我們就被要求讀:《大數(shù)據(jù)時(shí)代》這本書(shū)!洞髷(shù)據(jù)時(shí)代》是國(guó)外大數(shù)據(jù)系統(tǒng)研究的先河之作,本書(shū)作者維克托·邁爾·舍恩伯格被譽(yù)為“大數(shù)據(jù)時(shí)代的預(yù)言家”,他是一個(gè)特別厲害的人,他作為一個(gè)教師,他曾經(jīng)在哈佛大學(xué)、牛津大學(xué)、耶魯大學(xué)和新加坡國(guó)立大學(xué)等多所世界前列名校任教的經(jīng)歷。他作為一個(gè)科學(xué)家,早在20__年就在《經(jīng)濟(jì)學(xué)人》上發(fā)布了長(zhǎng)達(dá)14頁(yè)對(duì)大數(shù)據(jù)應(yīng)用的前瞻性研究。他是十余年潛心研究數(shù)據(jù)科學(xué)的技術(shù)權(quán)威。他是最早洞見(jiàn)大數(shù)據(jù)時(shí)代發(fā)展趨勢(shì)的數(shù)據(jù)科學(xué)家之一,也是最受人尊敬的權(quán)威發(fā)言人之一。現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人,哈佛國(guó)家電子商務(wù)研究中網(wǎng)絡(luò)監(jiān)管項(xiàng)目負(fù)責(zé)人;曾任新加坡國(guó)立大學(xué)李光耀學(xué)院信息與創(chuàng)新策略研究中心主任。并擔(dān)任耶魯大學(xué)、芝加哥大學(xué)、弗吉尼亞大學(xué)、圣地亞哥大學(xué)、維也納大學(xué)的客座教授。他作為一個(gè)研究學(xué)者,他的學(xué)術(shù)成果斐然,有一百多篇論文公開(kāi)發(fā)表在《科學(xué)》《自然》等著名學(xué)術(shù)期刊上,他同時(shí)也是哈佛大學(xué)出版社、麻省理工出版社、通信政策期刊、美國(guó)社會(huì)學(xué)期刊等多家出版機(jī)構(gòu)的特約評(píng)論員。他是備受眾多世界知名企業(yè)信賴的信息權(quán)威與顧問(wèn)。他的咨詢客戶包括微軟、惠普和IBM等全球頂級(jí)企業(yè);"大數(shù)據(jù)"在百度上搜索到的解釋是:稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。特點(diǎn):數(shù)量、速度、品種、真實(shí)性。而舍恩伯格認(rèn)為,大數(shù)據(jù)并不能定義一個(gè)確切的概念。他提到"大數(shù)據(jù)是人們獲得新的認(rèn)知,創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場(chǎng)、組織機(jī)構(gòu),以及政府和公民關(guān)系的方法。"這是一種更具有人文色彩和社會(huì)意義的詮釋。
大數(shù)據(jù)不僅改變了公共衛(wèi)生領(lǐng)域,整個(gè)商業(yè)領(lǐng)域都因?yàn)榇髷?shù)據(jù)而重新洗牌。購(gòu)買飛機(jī)票就是一個(gè)很好的例子。就像書(shū)中寫到20__年,奧倫·埃齊奧尼準(zhǔn)備乘坐從西雅圖到洛杉磯的飛機(jī)去參加弟弟的婚禮。他知道飛機(jī)票越早預(yù)訂越便宜,于是他在這個(gè)大喜日子來(lái)臨之前的幾個(gè)月,就在網(wǎng)上預(yù)訂了一張去洛杉磯的機(jī)票。在飛機(jī)上,埃齊奧尼好奇地問(wèn)鄰座的乘客花了多少錢購(gòu)買機(jī)票。當(dāng)?shù)弥m然那個(gè)人的機(jī)票比他買得更晚,但是票價(jià)卻比他便宜得多時(shí),他感到非常氣憤。于是,他又詢問(wèn)了另外幾個(gè)乘客,結(jié)果發(fā)現(xiàn)大家買的票居然都比他的便宜。
飛機(jī)著陸之后,埃齊奧尼下定決心要幫助人們開(kāi)發(fā)一個(gè)系統(tǒng),用來(lái)推測(cè)當(dāng)前網(wǎng)頁(yè)上的機(jī)票價(jià)格是否合理。作為一種商品,同一架飛機(jī)上每個(gè)座位的價(jià)格本來(lái)不應(yīng)該有差別。但實(shí)際上,價(jià)格卻千差萬(wàn)別,其中緣由只有航空公司自己清楚。
埃齊奧尼表示,他不需要去解開(kāi)機(jī)票價(jià)格差異的奧秘。他要做的僅僅是預(yù)測(cè)當(dāng)前的機(jī)票價(jià)格在未來(lái)一段時(shí)間內(nèi)會(huì)上漲還是下降。這個(gè)想法是可行的,但操作起來(lái)并不是那么簡(jiǎn)單。這個(gè)系統(tǒng)需要分析所有特定航線機(jī)票的銷售價(jià)格并確定票價(jià)與提前購(gòu)買天數(shù)的關(guān)系。
在信息時(shí)代,信息安全問(wèn)題的日趨凸顯,數(shù)據(jù)獨(dú)裁與隱私保護(hù)之間的矛盾更是立于風(fēng)口浪尖,成為眾矢之的,舍恩伯格在本書(shū)的最后章節(jié)曾試圖尋找一種解決方式來(lái)擺脫這一種困境,但最終沒(méi)能做到,但是他提出"大數(shù)據(jù)并不是一個(gè)充斥著算法的和機(jī)器的冰冷世界,人類的作用仍無(wú)法被完全代替。"這里表明人在數(shù)據(jù)時(shí)代同樣的重要,數(shù)據(jù)是為人類服務(wù)的,也就該人類驅(qū)使下完成相應(yīng)的目的。在這樣的大環(huán)境下,常引起我更多的思考和擔(dān)憂。
大數(shù)據(jù)時(shí)代對(duì)于我們同是機(jī)遇與挑戰(zhàn),一些國(guó)家已開(kāi)始步入大數(shù)據(jù)時(shí)代的行列,并在各個(gè)領(lǐng)域開(kāi)始研究和使用。而對(duì)于我國(guó)龐大的人口,以及較大的領(lǐng)土面積,都可以在大數(shù)據(jù)時(shí)代為我們提供數(shù)據(jù)的保障,而能否面臨挑戰(zhàn),在大國(guó)之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術(shù)等方面的問(wèn)題,更應(yīng)在政策上逐步開(kāi)放各領(lǐng)域的數(shù)據(jù),保證數(shù)據(jù)來(lái)源、權(quán)限等問(wèn)題得到解決,不斷學(xué)習(xí)先進(jìn)的計(jì)算機(jī)技術(shù),縮小與其他國(guó)家的差距。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇8
讀了《大數(shù)據(jù)時(shí)代》后,感覺(jué)到一個(gè)大變革的時(shí)代將要來(lái)臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來(lái)。
“在小數(shù)據(jù)時(shí)代,我們會(huì)假象世界是怎樣運(yùn)作的,然后通過(guò)收集和分析數(shù)據(jù)來(lái)驗(yàn)證這種假想!薄半S著由假想時(shí)代到數(shù)據(jù)時(shí)代的過(guò)渡,我們也很可能認(rèn)為我們不在需要理論了。”書(shū)中幾乎肯定要顛覆統(tǒng)計(jì)學(xué)的理論和方法,也試圖通過(guò)引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來(lái)“終結(jié)”量子力學(xué)。對(duì)此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書(shū)就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的.傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì)被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來(lái)的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見(jiàn)”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說(shuō)。反正我也不喜歡、也學(xué)不會(huì)它們。
當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
《大數(shù)據(jù)時(shí)代》第16頁(yè)“大數(shù)據(jù)的核心就是預(yù)測(cè)”。邏輯是——描述時(shí)空信息“類”與“類”之間長(zhǎng)時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒(méi)必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對(duì)立的。在同一件事上兩種方法對(duì)立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲。?wèn)題不解決,我就沒(méi)法思考和工作,自然就沒(méi)法活了!更何況還有兩個(gè)更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問(wèn)題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對(duì)論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲(chóng)洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛(ài)因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职,兒子就是兒子。那么大?shù)據(jù)會(huì)不會(huì)通過(guò)正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒(méi)有!洞髷(shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對(duì)什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來(lái)說(shuō)都是門外漢,也許上面一大篇都是在胡說(shuō)八道,所謂的擔(dān)心根本不存在。但問(wèn)題出現(xiàn)了,還是解決的好,不然沒(méi)法睡著覺(jué)。自己解決不了就只能依靠專家來(lái)指點(diǎn)迷津。
所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書(shū)繼續(xù)寫下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇9
我們生活在一個(gè)“概念”紛飛的年代,先前只有IBM熟諳的招數(shù),如今已經(jīng)“飛入平常百姓家”!耙苿(dòng)互聯(lián)網(wǎng)”、“云計(jì)算”的概念剛剛消停,業(yè)界的專家又送來(lái)了“大數(shù)據(jù)”的概念,一時(shí)間似乎人人都變成了“大數(shù)據(jù)”專家,見(jiàn)面要是不提“大數(shù)據(jù)”都不好意思跟人打招呼!
玩笑歸玩笑,當(dāng)我們的存儲(chǔ)能力、計(jì)算能力和網(wǎng)絡(luò)帶寬變得充裕之后,我們先前對(duì)待數(shù)據(jù),尤其是原始數(shù)據(jù)的態(tài)度和思維方式,將面臨著很大的改變!
其實(shí),作者的主要觀點(diǎn),已經(jīng)在翻譯者的譯者序中進(jìn)行了總結(jié):“大數(shù)據(jù)時(shí)代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:要全體不要抽樣,要效率不要絕對(duì)精確,要相關(guān)不要因果”。
如作者所言,“采樣分析是信息缺乏時(shí)代和信息流通受限制的模擬數(shù)據(jù)時(shí)代的產(chǎn)物”。如果可以,我們當(dāng)然會(huì)使用“全體數(shù)據(jù)”而不是“抽樣數(shù)據(jù)”。讀到這里,我估計(jì)大學(xué)里正在絞盡腦汁設(shè)計(jì)樣本抽樣方法的學(xué)生、教授們,連哭的心都有!
數(shù)據(jù)分析的及時(shí)性,在很多情況下比精確性更加重要,尤其是在商業(yè)領(lǐng)域。想想看,如果需要兩周時(shí)間才能計(jì)算出明天某個(gè)航班的滿座率,那還有什么意義?大數(shù)據(jù)計(jì)算技術(shù),適用的不是像衛(wèi)星發(fā)射、開(kāi)具銀行賬戶這樣的工作,而是不要求極端精確的情況,其核心是“預(yù)測(cè)趨勢(shì)”,況且原始數(shù)據(jù)也可能出現(xiàn)差錯(cuò)。
過(guò)往千年,探究因果關(guān)系幾乎是所有科學(xué)研究的原動(dòng)力。甚至,這已經(jīng)通過(guò)語(yǔ)言,融入我們的思維方式和哲學(xué)思想:“因?yàn)椤浴,凡事都要?wèn)“為什么”。但是,在大數(shù)據(jù)的范疇里,關(guān)注的卻是相關(guān)性,而不是因果關(guān)系,或者其次才是因果關(guān)系。超市只用關(guān)心把啤酒和尿不濕放在一起,會(huì)幫助提高銷售額,而不用關(guān)心其中的奧秘。如果說(shuō)原因,可能很多都是人們的習(xí)慣、方便,甚至是人性,例如奶爸們習(xí)慣買尿不濕的時(shí)候給自己捎上幾罐啤酒。
在此,也有一些自己的思考:如果說(shuō)搜索引擎所解決的問(wèn)題表面上是幫助用戶找到需要的信息,而實(shí)質(zhì)是幫助企業(yè)找到擁有某項(xiàng)需求的客戶,深層次講是解決了《第三次浪潮》中提出的消費(fèi)者和生產(chǎn)者分離的根本矛盾,如果再加上3D打印技術(shù),就可以完成由消費(fèi)者主導(dǎo)的“個(gè)性化”生產(chǎn)過(guò)程;而大數(shù)據(jù)所解決的是,通過(guò)對(duì)所有用戶的數(shù)據(jù)進(jìn)行分析,可以預(yù)測(cè)用戶群整體的需求變化趨勢(shì),從而完成批量產(chǎn)品生產(chǎn)、銷售的調(diào)整問(wèn)題,其奇妙之處就在于無(wú)需用戶“開(kāi)口”說(shuō)出她想要什么?一個(gè)解決的`“個(gè)體需求”,一個(gè)解決的是“群體需求”。
本書(shū)除了提出上述三項(xiàng)基本觀點(diǎn),其它的內(nèi)容大多是舉例說(shuō)明,多少有些空泛。但是,其實(shí)大數(shù)據(jù)時(shí)代才剛剛開(kāi)始,對(duì)大數(shù)據(jù)的應(yīng)用也只是停留在比較淺的層面上,作者能提出這三項(xiàng)基本觀點(diǎn)已屬難能可貴!
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇10
這么多年來(lái),看了很多東西,如今回過(guò)頭來(lái)發(fā)現(xiàn),好像什么都忘了,真是悲劇,所謂讀書(shū)破萬(wàn)卷,下筆如有神或許是不對(duì)的,還是需要下筆勤快,所以決定從這里開(kāi)始。
這些年對(duì)于技術(shù)的發(fā)展,我是沒(méi)有跟上,如今發(fā)現(xiàn)即便是對(duì)于投資,技術(shù)對(duì)于我們生活的改變太大,而自己身在這個(gè)技術(shù)浪潮的前沿,還是需要跟上步伐!把
大數(shù)據(jù)這個(gè)概念已經(jīng)提了很久,我也一直疏忽了對(duì)于它的理解?赐辍洞髷(shù)據(jù)時(shí)代》,再結(jié)合如果工作上對(duì)于大數(shù)據(jù)的理解,頓時(shí)發(fā)現(xiàn)數(shù)據(jù)的重要性,以前在這方面的確沒(méi)有足夠的思想意識(shí)。
整本書(shū)來(lái)說(shuō),我覺(jué)得最關(guān)鍵的三個(gè)點(diǎn)是前面幾個(gè)章節(jié):
1、要總體,不要隨機(jī)樣本:從小對(duì)于統(tǒng)計(jì)學(xué)相關(guān)的學(xué)習(xí),基本都是從樣本出發(fā),理論的基礎(chǔ)在于如何隨機(jī)的足夠分散的選取樣本,這可是技術(shù)活加直覺(jué)。而對(duì)于大數(shù)據(jù)來(lái)說(shuō),要的就是總體,本質(zhì)上來(lái)說(shuō),總體樣本的確更能準(zhǔn)確找到結(jié)果。但是對(duì)于統(tǒng)計(jì)來(lái)說(shuō),總體的分析增加了數(shù)據(jù)分析的難度,不僅數(shù)據(jù)核對(duì)不好進(jìn)行,一旦出現(xiàn)數(shù)據(jù)污染,準(zhǔn)確度就會(huì)大打折扣,而且進(jìn)行數(shù)據(jù)回溯的時(shí)候,也無(wú)法準(zhǔn)確確認(rèn)問(wèn)題,而這一點(diǎn)也是后面相關(guān)性上問(wèn)題;
2、要混亂,而不是精確:這里主要想說(shuō)明的是希望數(shù)據(jù)的多樣性,盡量將相關(guān)數(shù)據(jù)都收集起來(lái),不管是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的。這樣就不可避免的最終結(jié)果的不準(zhǔn)確性。大數(shù)據(jù)更多的是從一個(gè)總體數(shù)據(jù)中說(shuō)明以后概率事件,既然是概率,也就可以理解無(wú)法精確。這里有個(gè)點(diǎn)的說(shuō)明,我覺(jué)得需要提一下,大數(shù)據(jù)算法更傾向于“簡(jiǎn)單”,而不是復(fù)雜,這個(gè)倒是出乎我的意外。
3、要相關(guān)性,而不是因果:從我對(duì)于知識(shí)獲取的過(guò)程來(lái)說(shuō),我是不同意這個(gè)觀點(diǎn),從人體對(duì)于知識(shí)的理解,還是要從因果論出發(fā),沒(méi)有因果論,就會(huì)變成瞎子。而作者的觀點(diǎn)上來(lái)說(shuō),原因可能還是從大數(shù)據(jù)本身的非準(zhǔn)確性,一旦找到合適的算法,找到相關(guān)性,向上追述原因本身就很難。但是從舉的示例上看,相關(guān)性的確認(rèn)是一個(gè)非常大的工程,基本就是使用排舉法,一個(gè)一個(gè)試。
所以,對(duì)于大數(shù)據(jù)來(lái)說(shuō),最重要的三點(diǎn)是:
1、數(shù)據(jù)——得到更多數(shù)據(jù);
2、算法——建立更快的算法體系;
3、思維——尋找數(shù)據(jù)間更多的相關(guān)性。
對(duì)于數(shù)據(jù)最終的走向,我同意書(shū)中所提到的政府管理的觀點(diǎn),既然都是以“石油”的標(biāo)準(zhǔn)來(lái)看待數(shù)據(jù),政府統(tǒng)一管理也就是必然的了。而且對(duì)于政府來(lái)說(shuō),掌握更多數(shù)據(jù)也有利于其管理及維護(hù)社會(huì)的穩(wěn)定性。而對(duì)于社會(huì)道德方面的論述,我不想多說(shuō)什么,時(shí)代發(fā)展是不會(huì)被道德綁架的。
所以最后,想要建立對(duì)于大數(shù)據(jù)的思維,《大數(shù)據(jù)時(shí)代》還是值得一讀,里面的很多示例也非常不錯(cuò)。如人際關(guān)系這一塊,也是出乎我的意料。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇11
無(wú)處不在的大數(shù)據(jù):各種云計(jì)算,谷歌的神通,亞馬遜的推送,天涯人肉,微博萬(wàn)能等等,我們掌握了新的工具,也獲取了以前從未有過(guò)的各種信息。大數(shù)據(jù)拉近了我們與現(xiàn)實(shí)的距離,“地球村”變成了“地球屋”,仿佛所有人所有事物都觸手可及,而這些牛逼哄哄的互聯(lián)網(wǎng)巨頭就在客廳展示著世界的每一寸光景。
作者站在理論的至高點(diǎn)上,闡述了大數(shù)據(jù)對(duì)人類的工作、生活、思維帶來(lái)的革新,大數(shù)據(jù)時(shí)代的三種典型的商業(yè)模式,以及大數(shù)據(jù)時(shí)代對(duì)于個(gè)人隱私保護(hù)、公共安全提出的挑戰(zhàn)。作者認(rèn)為大數(shù)據(jù)時(shí)代具有三個(gè)顯著特點(diǎn)。
一、人們研究與分析某個(gè)現(xiàn)象時(shí),將使用全部數(shù)據(jù)而非抽樣數(shù)據(jù)。
二、在大數(shù)據(jù)時(shí)代,不能一味地追求數(shù)據(jù)的精確性,而要適應(yīng)數(shù)據(jù)的多樣性、豐富性、甚至要接受錯(cuò)誤的數(shù)據(jù)。
三、了解數(shù)據(jù)之間的相關(guān)性,勝于對(duì)因果關(guān)系的探索!笆鞘裁础北取盀槭裁础敝匾W髡咧赋,隨著技術(shù)的發(fā)展,數(shù)據(jù)的存儲(chǔ)與處理成本顯著降低,人們現(xiàn)在有能力從支離破碎的、看似毫不相干的數(shù)據(jù)礦渣中抽煉出真知爍見(jiàn)。在大數(shù)據(jù)時(shí)代,三類公司將成為時(shí)代的寵兒。一是擁有大數(shù)據(jù)的公司與組織,如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公司(阿里巴巴、淘寶網(wǎng))。二是擁有數(shù)據(jù)分析與處理技術(shù)的專業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng)新思維的公司,他們可能既不掌握大數(shù)據(jù),也沒(méi)有專業(yè)技術(shù),但卻擅長(zhǎng)使用大數(shù)據(jù),從大數(shù)據(jù)中找到自己的理想天地。面對(duì)即將來(lái)臨的大數(shù)據(jù)時(shí)代,個(gè)人將如何應(yīng)對(duì)自如?這是個(gè)嚴(yán)肅的問(wèn)題。大數(shù)據(jù)時(shí)代的社會(huì)倫理重點(diǎn)都在討論如何保護(hù)個(gè)人隱私。因?yàn)槭謾C(jī)越來(lái)越智能,網(wǎng)絡(luò)越來(lái)越快,個(gè)人的信息也越來(lái)越透明——隱形幾乎完全不可能。我想說(shuō)的是,作為硬幣的另外一面,我們無(wú)法舍棄:互聯(lián)網(wǎng)只不過(guò)是讓人與人之間碎片的關(guān)系得以統(tǒng)一,其實(shí)各種人肉和信息只不過(guò)是坊間傳聞的升級(jí)罷了。當(dāng)我們住在擁擠的小區(qū),三公里走完一圈的縣城,半小時(shí)散步完的村落,人和人之間有隱私嗎?現(xiàn)在只不過(guò)是把這個(gè)范圍放大到了一個(gè)地球而已。硬幣的一面是人和人之間有溝通的需要,去團(tuán)結(jié)對(duì)抗世界的未知,那么另外一面就是隱私的缺乏。與其說(shuō)是要在大數(shù)據(jù)時(shí)代保護(hù)自己的信息不被泄露,不如站起來(lái)維護(hù)自己和他人的隱私,從法律和道德的角度來(lái)尊重人與人之間的權(quán)利。
大數(shù)據(jù)時(shí)代是信息社會(huì)運(yùn)作的必然結(jié)果,而借由它,人類的信息社會(huì)更上一個(gè)臺(tái)階。農(nóng)業(yè)社會(huì)人們以土地為核心資源,工業(yè)時(shí)代轉(zhuǎn)為能源,信息社會(huì)則將變更為數(shù)據(jù)。誰(shuí)掌握數(shù)據(jù),以及數(shù)據(jù)分析方法,誰(shuí)就將在這個(gè)大數(shù)據(jù)時(shí)代勝出,無(wú)論是商業(yè)組織,還是國(guó)家文明。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇12
通過(guò)讀ViktorMayer-Schonberger的《大數(shù)據(jù)時(shí)代》重新認(rèn)真思考了大數(shù)據(jù),全書(shū)以數(shù)據(jù)為核心,引導(dǎo)人們用數(shù)據(jù)的思維去理解世界,用數(shù)據(jù)的思維去解決問(wèn)題,是推薦讀物。但個(gè)人認(rèn)為本書(shū)叫《數(shù)據(jù)時(shí)代》更為合適,因其講了不少統(tǒng)計(jì)學(xué)、數(shù)據(jù)收集的故事,“大數(shù)據(jù)”的故事只占一小部分。
維基百科說(shuō)大數(shù)據(jù)由巨型數(shù)據(jù)集組成,這些數(shù)據(jù)集大小常超出常用軟件在可接受時(shí)間下的收集、庋用、管理和處理能力,或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,大數(shù)據(jù)的常見(jiàn)特點(diǎn)是3V:Volume、Velocity、Variety。
規(guī)模巨大的數(shù)據(jù)未必是大數(shù)據(jù),需滿足她的三個(gè)特點(diǎn)。以研究擲硬幣概率的實(shí)驗(yàn)為例,當(dāng)傳統(tǒng)實(shí)驗(yàn)次數(shù)達(dá)到一定規(guī)模后就能幫助實(shí)驗(yàn)者分析正反面出現(xiàn)的概率,隨著實(shí)驗(yàn)次數(shù)的增加,數(shù)據(jù)大量積累可能越來(lái)越支持這一結(jié)論,數(shù)據(jù)達(dá)到一定量,它的邊際效應(yīng)就出現(xiàn)了,數(shù)據(jù)繼續(xù)增加對(duì)分析概率還有多少意義呢?按照現(xiàn)代概率學(xué)伯努利試驗(yàn)去帶入函數(shù)計(jì)算就好了,這僅算是概率學(xué)或者是統(tǒng)計(jì)學(xué)吧。故大數(shù)據(jù)不是因?yàn)閱渭凅w積大而大,是因?yàn)殡s而大,研究硬幣正反面的概率如引入天文學(xué)、心理學(xué)、材料學(xué)、物理學(xué)等領(lǐng)域的數(shù)據(jù)而使之變大,進(jìn)而研究關(guān)聯(lián)關(guān)系(或因果關(guān)系,注:本書(shū)不認(rèn)同因果關(guān)系的重要性),從而得出概率的分布,然而大量相關(guān)數(shù)據(jù)的引入,按照傳統(tǒng)分析過(guò)程的時(shí)間是不可接受的,需利用高效計(jì)算資源,迅速把雜而大的處理結(jié)果呈現(xiàn)出來(lái),并且實(shí)驗(yàn)者對(duì)結(jié)果的預(yù)期不能要求100%的精確。大數(shù)據(jù)并不是數(shù)據(jù)本身,而是一種思維方式。
大數(shù)據(jù)令人著迷的地方在于用“科學(xué)”的辦法挑戰(zhàn)了“預(yù)測(cè)學(xué)”,幫助人們發(fā)現(xiàn)未知,幫忙人們進(jìn)行決策。然而本書(shū)作者ViktorMayer-Schonberger強(qiáng)調(diào)“大數(shù)據(jù)不是因果關(guān)系,而是相關(guān)關(guān)系,相關(guān)關(guān)系比因果關(guān)系更重要”,此觀點(diǎn)不能認(rèn)同,因果關(guān)系是宇宙的基本定律,且不說(shuō)種瓜得瓜、善有善報(bào)之類哲學(xué)命題,若商家在發(fā)現(xiàn)電容器、釘子、高壓鍋有關(guān)聯(lián)購(gòu)買關(guān)系而去做大量營(yíng)銷的話豈不是有可能發(fā)生更多的波士頓爆炸案①。關(guān)聯(lián)關(guān)系在大數(shù)據(jù)中被提取出來(lái)使用,而不去關(guān)心因果關(guān)系是一種粗暴的、倒退的處理方式,是作者理解的現(xiàn)代社會(huì)浮躁的心里體現(xiàn)。我認(rèn)為的大數(shù)據(jù)應(yīng)該是把看起來(lái)不相干的數(shù)據(jù)放到一起分析,找到某些跨領(lǐng)域的關(guān)聯(lián)關(guān)系,進(jìn)而推論因果關(guān)系,發(fā)現(xiàn)其中價(jià)值。作者引用了安德森的觀點(diǎn)“現(xiàn)在已經(jīng)是一個(gè)有海量數(shù)據(jù)的時(shí)代,應(yīng)用數(shù)學(xué)已經(jīng)取代了其他的所有學(xué)科工具,而且只要數(shù)據(jù)足夠,就能說(shuō)明問(wèn)題”,數(shù)據(jù)和所有科學(xué)的關(guān)系,我覺(jué)得有點(diǎn)像現(xiàn)在互聯(lián)網(wǎng)和其他所有行業(yè)的關(guān)系一樣,互聯(lián)網(wǎng)終究還是一個(gè)工具。作者舉了沃爾瑪“尿布與啤酒”③的故事,這也是大家熟知的一個(gè)數(shù)據(jù)分析的故事,但是沃爾瑪真的是這么做的嗎?大家可以去沃爾瑪?shù)臅r(shí)候留意一下。一家大型的超市,如果為了這種所謂相關(guān)關(guān)系,所有商品用這種關(guān)聯(lián)關(guān)系去擺放,天哪,這將是一家多么混亂的超市,顧客進(jìn)去將難以區(qū)分食品在哪、生活用品在哪!有人可能說(shuō)這種關(guān)聯(lián)關(guān)系更適合電子商務(wù),是的,但是我還是比較看好已知原因的關(guān)聯(lián)關(guān)系,比如嬰幼兒智力玩具和孕婦減肥放到一起,比如在線播放器旁邊放衛(wèi)生紙的廣告(哈哈哈,你懂的)。本書(shū)用美國(guó)折扣零售店塔吉特與懷孕預(yù)測(cè)②來(lái)佐證他的觀點(diǎn),但恰恰是知道因果關(guān)系后商業(yè)價(jià)值才能更多的體現(xiàn)出來(lái),未知因果關(guān)系前顧客的父親生氣并要求賠償,知道因果關(guān)系后才使得這種廣告理所應(yīng)當(dāng)并讓客戶接受。
互聯(lián)網(wǎng)信息時(shí)代數(shù)據(jù)的積累以及BI、數(shù)據(jù)倉(cāng)庫(kù)、人工智能、HADOOP、NOSQL等技術(shù)的流行,使得人們考慮問(wèn)題的方式已經(jīng)發(fā)生變化,接下來(lái)我們要做的只有接受擁抱數(shù)據(jù)時(shí)代、大數(shù)據(jù)時(shí)代。軟件行業(yè)程序上線的變更差錯(cuò)率是一個(gè)考核IT水平的指標(biāo),為此很多公司引進(jìn)了CMMI體系,以求他保障軟件的質(zhì)量,為此也收集了大量的過(guò)程數(shù)據(jù)。若用數(shù)據(jù)的思維,是否可能根據(jù)之前的各種相關(guān)數(shù)據(jù)預(yù)測(cè)下次投產(chǎn)變更的成功率?若用大數(shù)據(jù)的思維,是否可以根據(jù)CMMI數(shù)據(jù)以及程序員開(kāi)發(fā)期間上下班考勤數(shù)據(jù)、工資發(fā)放時(shí)間、上線當(dāng)天天氣情況來(lái)綜合預(yù)測(cè)投產(chǎn)變更的成功率?用大數(shù)據(jù)的思維,訂餐網(wǎng)站不僅根據(jù)之前你定的是咸的還是辣的來(lái)給你推薦菜單,可能因?yàn)槟阄⒉┥习l(fā)了一句“每個(gè)月總有那么幾天”修改了訂餐的推薦菜單(哈哈)!故在數(shù)據(jù)時(shí)代,提議童鞋們檢查公司的信息系統(tǒng),是否有定期刪除“垃圾”日志、數(shù)據(jù)的機(jī)制(Viktor說(shuō),即使最平凡的信息業(yè)可以具有特殊的價(jià)值),為了日益廉價(jià)的存儲(chǔ)而刪除日益昂貴的數(shù)據(jù),請(qǐng)三思后行吧。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇13
我主要讀了第一部分和第三部分。
第一部分是大數(shù)據(jù)的思維變革,作者舍恩伯格提出了三個(gè)觀點(diǎn),一是"不是隨機(jī)樣本,而是全體數(shù)據(jù)",二是"不是精確性,而是混雜性",三是"不是因果關(guān)系,而是相關(guān)關(guān)系",作者被譽(yù)為"大數(shù)據(jù)時(shí)代的預(yù)言家",拋出的觀點(diǎn)是擲地有聲的,下面我將談?wù)勎覍?duì)這三點(diǎn)的理解。
對(duì)于一,我們必須承認(rèn)我們以往做的處理抽樣數(shù)據(jù)得到結(jié)果的方法,是省時(shí)省力省錢的,而且判斷結(jié)果是相對(duì)高精準(zhǔn)的,如人口普查這一案例,如果采用全體數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的話,工作難度是相當(dāng)大的,最后的結(jié)果也不會(huì)很滿意,這是得不償失的。但是隨著數(shù)據(jù)處理技術(shù)的飛速發(fā)展,我們已經(jīng)具備了處理大量數(shù)據(jù)的能力,如果在數(shù)據(jù)分析過(guò)程中采用全體數(shù)據(jù),就能避免抽樣數(shù)據(jù)可能由于選取偏見(jiàn)帶來(lái)的非隨機(jī)性,處理全體數(shù)據(jù)也必將成為一種趨勢(shì)。用在國(guó)防生管理工作中,就是管理層要對(duì)每個(gè)個(gè)體都給予充分的關(guān)心與互動(dòng),對(duì)于優(yōu)秀的固然要偏愛(ài),但是對(duì)于較差的也要保持"不拋棄不放棄"的態(tài)度,讓每一個(gè)個(gè)體都找到自己的定位與價(jià)值。
對(duì)于二,作者強(qiáng)調(diào)通過(guò)掌握更多的數(shù)據(jù),暫時(shí)犧牲精確性,關(guān)注更多容易被忽略的細(xì)節(jié),來(lái)做更多的事,得到更多的結(jié)果,也就是說(shuō)我們要有一定的包容錯(cuò)誤的能力。我們?cè)谑占瘮?shù)據(jù)時(shí),要主動(dòng)獲取更多的數(shù)據(jù),少加一些限制性條件,然后應(yīng)用我們處理大數(shù)據(jù)的能力,或許會(huì)獲得意想不到的結(jié)果。作者舉了一個(gè)谷歌翻譯系統(tǒng)的例子,通過(guò)英語(yǔ)作為中轉(zhuǎn),進(jìn)行各語(yǔ)言之間的轉(zhuǎn)換。此處的啟發(fā)就是用我們最擅長(zhǎng)的途徑,不拘泥于特定規(guī)則,來(lái)達(dá)到我們的目的,也就是說(shuō)我們要先認(rèn)清自己,不去刻意的模仿,找出最適合自己的一套方法。
對(duì)于三,作者指出知道"是什么"就夠了,沒(méi)必要知道"為什么",乍一看這個(gè)觀點(diǎn)覺(jué)得有點(diǎn)無(wú)腦,但是結(jié)合第二點(diǎn)就合理了,降低對(duì)精確性及原因結(jié)果的要求,通過(guò)對(duì)相關(guān)數(shù)據(jù)的廣泛分析,進(jìn)而得到更豐富更多元的結(jié)果。如購(gòu)物時(shí),系統(tǒng)的購(gòu)物推薦,并不是肯定你會(huì)購(gòu)買,僅僅是你感興趣進(jìn)而可能會(huì)買就足夠了。其實(shí)作者對(duì)"相關(guān)關(guān)系"的強(qiáng)調(diào),主要是大數(shù)據(jù)強(qiáng)大的預(yù)測(cè)能力,而且這種預(yù)測(cè)性能還是相當(dāng)精確的。以上只是我用作者的觀點(diǎn)佐證他自己的觀點(diǎn),證明其一定的合理性,但是我是不完全認(rèn)同的,在航天領(lǐng)域,我們對(duì)成功率的要求是極高的,尤其是載人航天領(lǐng)域,我們必須做到萬(wàn)無(wú)一失,我們對(duì)每一個(gè)結(jié)果都會(huì)深究其根,找出原因。對(duì)于國(guó)防生體能成績(jī)的分析也是如此,結(jié)果只是我們的一個(gè)評(píng)價(jià)機(jī)制,而最重要的還是產(chǎn)生這一結(jié)果的原因及過(guò)程。
第三部分是大數(shù)據(jù)的管理變革,本來(lái)以為作者會(huì)講點(diǎn)如何通過(guò)大數(shù)據(jù)來(lái)改革管理機(jī)制和提高管理效率,沒(méi)想到作者只是講了大數(shù)據(jù)其實(shí)就是我們的隱私的暴露,提出了要讓數(shù)據(jù)采集管理公司對(duì)數(shù)據(jù)的使用負(fù)起責(zé)任的解決途徑。個(gè)人感覺(jué),一是我們?cè)谄綍r(shí)要意識(shí)到個(gè)人隱私的保護(hù),而是相關(guān)法律政策的完善,真正的讓大數(shù)據(jù)服務(wù)我們的工作生活,而不是一種變相的威脅。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇14
未來(lái)的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時(shí)代。不管你是否意識(shí)到它的存在,大數(shù)據(jù)都將越來(lái)越快地改變我們這個(gè)時(shí)代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見(jiàn)大數(shù)據(jù)時(shí)代發(fā)展趨勢(shì)的數(shù)據(jù)科學(xué)家之一。他通過(guò)一個(gè)大家熟知的事例,來(lái)幫助我們理解“大數(shù)據(jù)”的潛在影響力,那就是四個(gè)世紀(jì)之前望遠(yuǎn)鏡和顯微鏡的發(fā)明。望遠(yuǎn)鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測(cè)微生物,它們都是收集海量數(shù)據(jù)的新工具,因?yàn)檫@種工具的發(fā)明,人們同步更新了分析數(shù)據(jù)的技術(shù)和方法,促進(jìn)了人們對(duì)世界更好的理解。如果說(shuō)望遠(yuǎn)鏡和顯微鏡是測(cè)量領(lǐng)域中的一場(chǎng)革命,那么今天的數(shù)據(jù)測(cè)量就相當(dāng)于是現(xiàn)代版的望遠(yuǎn)鏡、顯微鏡。隨著社交網(wǎng)絡(luò)的逐漸成熟,移動(dòng)帶寬迅速提升,云計(jì)算、物聯(lián)網(wǎng)應(yīng)用更加豐富,以及更多的傳感設(shè)備、移動(dòng)終端接入到網(wǎng)絡(luò),由此產(chǎn)生的數(shù)據(jù)及數(shù)據(jù)的增長(zhǎng)速度比歷史上的任何時(shí)期都要多、都要快。一個(gè)大數(shù)據(jù)的時(shí)代,不經(jīng)意間順理成章地翩然而至。
一、什么是大數(shù)據(jù)?
大數(shù)據(jù)是當(dāng)前最熱門的話題之一。但什么是大數(shù)據(jù),人們尚未給出確切的定義。首先,“大數(shù)據(jù)”是相對(duì)過(guò)去小的、局部性的數(shù)據(jù)而言的;其次,利用大數(shù)據(jù)進(jìn)行分析和工作時(shí),所依據(jù)的關(guān)于此事盡可能完整的數(shù)據(jù),從而“一覽眾山小”,而不是采用局部的小數(shù)據(jù),從局部推斷整體。
維克托也并未直接給出大數(shù)據(jù)的定義。不過(guò),他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性:
轉(zhuǎn)變之一:在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣。例如一項(xiàng)針對(duì)相撲比賽中非法操縱比賽結(jié)果的研究對(duì)64000場(chǎng)比賽進(jìn)行了分析,這算不上一個(gè)很大的數(shù)字,但由于這是過(guò)去十年所有的比賽,所以它是大數(shù)據(jù)。
轉(zhuǎn)變之二:由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對(duì)于一個(gè)事物只有50個(gè)數(shù)據(jù)點(diǎn),那么每一個(gè)數(shù)據(jù)點(diǎn)都必須非常精確,因?yàn)槊總(gè)數(shù)據(jù)點(diǎn)都是有用的;但是如果我們有5000萬(wàn)個(gè),去掉10個(gè),甚至去掉1000個(gè)都沒(méi)有太大的問(wèn)題。
轉(zhuǎn)變之三:不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。分析大數(shù)據(jù)主要為了預(yù)測(cè)未來(lái)“是什么”,而不是“為什么”。因?yàn)楹芏鄷r(shí)候我們以為我們找到了事情背后的原因,實(shí)際上卻沒(méi)有找到。更多時(shí)候知道了“是什么”就足夠了。例如知道流感將會(huì)擴(kuò)散到哪里就足夠了,我不需要知道為什么;知道什么時(shí)候在網(wǎng)上購(gòu)買機(jī)票能夠獲得最優(yōu)惠的價(jià)格就足夠了,我不需要知道為什么此時(shí)價(jià)格最低。
二、大數(shù)據(jù)帶來(lái)的變化
大數(shù)據(jù)從根本上改變我們認(rèn)識(shí)世界和改變世界的方式。很多傳統(tǒng)的習(xí)慣將被顛覆,很多舊的制度將面臨挑戰(zhàn)。舉例來(lái)說(shuō):
第一,科學(xué)探究的思路和方式受到挑戰(zhàn)
探究是新課程改革中的一個(gè)熱詞,是促進(jìn)學(xué)校教學(xué)與科學(xué)研究相融合的實(shí)踐舉措?茖W(xué)探究的基本路徑是:發(fā)現(xiàn)問(wèn)題,提出假設(shè),制定方案,實(shí)踐探究,分析數(shù)據(jù),得出結(jié)論。之所以會(huì)梳理出這樣一個(gè)探究的路徑,與我們對(duì)問(wèn)題知曉的信息過(guò)少有關(guān)。換句話說(shuō),對(duì)所要研究的事物,我們知道的數(shù)據(jù)很少,需要從這些很小的數(shù)據(jù)出發(fā),通過(guò)猜想和假設(shè),進(jìn)行試探性的研究,如果研究得出的結(jié)果和自己的假想是一致的,則說(shuō)明我們的假說(shuō)是正確的,這些假說(shuō)會(huì)上升為對(duì)該事物描述的知識(shí),我們掌握該事物的數(shù)據(jù)也隨之增加。
利用測(cè)量所獲得的點(diǎn)滴數(shù)據(jù),從一個(gè)局部來(lái)推測(cè)世界是怎樣的,這是科學(xué)探究的基本思路和方式。長(zhǎng)期以來(lái),我們總是通過(guò)這樣的方式來(lái)認(rèn)識(shí)世界,對(duì)其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會(huì)提出假設(shè)。如果決策者自身對(duì)所研究的事情存在著偏見(jiàn),所提出的假設(shè)就很難得到實(shí)證的支持,這往往會(huì)導(dǎo)致探究花費(fèi)了很長(zhǎng)的時(shí)間、很大的物力和財(cái)力,也常常勞而無(wú)功。但科學(xué)研究者還是堅(jiān)定不移地沿著這條道路前行,學(xué)校在教學(xué)中也將其作為科學(xué)研究的基本規(guī)范來(lái)傳授。
在大數(shù)據(jù)時(shí)代,這樣的研究方式收到了極大的挑戰(zhàn)。先舉個(gè)事例來(lái)說(shuō)吧。手機(jī)輻射是否能夠致癌?關(guān)于這個(gè)問(wèn)題,無(wú)論我們的假設(shè)如何,實(shí)驗(yàn)的設(shè)計(jì)都很難進(jìn)行。首先,樣本選擇過(guò)少,沒(méi)有統(tǒng)計(jì)學(xué)上的意義;其次,不能拿人做研究對(duì)象;第三,短時(shí)間的研究很難觀察到變化。有了大數(shù)據(jù)之后,這樣的難題就可以迎刃而解了。前段時(shí)間,丹麥就進(jìn)行了這樣的研究。丹麥擁有1985年手機(jī)推出以來(lái)所有手機(jī)用戶的數(shù)據(jù)庫(kù)。他們從這個(gè)數(shù)據(jù)庫(kù)中分析了1990年至20__年擁有手機(jī)的所用用戶的數(shù)據(jù),同時(shí),他們還收集了這一期間醫(yī)院收集的所有癌癥患者的數(shù)據(jù),然后分析手機(jī)用戶是否比非手機(jī)用戶有更高的癌癥發(fā)病率。這兩個(gè)數(shù)據(jù)庫(kù)本身是完全獨(dú)立的,在作分析之前從來(lái)沒(méi)有想過(guò)可以做這樣的研究。結(jié)果表明,使用移動(dòng)用戶和癌癥風(fēng)險(xiǎn)增加之間不存在任何關(guān)系。20__年10月,這一研究的結(jié)果發(fā)表在《英國(guó)醫(yī)學(xué)雜志》上。
上述的案例告訴我們,在獲得了大量的數(shù)據(jù),能夠?qū)κ挛锏恼w進(jìn)行全面的認(rèn)識(shí)之后,假想就沒(méi)有意義了,我們可以直接根據(jù)全面的數(shù)據(jù)做出結(jié)論。
第二,傳統(tǒng)的思維習(xí)慣受到挑戰(zhàn)
因果關(guān)系思維,是人們生活中最為普遍的一種思維方式。既是看上去沒(méi)有關(guān)系的事情,人們也總是從因果的角度去理解他。比如說(shuō),1885年7月6日,巴斯德接診了一個(gè)被帶有狂犬病毒的狗咬傷的孩子,他把自己剛研制出來(lái)的狂犬疫苗給孩子注射,結(jié)果孩子活下來(lái)了。巴斯德的這一舉措,使得狂犬疫苗和孩子的生存之間建立起了一個(gè)因果關(guān)系。但事實(shí)上,人被狂犬病狗咬傷后換上狂犬病的概率是只有七分之一,就算沒(méi)有狂犬疫苗,這個(gè)孩子活下來(lái)的幾率還是有85%。
在哲學(xué)界,關(guān)于因果關(guān)系的爭(zhēng)論已經(jīng)持續(xù)了幾個(gè)世紀(jì)。爭(zhēng)論的焦點(diǎn)在于:如果因果關(guān)系是普遍存在的,每一個(gè)果都有一個(gè)因和他相對(duì)應(yīng),世界上的所有事情都有因果的話,我們就沒(méi)有決定任何事情的自由了。盡管哲學(xué)領(lǐng)域的爭(zhēng)論很熱烈,但并不耽誤人們?cè)谌粘I钪型ㄟ^(guò)因果關(guān)系來(lái)思考問(wèn)題。不僅如此,由于掌握的數(shù)據(jù)過(guò)少,人們還容易從線性關(guān)系的角度找尋事物之間的因果關(guān)系。在物理學(xué)中,有一種處理數(shù)據(jù)的方式之一就是“化曲為直”,設(shè)法找到兩個(gè)變量之間的線性因果關(guān)系,從而進(jìn)行定量的描述。事實(shí)上,由于很多事情之間的關(guān)系是很復(fù)雜的,簡(jiǎn)單的線性處理容易導(dǎo)致人們對(duì)事物本質(zhì)屬性的誤解。
在大數(shù)據(jù)時(shí)代,相關(guān)關(guān)系比因果關(guān)系重要。20__年甲型H1N1流感發(fā)生之后,美國(guó)的衛(wèi)生系統(tǒng)極力想從因果關(guān)系上來(lái)找到流感的源頭,但信息反饋的速度太慢,讓專家們束手無(wú)策。谷歌公司做出了快速反應(yīng),把5000萬(wàn)條美國(guó)人最頻繁檢索的詞條和美國(guó)疾控中心在20__年至20__年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,研究特定檢索詞條的頻繁使用與流感在時(shí)間和空間上的傳播之間的聯(lián)系,很快就確定了流感是從哪個(gè)地方傳播出來(lái)的。谷歌采取的就是相關(guān)關(guān)系分析的方法,而不是因果關(guān)系分析的方法。這是大數(shù)據(jù)時(shí)代,對(duì)數(shù)據(jù)進(jìn)行處理的一種典型方法。
第三,數(shù)據(jù)化比數(shù)字化更加重要
數(shù)字化是將模擬數(shù)據(jù)轉(zhuǎn)化成0和1的二進(jìn)制碼,以便電腦進(jìn)行數(shù)據(jù)處理的過(guò)程。過(guò)去的很長(zhǎng)時(shí)間,我們所做的事情,就是對(duì)文本進(jìn)行數(shù)字化。很多書(shū)籍包括教材,通過(guò)PDF等格式,變成了數(shù)字形態(tài)的資料,存入了電腦或者網(wǎng)路之中。
但是,這些數(shù)字化的資料要查詢起來(lái)并不方便。首先你要知道所需的資料在那本書(shū)中,其次你還要仔細(xì)地去翻閱這些數(shù)字化的資源,以便找到你所需要的信息。這和到書(shū)本里去找沒(méi)有本質(zhì)的區(qū)別。
如果這些數(shù)字文本能夠被數(shù)據(jù)化,文本中的字、詞和段落能夠一一被識(shí)別,利用搜索殷勤加以檢索就會(huì)方便很多。所謂數(shù)據(jù)化就是將一種現(xiàn)象轉(zhuǎn)化為可以制表分析的可量化的過(guò)程,量化,是數(shù)據(jù)化的核心。信息只能被數(shù)據(jù)化,其巨大的潛在價(jià)值才有可能被釋放出來(lái)。
數(shù)字化帶來(lái)了數(shù)據(jù)化,但數(shù)字化不能替代數(shù)據(jù)化。今天,很多學(xué)校都在進(jìn)行“電子書(shū)包”的課程教學(xué)實(shí)踐,但有不少實(shí)踐者認(rèn)為,所為電子書(shū)包,就是將紙質(zhì)的課本和教輔資料數(shù)字化,裝入電腦中讓學(xué)生上課中使用,這其實(shí)是對(duì)電子書(shū)包最大的誤解。電子書(shū)包的核心在于數(shù)據(jù)化,要通過(guò)對(duì)學(xué)生學(xué)習(xí)過(guò)程所記錄的大數(shù)據(jù)分析,把握學(xué)生的個(gè)性化學(xué)習(xí)特征,以便給予更有針對(duì)性的指導(dǎo)。
三、需要關(guān)注的一些問(wèn)題
從教育的角度看,大數(shù)據(jù)時(shí)代的來(lái)臨,對(duì)教育的變革將帶來(lái)巨大的影響。
首先是教育內(nèi)容要進(jìn)行革新。大數(shù)據(jù)使得傳統(tǒng)的因果思維方式、科學(xué)研究方式不再是生活、工作起主導(dǎo)地位的方式,這必然要求我們?cè)诮虒W(xué)中要將這些變化和學(xué)生講清楚,以便他們能夠在今后走上社會(huì)的時(shí)候有足夠的能力迎接挑戰(zhàn)。
其次是教學(xué)方式要進(jìn)行革新。過(guò)去的教學(xué),因?yàn)闆](méi)有大量數(shù)據(jù)的支撐,該教什么全憑教師自己跟著感覺(jué)走。今天,我們可以將教師的教學(xué)視頻掛在晚上,通過(guò)深度分析學(xué)生在觀看視頻的過(guò)程中在哪些地方停頓或者重放的頻次比較高,來(lái)找出學(xué)生不明確或者課程吸引人的地方,幫助教師改進(jìn)教學(xué)、確定教學(xué)重點(diǎn)。這必然導(dǎo)致教師教學(xué)方式的變革。
第三是學(xué)習(xí)路徑會(huì)發(fā)生變化。在過(guò)去,如果你想成為一個(gè)優(yōu)秀的生物學(xué)家,一定要認(rèn)識(shí)很多生物學(xué)家。今天,要解決一個(gè)生物難題,可能與天體物理學(xué)家或者數(shù)據(jù)視圖設(shè)計(jì)師聯(lián)系就可以實(shí)現(xiàn)。
第四是要防止對(duì)數(shù)據(jù)的癡迷。一方面,我們要研究學(xué)校長(zhǎng)期以來(lái)儲(chǔ)存下來(lái)的大量數(shù)據(jù),同時(shí)積累學(xué)校每天的教育數(shù)據(jù),為進(jìn)入大數(shù)據(jù)時(shí)代做好充分的思想準(zhǔn)備;另一方面,要喚醒學(xué)校里沉睡的數(shù)據(jù),讓其在學(xué)校管理和教師教學(xué)中發(fā)揮更大的作用;再一方面,也要防止出現(xiàn)另一個(gè)極端,那就是對(duì)數(shù)據(jù)的癡迷。能僅僅為了收集數(shù)據(jù)而收集數(shù)據(jù),要讓數(shù)據(jù)在如何全面反映一個(gè)學(xué)生的能力、全面反映教師的教育質(zhì)量等方面做出實(shí)踐和探索。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇15
4月13日下午,在湖南大學(xué)東樓205參加了關(guān)于《大數(shù)據(jù)時(shí)代》的讀書(shū)交流活動(dòng)。通過(guò)相互交流學(xué)習(xí),使我更深層次的理解了大數(shù)據(jù)時(shí)代的利與弊,機(jī)遇和挑戰(zhàn)。在寫心得體會(huì)前,我想再重新審視一下關(guān)于大數(shù)據(jù)的歷史沿革和現(xiàn)實(shí)意義。
首先,最早提出“大數(shù)據(jù)”時(shí)代到來(lái)的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)!薄按髷(shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時(shí)日,卻因?yàn)榻陙?lái)互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計(jì)算、物聯(lián)網(wǎng)之后又IT行業(yè)又一大顛覆性的技術(shù)革命。云計(jì)算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問(wèn)的場(chǎng)所和渠道,而數(shù)據(jù)才是真正有價(jià)值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營(yíng)交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實(shí)時(shí)性要求也將大大超越現(xiàn)有的計(jì)算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國(guó)家治理、企業(yè)決策乃至個(gè)人生活服務(wù),是大數(shù)據(jù)的核心議題,也是云計(jì)算內(nèi)在的靈魂和必然的升級(jí)方向。
其次,進(jìn)入20__年,大數(shù)據(jù)(big data)一詞越來(lái)越多地被提及,人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過(guò)《紐約時(shí)報(bào)》《華爾街日?qǐng)?bào)》的專欄封面,進(jìn)入美國(guó)白宮的新聞,現(xiàn)身在國(guó)內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺(jué)靈敏的國(guó)金證券、國(guó)泰君安、銀河證券等寫進(jìn)了投資推薦報(bào)告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來(lái)發(fā)展,雖然很多企業(yè)可能并沒(méi)有意識(shí)到數(shù)據(jù)爆炸性增長(zhǎng)帶來(lái)問(wèn)題的隱患,但是隨著時(shí)間的推移,人們將越來(lái)越多的意識(shí)到數(shù)據(jù)對(duì)企業(yè)的重要性。正如《紐約時(shí)報(bào)》20__年2月的一篇專欄中所稱,“大數(shù)據(jù)”時(shí)代已經(jīng)降臨,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺(jué)。哈佛大學(xué)社會(huì)學(xué)教授加里·金說(shuō):“這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開(kāi)始了量化進(jìn)程,無(wú)論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開(kāi)始這種進(jìn)程!
最后,隨著云時(shí)代的來(lái)臨,大數(shù)據(jù)(Big data)也吸引了越來(lái)越多的關(guān)注。著云臺(tái)的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Big data)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作!按髷(shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運(yùn)營(yíng)中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來(lái)衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國(guó)兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬(wàn)個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量);賣出的手機(jī)為37.8萬(wàn)臺(tái),高于全球每天出生的嬰兒數(shù)量37.1萬(wàn)……,截止到xx年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,xx年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,xx年的數(shù)據(jù)量為0.8ZB,xx年增長(zhǎng)為1.2ZB,xx年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到xx年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說(shuō)過(guò)的所有話的數(shù)據(jù)量大約是5EB.IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過(guò)去兩年內(nèi)產(chǎn)生的。而到了xx年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
首先,談?wù)劥髷?shù)據(jù)帶給生活的轉(zhuǎn)變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢(shì),可以說(shuō),大數(shù)據(jù)現(xiàn)在已經(jīng)開(kāi)始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來(lái)優(yōu)化規(guī)模和實(shí)現(xiàn)利益最大化。而我們很多人對(duì)大數(shù)據(jù)還很陌生,只是被動(dòng)的適應(yīng)著大數(shù)據(jù)給生活帶來(lái)的改變。大數(shù)據(jù)時(shí)代是以云計(jì)算為基礎(chǔ)的,所以,要實(shí)現(xiàn)大數(shù)據(jù),相關(guān)的很多的硬件設(shè)備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關(guān)產(chǎn)業(yè)都要重新調(diào)整產(chǎn)業(yè)結(jié)構(gòu),在那時(shí),可以夸張的說(shuō),信息就是黃金,信息就是石油。大數(shù)據(jù)時(shí)代的到來(lái)會(huì)解放更多的勞動(dòng)生產(chǎn)力,勢(shì)必將會(huì)更加加劇生產(chǎn)力過(guò)剩的現(xiàn)狀,社會(huì)兩極分化現(xiàn)象會(huì)更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來(lái)的可怕局面。大數(shù)據(jù)時(shí)代的到來(lái)會(huì)使人們的生活節(jié)奏急速加快,信息的時(shí)效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會(huì)越來(lái)越忙,到那時(shí),就像現(xiàn)在的日本,可能想找個(gè)人聽(tīng)你說(shuō)說(shuō)話,真的是一件很難的事。
第二,關(guān)于數(shù)據(jù)管理的看法。大數(shù)據(jù)時(shí)代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹(shù)立信息安全防范的意識(shí),不主動(dòng)泄露信息,要管理好自己身邊的信息設(shè)備;技防,就是要運(yùn)用軟件來(lái)管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫(kù),定時(shí)查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應(yīng)當(dāng)做到備份與原始文件是物理隔離,無(wú)關(guān)的信息應(yīng)當(dāng)及時(shí)刪除,減輕硬盤的壓力。
三、怎么保護(hù)自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時(shí)代,更要管理好自己的隱私,以免對(duì)自己和家人造成麻煩和損失。越是隱私的信息,越要遠(yuǎn)離網(wǎng)絡(luò),不要再公開(kāi)的社交網(wǎng)絡(luò)儲(chǔ)存和展示個(gè)人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質(zhì)的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機(jī)碼來(lái)保護(hù)自己真實(shí)IP地址,提高網(wǎng)絡(luò)安全的可靠性,加強(qiáng)對(duì)聯(lián)網(wǎng)信息的管理和保護(hù)。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇16
知道"是什么"就夠了,沒(méi)必要知道"為什么"。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是讓數(shù)據(jù)自己"發(fā)聲"。這個(gè)命題是我讀這本書(shū)最大的感觸。
對(duì)于大多數(shù)人來(lái)說(shuō),這的確是一場(chǎng)思維變革。對(duì)于理科學(xué)生來(lái)說(shuō),會(huì)認(rèn)為這是一個(gè)錯(cuò)誤的觀點(diǎn),因?yàn)檫@無(wú)異于否定了他們對(duì)世界客觀物理化學(xué)規(guī)律探索的重要性;對(duì)于一名工科學(xué)生,其實(shí)這并不是一個(gè)多么新穎的觀點(diǎn),因?yàn)楣た剖侵v求時(shí)用性的,如何能更好地利用基本自然科學(xué)規(guī)律創(chuàng)造社會(huì)財(cái)富比探索自然科學(xué)知識(shí)顯得更重要。
這些天來(lái),在讀大數(shù)據(jù)這本書(shū)的同時(shí),也稍微重溫了一下自動(dòng)控制原理,認(rèn)識(shí)到控制系統(tǒng)中存在明顯的大數(shù)據(jù)時(shí)代思維方式,借讀書(shū)交流會(huì)之際,與大家分享。
對(duì)系統(tǒng)的有效控制需要對(duì)系統(tǒng)理解與建模。以一個(gè)日常生活中的例子說(shuō)明。開(kāi)車的時(shí)候一腳油門下去車就飛出去了,但并不知道這一腳油門下去能給多大車速,這就需要駕駛?cè)藛T的熟練的駕駛技能了,不然超速被開(kāi)罰單是很正常的。那么,問(wèn)題就來(lái)了:如何能實(shí)現(xiàn)速度的自動(dòng)控制而不用駕駛?cè)藛T踩油門?這就是控制系統(tǒng)最關(guān)鍵的環(huán)節(jié)——建立系統(tǒng)數(shù)學(xué)模型。大白話就是知道車速與燃油量的數(shù)學(xué)關(guān)系式。若是以探索為什么的思維模式,不可避免的要列一大堆能量方程、動(dòng)量方程等物理化學(xué)式子,經(jīng)過(guò)繁雜的計(jì)算,還是能得到車速和燃油量的數(shù)學(xué)關(guān)系式的。很明顯這是一個(gè)繁瑣的過(guò)程,因?yàn)榈弥垃F(xiàn)象背后的原因。這僅是對(duì)于這種簡(jiǎn)單的系統(tǒng),若是對(duì)于航空發(fā)動(dòng)機(jī)這種復(fù)雜的系統(tǒng),結(jié)構(gòu)工藝過(guò)于復(fù)雜,分析各部分的物理化學(xué)過(guò)程是十分困難的,這時(shí)候可以通過(guò)實(shí)驗(yàn)法得到數(shù)學(xué)模型。
實(shí)驗(yàn)法主要有時(shí)域測(cè)定法、頻域測(cè)定法和統(tǒng)計(jì)相關(guān)法。與大數(shù)據(jù)時(shí)代思維最接近的是統(tǒng)計(jì)相關(guān)法,主要過(guò)程是對(duì)被研究對(duì)象施加某種隨機(jī)信號(hào),根據(jù)被測(cè)對(duì)象各參數(shù)的變化,采用統(tǒng)計(jì)相關(guān)法確定被測(cè)系統(tǒng)或?qū)ο蟮膭?dòng)態(tài)特性。這種方法可以在被測(cè)系統(tǒng)或生產(chǎn)過(guò)程正常運(yùn)行狀態(tài)下進(jìn)行在線辨識(shí),測(cè)試結(jié)果精度較高,但要求采集大量測(cè)試數(shù)據(jù),并需要相關(guān)儀和計(jì)算機(jī)進(jìn)行數(shù)據(jù)計(jì)算和處理。
若用開(kāi)車實(shí)例來(lái)解釋,此時(shí)的系統(tǒng)為汽車動(dòng)力系統(tǒng),施加的隨機(jī)信號(hào)為燃油量,被測(cè)對(duì)象指車轉(zhuǎn)速,得到的動(dòng)態(tài)特性就是指車速與燃油量函數(shù)關(guān)系式,從而不用探求背后的物理化學(xué)規(guī)律就得到了數(shù)學(xué)模型。
在沈陽(yáng)黎明航空公司實(shí)習(xí)時(shí)去過(guò)試車間,除了發(fā)動(dòng)機(jī)點(diǎn)火后震撼的場(chǎng)景動(dòng)人心魄,控制室屏幕上海量的數(shù)據(jù)也同樣引人注目,我想這么多數(shù)據(jù)無(wú)非就是驗(yàn)證數(shù)學(xué)模型或直接實(shí)驗(yàn)法得到數(shù)學(xué)模型,結(jié)合航空發(fā)動(dòng)機(jī)這種復(fù)雜的系統(tǒng),對(duì)于搞控制的人來(lái)說(shuō),得到數(shù)學(xué)模型就夠了,現(xiàn)象背后的原因交給研發(fā)的人來(lái)探索更好。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇17
《大數(shù)據(jù)時(shí)代》這本書(shū)主要描述的是大數(shù)據(jù)時(shí)代到臨人們生活、工作與思維各方面所遇到的重大變革。
文中清晰的闡述了大數(shù)據(jù)的基本概念和特點(diǎn),并列出明確的觀點(diǎn)。不管對(duì)于產(chǎn)業(yè)實(shí)踐者,還是對(duì)于政府和公眾機(jī)構(gòu),都非常具有價(jià)值。作者將本書(shū)分為3個(gè)部分。第一部分提出了大數(shù)據(jù)時(shí)代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:抽樣等于全體;要效率不要絕對(duì)精確;要相關(guān)不要因果;第二部分作者從萬(wàn)事萬(wàn)物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價(jià)值兩個(gè)方面,講述驅(qū)動(dòng)大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動(dòng)的最根本動(dòng)力;最后一部分,作者描繪了大數(shù)據(jù)帝國(guó)前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開(kāi)等問(wèn)題。
本書(shū)觀點(diǎn)擲地有聲,作者觀念高屋建瓴,從很多實(shí)例和經(jīng)驗(yàn)中萃取普適性觀念。例子詳實(shí)豐富,囊括了進(jìn)百個(gè)學(xué)術(shù)和商業(yè)實(shí)例。
引言提出了大數(shù)據(jù)將給生活、工作于思維帶來(lái)重大的變革。一個(gè)例子是20__年H1N1流行病毒背景下谷歌通過(guò)檢測(cè)檢索詞條,處理了4.5億個(gè)不同的數(shù)據(jù)模型,通過(guò)預(yù)測(cè)并與20__年、20__年美國(guó)疾控中心記錄的實(shí)際流感病例進(jìn)行對(duì)比后,確定了45條檢索詞條組合,并將其用于一個(gè)特定的數(shù)學(xué)模型后,預(yù)測(cè)的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達(dá)97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對(duì)于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運(yùn)用大數(shù)據(jù)技術(shù),以前所未有的方式,通過(guò)海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預(yù)測(cè)流感提供了一種更快捷的預(yù)測(cè)工具。此外,我聯(lián)想到原淘寶董事長(zhǎng)馬云通過(guò)大量數(shù)據(jù)分析得出20__年經(jīng)濟(jì)疲弱,為其商家提前做好迎接經(jīng)濟(jì)危機(jī)提供了時(shí)間緩沖。(補(bǔ)充并清晰描述詳細(xì))關(guān)于大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用, Farecast公司是一個(gè)成功的典型范例。該公司由奧倫·埃齊奧尼創(chuàng)辦,利用機(jī)票的銷售數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)的機(jī)票價(jià)格,旨在幫助用戶在購(gòu)買機(jī)票方面做出預(yù)測(cè),并對(duì)機(jī)票價(jià)格走勢(shì)預(yù)測(cè)的可信度標(biāo)示出來(lái)供消費(fèi)者查考。Farecast系統(tǒng)利用近十萬(wàn)億條價(jià)格記錄預(yù)測(cè)的準(zhǔn)確度達(dá)75%,使得使用Farecast票價(jià)預(yù)測(cè)工具購(gòu)買機(jī)票的旅客,平均每張機(jī)票節(jié)約50美元。而處理如此多的數(shù)據(jù)離開(kāi)了大數(shù)據(jù)技術(shù)將無(wú)法進(jìn)行。
也正是由于我們進(jìn)入了一個(gè)前所未有的信息化時(shí)代,人們擁有了如此多的數(shù)據(jù),才提供給我們利用大數(shù)據(jù)的分析處理手段,創(chuàng)造新的價(jià)值。也許有人以為我們大數(shù)據(jù)時(shí)代的還未來(lái)臨。其實(shí)大數(shù)據(jù)技術(shù)早已滲透到我們中間,它被應(yīng)用在垃圾郵件的過(guò)濾,新浪微博技術(shù)平臺(tái),谷歌翻譯以及輸入文字的自動(dòng)糾錯(cuò)等。
文中提出的一個(gè)觀點(diǎn)是,預(yù)測(cè)是大數(shù)據(jù)的核心。其實(shí)從過(guò)去的時(shí)代人們就利用掌握的數(shù)據(jù)進(jìn)行各種分析,從而對(duì)經(jīng)濟(jì)等各方面進(jìn)行預(yù)測(cè)、矯正。只是進(jìn)入了大數(shù)據(jù)時(shí)代人們掌握的數(shù)據(jù)爆炸性的速度在增長(zhǎng),從而數(shù)據(jù)的存儲(chǔ)和分析數(shù)據(jù)分方法成了釋放大數(shù)據(jù)能量的關(guān)鍵。
關(guān)于不是隨機(jī)樣本而是整體數(shù)據(jù)中。作者指出了隨機(jī)取樣是小數(shù)據(jù)時(shí)代用最少的數(shù)據(jù)獲取最大價(jià)值的做法。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說(shuō)明了使用全部數(shù)據(jù)而非樣本的意義。喬布斯成為世界上第一個(gè)對(duì)自身所有DNA和腫瘤DNA進(jìn)行排序的人。喬布斯曾開(kāi)玩笑說(shuō)“我要么是第一個(gè)通過(guò)這種方式戰(zhàn)勝癌癥的人,要么就是最后一個(gè)因?yàn)檫@種方式死于癌癥的人”。雖然最后難免死于癌癥但這種獲得所有數(shù)據(jù)而不是僅樣本的方法將他的生命延長(zhǎng)了幾年。同樣,從事跨境匯款業(yè)務(wù)的Xoom公司偵破一起犯罪集團(tuán)的詐騙也是由于使用了整體數(shù)據(jù)。初此之外,他還列舉了日本“相撲”等來(lái)證明使用全體數(shù)據(jù)的重要性。
作者同時(shí)也指出隨著數(shù)據(jù)使用的越來(lái)越多,其得出的結(jié)果并一定能越來(lái)越精確,畢竟數(shù)據(jù)不能保證百分之百的正確,特別是大數(shù)據(jù)時(shí)代各種結(jié)構(gòu)化與非結(jié)構(gòu)化類型的數(shù)據(jù)聚集在一起難免導(dǎo)致結(jié)果的不太精確。大數(shù)據(jù)時(shí)代要求我們重新審視精確性的優(yōu)劣。作者特別舉了谷歌翻譯成功的例子。谷歌翻譯之所以優(yōu)于IBM的Candide系統(tǒng)并不是因?yàn)樗鼡碛懈玫乃惴C(jī)制。和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯(cuò)誤的數(shù)據(jù)。(其語(yǔ)庫(kù)來(lái)自于未經(jīng)過(guò)濾的網(wǎng)頁(yè)內(nèi)容,會(huì)包含一些不完整的句子、拼寫錯(cuò)誤、語(yǔ)法錯(cuò)誤以及其他各種錯(cuò)誤)
在不是因果關(guān)系,而是相關(guān)關(guān)系的篇章中。作者指出在大數(shù)據(jù)時(shí)代往往知道是什么要比知道為什么來(lái)的更實(shí)在。作者列舉了林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢(shì)以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的先鋒和代表,從以前廣為人事的啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣的案例,都說(shuō)明了掌握了相關(guān)關(guān)系對(duì)于其策略的幫助。建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的核心。Aviva保險(xiǎn)公司利用幾百種生活方式的數(shù)據(jù),如愛(ài)好、長(zhǎng)瀏覽網(wǎng)頁(yè)等間接的預(yù)測(cè)出哪些人更可能患高血壓、糖尿病和抑郁癥。UPS國(guó)家快遞公司通過(guò)使用預(yù)測(cè)性分析檢測(cè)其全美6萬(wàn)輛車隊(duì)。進(jìn)行防御性的修理,節(jié)約巨大得的成本。這些都充分顯示了大數(shù)據(jù)在預(yù)測(cè)方面的優(yōu)勢(shì)。
本書(shū)第二部分講的是大數(shù)據(jù)時(shí)代的商業(yè)變革。
作者用莫里繪制導(dǎo)航圖的例子告訴我們,遠(yuǎn)在信息數(shù)字化之前,對(duì)數(shù)據(jù)的運(yùn)用就已經(jīng)開(kāi)始了。莫里利用大量的人力去分析多年保存的航海記錄,他從這些大量的數(shù)據(jù)中獲取到新的利用價(jià)值。繪制的圖表幫助商人節(jié)約一大筆錢,使年輕的海員們間接獲取了成千上萬(wàn)名經(jīng)驗(yàn)豐富的航海家的指導(dǎo)。日本先進(jìn)工業(yè)技術(shù)研究所越水重臣教授通過(guò)安裝壓力傳感器將人屁股特征數(shù)據(jù)化,進(jìn)而形成對(duì)乘客身份的特征識(shí)別。這項(xiàng)技術(shù)為汽車防盜系統(tǒng)提供了方案。公司,致力于為顧客預(yù)測(cè)商品的價(jià)格,通過(guò)收集處理海量的價(jià)格信息,預(yù)測(cè)準(zhǔn)確率高達(dá)77%,幫助顧客在購(gòu)買一個(gè)產(chǎn)品時(shí)節(jié)約了大約100美元。MasterCardd.Advisor部門通過(guò)分析來(lái)自210個(gè)國(guó)家的15億信用卡用戶的650億條交易記錄,分析得出商業(yè)發(fā)展和客戶消費(fèi)趨勢(shì),如通過(guò)分析發(fā)現(xiàn)如果一個(gè)人下午四點(diǎn)左右給汽車加油的話,他很可能在接下來(lái)的一個(gè)小時(shí)內(nèi)去購(gòu)物或者去餐館吃飯 ,且在這一小時(shí)里大約花費(fèi)35到40美元。商家正可以利用這個(gè)分析結(jié)果,在加油的小票背面附加上附近商店的優(yōu)惠券。
這些例子都證明了大數(shù)據(jù)蘊(yùn)藏著巨大的商業(yè)價(jià)值。根據(jù)提供價(jià)值的不同來(lái)源,大數(shù)據(jù)價(jià)值鏈包括三大構(gòu)成部分。包括第一種是基于數(shù)據(jù)本身的公司。這些公司擁有大量數(shù)據(jù)或者至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價(jià)值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。第二種是基于技能的公司。它們通常是咨詢公司、技術(shù)供應(yīng)商或者分析公司。它們掌握了專業(yè)技能但并不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)性用途的才能。比如說(shuō),沃爾瑪和Pop-Tarts這兩個(gè)零售商就是借助天睿公司的分析來(lái)獲得營(yíng)銷點(diǎn)子,天睿就是一家大數(shù)據(jù)分析公司。第三種是基于思維的公司。皮特.華登,Jetpac的聯(lián)合創(chuàng)始人,就是通過(guò)想法獲得價(jià)值的一個(gè)例子,他通過(guò)用戶分享到網(wǎng)上的旅行照片來(lái)為人們推薦下一次旅行目的地。對(duì)于某些公司來(lái)說(shuō),數(shù)據(jù)和技能并不是成功的關(guān)鍵。挖掘數(shù)據(jù)的新價(jià)值的創(chuàng)新思維才是這些公司脫穎而出的優(yōu)勢(shì)所在。
大數(shù)據(jù)成為許多公司競(jìng)爭(zhēng)力的來(lái)源,未來(lái)可能整個(gè)行業(yè)的結(jié)構(gòu)會(huì)發(fā)生改變,大公司和小公司最有可能成為贏家。如今的核心競(jìng)爭(zhēng)力在于快速而廉價(jià)地進(jìn)行大量的數(shù)據(jù)存儲(chǔ)和處理。當(dāng)然公司要根據(jù)自己的情況進(jìn)行調(diào)整。大數(shù)據(jù)向小數(shù)據(jù)時(shí)代的贏家以及那些線下大公司(如沃爾瑪、聯(lián)邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰(zhàn)。同時(shí),大數(shù)據(jù)也為小公司帶來(lái)了機(jī)遇。大數(shù)據(jù)也將會(huì)影響國(guó)家競(jìng)爭(zhēng)力。當(dāng)制造業(yè)已經(jīng)大幅轉(zhuǎn)向發(fā)展中國(guó)家,而大家都爭(zhēng)相發(fā)展創(chuàng)新行業(yè)的時(shí)候,工業(yè)化國(guó)家因?yàn)檎莆樟藬?shù)據(jù)以及大數(shù)據(jù)技術(shù),所以仍然在全球競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì),但這個(gè)優(yōu)勢(shì)很難持續(xù)。隨著技術(shù)的發(fā)展,西方世界在大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)將會(huì)慢慢消失。對(duì)于大公司而言,好消息是大數(shù)據(jù)技術(shù)可以加劇優(yōu)勝劣汰。一旦公司掌握了大數(shù)據(jù),它不但可能超過(guò)對(duì)手還可能遙遙領(lǐng)先。
文章第三部分講了大數(shù)據(jù)帶來(lái)無(wú)數(shù)好處的同時(shí)帶來(lái)的不良影響以及如何面對(duì)這些影響。包括如數(shù)據(jù)的收益的處理問(wèn)題以及數(shù)據(jù)中用戶資料的隱私和決策過(guò)程帶來(lái)的影響。作者在保護(hù)個(gè)人隱私方面提出了幾種想法。一種是使用數(shù)據(jù)時(shí)征詢數(shù)據(jù)所有個(gè)人的知曉和授權(quán)。第二個(gè)技術(shù)途徑就是匿名化。作者同時(shí)也指出了這兩種方式的難度。一方面收集到的數(shù)據(jù)可能會(huì)被后續(xù)的多次利用。另一方面,匿名化會(huì)在數(shù)據(jù)收集越來(lái)越多和數(shù)據(jù)的相互結(jié)合關(guān)聯(lián)使用時(shí)變得無(wú)效。作者列列舉電影《少數(shù)派報(bào)告》的情節(jié)說(shuō)明越來(lái)越依賴數(shù)據(jù)時(shí),大數(shù)據(jù)可能將我們禁錮在可能性之中。當(dāng)然通過(guò)分析犯罪的常發(fā)地與常發(fā)時(shí)間,合理安排警力會(huì)對(duì)治安防范提供不小的幫助。作者還指出不能盡信數(shù)據(jù)的分析結(jié)果,因?yàn)椴荒鼙WC獲取分析結(jié)果來(lái)源的數(shù)據(jù)準(zhǔn)確性。大數(shù)據(jù)在給我們生活提供便利的同時(shí),也讓隱私保護(hù)的法律手段失去了作用。我們必須杜絕對(duì)數(shù)據(jù)的過(guò)分依賴。
在高速邁進(jìn)大數(shù)據(jù)時(shí)代的同時(shí),人類信息管理準(zhǔn)則需要重新定位,這將帶動(dòng)社會(huì)核心價(jià)值觀的轉(zhuǎn)變。大數(shù)據(jù)時(shí)代,對(duì)原有規(guī)范的修修補(bǔ)補(bǔ)已經(jīng)不足以抑制大數(shù)據(jù)帶來(lái)的風(fēng)險(xiǎn)。保護(hù)個(gè)人隱私就需要對(duì)個(gè)人數(shù)據(jù)處理器對(duì)其政策和行為承擔(dān)更多責(zé)任。同時(shí)必須重新定義公正的概念,以確保人類行為的自由。作者提出了解決這些問(wèn)題的方向。如個(gè)人隱私保護(hù)方面,可以讓使用者承擔(dān)更多的社會(huì)責(zé)任。將責(zé)任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者有很多意義,也有充分的理由。因?yàn)樗麄兏宄䦟⑷绾问褂脭?shù)據(jù)且是數(shù)據(jù)應(yīng)用最大的受益者。關(guān)于公正方面簡(jiǎn)單的講就是個(gè)人可以并應(yīng)為他們的行為而非傾向負(fù)責(zé)。就像公司有內(nèi)部會(huì)計(jì)和外部審計(jì)人員一樣,大數(shù)據(jù)時(shí)代,公司將設(shè)置專門的人員--內(nèi)部和外部算法師對(duì)大數(shù)據(jù)活動(dòng)進(jìn)行監(jiān)督。還有可能出現(xiàn)第三方的機(jī)構(gòu)對(duì)大數(shù)據(jù)行為進(jìn)行監(jiān)督和衡量。作者甚至考慮到對(duì)大數(shù)據(jù)存在的壟斷情況進(jìn)行分析并在反壟斷反面給了建議。最后結(jié)語(yǔ)中作者提出大數(shù)據(jù)提供給人們的只是參考答案,提醒我們?cè)诶眠@個(gè)工具時(shí)要銘記人類的作用是無(wú)法完全替代的。
大數(shù)據(jù)時(shí)代是信息化社會(huì)發(fā)展必然趨勢(shì),我們只有緊緊跟隨時(shí)代發(fā)展的潮流,在技術(shù)上、制度上、價(jià)值觀念上做出迅速調(diào)整并牢牢跟進(jìn),才能在接下來(lái)新一輪的國(guó)際競(jìng)爭(zhēng)中擺脫受制于人的弱勢(shì)境地,才能把握發(fā)展的方向,沖破與西方國(guó)家的差距。對(duì)于一個(gè)國(guó)家如此,對(duì)于一個(gè)企業(yè)亦是如此。在如此快速的到來(lái)的大數(shù)據(jù)時(shí)代,我們還有很多知識(shí)需要學(xué)習(xí),許多思維需要轉(zhuǎn)變,許多技術(shù)需要研究。公司的規(guī)劃中,也需充分考慮到大數(shù)據(jù)對(duì)于公司的未來(lái)發(fā)展所帶來(lái)的機(jī)遇和挑戰(zhàn)。對(duì)于掌握大量數(shù)據(jù)的公司,需要考慮有多少數(shù)字化的數(shù)據(jù),又有哪些可以通過(guò)大數(shù)據(jù)的分析處理而帶來(lái)有價(jià)值的用途?比如國(guó)內(nèi)目前的社交網(wǎng)站,購(gòu)物網(wǎng)站等都掌握了用戶的大量的數(shù)據(jù)信息。在大數(shù)據(jù)時(shí)代制勝的良藥也許是創(chuàng)新的點(diǎn)子,也許可以利用外部的數(shù)據(jù),通過(guò)多維化、多層面的分析給其他企業(yè)或個(gè)人帶來(lái)價(jià)值。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇18
未來(lái)的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時(shí)代。不管你是否意識(shí)到它的存在,大數(shù)據(jù)都將越來(lái)越快地改變我們這個(gè)時(shí)代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見(jiàn)大數(shù)據(jù)時(shí)代發(fā)展趨勢(shì)的數(shù)據(jù)科學(xué)家之一。他通過(guò)一個(gè)大家熟知的事例,來(lái)幫助我們理解“大數(shù)據(jù)”的潛在影響力,那就是四個(gè)世紀(jì)之前望遠(yuǎn)鏡和顯微鏡的發(fā)明。望遠(yuǎn)鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測(cè)微生物,它們都是收集海量數(shù)據(jù)的新工具,因?yàn)檫@種工具的發(fā)明,人們同步更新了分析數(shù)據(jù)的技術(shù)和方法,促進(jìn)了人們對(duì)世界更好的理解。如果說(shuō)望遠(yuǎn)鏡和顯微鏡是測(cè)量領(lǐng)域中的一場(chǎng)革命,那么今天的數(shù)據(jù)測(cè)量就相當(dāng)于是現(xiàn)代版的望遠(yuǎn)鏡、顯微鏡。隨著社交網(wǎng)絡(luò)的逐漸成熟,移動(dòng)帶寬迅速提升,云計(jì)算、物聯(lián)網(wǎng)應(yīng)用更加豐富,以及更多的傳感設(shè)備、移動(dòng)終端接入到網(wǎng)絡(luò),由此產(chǎn)生的數(shù)據(jù)及數(shù)據(jù)的增長(zhǎng)速度比歷史上的任何時(shí)期都要多、都要快。一個(gè)大數(shù)據(jù)的時(shí)代,不經(jīng)意間順理成章地翩然而至。
一、什么是大數(shù)據(jù)?
大數(shù)據(jù)是當(dāng)前最熱門的話題之一。但什么是大數(shù)據(jù),人們尚未給出確切的定義。首先,“大數(shù)據(jù)”是相對(duì)過(guò)去小的、局部性的數(shù)據(jù)而言的;其次,利用大數(shù)據(jù)進(jìn)行分析和工作時(shí),所依據(jù)的關(guān)于此事盡可能完整的數(shù)據(jù),從而“一覽眾山小”,而不是采用局部的小數(shù)據(jù),從局部推斷整體。
維克托也并未直接給出大數(shù)據(jù)的定義。不過(guò),他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性:
轉(zhuǎn)變之一:在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣。例如一項(xiàng)針對(duì)相撲比賽中非法操縱比賽結(jié)果的研究對(duì)64000場(chǎng)比賽進(jìn)行了分析,這算不上一個(gè)很大的數(shù)字,但由于這是過(guò)去十年所有的比賽,所以它是大數(shù)據(jù)。
轉(zhuǎn)變之二:由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對(duì)于一個(gè)事物只有50個(gè)數(shù)據(jù)點(diǎn),那么每一個(gè)數(shù)據(jù)點(diǎn)都必須非常精確,因?yàn)槊總(gè)數(shù)據(jù)點(diǎn)都是有用的;但是如果我們有5000萬(wàn)個(gè),去掉10個(gè),甚至去掉1000個(gè)都沒(méi)有太大的問(wèn)題。
轉(zhuǎn)變之三:不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。分析大數(shù)據(jù)主要為了預(yù)測(cè)未來(lái)“是什么”,而不是“為什么”。因?yàn)楹芏鄷r(shí)候我們以為我們找到了事情背后的原因,實(shí)際上卻沒(méi)有找到。更多時(shí)候知道了“是什么”就足夠了。例如知道流感將會(huì)擴(kuò)散到哪里就足夠了,我不需要知道為什么;知道什么時(shí)候在網(wǎng)上購(gòu)買機(jī)票能夠獲得最優(yōu)惠的價(jià)格就足夠了,我不需要知道為什么此時(shí)價(jià)格最低。
二、大數(shù)據(jù)帶來(lái)的變化
大數(shù)據(jù)從根本上改變我們認(rèn)識(shí)世界和改變世界的方式。很多傳統(tǒng)的習(xí)慣將被顛覆,很多舊的制度將面臨挑戰(zhàn)。舉例來(lái)說(shuō):
第一,科學(xué)探究的思路和方式受到挑戰(zhàn)
探究是新課程改革中的一個(gè)熱詞,是促進(jìn)學(xué)校教學(xué)與科學(xué)研究相融合的實(shí)踐舉措。科學(xué)探究的基本路徑是:發(fā)現(xiàn)問(wèn)題,提出假設(shè),制定方案,實(shí)踐探究,分析數(shù)據(jù),得出結(jié)論。之所以會(huì)梳理出這樣一個(gè)探究的路徑,與我們對(duì)問(wèn)題知曉的信息過(guò)少有關(guān)。換句話說(shuō),對(duì)所要研究的事物,我們知道的數(shù)據(jù)很少,需要從這些很小的數(shù)據(jù)出發(fā),通過(guò)猜想和假設(shè),進(jìn)行試探性的研究,如果研究得出的結(jié)果和自己的假想是一致的,則說(shuō)明我們的假說(shuō)是正確的,這些假說(shuō)會(huì)上升為對(duì)該事物描述的知識(shí),我們掌握該事物的數(shù)據(jù)也隨之增加。
利用測(cè)量所獲得的點(diǎn)滴數(shù)據(jù),從一個(gè)局部來(lái)推測(cè)世界是怎樣的,這是科學(xué)探究的基本思路和方式。長(zhǎng)期以來(lái),我們總是通過(guò)這樣的方式來(lái)認(rèn)識(shí)世界,對(duì)其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會(huì)提出假設(shè)。如果決策者自身對(duì)所研究的事情存在著偏見(jiàn),所提出的假設(shè)就很難得到實(shí)證的支持,這往往會(huì)導(dǎo)致探究花費(fèi)了很長(zhǎng)的時(shí)間、很大的物力和財(cái)力,也常常勞而無(wú)功。但科學(xué)研究者還是堅(jiān)定不移地沿著這條道路前行,學(xué)校在教學(xué)中也將其作為科學(xué)研究的基本規(guī)范來(lái)傳授。
在大數(shù)據(jù)時(shí)代,這樣的研究方式收到了極大的挑戰(zhàn)。先舉個(gè)事例來(lái)說(shuō)吧。手機(jī)輻射是否能夠致癌?關(guān)于這個(gè)問(wèn)題,無(wú)論我們的假設(shè)如何,實(shí)驗(yàn)的設(shè)計(jì)都很難進(jìn)行。首先,樣本選擇過(guò)少,沒(méi)有統(tǒng)計(jì)學(xué)上的意義;其次,不能拿人做研究對(duì)象;第三,短時(shí)間的研究很難觀察到變化。有了大數(shù)據(jù)之后,這樣的難題就可以迎刃而解了。前段時(shí)間,丹麥就進(jìn)行了這樣的研究。丹麥擁有1985年手機(jī)推出以來(lái)所有手機(jī)用戶的數(shù)據(jù)庫(kù)。他們從這個(gè)數(shù)據(jù)庫(kù)中分析了1990年至20xx年擁有手機(jī)的所用用戶的數(shù)據(jù),同時(shí),他們還收集了這一期間醫(yī)院收集的所有癌癥患者的數(shù)據(jù),然后分析手機(jī)用戶是否比非手機(jī)用戶有更高的癌癥發(fā)病率。這兩個(gè)數(shù)據(jù)庫(kù)本身是完全獨(dú)立的,在作分析之前從來(lái)沒(méi)有想過(guò)可以做這樣的研究。結(jié)果表明,使用移動(dòng)用戶和癌癥風(fēng)險(xiǎn)增加之間不存在任何關(guān)系。20xx年10月,這一研究的結(jié)果發(fā)表在《英國(guó)醫(yī)學(xué)雜志》上。
上述的案例告訴我們,在獲得了大量的數(shù)據(jù),能夠?qū)κ挛锏恼w進(jìn)行全面的認(rèn)識(shí)之后,假想就沒(méi)有意義了,我們可以直接根據(jù)全面的數(shù)據(jù)做出結(jié)論。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇19
“大數(shù)據(jù)”概念早在1980年就有國(guó)外的學(xué)者提出,可是最近幾年才廣泛受到大家的關(guān)注。當(dāng)“大數(shù)據(jù)”這個(gè)概念傳到中國(guó)的時(shí)候,瞬間引起了轟動(dòng)。隨即,各種有關(guān)“大數(shù)據(jù)”的資料和書(shū)籍充斥的我們的視野。隨意打開(kāi)某個(gè)電子商務(wù)平臺(tái)圖書(shū)類頁(yè)面,在搜索框中搜索“大數(shù)據(jù)”三個(gè)字,就會(huì)出現(xiàn)好多本有關(guān)“大數(shù)據(jù)”的書(shū)籍?墒,有一個(gè)很有趣的現(xiàn)象就是:幾乎所有的平臺(tái)上,出現(xiàn)的第一本關(guān)于“大數(shù)據(jù)”的書(shū)籍一定是《大數(shù)據(jù)時(shí)代》。一點(diǎn)進(jìn)去,這本書(shū)推薦欄里的第一句話就是:迄今為止全世界最好的一本大數(shù)據(jù)專著。同時(shí),為這本書(shū)做推薦的都是各行業(yè)的精英領(lǐng)袖。所有“大數(shù)據(jù)”方面的書(shū)籍也是這本書(shū)銷量最高,評(píng)價(jià)最好。
我從來(lái)不會(huì)因?yàn)槟谋緯?shū)暢銷和很多人推薦就盲目跟風(fēng)的去看一本書(shū)。因?yàn)槲抑劳ǔT谶@種情況下選擇一本書(shū),整個(gè)閱讀的體會(huì)和感受是無(wú)法遵從自己的內(nèi)心的,整個(gè)過(guò)程都很容易夾雜著別人對(duì)這本書(shū)的感受。所以通常我讀書(shū)的節(jié)奏大多都是跟不上“潮流”的,但往往經(jīng)過(guò)風(fēng)雨洗禮之后沉淀下來(lái)的都是精華。坦白講,閱讀這本書(shū)的初衷并不是因?yàn)槲蚁霃臅?shū)中獲取到多少大數(shù)據(jù)方面的精華,只是很想知道對(duì)于這么一個(gè)很直白的名詞,作者是怎么寫出這么厚的一本書(shū)的。這種初衷或許很無(wú)知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書(shū)中的精華。
在看《大數(shù)據(jù)時(shí)代》這本書(shū)之前,我的所有讀后感都是集中在書(shū)籍給了我什么思考。對(duì)于這本書(shū)的讀后感,除了觀點(diǎn)碰撞之外,我還會(huì)加上大部分個(gè)人看這本書(shū)的體會(huì)。因?yàn)檫@本書(shū),已經(jīng)完全讓我模糊了大多數(shù)人口中的“全世界最好的書(shū)”是一種什么標(biāo)準(zhǔn)。也許《大數(shù)據(jù)時(shí)代》真的無(wú)法承載那么高的贊美!
大數(shù)據(jù)時(shí)代的入門書(shū)
看完這本書(shū),我隨意調(diào)查了一些閱讀過(guò)這本書(shū)并且給這本書(shū)絕對(duì)好評(píng)的朋友。詢問(wèn)他們這本書(shū)好在哪里?大多數(shù)的回答是說(shuō)《大數(shù)據(jù)時(shí)代》這本書(shū)讓對(duì)大數(shù)據(jù)一無(wú)所知的他們了解了大數(shù)據(jù)這個(gè)概念,同時(shí)通過(guò)很多案例說(shuō)明原來(lái)大數(shù)據(jù)能有這么大的用處,影響會(huì)有這么大!僅此而已。我看完這本書(shū)最大的感受是這本書(shū)分為上、下兩部分。前120多頁(yè)為上部分,后120多頁(yè)為下部分。之所以說(shuō)《大數(shù)據(jù)時(shí)代》是一本關(guān)于大數(shù)據(jù)的入門書(shū),是因?yàn)檫@本書(shū)用了前面120多頁(yè)的篇幅反復(fù)的強(qiáng)調(diào)大數(shù)據(jù)的出現(xiàn)對(duì)社會(huì)發(fā)展影響很大,并且要人們轉(zhuǎn)變小數(shù)據(jù)時(shí)代慣有的思想。所以整本書(shū)的前半部分就強(qiáng)調(diào)大數(shù)據(jù)時(shí)代的三個(gè)轉(zhuǎn)變:1、大數(shù)據(jù)利用所有的數(shù)據(jù),而不再僅僅依靠一小部分?jǐn)?shù)據(jù),不再依賴于隨機(jī)采樣。2、大數(shù)據(jù)數(shù)據(jù)多,不再熱衷于追求精確性,也不再期待精確性。3、大數(shù)據(jù)時(shí)代不再熱衷于尋找因果關(guān)系,而是追求相關(guān)關(guān)系。所以整個(gè)上半部分沒(méi)什么可詳說(shuō)的。我們重點(diǎn)聊聊本書(shū)的后半部分。
既然一直都在強(qiáng)調(diào)大數(shù)據(jù)對(duì)我們的意義,總要有具體體現(xiàn)。整本書(shū)中,我感觸最大的一個(gè)案例就是某公司通過(guò)分析大數(shù)據(jù)發(fā)現(xiàn):新品發(fā)布的時(shí)候,舊一代的產(chǎn)品可能會(huì)出現(xiàn)短暫的價(jià)格上漲。因?yàn)槿藗冊(cè)谛睦砩暇驼J(rèn)為新產(chǎn)品的推出,舊產(chǎn)品就會(huì)便宜,從而就會(huì)提高購(gòu)買量。這個(gè)發(fā)現(xiàn)和我們平常的心理是完全違背的,而且如果不用數(shù)據(jù)來(lái)證明,直接講道理給大家可能還是無(wú)法相信。這就是大數(shù)據(jù)對(duì)我們很多傳統(tǒng)思維的顛覆。一旦涉及到思維的改變,往往就會(huì)引起整個(gè)社會(huì)的大變動(dòng)。
大數(shù)據(jù)這個(gè)概念的出現(xiàn),讓大數(shù)據(jù)逐漸發(fā)展形成一條價(jià)值鏈。在這條價(jià)值鏈上,數(shù)據(jù)本身、技能和思維是最重要的環(huán)節(jié)。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,越來(lái)越多的公司都能收集到大量的數(shù)據(jù),這些數(shù)據(jù)也會(huì)越來(lái)越公開(kāi)?墒窃谶@些公司中,不是所有的公司都有從數(shù)據(jù)中提取價(jià)值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。于是就會(huì)出現(xiàn)以下兩種公司,一種是掌握了專業(yè)技能但不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數(shù)據(jù)的新價(jià)值的創(chuàng)新公司。短時(shí)間內(nèi),我們可能會(huì)感覺(jué)擁有創(chuàng)新思維,懂得挖掘出數(shù)據(jù)新價(jià)值的大數(shù)據(jù)思維是最重要的。可是等到產(chǎn)業(yè)成熟之后,所有人都知曉了大數(shù)據(jù)的意義,所有人便開(kāi)始挖掘自己的大數(shù)據(jù)思維。同時(shí),隨著科技的進(jìn)步,掌握大數(shù)據(jù)技術(shù)的也將成為常態(tài)。所以到后來(lái),整個(gè)價(jià)值鏈的核心環(huán)節(jié)還是回到了數(shù)據(jù)本身。而到那時(shí)候,大數(shù)據(jù)的公開(kāi)性也就越來(lái)越小。
在大談完大數(shù)據(jù)對(duì)人類發(fā)展的積極意義之后,作者也考慮到大數(shù)據(jù)時(shí)代的風(fēng)險(xiǎn)。這一部分是作者腦洞大開(kāi)的精彩之處,同時(shí)也是最荒謬的一部分。書(shū)中說(shuō)大數(shù)據(jù)時(shí)代將要懲罰未來(lái)犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行為給防止。這樣的社會(huì),大數(shù)據(jù)儼然已經(jīng)延伸到了我們每個(gè)人生活的點(diǎn)滴。幾乎我們?cè)谏钪兴龅囊磺卸荚诖髷?shù)據(jù)的“監(jiān)控”之下,我想到那時(shí)候,別說(shuō)我們每個(gè)人的隱私已經(jīng)沒(méi)有的了,嚴(yán)重一點(diǎn)可以說(shuō)是我們可能連人都不算了。在我們?nèi)说纳鐣?huì)屬性中,自由權(quán)利是一項(xiàng)很重要的指標(biāo)。通過(guò)大數(shù)據(jù)懲罰人的未來(lái)犯罪已經(jīng)否定了人的自由選擇能力和人的行為責(zé)任自負(fù)。同時(shí),由于數(shù)據(jù)是永久保存,大數(shù)據(jù)預(yù)測(cè)也是通過(guò)每個(gè)人之前的數(shù)據(jù)來(lái)判斷,所以大數(shù)據(jù)同樣也否定了人的求善心理。還有,從現(xiàn)在各種大數(shù)據(jù)預(yù)測(cè)的結(jié)果來(lái)看,很多發(fā)言人都說(shuō)大數(shù)據(jù)不是百分百的準(zhǔn)確。所以利用大數(shù)據(jù)來(lái)判斷人的行為發(fā)展已經(jīng)違背了大數(shù)據(jù)不追求精確性的特征,這也是書(shū)中自相矛盾的地方。
對(duì)于一個(gè)新事物,如果能讓大家了解這個(gè)事物并且對(duì)此產(chǎn)生興趣,這已經(jīng)算是一本不錯(cuò)的入門書(shū)了。
大數(shù)據(jù)時(shí)代的心靈雞湯
從小到大,雞湯對(duì)于我們來(lái)說(shuō)一直都挺珍貴的。身體虛弱了,喝點(diǎn)雞湯能夠補(bǔ)充營(yíng)養(yǎng)。心靈受傷了,看點(diǎn)心靈雞湯可以鼓舞人心?墒墙鼛啄,人們生活水平提高了,營(yíng)養(yǎng)富余,雞湯已經(jīng)不是人們補(bǔ)營(yíng)養(yǎng)的期待了。同樣,心靈雞湯也是如此。
心靈雞湯其實(shí)是一個(gè)很虛偽的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來(lái),心靈雞湯很大的一個(gè)特征就是:立人的志,但是就不告訴你實(shí)現(xiàn)志的方法。很多人每次在失意的時(shí)候就喜歡看心靈雞湯,希望能得到慰藉?赐旰笠灿X(jué)得醍醐灌頂,感覺(jué)整個(gè)世界都亮了。但又有幾個(gè)人想過(guò)喝完這些雞湯之后你除了看似重拾夢(mèng)想,你還獲得了什么?你知道怎么去做嗎?《大數(shù)據(jù)時(shí)代》就是這樣一本書(shū)。整本書(shū)從頭到尾都在向讀者講述大數(shù)據(jù)的意義,當(dāng)然期間也會(huì)用相應(yīng)的案例來(lái)證明大數(shù)據(jù)確實(shí)有這樣的能力。但是,整本書(shū)從沒(méi)有涉及到技術(shù)層面的問(wèn)題;蛟S對(duì)于大數(shù)據(jù)這種依靠互聯(lián)網(wǎng)技術(shù)的新事物,即使向讀者講技術(shù),也沒(méi)有幾個(gè)人看得懂,可是整本書(shū)沒(méi)有一點(diǎn)關(guān)于大數(shù)據(jù)思維的技能引導(dǎo)。給出的案例中只有少數(shù)案例向讀者講述了這個(gè)公司為什么要利用大數(shù)據(jù)來(lái)解決這種問(wèn)題,大多數(shù)都只是告訴讀者國(guó)外某家公司運(yùn)用大數(shù)據(jù)得出了某種結(jié)論。同時(shí),在本書(shū)中文譯作者寫的序里,強(qiáng)調(diào)自己翻譯這本著作的一大優(yōu)點(diǎn)是可以結(jié)合國(guó)內(nèi)的案例來(lái)分析書(shū)中的理論,結(jié)果,看到最后一頁(yè)都沒(méi)有看到一個(gè)國(guó)內(nèi)企業(yè)關(guān)于大數(shù)據(jù)運(yùn)用的案例。
之所以我稱之為“心靈雞湯”,還有一個(gè)原因就是作者在書(shū)中大講特講的大數(shù)據(jù)的作用,事實(shí)上按照現(xiàn)在的經(jīng)濟(jì)發(fā)展水平和社會(huì)文明發(fā)展程度是很難實(shí)現(xiàn)的。書(shū)中很多時(shí)候的理論都是要建立在社會(huì)各項(xiàng)文明都發(fā)展健全的基礎(chǔ)上才能實(shí)現(xiàn)。
大數(shù)據(jù)的“傳銷手冊(cè)”
看到這個(gè)標(biāo)題,大家可能會(huì)覺(jué)得我夸大其詞,受到如此多人好評(píng)的書(shū)怎么是“傳銷手冊(cè)”呢?對(duì)于這個(gè)表達(dá),我只想說(shuō)兩點(diǎn):1、此說(shuō)法僅代表我個(gè)人觀點(diǎn),是否認(rèn)同是個(gè)人問(wèn)題。2、此說(shuō)法主要針對(duì)本書(shū)的上部分。
我們都知道傳銷組織在發(fā)展下線的前期是要花大力氣去培訓(xùn)的,也就是洗腦。而對(duì)于一個(gè)陌生又很難以理解的事物,最好的“洗腦”方式就是重復(fù)!洞髷(shù)據(jù)時(shí)代》這本書(shū)就是運(yùn)用這種方式,前半部分為了讓讀者能夠接受“大數(shù)據(jù)”這個(gè)概念,作者反反復(fù)復(fù)提醒讀者大數(shù)據(jù)不是隨機(jī)采樣、不追求精確和不尋找因果關(guān)系。同時(shí)用很多看似很通俗易懂其實(shí)看完后還是不知道說(shuō)了什么的案例來(lái)讓人信服大數(shù)據(jù)的作用。書(shū)中的后半部分雖然也是用這種方式來(lái)感染讀者,可后半部分中作者的暢想和對(duì)大數(shù)據(jù)的威脅分析還是對(duì)讀者有一些實(shí)質(zhì)意義的,所以后半部分的“傳銷”影響就不是很重要。
大數(shù)據(jù)時(shí)代是未來(lái)的趨勢(shì),這誰(shuí)都不會(huì)否認(rèn)。大數(shù)據(jù)改造了我們的生活,改變著我們的世界。不管它是以一種什么樣的姿態(tài)面向世界,它都沒(méi)有錯(cuò),因?yàn)榇髷?shù)據(jù)只是一種工具。但當(dāng)人類開(kāi)始質(zhì)疑甚至恐懼大數(shù)據(jù)的時(shí)候,人類就該思考自己是否利用好這個(gè)好工具了。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇20
4月13日下午,在湖南大學(xué)東樓205參加了關(guān)于《大數(shù)據(jù)時(shí)代》的讀書(shū)交流活動(dòng)。通過(guò)相互交流學(xué)習(xí),使我更深層次的理解了大數(shù)據(jù)時(shí)代的利與弊,機(jī)遇和挑戰(zhàn)。在寫心得體會(huì)前,我想再重新審視一下關(guān)于大數(shù)據(jù)的歷史沿革和現(xiàn)實(shí)意義。
首先,最早提出“大數(shù)據(jù)”時(shí)代到來(lái)的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù) 據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。”“大數(shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時(shí)日,卻因?yàn)榻陙?lái)互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計(jì)算、物聯(lián)網(wǎng)之后又IT行業(yè)又一大顛覆性的技術(shù)革命。云計(jì)算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問(wèn)的場(chǎng)所和渠道,而數(shù)據(jù)才是真正有價(jià)值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營(yíng)交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實(shí)時(shí)性要求也將大大超越現(xiàn)有的計(jì)算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國(guó)家治理、企業(yè)決策乃至個(gè)人生活服務(wù),是大數(shù)據(jù)的核心議題,也是云計(jì)算內(nèi)在的靈魂和必然的升級(jí)方向。
其次,進(jìn)入20xx年,大數(shù)據(jù)(big data)一詞越來(lái)越多地被提及,人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過(guò)《紐約時(shí)報(bào)》《華爾街日?qǐng)?bào)》的專欄封面,進(jìn)入美國(guó)白宮官網(wǎng)的新聞,現(xiàn)身在國(guó)內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺(jué)靈敏的國(guó)金證券、國(guó)泰君安、銀河證券等寫進(jìn)了投資推薦報(bào)告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來(lái)發(fā)展,雖然很多企業(yè)可能并沒(méi)有意識(shí)到數(shù)據(jù)爆炸性增長(zhǎng)帶來(lái)問(wèn)題的隱患,但是隨著時(shí)間的推移,人們將越來(lái)越多的意識(shí)到數(shù)據(jù)對(duì)企業(yè)的重要性。正如《紐約時(shí)報(bào)》20xx年2月的一篇專欄中所稱,“大數(shù)據(jù)”時(shí)代已經(jīng)降臨,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺(jué)。哈佛大學(xué)社會(huì)學(xué)教授加里·金說(shuō):“這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開(kāi)始了量化進(jìn)程,無(wú)論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開(kāi)始這種進(jìn)程。”
最后,隨著云時(shí)代的來(lái)臨,大數(shù)據(jù)(Big data)也吸引了越來(lái)越多的關(guān)注。著云臺(tái)的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Big data)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。“大數(shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運(yùn)營(yíng)中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來(lái)衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國(guó)兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬(wàn)個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量);賣出的手機(jī)為37.8萬(wàn)臺(tái),高于全球每天出生的嬰兒數(shù)量37.1萬(wàn)……,截止到20xx年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,20xx年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,20xx年的數(shù)據(jù)量為0.8ZB,20xx年增長(zhǎng)為1.2ZB,20xx年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到20xx年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說(shuō)過(guò)的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過(guò)去兩年內(nèi)產(chǎn)生的。而到了20xx年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
首先,談?wù)劥髷?shù)據(jù)帶給生活的轉(zhuǎn)變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢(shì),可以說(shuō),大數(shù)據(jù)現(xiàn)在已經(jīng)開(kāi)始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來(lái)優(yōu)化規(guī)模和實(shí)現(xiàn)利益最大化。而我們很多人對(duì)大數(shù)據(jù)還很陌生,只是被動(dòng)的適應(yīng)著大數(shù)據(jù)給生活帶來(lái)的改變。大數(shù)據(jù)時(shí)代是以云計(jì)算為基礎(chǔ)的,所以,要實(shí)現(xiàn)大數(shù)據(jù),相關(guān)的很多的硬件設(shè)備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關(guān)產(chǎn)業(yè)都要重新調(diào)整產(chǎn)業(yè)結(jié)構(gòu),在那時(shí),可以夸張的說(shuō),信息就是黃金,信息就是石油。大數(shù)據(jù)時(shí)代的到來(lái)會(huì)解放更多的勞動(dòng)生產(chǎn)力,勢(shì)必將會(huì)更加加劇生產(chǎn)力過(guò)剩的現(xiàn)狀,社會(huì)兩極分化現(xiàn)象會(huì)更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來(lái)的可怕局面。大數(shù)據(jù)時(shí)代的到來(lái)會(huì)使人們的生活節(jié)奏急速加快,信息的時(shí)效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會(huì)越來(lái)越忙,到那時(shí),就像現(xiàn)在的日本,可能想找個(gè)人聽(tīng)你說(shuō)說(shuō)話,真的是一件很難的事。
第二,關(guān)于數(shù)據(jù)管理的看法。大數(shù)據(jù)時(shí)代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹(shù)立信息安全防范的意識(shí),不主動(dòng)泄露信息,要管理好自己身邊的信息設(shè)備;技防,就是要運(yùn)用軟件來(lái)管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫(kù),定時(shí)查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應(yīng)當(dāng)做到備份與原始文件是物理隔離,無(wú)關(guān)的信息應(yīng)當(dāng)及時(shí)刪除,減輕硬盤的壓力。
三、怎么保護(hù)自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時(shí)代,更要管理好自己的隱私,以免對(duì)自己和家人造成麻煩和損失。越是隱私的信息,越要遠(yuǎn)離網(wǎng)絡(luò),不要再公開(kāi)的社交網(wǎng)絡(luò)儲(chǔ)存和展示個(gè)人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質(zhì)的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機(jī)碼來(lái)保護(hù)自己真實(shí)IP地址,提高網(wǎng)絡(luò)安全的可靠性,加強(qiáng)對(duì)聯(lián)網(wǎng)信息的管理和保護(hù)。
不論我們情不情愿,大數(shù)據(jù)時(shí)代都會(huì)到來(lái),現(xiàn)實(shí)社會(huì)是我們高喊著走向大數(shù)據(jù)時(shí)代,其實(shí)大數(shù)據(jù)時(shí)代已經(jīng)向我們走來(lái),所以與其被動(dòng)接受,不如主動(dòng)學(xué)習(xí),從中找到自己的出路,成為大數(shù)據(jù)時(shí)代的建設(shè)者和受益者。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇21
《大數(shù)據(jù)時(shí)代》這本書(shū)主要描述的是大數(shù)據(jù)時(shí)代到臨人們生活、工作與思維各方面所遇到的重大變革。
文中清晰的闡述了大數(shù)據(jù)的基本概念和特點(diǎn),并列出明確的觀點(diǎn)。不管對(duì)于產(chǎn)業(yè)實(shí)踐者,還是對(duì)于政府和公眾機(jī)構(gòu),都非常具有價(jià)值。作者將本書(shū)分為3個(gè)部分。第一部分提出了大數(shù)據(jù)時(shí)代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:抽樣等于全體;要效率不要絕對(duì)精確;要相關(guān)不要因果;第二部分作者從萬(wàn)事萬(wàn)物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價(jià)值兩個(gè)方面,講述驅(qū)動(dòng)大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動(dòng)的最根本動(dòng)力;最后一部分,作者描繪了大數(shù)據(jù)帝國(guó)前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開(kāi)等問(wèn)題。
本書(shū)觀點(diǎn)擲地有聲,作者觀念高屋建瓴,從很多實(shí)例和經(jīng)驗(yàn)中萃取普適性觀念。例子詳實(shí)豐富,囊括了進(jìn)百個(gè)學(xué)術(shù)和商業(yè)實(shí)例。
引言提出了大數(shù)據(jù)將給生活、工作于思維帶來(lái)重大的變革。一個(gè)例子是20xx年H1N1流行病毒背景下谷歌通過(guò)檢測(cè)檢索詞條,處理了4.5億個(gè)不同的數(shù)據(jù)模型,通過(guò)預(yù)測(cè)并與20xx年、20xx年美國(guó)疾控中心記錄的實(shí)際流感病例進(jìn)行對(duì)比后,確定了45條檢索詞條組合,并將其用于一個(gè)特定的數(shù)學(xué)模型后,預(yù)測(cè)的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達(dá)97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對(duì)于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運(yùn)用大數(shù)據(jù)技術(shù),以前所未有的方式,通過(guò)海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預(yù)測(cè)流感提供了一種更快捷的預(yù)測(cè)工具。此外,我聯(lián)想到原淘寶董事長(zhǎng)馬云通過(guò)大量數(shù)據(jù)分析得出20xx年經(jīng)濟(jì)疲弱,為其商家提前做好迎接經(jīng)濟(jì)危機(jī)提供了時(shí)間緩沖。(補(bǔ)充并清晰描述詳細(xì))關(guān)于大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用, Farecast公司是一個(gè)成功的典型范例。該公司由奧倫·埃齊奧尼創(chuàng)辦,利用機(jī)票的銷售數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)的機(jī)票價(jià)格,旨在幫助用戶在購(gòu)買機(jī)票方面做出預(yù)測(cè),并對(duì)機(jī)票價(jià)格走勢(shì)預(yù)測(cè)的可信度標(biāo)示出來(lái)供消費(fèi)者查考。Farecast系統(tǒng)利用近十萬(wàn)億條價(jià)格記錄預(yù)測(cè)的準(zhǔn)確度達(dá)75%,使得使用Farecast票價(jià)預(yù)測(cè)工具購(gòu)買機(jī)票的旅客,平均每張機(jī)票節(jié)約50美元。而處理如此多的數(shù)據(jù)離開(kāi)了大數(shù)據(jù)技術(shù)將無(wú)法進(jìn)行。
也正是由于我們進(jìn)入了一個(gè)前所未有的信息化時(shí)代,人們擁有了如此多的數(shù)據(jù),才提供給我們利用大數(shù)據(jù)的分析處理手段,創(chuàng)造新的價(jià)值。也許有人以為我們大數(shù)據(jù)時(shí)代的還未來(lái)臨。其實(shí)大數(shù)據(jù)技術(shù)早已滲透到我們中間,它被應(yīng)用在垃圾郵件的過(guò)濾,新浪微博技術(shù)平臺(tái),谷歌翻譯以及輸入文字的自動(dòng)糾錯(cuò)等。
文中提出的一個(gè)觀點(diǎn)是,預(yù)測(cè)是大數(shù)據(jù)的核心。其實(shí)從過(guò)去的時(shí)代人們就利用掌握的數(shù)據(jù)進(jìn)行各種分析,從而對(duì)經(jīng)濟(jì)等各方面進(jìn)行預(yù)測(cè)、矯正。只是進(jìn)入了大數(shù)據(jù)時(shí)代人們掌握的數(shù)據(jù)爆炸性的速度在增長(zhǎng),從而數(shù)據(jù)的存儲(chǔ)和分析數(shù)據(jù)分方法成了釋放大數(shù)據(jù)能量的關(guān)鍵。
關(guān)于不是隨機(jī)樣本而是整體數(shù)據(jù)中。作者指出了隨機(jī)取樣是小數(shù)據(jù)時(shí)代用最少的數(shù)據(jù)獲取最大價(jià)值的做法。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說(shuō)明了使用全部數(shù)據(jù)而非樣本的意義。喬布斯成為世界上第一個(gè)對(duì)自身所有DNA和腫瘤DNA進(jìn)行排序的人。喬布斯曾開(kāi)玩笑說(shuō)“我要么是第一個(gè)通過(guò)這種方式戰(zhàn)勝癌癥的人,要么就是最后一個(gè)因?yàn)檫@種方式死于癌癥的人”。雖然最后難免死于癌癥但這種獲得所有數(shù)據(jù)而不是僅樣本的方法將他的生命延長(zhǎng)了幾年。同樣,從事跨境匯款業(yè)務(wù)的Xoom公司偵破一起犯罪集團(tuán)的詐騙也是由于使用了整體數(shù)據(jù)。初此之外,他還列舉了日本“相撲”等來(lái)證明使用全體數(shù)據(jù)的重要性。
作者同時(shí)也指出隨著數(shù)據(jù)使用的越來(lái)越多,其得出的結(jié)果并一定能越來(lái)越精確,畢竟數(shù)據(jù)不能保證百分之百的正確,特別是大數(shù)據(jù)時(shí)代各種結(jié)構(gòu)化與非結(jié)構(gòu)化類型的數(shù)據(jù)聚集在一起難免導(dǎo)致結(jié)果的不太精確。大數(shù)據(jù)時(shí)代要求我們重新審視精確性的優(yōu)劣。作者特別舉了谷歌翻譯成功的例子。谷歌翻譯之所以優(yōu)于IBM的Candide系統(tǒng)并不是因?yàn)樗鼡碛懈玫乃惴C(jī)制。和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯(cuò)誤的數(shù)據(jù)。(其語(yǔ)庫(kù)來(lái)自于未經(jīng)過(guò)濾的網(wǎng)頁(yè)內(nèi)容,會(huì)包含一些不完整的句子、拼寫錯(cuò)誤、語(yǔ)法錯(cuò)誤以及其他各種錯(cuò)誤)
在不是因果關(guān)系,而是相關(guān)關(guān)系的篇章中。作者指出在大數(shù)據(jù)時(shí)代往往知道是什么要比知道為什么來(lái)的更實(shí)在。作者列舉了林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢(shì)以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的先鋒和代表,從以前廣為人事的啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣的案例,都說(shuō)明了掌握了相關(guān)關(guān)系對(duì)于其策略的幫助。建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的核心。Aviva保險(xiǎn)公司利用幾百種生活方式的數(shù)據(jù),如愛(ài)好、長(zhǎng)瀏覽網(wǎng)頁(yè)等間接的預(yù)測(cè)出哪些人更可能患高血壓、糖尿病和抑郁癥。UPS國(guó)家快遞公司通過(guò)使用預(yù)測(cè)性分析檢測(cè)其全美6萬(wàn)輛車隊(duì)。進(jìn)行防御性的修理,節(jié)約巨大得的成本。這些都充分顯示了大數(shù)據(jù)在預(yù)測(cè)方面的優(yōu)勢(shì)。
本書(shū)第二部分講的是大數(shù)據(jù)時(shí)代的商業(yè)變革。
作者用莫里繪制導(dǎo)航圖的例子告訴我們,遠(yuǎn)在信息數(shù)字化之前,對(duì)數(shù)據(jù)的運(yùn)用就已經(jīng)開(kāi)始了。莫里利用大量的人力去分析多年保存的航海記錄,他從這些大量的數(shù)據(jù)中獲取到新的利用價(jià)值。繪制的圖表幫助商人節(jié)約一大筆錢,使年輕的海員們間接獲取了成千上萬(wàn)名經(jīng)驗(yàn)豐富的航海家的指導(dǎo)。日本先進(jìn)工業(yè)技術(shù)研究所越水重臣教授通過(guò)安裝壓力傳感器將人屁股特征數(shù)據(jù)化,進(jìn)而形成對(duì)乘客身份的特征識(shí)別。這項(xiàng)技術(shù)為汽車防盜系統(tǒng)提供了方案。公司,致力于為顧客預(yù)測(cè)商品的價(jià)格,通過(guò)收集處理海量的價(jià)格信息,預(yù)測(cè)準(zhǔn)確率高達(dá)77%,幫助顧客在購(gòu)買一個(gè)產(chǎn)品時(shí)節(jié)約了大約100美元。MasterCardd.Advisor部門通過(guò)分析來(lái)自210個(gè)國(guó)家的15億信用卡用戶的650億條交易記錄,分析得出商業(yè)發(fā)展和客戶消費(fèi)趨勢(shì),如通過(guò)分析發(fā)現(xiàn)如果一個(gè)人下午四點(diǎn)左右給汽車加油的話,他很可能在接下來(lái)的一個(gè)小時(shí)內(nèi)去購(gòu)物或者去餐館吃飯 ,且在這一小時(shí)里大約花費(fèi)35到40美元。商家正可以利用這個(gè)分析結(jié)果,在加油的小票背面附加上附近商店的優(yōu)惠券。
這些例子都證明了大數(shù)據(jù)蘊(yùn)藏著巨大的商業(yè)價(jià)值。根據(jù)提供價(jià)值的不同來(lái)源,大數(shù)據(jù)價(jià)值鏈包括三大構(gòu)成部分。包括第一種是基于數(shù)據(jù)本身的公司。這些公司擁有大量數(shù)據(jù)或者至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價(jià)值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。第二種是基于技能的公司。它們通常是咨詢公司、技術(shù)供應(yīng)商或者分析公司。它們掌握了專業(yè)技能但并不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)性用途的才能。比如說(shuō),沃爾瑪和Pop-Tarts這兩個(gè)零售商就是借助天睿公司的分析來(lái)獲得營(yíng)銷點(diǎn)子,天睿就是一家大數(shù)據(jù)分析公司。第三種是基于思維的公司。皮特.華登,Jetpac的聯(lián)合創(chuàng)始人,就是通過(guò)想法獲得價(jià)值的一個(gè)例子,他通過(guò)用戶分享到網(wǎng)上的旅行照片來(lái)為人們推薦下一次旅行目的地。對(duì)于某些公司來(lái)說(shuō),數(shù)據(jù)和技能并不是成功的關(guān)鍵。挖掘數(shù)據(jù)的新價(jià)值的創(chuàng)新思維才是這些公司脫穎而出的優(yōu)勢(shì)所在。
大數(shù)據(jù)成為許多公司競(jìng)爭(zhēng)力的來(lái)源,未來(lái)可能整個(gè)行業(yè)的結(jié)構(gòu)會(huì)發(fā)生改變,大公司和小公司最有可能成為贏家。如今的核心競(jìng)爭(zhēng)力在于快速而廉價(jià)地進(jìn)行大量的數(shù)據(jù)存儲(chǔ)和處理。當(dāng)然公司要根據(jù)自己的情況進(jìn)行調(diào)整。大數(shù)據(jù)向小數(shù)據(jù)時(shí)代的贏家以及那些線下大公司(如沃爾瑪、聯(lián)邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰(zhàn)。同時(shí),大數(shù)據(jù)也為小公司帶來(lái)了機(jī)遇。大數(shù)據(jù)也將會(huì)影響國(guó)家競(jìng)爭(zhēng)力。當(dāng)制造業(yè)已經(jīng)大幅轉(zhuǎn)向發(fā)展中國(guó)家,而大家都爭(zhēng)相發(fā)展創(chuàng)新行業(yè)的時(shí)候,工業(yè)化國(guó)家因?yàn)檎莆樟藬?shù)據(jù)以及大數(shù)據(jù)技術(shù),所以仍然在全球競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì),但這個(gè)優(yōu)勢(shì)很難持續(xù)。隨著技術(shù)的發(fā)展,西方世界在大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)將會(huì)慢慢消失。對(duì)于大公司而言,好消息是大數(shù)據(jù)技術(shù)可以加劇優(yōu)勝劣汰。一旦公司掌握了大數(shù)據(jù),它不但可能超過(guò)對(duì)手還可能遙遙領(lǐng)先。
文章第三部分講了大數(shù)據(jù)帶來(lái)無(wú)數(shù)好處的同時(shí)帶來(lái)的不良影響以及如何面對(duì)這些影響。包括如數(shù)據(jù)的收益的處理問(wèn)題以及數(shù)據(jù)中用戶資料的隱私和決策過(guò)程帶來(lái)的影響。作者在保護(hù)個(gè)人隱私方面提出了幾種想法。一種是使用數(shù)據(jù)時(shí)征詢數(shù)據(jù)所有個(gè)人的知曉和授權(quán)。第二個(gè)技術(shù)途徑就是匿名化。作者同時(shí)也指出了這兩種方式的難度。一方面收集到的數(shù)據(jù)可能會(huì)被后續(xù)的多次利用。另一方面,匿名化會(huì)在數(shù)據(jù)收集越來(lái)越多和數(shù)據(jù)的相互結(jié)合關(guān)聯(lián)使用時(shí)變得無(wú)效。作者列列舉電影《少數(shù)派報(bào)告》的情節(jié)說(shuō)明越來(lái)越依賴數(shù)據(jù)時(shí),大數(shù)據(jù)可能將我們禁錮在可能性之中。當(dāng)然通過(guò)分析犯罪的常發(fā)地與常發(fā)時(shí)間,合理安排警力會(huì)對(duì)治安防范提供不小的幫助。作者還指出不能盡信數(shù)據(jù)的分析結(jié)果,因?yàn)椴荒鼙WC獲取分析結(jié)果來(lái)源的數(shù)據(jù)準(zhǔn)確性。大數(shù)據(jù)在給我們生活提供便利的同時(shí),也讓隱私保護(hù)的法律手段失去了作用。我們必須杜絕對(duì)數(shù)據(jù)的過(guò)分依賴。
在高速邁進(jìn)大數(shù)據(jù)時(shí)代的同時(shí),人類信息管理準(zhǔn)則需要重新定位,這將帶動(dòng)社會(huì)核心價(jià)值觀的轉(zhuǎn)變。大數(shù)據(jù)時(shí)代,對(duì)原有規(guī)范的修修補(bǔ)補(bǔ)已經(jīng)不足以抑制大數(shù)據(jù)帶來(lái)的風(fēng)險(xiǎn)。保護(hù)個(gè)人隱私就需要對(duì)個(gè)人數(shù)據(jù)處理器對(duì)其政策和行為承擔(dān)更多責(zé)任。同時(shí)必須重新定義公正的概念,以確保人類行為的自由。作者提出了解決這些問(wèn)題的方向。如個(gè)人隱私保護(hù)方面,可以讓使用者承擔(dān)更多的社會(huì)責(zé)任。將責(zé)任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者有很多意義,也有充分的理由。因?yàn)樗麄兏宄䦟⑷绾问褂脭?shù)據(jù)且是數(shù)據(jù)應(yīng)用最大的受益者。關(guān)于公正方面簡(jiǎn)單的講就是個(gè)人可以并應(yīng)為他們的行為而非傾向負(fù)責(zé)。就像公司有內(nèi)部會(huì)計(jì)和外部審計(jì)人員一樣,大數(shù)據(jù)時(shí)代,公司將設(shè)置專門的人員--內(nèi)部和外部算法師對(duì)大數(shù)據(jù)活動(dòng)進(jìn)行監(jiān)督。還有可能出現(xiàn)第三方的機(jī)構(gòu)對(duì)大數(shù)據(jù)行為進(jìn)行監(jiān)督和衡量。作者甚至考慮到對(duì)大數(shù)據(jù)存在的壟斷情況進(jìn)行分析并在反壟斷反面給了建議。最后結(jié)語(yǔ)中作者提出大數(shù)據(jù)提供給人們的只是參考答案,提醒我們?cè)诶眠@個(gè)工具時(shí)要銘記人類的作用是無(wú)法完全替代的。
大數(shù)據(jù)時(shí)代是信息化社會(huì)發(fā)展必然趨勢(shì),我們只有緊緊跟隨時(shí)代發(fā)展的潮流,在技術(shù)上、制度上、價(jià)值觀念上做出迅速調(diào)整并牢牢跟進(jìn),才能在接下來(lái)新一輪的國(guó)際競(jìng)爭(zhēng)中擺脫受制于人的弱勢(shì)境地,才能把握發(fā)展的方向,沖破與西方國(guó)家的差距。對(duì)于一個(gè)國(guó)家如此,對(duì)于一個(gè)企業(yè)亦是如此。在如此快速的到來(lái)的大數(shù)據(jù)時(shí)代,我們還有很多知識(shí)需要學(xué)習(xí),許多思維需要轉(zhuǎn)變,許多技術(shù)需要研究。公司的規(guī)劃中,也需充分考慮到大數(shù)據(jù)對(duì)于公司的未來(lái)發(fā)展所帶來(lái)的機(jī)遇和挑戰(zhàn)。對(duì)于掌握大量數(shù)據(jù)的公司,需要考慮有多少數(shù)字化的數(shù)據(jù),又有哪些可以通過(guò)大數(shù)據(jù)的分析處理而帶來(lái)有價(jià)值的用途?比如國(guó)內(nèi)目前的社交網(wǎng)站,購(gòu)物網(wǎng)站等都掌握了用戶的大量的數(shù)據(jù)信息。在大數(shù)據(jù)時(shí)代制勝的良藥也許是創(chuàng)新的點(diǎn)子,也許可以利用外部的數(shù)據(jù),通過(guò)多維化、多層面的分析給其他企業(yè)或個(gè)人帶來(lái)價(jià)值。
大數(shù)據(jù)時(shí)代讀書(shū)心得體會(huì)范文6
“大數(shù)據(jù)”概念早在1980年就有國(guó)外的學(xué)者提出,可是最近幾年才廣泛受到大家的關(guān)注。當(dāng)“大數(shù)據(jù)”這個(gè)概念傳到中國(guó)的時(shí)候,瞬間引起了轟動(dòng)。隨即,各種有關(guān)“大數(shù)據(jù)”的資料和書(shū)籍充斥的我們的視野。隨意打開(kāi)某個(gè)電子商務(wù)平臺(tái)圖書(shū)類頁(yè)面,在搜索框中搜索“大數(shù)據(jù)”三個(gè)字,就會(huì)出現(xiàn)好多本有關(guān)“大數(shù)據(jù)”的書(shū)籍?墒牵幸粋(gè)很有趣的現(xiàn)象就是:幾乎所有的平臺(tái)上,出現(xiàn)的第一本關(guān)于“大數(shù)據(jù)”的書(shū)籍一定是《大數(shù)據(jù)時(shí)代》。一點(diǎn)進(jìn)去,這本書(shū)推薦欄里的第一句話就是:迄今為止全世界最好的一本大數(shù)據(jù)專著。同時(shí),為這本書(shū)做推薦的都是各行業(yè)的精英領(lǐng)袖。所有“大數(shù)據(jù)”方面的書(shū)籍也是這本書(shū)銷量最高,評(píng)價(jià)最好。
我從來(lái)不會(huì)因?yàn)槟谋緯?shū)暢銷和很多人推薦就盲目跟風(fēng)的去看一本書(shū)。因?yàn)槲抑劳ǔT谶@種情況下選擇一本書(shū),整個(gè)閱讀的體會(huì)和感受是無(wú)法遵從自己的內(nèi)心的,整個(gè)過(guò)程都很容易夾雜著別人對(duì)這本書(shū)的感受。所以通常我讀書(shū)的節(jié)奏大多都是跟不上“潮流”的,但往往經(jīng)過(guò)風(fēng)雨洗禮之后沉淀下來(lái)的都是精華。坦白講,閱讀這本書(shū)的初衷并不是因?yàn)槲蚁霃臅?shū)中獲取到多少大數(shù)據(jù)方面的精華,只是很想知道對(duì)于這么一個(gè)很直白的名詞,作者是怎么寫出這么厚的一本書(shū)的。這種初衷或許很無(wú)知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書(shū)中的精華。
在看《大數(shù)據(jù)時(shí)代》這本書(shū)之前,我的所有讀后感都是集中在書(shū)籍給了我什么思考。對(duì)于這本書(shū)的讀后感,除了觀點(diǎn)碰撞之外,我還會(huì)加上大部分個(gè)人看這本書(shū)的體會(huì)。因?yàn)檫@本書(shū),已經(jīng)完全讓我模糊了大多數(shù)人口中的“全世界最好的書(shū)”是一種什么標(biāo)準(zhǔn)。也許《大數(shù)據(jù)時(shí)代》真的無(wú)法承載那么高的贊美!
大數(shù)據(jù)時(shí)代的入門書(shū)
看完這本書(shū),我隨意調(diào)查了一些閱讀過(guò)這本書(shū)并且給這本書(shū)絕對(duì)好評(píng)的朋友。詢問(wèn)他們這本書(shū)好在哪里?大多數(shù)的回答是說(shuō)《大數(shù)據(jù)時(shí)代》這本書(shū)讓對(duì)大數(shù)據(jù)一無(wú)所知的他們了解了大數(shù)據(jù)這個(gè)概念,同時(shí)通過(guò)很多案例說(shuō)明原來(lái)大數(shù)據(jù)能有這么大的用處,影響會(huì)有這么大!僅此而已。我看完這本書(shū)最大的感受是這本書(shū)分為上、下兩部分。前120多頁(yè)為上部分,后120多頁(yè)為下部分。之所以說(shuō)《大數(shù)據(jù)時(shí)代》是一本關(guān)于大數(shù)據(jù)的入門書(shū),是因?yàn)檫@本書(shū)用了前面120多頁(yè)的篇幅反復(fù)的強(qiáng)調(diào)大數(shù)據(jù)的出現(xiàn)對(duì)社會(huì)發(fā)展影響很大,并且要人們轉(zhuǎn)變小數(shù)據(jù)時(shí)代慣有的思想。所以整本書(shū)的前半部分就強(qiáng)調(diào)大數(shù)據(jù)時(shí)代的三個(gè)轉(zhuǎn)變:1、大數(shù)據(jù)利用所有的數(shù)據(jù),而不再僅僅依靠一小部分?jǐn)?shù)據(jù),不再依賴于隨機(jī)采樣。2、大數(shù)據(jù)數(shù)據(jù)多,不再熱衷于追求精確性,也不再期待精確性。3、大數(shù)據(jù)時(shí)代不再熱衷于尋找因果關(guān)系,而是追求相關(guān)關(guān)系。所以整個(gè)上半部分沒(méi)什么可詳說(shuō)的。我們重點(diǎn)聊聊本書(shū)的后半部分。
既然一直都在強(qiáng)調(diào)大數(shù)據(jù)對(duì)我們的意義,總要有具體體現(xiàn)。整本書(shū)中,我感觸最大的一個(gè)案例就是某公司通過(guò)分析大數(shù)據(jù)發(fā)現(xiàn):新品發(fā)布的時(shí)候,舊一代的產(chǎn)品可能會(huì)出現(xiàn)短暫的價(jià)格上漲。因?yàn)槿藗冊(cè)谛睦砩暇驼J(rèn)為新產(chǎn)品的推出,舊產(chǎn)品就會(huì)便宜,從而就會(huì)提高購(gòu)買量。這個(gè)發(fā)現(xiàn)和我們平常的心理是完全違背的,而且如果不用數(shù)據(jù)來(lái)證明,直接講道理給大家可能還是無(wú)法相信。這就是大數(shù)據(jù)對(duì)我們很多傳統(tǒng)思維的顛覆。一旦涉及到思維的改變,往往就會(huì)引起整個(gè)社會(huì)的大變動(dòng)。
大數(shù)據(jù)這個(gè)概念的出現(xiàn),讓大數(shù)據(jù)逐漸發(fā)展形成一條價(jià)值鏈。在這條價(jià)值鏈上,數(shù)據(jù)本身、技能和思維是最重要的環(huán)節(jié)。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,越來(lái)越多的公司都能收集到大量的數(shù)據(jù),這些數(shù)據(jù)也會(huì)越來(lái)越公開(kāi)?墒窃谶@些公司中,不是所有的公司都有從數(shù)據(jù)中提取價(jià)值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。于是就會(huì)出現(xiàn)以下兩種公司,一種是掌握了專業(yè)技能但不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數(shù)據(jù)的新價(jià)值的創(chuàng)新公司。短時(shí)間內(nèi),我們可能會(huì)感覺(jué)擁有創(chuàng)新思維,懂得挖掘出數(shù)據(jù)新價(jià)值的大數(shù)據(jù)思維是最重要的?墒堑鹊疆a(chǎn)業(yè)成熟之后,所有人都知曉了大數(shù)據(jù)的意義,所有人便開(kāi)始挖掘自己的大數(shù)據(jù)思維。同時(shí),隨著科技的進(jìn)步,掌握大數(shù)據(jù)技術(shù)的也將成為常態(tài)。所以到后來(lái),整個(gè)價(jià)值鏈的核心環(huán)節(jié)還是回到了數(shù)據(jù)本身。而到那時(shí)候,大數(shù)據(jù)的公開(kāi)性也就越來(lái)越小。
在大談完大數(shù)據(jù)對(duì)人類發(fā)展的積極意義之后,作者也考慮到大數(shù)據(jù)時(shí)代的風(fēng)險(xiǎn)。這一部分是作者腦洞大開(kāi)的精彩之處,同時(shí)也是最荒謬的一部分。書(shū)中說(shuō)大數(shù)據(jù)時(shí)代將要懲罰未來(lái)犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行為給防止。這樣的社會(huì),大數(shù)據(jù)儼然已經(jīng)延伸到了我們每個(gè)人生活的點(diǎn)滴。幾乎我們?cè)谏钪兴龅囊磺卸荚诖髷?shù)據(jù)的“監(jiān)控”之下,我想到那時(shí)候,別說(shuō)我們每個(gè)人的隱私已經(jīng)沒(méi)有的了,嚴(yán)重一點(diǎn)可以說(shuō)是我們可能連人都不算了。在我們?nèi)说纳鐣?huì)屬性中,自由權(quán)利是一項(xiàng)很重要的指標(biāo)。通過(guò)大數(shù)據(jù)懲罰人的未來(lái)犯罪已經(jīng)否定了人的自由選擇能力和人的行為責(zé)任自負(fù)。同時(shí),由于數(shù)據(jù)是永久保存,大數(shù)據(jù)預(yù)測(cè)也是通過(guò)每個(gè)人之前的數(shù)據(jù)來(lái)判斷,所以大數(shù)據(jù)同樣也否定了人的求善心理。還有,從現(xiàn)在各種大數(shù)據(jù)預(yù)測(cè)的結(jié)果來(lái)看,很多發(fā)言人都說(shuō)大數(shù)據(jù)不是百分百的準(zhǔn)確。所以利用大數(shù)據(jù)來(lái)判斷人的行為發(fā)展已經(jīng)違背了大數(shù)據(jù)不追求精確性的特征,這也是書(shū)中自相矛盾的地方。
對(duì)于一個(gè)新事物,如果能讓大家了解這個(gè)事物并且對(duì)此產(chǎn)生興趣,這已經(jīng)算是一本不錯(cuò)的入門書(shū)了。
大數(shù)據(jù)時(shí)代的心靈雞湯
從小到大,雞湯對(duì)于我們來(lái)說(shuō)一直都挺珍貴的。身體虛弱了,喝點(diǎn)雞湯能夠補(bǔ)充營(yíng)養(yǎng)。心靈受傷了,看點(diǎn)心靈雞湯可以鼓舞人心。可是近幾年,人們生活水平提高了,營(yíng)養(yǎng)富余,雞湯已經(jīng)不是人們補(bǔ)營(yíng)養(yǎng)的期待了。同樣,心靈雞湯也是如此。
心靈雞湯其實(shí)是一個(gè)很虛偽的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來(lái),心靈雞湯很大的一個(gè)特征就是:立人的志,但是就不告訴你實(shí)現(xiàn)志的方法。很多人每次在失意的時(shí)候就喜歡看心靈雞湯,希望能得到慰藉?赐旰笠灿X(jué)得醍醐灌頂,感覺(jué)整個(gè)世界都亮了。但又有幾個(gè)人想過(guò)喝完這些雞湯之后你除了看似重拾夢(mèng)想,你還獲得了什么?你知道怎么去做嗎?《大數(shù)據(jù)時(shí)代》就是這樣一本書(shū)。整本書(shū)從頭到尾都在向讀者講述大數(shù)據(jù)的意義,當(dāng)然期間也會(huì)用相應(yīng)的案例來(lái)證明大數(shù)據(jù)確實(shí)有這樣的能力。但是,整本書(shū)從沒(méi)有涉及到技術(shù)層面的問(wèn)題;蛟S對(duì)于大數(shù)據(jù)這種依靠互聯(lián)網(wǎng)技術(shù)的新事物,即使向讀者講技術(shù),也沒(méi)有幾個(gè)人看得懂,可是整本書(shū)沒(méi)有一點(diǎn)關(guān)于大數(shù)據(jù)思維的技能引導(dǎo)。給出的案例中只有少數(shù)案例向讀者講述了這個(gè)公司為什么要利用大數(shù)據(jù)來(lái)解決這種問(wèn)題,大多數(shù)都只是告訴讀者國(guó)外某家公司運(yùn)用大數(shù)據(jù)得出了某種結(jié)論。同時(shí),在本書(shū)中文譯作者寫的序里,強(qiáng)調(diào)自己翻譯這本著作的一大優(yōu)點(diǎn)是可以結(jié)合國(guó)內(nèi)的案例來(lái)分析書(shū)中的理論,結(jié)果,看到最后一頁(yè)都沒(méi)有看到一個(gè)國(guó)內(nèi)企業(yè)關(guān)于大數(shù)據(jù)運(yùn)用的案例。
之所以我稱之為“心靈雞湯”,還有一個(gè)原因就是作者在書(shū)中大講特講的大數(shù)據(jù)的作用,事實(shí)上按照現(xiàn)在的經(jīng)濟(jì)發(fā)展水平和社會(huì)文明發(fā)展程度是很難實(shí)現(xiàn)的。書(shū)中很多時(shí)候的理論都是要建立在社會(huì)各項(xiàng)文明都發(fā)展健全的基礎(chǔ)上才能實(shí)現(xiàn)。
大數(shù)據(jù)的“傳銷手冊(cè)”
看到這個(gè)標(biāo)題,大家可能會(huì)覺(jué)得我夸大其詞,受到如此多人好評(píng)的書(shū)怎么是“傳銷手冊(cè)”呢?對(duì)于這個(gè)表達(dá),我只想說(shuō)兩點(diǎn):1、此說(shuō)法僅代表我個(gè)人觀點(diǎn),是否認(rèn)同是個(gè)人問(wèn)題。2、此說(shuō)法主要針對(duì)本書(shū)的上部分。
我們都知道傳銷組織在發(fā)展下線的前期是要花大力氣去培訓(xùn)的,也就是洗腦。而對(duì)于一個(gè)陌生又很難以理解的事物,最好的“洗腦”方式就是重復(fù)!洞髷(shù)據(jù)時(shí)代》這本書(shū)就是運(yùn)用這種方式,前半部分為了讓讀者能夠接受“大數(shù)據(jù)”這個(gè)概念,作者反反復(fù)復(fù)提醒讀者大數(shù)據(jù)不是隨機(jī)采樣、不追求精確和不尋找因果關(guān)系。同時(shí)用很多看似很通俗易懂其實(shí)看完后還是不知道說(shuō)了什么的案例來(lái)讓人信服大數(shù)據(jù)的作用。書(shū)中的后半部分雖然也是用這種方式來(lái)感染讀者,可后半部分中作者的暢想和對(duì)大數(shù)據(jù)的威脅分析還是對(duì)讀者有一些實(shí)質(zhì)意義的,所以后半部分的“傳銷”影響就不是很重要。
大數(shù)據(jù)時(shí)代是未來(lái)的趨勢(shì),這誰(shuí)都不會(huì)否認(rèn)。大數(shù)據(jù)改造了我們的生活,改變著我們的世界。不管它是以一種什么樣的姿態(tài)面向世界,它都沒(méi)有錯(cuò),因?yàn)榇髷?shù)據(jù)只是一種工具。但當(dāng)人類開(kāi)始質(zhì)疑甚至恐懼大數(shù)據(jù)的時(shí)候,人類就該思考自己是否利用好這個(gè)好工具了。
《大數(shù)據(jù)時(shí)代》讀書(shū)心得體會(huì) 篇22
《大數(shù)據(jù)時(shí)代》是英國(guó)維克托·邁爾-舍恩伯格教授的著作,這本書(shū)也被尊為國(guó)外大數(shù)據(jù)研究的先河之作。這本書(shū)最大的優(yōu)點(diǎn)就在于作者利用上百個(gè)例子來(lái)對(duì)大數(shù)據(jù)的方方面面做了詳細(xì)解說(shuō),讓外行也很容易理解。結(jié)構(gòu)上,作者通過(guò)大數(shù)據(jù)時(shí)代的思維變革、商業(yè)變革和管理變革三個(gè)角度依次闡述,條理清晰。
所謂"大數(shù)據(jù)",按作者的說(shuō)法,就是"所有數(shù)據(jù)"。隨著計(jì)算機(jī)運(yùn)算速度和存儲(chǔ)能力的發(fā)展,收集數(shù)據(jù)變得越來(lái)越簡(jiǎn)單,儲(chǔ)存數(shù)據(jù)的成本越來(lái)越低。在過(guò)去,由于技術(shù)限制,人們做統(tǒng)計(jì)時(shí)只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機(jī)樣本的選擇,努力減小因樣本問(wèn)題出現(xiàn)的誤差;統(tǒng)計(jì)結(jié)果往往不能重復(fù)使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來(lái)不可避免的精確性問(wèn)題。 "小數(shù)據(jù)"時(shí)代,一個(gè)樣本的錯(cuò)誤就可以造成對(duì)總體估計(jì)的失敗,幸運(yùn)的是,"大數(shù)據(jù)"時(shí)代對(duì)精確性不再那么要求苛刻——也無(wú)法要求太嚴(yán)格——數(shù)據(jù)的數(shù)量足以彌補(bǔ)這一缺陷。在對(duì)思維變革這一部分的闡述中,最重要也是全書(shū)的核心觀點(diǎn)就是大數(shù)據(jù)時(shí)代,我們應(yīng)該從追求"因果關(guān)系"的舊思維方式向追求"相關(guān)關(guān)系"轉(zhuǎn)變。 在我看來(lái),這實(shí)際上是通過(guò)大數(shù)據(jù)來(lái)透視一種事物的發(fā)展趨勢(shì),而很多精確學(xué)科領(lǐng)域依然需要探尋"因果關(guān)系"解決更有針對(duì)性的問(wèn)題,所以,這局限了這一轉(zhuǎn)變只能在特定的領(lǐng)域發(fā)生。作者自己也說(shuō),"大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。"
大數(shù)據(jù)時(shí)代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬(wàn)物都可以被數(shù)據(jù)化后用來(lái)分析。對(duì)這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價(jià)值,更要放眼它未來(lái)可能的用途以提高數(shù)據(jù)的利用率。當(dāng)然數(shù)據(jù)并不是無(wú)限使用,時(shí)效、環(huán)境的變化肯定會(huì)對(duì)數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應(yīng)當(dāng)考慮的。這又引出了對(duì)數(shù)據(jù)這一無(wú)形資產(chǎn)的估值可能性。對(duì)于Facebook, Twitter這樣的公司來(lái)說(shuō),數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負(fù)債表上給他們一個(gè)公正的體現(xiàn)正是我們需要考慮的。
大數(shù)據(jù)時(shí)代的價(jià)值鏈由三部分構(gòu)成,我把它們簡(jiǎn)化為"生產(chǎn)—分析—使用"三個(gè)環(huán)節(jié),這對(duì)應(yīng)書(shū)中的三種類型公司: 第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價(jià)值,但作者認(rèn)為,最終,大部分的價(jià)值還是必須從數(shù)據(jù)本身來(lái)挖掘。這是假定了一個(gè)成熟的市場(chǎng),人人都了解了大數(shù)據(jù)的用途。
對(duì)于普通人來(lái)說(shuō),大數(shù)據(jù)時(shí)代最關(guān)心的還是隱私問(wèn)題。不知不覺(jué)中,個(gè)人的一舉一動(dòng)都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風(fēng)險(xiǎn)。對(duì)此,作者提出了使用者承擔(dān)責(zé)任的解決辦法,而不是過(guò)去那種流于形式的使用授權(quán)。大數(shù)據(jù)甚至能預(yù)測(cè)一個(gè)人的犯罪動(dòng)機(jī),這給監(jiān)管者帶來(lái)的難題是,預(yù)測(cè)一個(gè)人要犯罪,懲罰還是不懲罰?在這點(diǎn)上,社會(huì)達(dá)成"個(gè)人僅需對(duì)行為而非動(dòng)機(jī)負(fù)責(zé)"的共識(shí)非常重要。
大數(shù)據(jù)時(shí)代的風(fēng)險(xiǎn)控制靠的是"算法師",類似會(huì)計(jì)師一樣的職業(yè),對(duì)大數(shù)據(jù)的準(zhǔn)確度或有效性進(jìn)行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨(dú)裁。當(dāng)今的法律亦需對(duì)大數(shù)據(jù)監(jiān)管進(jìn)行修訂補(bǔ)充。
當(dāng)代大數(shù)據(jù)發(fā)展主要由科技公司推動(dòng),相信在不久的將來(lái)更多的傳統(tǒng)領(lǐng)域會(huì)意識(shí)到大數(shù)據(jù)的重要性。但我們也應(yīng)該保持清醒,大數(shù)據(jù)并不是萬(wàn)能藥,對(duì)某些領(lǐng)域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡(jiǎn)單且實(shí)用的選擇;但對(duì)某些領(lǐng)域,盲目使用大數(shù)據(jù)只會(huì)適得其反。