早期在描述大數(shù)據(jù)的時(shí)候,往往從大數(shù)據(jù)本身的特點(diǎn)來入手,比如數(shù)據(jù)量大、速度快、數(shù)據(jù)類型多樣化、價(jià)值密度低、真假難辨等等,但是對于普通人來即使知道了這些特點(diǎn),對于大數(shù)據(jù)的概念依然是模糊的,依然不知道大數(shù)據(jù)到底用來做什么,能夠與普通人產(chǎn)生哪些連接。
1、什么是大數(shù)據(jù)?
這是一個(gè)非常好的問題,作為一名IT從業(yè)者,同時(shí)也是一名計(jì)算機(jī)專業(yè)的教育工作者,我來回答一下。首先,要想把大數(shù)據(jù)搞清楚,首先要明白大數(shù)據(jù)本身并不是一個(gè)單一的概念,如今的大數(shù)據(jù)已經(jīng)發(fā)展成了一個(gè)龐大的生態(tài)體系,涉及到的產(chǎn)業(yè)鏈也在不斷完善和發(fā)展,隨著大數(shù)據(jù)技術(shù)體系逐漸成熟,大數(shù)據(jù)的落地應(yīng)用已經(jīng)開始逐漸展開,隨著諸多行業(yè)企業(yè)紛紛實(shí)現(xiàn)業(yè)務(wù)上云,未來大數(shù)據(jù)的應(yīng)用場景會越來越多,大數(shù)據(jù)所構(gòu)建起來的價(jià)值空間也有很大的潛力。
早期在描述大數(shù)據(jù)的時(shí)候,往往從大數(shù)據(jù)本身的特點(diǎn)來入手,比如數(shù)據(jù)量大、速度快、數(shù)據(jù)類型多樣化、價(jià)值密度低、真假難辨等等,但是對于普通人來說,即使知道了這些特點(diǎn),對于大數(shù)據(jù)的概念依然是模糊的,依然不知道大數(shù)據(jù)到底用來做什么,能夠與普通人產(chǎn)生哪些連接,實(shí)際上,要想了解大數(shù)據(jù),首先要搞清楚大數(shù)據(jù)的目的,大數(shù)據(jù)的目的就是實(shí)現(xiàn)數(shù)據(jù)的價(jià)值化,大數(shù)據(jù)的所有操作幾乎都是圍繞數(shù)據(jù)價(jià)值化展開的,包括數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)存儲、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用等等,這一系列環(huán)節(jié)都是圍繞數(shù)據(jù)的價(jià)值增量來展開的,最終通過數(shù)據(jù)應(yīng)用來完成價(jià)值體現(xiàn)。
簡單的說,通過大數(shù)據(jù)能夠讓更多的數(shù)據(jù)產(chǎn)生價(jià)值,通過大數(shù)據(jù)能夠讓數(shù)據(jù)的價(jià)值進(jìn)行傳遞(賦能)和提升,通過大數(shù)據(jù)能夠讓數(shù)據(jù)逐漸成為一個(gè)重要的生產(chǎn)材料,通過大數(shù)據(jù)能夠衡量一個(gè)企業(yè)的價(jià)值和發(fā)展?jié)摿Φ鹊?,隨著工業(yè)互聯(lián)網(wǎng)的發(fā)展,未來大數(shù)據(jù)本身所承載的價(jià)值空間會越來越大,我從事互聯(lián)網(wǎng)行業(yè)多年,目前也在帶計(jì)算機(jī)專業(yè)的研究生,主要的研究方向集中在大數(shù)據(jù)和人工智能領(lǐng)域,我會陸續(xù)寫一些關(guān)于互聯(lián)網(wǎng)技術(shù)方面的文章,感興趣的朋友可以關(guān)注我,相信一定會有所收獲。
2、大數(shù)據(jù)是什么?
采集記錄足夠多的數(shù)據(jù),使工作更加針對化和精準(zhǔn)化,這是大數(shù)據(jù)嗎?這不是大數(shù)據(jù)而只是數(shù)據(jù)化,什么是大數(shù)據(jù)呢?例如洛杉磯警方曾對以往的刑事案件做了統(tǒng)計(jì),通過算法得出了第二天的高概率犯罪地點(diǎn),然后有針對性的派警察去該處巡邏,從而使得當(dāng)?shù)氐姆缸铿F(xiàn)象下降20%。這是大數(shù)據(jù),再比如,經(jīng)濟(jì)學(xué)家都認(rèn)為股票無法預(yù)測,而一位劍橋大學(xué)畢業(yè)的博士搞了個(gè)公司,對有史以來幾乎所有的證券交易的數(shù)據(jù)進(jìn)行記錄,然后通過算法進(jìn)行分析。
他對什么國家政策、公司業(yè)績、行業(yè)走向等等一眼都不看,100%地排除主觀意志的,只根據(jù)計(jì)算結(jié)果來進(jìn)行投資,最后賺了大錢,這是大數(shù)據(jù)。大數(shù)據(jù)的精髓并不在于數(shù)據(jù)的精準(zhǔn)和數(shù)量,而在于對內(nèi)在規(guī)律的挖掘和對未來趨勢的預(yù)測,其思路是:一個(gè)結(jié)果是有很多原因的,原因作用的強(qiáng)度可能是隨機(jī)的,我們對其中作用的機(jī)理并不清楚。
我們難以找出規(guī)律性,但知道規(guī)律性就蘊(yùn)含在結(jié)果數(shù)據(jù)之中,如果我們能建設(shè)合適的模型,寫出好的算法,就有可能把這個(gè)規(guī)律性提煉出來,從而能科學(xué)地發(fā)現(xiàn)真相和預(yù)測未來,今天上午在貴州省大數(shù)據(jù)中心看到了大數(shù)據(jù)應(yīng)用的事例。金潤建設(shè)和鵬潤達(dá)這兩家企業(yè)分別投標(biāo)200多次,一次也沒中過,依然積極地投,投標(biāo)是要成本的,這兩家公司那里來的動力?通過大數(shù)據(jù)的知識挖掘技術(shù),發(fā)現(xiàn)了它們總是陪著固定的一家公司一同招標(biāo),最后總是那家公司中標(biāo)。
3、大數(shù)據(jù)的概念和應(yīng)用,到底是什么?
大數(shù)據(jù)技術(shù)是指從各種各樣類型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,適用于大數(shù)據(jù)的技術(shù)。包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫,數(shù)據(jù)挖掘電網(wǎng),分布式文件系統(tǒng),分布式數(shù)據(jù)庫,云計(jì)算平臺,互聯(lián)網(wǎng),和可擴(kuò)展的存儲系統(tǒng),大數(shù)據(jù)的應(yīng)用:大數(shù)據(jù)是信息產(chǎn)業(yè)持續(xù)高速增長的新引擎,幾乎各個(gè)行業(yè)都會逐步引入大數(shù)據(jù)技術(shù),尤其是那些將要實(shí)現(xiàn)互聯(lián)網(wǎng)信息化轉(zhuǎn)型的傳統(tǒng)企業(yè)。