早期在描述大數(shù)據(jù)的時(shí)候,往往從大數(shù)據(jù)本身的特點(diǎn)來(lái)入手,比如數(shù)據(jù)量大、速度快、數(shù)據(jù)類(lèi)型多樣化、價(jià)值密度低、真假難辨等等,但是對(duì)于普通人來(lái)即使知道了這些特點(diǎn),對(duì)于大數(shù)據(jù)的概念依然是模糊的,依然不知道大數(shù)據(jù)到底用來(lái)做什么,能夠與普通人產(chǎn)生哪些連接。
1、什么是大數(shù)據(jù)?
這是一個(gè)非常好的問(wèn)題,作為一名IT從業(yè)者,同時(shí)也是一名計(jì)算機(jī)專(zhuān)業(yè)的教育工作者,我來(lái)回答一下。首先,要想把大數(shù)據(jù)搞清楚,首先要明白大數(shù)據(jù)本身并不是一個(gè)單一的概念,如今的大數(shù)據(jù)已經(jīng)發(fā)展成了一個(gè)龐大的生態(tài)體系,涉及到的產(chǎn)業(yè)鏈也在不斷完善和發(fā)展,隨著大數(shù)據(jù)技術(shù)體系逐漸成熟,大數(shù)據(jù)的落地應(yīng)用已經(jīng)開(kāi)始逐漸展開(kāi),隨著諸多行業(yè)企業(yè)紛紛實(shí)現(xiàn)業(yè)務(wù)上云,未來(lái)大數(shù)據(jù)的應(yīng)用場(chǎng)景會(huì)越來(lái)越多,大數(shù)據(jù)所構(gòu)建起來(lái)的價(jià)值空間也有很大的潛力。
早期在描述大數(shù)據(jù)的時(shí)候,往往從大數(shù)據(jù)本身的特點(diǎn)來(lái)入手,比如數(shù)據(jù)量大、速度快、數(shù)據(jù)類(lèi)型多樣化、價(jià)值密度低、真假難辨等等,但是對(duì)于普通人來(lái)說(shuō),即使知道了這些特點(diǎn),對(duì)于大數(shù)據(jù)的概念依然是模糊的,依然不知道大數(shù)據(jù)到底用來(lái)做什么,能夠與普通人產(chǎn)生哪些連接,實(shí)際上,要想了解大數(shù)據(jù),首先要搞清楚大數(shù)據(jù)的目的,大數(shù)據(jù)的目的就是實(shí)現(xiàn)數(shù)據(jù)的價(jià)值化,大數(shù)據(jù)的所有操作幾乎都是圍繞數(shù)據(jù)價(jià)值化展開(kāi)的,包括數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用等等,這一系列環(huán)節(jié)都是圍繞數(shù)據(jù)的價(jià)值增量來(lái)展開(kāi)的,最終通過(guò)數(shù)據(jù)應(yīng)用來(lái)完成價(jià)值體現(xiàn)。
簡(jiǎn)單的說(shuō),通過(guò)大數(shù)據(jù)能夠讓更多的數(shù)據(jù)產(chǎn)生價(jià)值,通過(guò)大數(shù)據(jù)能夠讓數(shù)據(jù)的價(jià)值進(jìn)行傳遞(賦能)和提升,通過(guò)大數(shù)據(jù)能夠讓數(shù)據(jù)逐漸成為一個(gè)重要的生產(chǎn)材料,通過(guò)大數(shù)據(jù)能夠衡量一個(gè)企業(yè)的價(jià)值和發(fā)展?jié)摿Φ鹊龋S著工業(yè)互聯(lián)網(wǎng)的發(fā)展,未來(lái)大數(shù)據(jù)本身所承載的價(jià)值空間會(huì)越來(lái)越大,我從事互聯(lián)網(wǎng)行業(yè)多年,目前也在帶計(jì)算機(jī)專(zhuān)業(yè)的研究生,主要的研究方向集中在大數(shù)據(jù)和人工智能領(lǐng)域,我會(huì)陸續(xù)寫(xiě)一些關(guān)于互聯(lián)網(wǎng)技術(shù)方面的文章,感興趣的朋友可以關(guān)注我,相信一定會(huì)有所收獲。
2、大數(shù)據(jù)是什么?
采集記錄足夠多的數(shù)據(jù),使工作更加針對(duì)化和精準(zhǔn)化,這是大數(shù)據(jù)嗎?這不是大數(shù)據(jù)而只是數(shù)據(jù)化,什么是大數(shù)據(jù)呢?例如洛杉磯警方曾對(duì)以往的刑事案件做了統(tǒng)計(jì),通過(guò)算法得出了第二天的高概率犯罪地點(diǎn),然后有針對(duì)性的派警察去該處巡邏,從而使得當(dāng)?shù)氐姆缸铿F(xiàn)象下降20%。這是大數(shù)據(jù),再比如,經(jīng)濟(jì)學(xué)家都認(rèn)為股票無(wú)法預(yù)測(cè),而一位劍橋大學(xué)畢業(yè)的博士搞了個(gè)公司,對(duì)有史以來(lái)幾乎所有的證券交易的數(shù)據(jù)進(jìn)行記錄,然后通過(guò)算法進(jìn)行分析。
他對(duì)什么國(guó)家政策、公司業(yè)績(jī)、行業(yè)走向等等一眼都不看,100%地排除主觀意志的,只根據(jù)計(jì)算結(jié)果來(lái)進(jìn)行投資,最后賺了大錢(qián),這是大數(shù)據(jù)。大數(shù)據(jù)的精髓并不在于數(shù)據(jù)的精準(zhǔn)和數(shù)量,而在于對(duì)內(nèi)在規(guī)律的挖掘和對(duì)未來(lái)趨勢(shì)的預(yù)測(cè),其思路是:一個(gè)結(jié)果是有很多原因的,原因作用的強(qiáng)度可能是隨機(jī)的,我們對(duì)其中作用的機(jī)理并不清楚。
我們難以找出規(guī)律性,但知道規(guī)律性就蘊(yùn)含在結(jié)果數(shù)據(jù)之中,如果我們能建設(shè)合適的模型,寫(xiě)出好的算法,就有可能把這個(gè)規(guī)律性提煉出來(lái),從而能科學(xué)地發(fā)現(xiàn)真相和預(yù)測(cè)未來(lái),今天上午在貴州省大數(shù)據(jù)中心看到了大數(shù)據(jù)應(yīng)用的事例。金潤(rùn)建設(shè)和鵬潤(rùn)達(dá)這兩家企業(yè)分別投標(biāo)200多次,一次也沒(méi)中過(guò),依然積極地投,投標(biāo)是要成本的,這兩家公司那里來(lái)的動(dòng)力?通過(guò)大數(shù)據(jù)的知識(shí)挖掘技術(shù),發(fā)現(xiàn)了它們總是陪著固定的一家公司一同招標(biāo),最后總是那家公司中標(biāo)。
3、大數(shù)據(jù)的概念和應(yīng)用,到底是什么?
非常高興回答您的這個(gè)問(wèn)題,以下是我自己的一些理解和看法:大數(shù)據(jù)的本質(zhì)是:大量多維、多形式的數(shù)據(jù),它包含每個(gè)時(shí)空節(jié)點(diǎn)的信息。如果我們認(rèn)為人工智能是嬰兒喂養(yǎng)的,那么每個(gè)領(lǐng)域的大數(shù)據(jù)就是喂養(yǎng)嬰兒的奶粉量——“奶粉”的量決定了嬰兒能生長(zhǎng)多長(zhǎng)時(shí)間,“奶粉”的質(zhì)量決定了嬰兒的智力發(fā)展水平,馬云在16年中提到大數(shù)據(jù)是未來(lái)的新能源。