當前位置:首頁(yè) » 專(zhuān)題報道 » 2018年春節專(zhuān)題 » 關(guān)鍵詞
大數據
2017年12月22日 14:53 來(lái)源:中國政府采購網(wǎng) 【打印】
對于“大數據”(Big data)研究機構Gartner給出了這樣的定義?!按髷祿笔切枰绿幚砟J讲拍芫哂懈鼜姷臎Q策力、洞察發(fā)現力和流程優(yōu)化能力來(lái)適應海量、高增長(cháng)率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類(lèi)型和價(jià)值密度低四大特征。
大數據技術(shù)的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進(jìn)行專(zhuān)業(yè)化處理。換而言之,如果把大數據比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現盈利的關(guān)鍵,在于提高對數據的“加工能力”,通過(guò)“加工”實(shí)現數據的“增值”。
從技術(shù)上看,大數據與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數據必然無(wú)法用單臺的計算機進(jìn)行處理,必須采用分布式架構。它的特色在于對海量數據進(jìn)行分布式數據挖掘。但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術(shù)。
隨著(zhù)云時(shí)代的來(lái)臨,大數據(Big data)也吸引了越來(lái)越多的關(guān)注。分析師團隊認為,大數據(Big data)通常用來(lái)形容一個(gè)公司創(chuàng )造的大量非結構化數據和半結構化數據,這些數據在下載到關(guān)系型數據庫用于分析時(shí)會(huì )花費過(guò)多時(shí)間和金錢(qián)。大數據分析常和云計算聯(lián)系到一起,因為實(shí)時(shí)的大型數據集分析需要像MapReduce一樣的框架來(lái)向數十、數百或甚至數千的電腦分配工作。
大數據需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過(guò)時(shí)間內的數據。適用于大數據的技術(shù),包括大規模并行處理(MPP)數據庫、數據挖掘、分布式文件系統、分布式數據庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統。
最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
相關(guān)文章