国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

MongoDB讀書筆記-大數(shù)據(jù)

fengxiuping / 1720人閱讀

摘要:大數(shù)據(jù)大數(shù)據(jù)是用于描述海量的具有各種結(jié)構(gòu)并且高速生成的數(shù)據(jù)的一個(gè)術(shù)語(yǔ)這類數(shù)據(jù)對(duì)用于存儲(chǔ)和處理數(shù)據(jù)傳統(tǒng)即關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)提出了挑戰(zhàn)大數(shù)據(jù)為處理和存儲(chǔ)數(shù)據(jù)的新途徑鋪平了道路在本章節(jié)中我們將探討大數(shù)據(jù)基礎(chǔ)來源以及挑戰(zhàn)將介紹大數(shù)據(jù)的三個(gè)數(shù)量

大數(shù)據(jù)

大數(shù)據(jù)是用于描述海量的,具有各種結(jié)構(gòu)并且高速生成的數(shù)據(jù)的一個(gè)術(shù)語(yǔ).這類數(shù)據(jù)對(duì)用于存儲(chǔ)和處理數(shù)據(jù)傳統(tǒng)RDBMS(即關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng))提出了挑戰(zhàn).大數(shù)據(jù)為處理和存儲(chǔ)數(shù)據(jù)的新途徑鋪平了道路.
在本章節(jié)中,我們將探討大數(shù)據(jù)基礎(chǔ)、來源以及挑戰(zhàn),將介紹大數(shù)據(jù)的三個(gè)V---數(shù)量(volume)、速率(velocity)和多樣性(variety).

入門指南

供應(yīng)給大眾使用的互聯(lián)網(wǎng)和電子設(shè)備,其數(shù)量每天都在增長(zhǎng).尤其是,智能手機(jī)、社交網(wǎng)絡(luò)站點(diǎn)以及像平板電腦和傳感器這樣的其他數(shù)據(jù)生成設(shè)備都在導(dǎo)致數(shù)據(jù)爆炸性增長(zhǎng).
智能手機(jī)、社交網(wǎng)絡(luò)站點(diǎn)以及其他媒體都在創(chuàng)造數(shù)據(jù)洪流以便這些公司能夠處理和存儲(chǔ).當(dāng)數(shù)據(jù)的大小對(duì)典型軟件工具捕獲、處理、存儲(chǔ)和管理數(shù)據(jù)的能力提出挑戰(zhàn)時(shí),我們就面臨大數(shù)據(jù)的處理.

大數(shù)據(jù)

大數(shù)據(jù)是具有高容量的、高速生成的并且具有多種樣式的數(shù)據(jù).
IDC的分析表明,一年中所產(chǎn)生的數(shù)字?jǐn)?shù)據(jù)量要比整個(gè)世界用于存儲(chǔ)它的總體容量還大,這意味著沒有辦法存儲(chǔ)所產(chǎn)生的所有數(shù)據(jù).
大數(shù)據(jù)的商業(yè)和經(jīng)濟(jì)潛力以及其廣闊的影響是很重要的問題,商業(yè)領(lǐng)袖和政策制定者必須應(yīng)對(duì)該問題.

大數(shù)據(jù)的大小因行業(yè)而異

有些行業(yè)展現(xiàn)出了遠(yuǎn)高于其他行業(yè)的數(shù)據(jù)強(qiáng)度水平;在這里,數(shù)據(jù)強(qiáng)度指的是該行業(yè)中跨公司/企業(yè)所累積的數(shù)據(jù)的平均量,這表明這些公司/企業(yè)擁有更多的從大數(shù)據(jù)中獲得價(jià)值的潛力.
金融服務(wù)行業(yè),其中包括銀行、投資以及安全服務(wù),都是高度交易導(dǎo)向的;根據(jù)法規(guī),它們也被要求存儲(chǔ)數(shù)據(jù).
通信和媒體公司、公用事業(yè)以及政府,這些領(lǐng)域中的每家企業(yè)或組織同樣存儲(chǔ)了大量的數(shù)字?jǐn)?shù)據(jù).
離散型和流程式制造業(yè)具有以字節(jié)方式存儲(chǔ)的最高水平的聚合數(shù)據(jù),不過,這些行業(yè)在強(qiáng)度排名要遠(yuǎn)低得多.

大數(shù)據(jù)的類型因行業(yè)而異

數(shù)據(jù)存儲(chǔ)的類型也會(huì)因行業(yè)而異.例如,
零售業(yè)和批發(fā)業(yè)、政府的行政管理部門以及金融服務(wù)都會(huì)產(chǎn)生大量的文本和數(shù)值數(shù)據(jù),其中包括客戶數(shù)據(jù)、交易信息以及數(shù)學(xué)建模和模擬.
制造、醫(yī)療衛(wèi)生、媒體和通信這樣的行業(yè)都要負(fù)責(zé)處理和存儲(chǔ)較高比例的多媒體數(shù)據(jù).
在大數(shù)據(jù)的地理性傳播方面,目前北美和歐洲占據(jù)了全球總量的70%.幸虧有云計(jì)算,一個(gè)地區(qū)產(chǎn)生的數(shù)據(jù)才能被存儲(chǔ)到另一個(gè)國(guó)家的數(shù)據(jù)中心.因此擁有大量云和主機(jī)服務(wù)提供商產(chǎn)品的國(guó)家往往具有大量的數(shù)據(jù)存儲(chǔ).

大數(shù)據(jù)源

正如MGI報(bào)告中所強(qiáng)調(diào)的,這些數(shù)據(jù)的主要來源是:

企業(yè),如今它們正在收集更多粒度的數(shù)據(jù),其中包含每筆交易的更多詳細(xì)信息,,以便理解消費(fèi)者的行為.

跨行多媒體使用的增長(zhǎng),例如醫(yī)療衛(wèi)生、商品量產(chǎn)公司等.

日益流行的社交媒體站點(diǎn),例如facebook、Twitter等.

智能手機(jī)的迅速普及,它們使得用戶積極地使用社交媒體站點(diǎn)以及其他互聯(lián)網(wǎng)應(yīng)用.

日常生活中傳感器和設(shè)備使用的增加,網(wǎng)絡(luò)將它們與計(jì)算機(jī)資源連接在一起.

數(shù)據(jù)的增長(zhǎng)速度正在提高,并且其多樣性也是如此.另外,數(shù)據(jù)產(chǎn)生的模型已經(jīng)從一種模式(一些公司產(chǎn)生數(shù)據(jù),而其他公司消費(fèi)這些數(shù)據(jù))轉(zhuǎn)變?yōu)榱硪环N模式(每個(gè)人都產(chǎn)生數(shù)據(jù),而每個(gè)人也都消費(fèi)這些數(shù)據(jù)).這是由于消費(fèi)者信息技術(shù)和互聯(lián)網(wǎng)技術(shù)伴隨著像社交媒體這樣的潮流而滲透到人們的生活中所造成的.

大數(shù)據(jù)的三個(gè)V

我們已經(jīng)用三個(gè)V定義了大數(shù)據(jù):數(shù)量、速率以及多樣性."大"并不僅僅指數(shù)量

數(shù)量

大數(shù)據(jù)中的數(shù)量意味著數(shù)據(jù)的大小.正如上述所討論過的,各種因素都會(huì)導(dǎo)致數(shù)據(jù)大小的增加.
這樣大量的數(shù)據(jù)對(duì)于大數(shù)據(jù)技術(shù)來說是最大的挑戰(zhàn).用及時(shí)有效且低成本的方式來存儲(chǔ)、處理和訪問數(shù)據(jù),其所需的存儲(chǔ)和處理能力是巨大的.

多樣性

從各種設(shè)備和來源產(chǎn)生的數(shù)據(jù)并不遵循固定的格式或結(jié)構(gòu).如今無法對(duì)數(shù)據(jù)的結(jié)構(gòu)進(jìn)行控制.新的數(shù)據(jù)來源和結(jié)構(gòu)正在被飛速創(chuàng)建.因此技術(shù)上的責(zé)任在于找到一個(gè)解決方案來分析和可視化所存在的大量各式各樣的數(shù)據(jù).

速率

大數(shù)據(jù)中的速率是指數(shù)據(jù)被創(chuàng)造的速度以及處理這些數(shù)據(jù)所需要的速度.如果無法按照所需的速度處理數(shù)據(jù),它就失去了其意義.在處理數(shù)據(jù)的速率方面,能夠足夠快速地做出反應(yīng)并且進(jìn)行處理是大數(shù)據(jù)技術(shù)的另一個(gè)挑戰(zhàn).
在討論大數(shù)據(jù)時(shí)都會(huì)談及第4個(gè)V.這第4個(gè)V就是真實(shí)性(veracity),它意味著并非所有的數(shù)據(jù)都是重要的,因此識(shí)別出哪些數(shù)據(jù)能夠提供有意義的見解,哪些應(yīng)該被忽略是至關(guān)重要的.

傳統(tǒng)系統(tǒng)和大數(shù)據(jù) 大數(shù)據(jù)的結(jié)構(gòu)

傳統(tǒng)系統(tǒng)旨在處理結(jié)構(gòu)化的數(shù)據(jù),其中帶有列的表都是定義好的.保存在列中的數(shù)據(jù)格式也是預(yù)先就知道的.
由于大數(shù)據(jù)可以是非結(jié)構(gòu)化的,因此被創(chuàng)建以執(zhí)行快速查詢和分析的傳統(tǒng)系統(tǒng)就無法被用于保存或處理大數(shù)據(jù).

數(shù)據(jù)存儲(chǔ)

傳統(tǒng)系統(tǒng)使用了大型服務(wù)器以及NAS和SAN系統(tǒng)來存儲(chǔ)數(shù)據(jù).隨著數(shù)據(jù)的增長(zhǎng),就必須增加服務(wù)器的大小以及后端存儲(chǔ)大小.
傳統(tǒng)的舊式系統(tǒng)通常運(yùn)行于可縱向拓展的模型中,需要為一臺(tái)服務(wù)器添加越來越多的計(jì)算資源、內(nèi)存和存儲(chǔ)來滿足日益增長(zhǎng)的數(shù)據(jù)需求.

數(shù)據(jù)處理

傳統(tǒng)系統(tǒng)中的算法旨在處理結(jié)構(gòu)化數(shù)據(jù),比如字符串和整數(shù).它們也受到數(shù)據(jù)大小的限制.
因此傳統(tǒng)系統(tǒng)無法應(yīng)對(duì)非結(jié)構(gòu)化數(shù)據(jù)和大量此類數(shù)據(jù)的處理,以及需要執(zhí)行的處理所需達(dá)到的速度.

大數(shù)據(jù)技術(shù)

以下是讓組織能夠最大限度地利用其大數(shù)據(jù)的最新技術(shù)進(jìn)步:

特別為大型非結(jié)構(gòu)化數(shù)據(jù)設(shè)計(jì)的新的存儲(chǔ)和處理技術(shù)

并行處理

群集

大型網(wǎng)格環(huán)境

高連通性和高吞吐量

云計(jì)算和橫向拓展結(jié)構(gòu)

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/19056.html

相關(guān)文章

  • MongoDB權(quán)威指南讀書筆記(一)

    摘要:如果沒有找到找到符合條件的文檔,就會(huì)以這個(gè)條件和更新文檔為基礎(chǔ)新建一個(gè)新的文檔。使用它可以快速方便的對(duì)文檔進(jìn)行更新。更新多個(gè)文檔默認(rèn)情況下,文檔的更新只針對(duì)第一個(gè)匹配到的文檔,多個(gè)條件符合時(shí),其它文檔不會(huì)改變。 what is MongoDB ? 面向文檔的數(shù)據(jù)庫(kù) 不再有行的概念,不再有預(yù)定義模式 易于拓展 豐富的功能 索引 聚合 特殊的集合類型 文件存儲(chǔ) 高性能 可以一個(gè)示...

    Barrior 評(píng)論0 收藏0
  • MongoDB權(quán)威指南讀書筆記(一)

    摘要:如果沒有找到找到符合條件的文檔,就會(huì)以這個(gè)條件和更新文檔為基礎(chǔ)新建一個(gè)新的文檔。使用它可以快速方便的對(duì)文檔進(jìn)行更新。更新多個(gè)文檔默認(rèn)情況下,文檔的更新只針對(duì)第一個(gè)匹配到的文檔,多個(gè)條件符合時(shí),其它文檔不會(huì)改變。 what is MongoDB ? 面向文檔的數(shù)據(jù)庫(kù) 不再有行的概念,不再有預(yù)定義模式 易于拓展 豐富的功能 索引 聚合 特殊的集合類型 文件存儲(chǔ) 高性能 可以一個(gè)示...

    sixleaves 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<