回答:這個太范化了吧。大數(shù)據(jù)架構(gòu)選擇的方案就有很多,海量數(shù)據(jù)的即席查詢本省就是業(yè)內(nèi)目前的痛點,暫時沒有太好的解決方案,kylin等框架也只是一個折中方案,如果你不是要求海量數(shù)據(jù)分析的秒級響應(yīng)的話sparkSql、presto等都是不錯的方案,分鐘級別可以返回。
回答:隨著云計算的高速發(fā)展,越來越多的應(yīng)用需要存儲海量數(shù)據(jù),并且對高并發(fā)和處理海量數(shù)據(jù)提出了更高的要求,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫對于這些應(yīng)用場景難以滿足應(yīng)用需求。作為NoSQL數(shù)據(jù)庫之一的MongoDB數(shù)據(jù)庫能夠完全滿足和解決在海量數(shù)據(jù)存儲方面的應(yīng)用,越來越多的大網(wǎng)站和企業(yè)選擇MongoDB代替Mysql進(jìn)行存儲。什么是MongoDB?MongoDB[1] 是一個基于分布式文件存儲的數(shù)據(jù)庫。由C 語言編寫。旨...
回答:通常來說,當(dāng)數(shù)據(jù)多、并發(fā)量大的時候,架構(gòu)中可以引入Redis,幫助提升架構(gòu)的整體性能,減少Mysql(或其他數(shù)據(jù)庫)的壓力,但不是使用Redis,就不用MySQL。因為Redis的性能十分優(yōu)越,可以支持每秒十幾萬此的讀/寫操作,并且它還支持持久化、集群部署、分布式、主從同步等,Redis在高并發(fā)的場景下數(shù)據(jù)的安全和一致性,所以它經(jīng)常用于兩個場景:緩存經(jīng)常會被查詢,但是不經(jīng)常被修改或者刪除的數(shù)據(jù);比...
回答:近幾年,大數(shù)據(jù)的概念逐漸深入人心,大數(shù)據(jù)的趨勢越來越火爆。但是,大數(shù)據(jù)到底是個啥?怎么樣才能玩好大數(shù)據(jù)呢?大數(shù)據(jù)的基本含義就是海量數(shù)據(jù),麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征。數(shù)字經(jīng)濟(jì)的要素之一就是大數(shù)據(jù)資源,現(xiàn)在大家聊得最多的大數(shù)據(jù)是基于已經(jīng)存在的...
回答:在大數(shù)據(jù)領(lǐng)域大概有四個大的工作方向,除了大數(shù)據(jù)平臺應(yīng)用及開發(fā)、大數(shù)據(jù)分析與應(yīng)用和大數(shù)據(jù)平臺集成與運(yùn)維之外,還有大數(shù)據(jù)平臺架構(gòu)與研發(fā),除了以上四個大的工作方向之外,還有一個工作方向是大數(shù)據(jù)技術(shù)推廣和培訓(xùn),這部分工作目前也有不少人在從事。大數(shù)據(jù)平臺架構(gòu)與研發(fā)主要的工作內(nèi)容是研發(fā)底層的大數(shù)據(jù)平臺,這部分工作的難度較高,從事這部分工作的研發(fā)級崗位也并不多。現(xiàn)在不少技術(shù)研發(fā)團(tuán)隊都以Hadoop、Spark平...
回答:采集記錄足夠多的數(shù)據(jù),使工作更加針對化和精準(zhǔn)化,這是大數(shù)據(jù)嗎?這不是大數(shù)據(jù)而只是數(shù)據(jù)化。什么是大數(shù)據(jù)呢?例如洛杉磯警方曾對以往的刑事案件做了統(tǒng)計,通過算法得出了第二天的高概率犯罪地點,然后有針對性的派警察去該處巡邏,從而使得當(dāng)?shù)氐姆缸铿F(xiàn)象下降20%。這是大數(shù)據(jù)。再比如,經(jīng)濟(jì)學(xué)家都認(rèn)為股票無法預(yù)測,而一位劍橋大學(xué)畢業(yè)的博士搞了個公司,對有史以來幾乎所有的證券交易的數(shù)據(jù)進(jìn)行記錄,然后通過算法進(jìn)行分析。...
云計算正在走向成熟,大數(shù)據(jù)正在發(fā)展 在經(jīng)歷了對云計算的認(rèn)識以后,已經(jīng)成為當(dāng)前信息通信行業(yè)的主旋律。我們可以用維基百科看一看當(dāng)前對三個重要技術(shù)概念的理解。一個是曾經(jīng)人們跟云計算混淆不清的網(wǎng)格計算,一個是...
...機(jī)器學(xué)習(xí)與深度學(xué)習(xí)? 大家好,我是楊鋒,作為一個大數(shù)據(jù)從業(yè)人員,相信大家整天都在被 AI、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等一些概念轟炸。有時候甚至有點誠惶誠恐,一方面作為一個業(yè)內(nèi)人士而自豪,二方面覺得新概念一個接...
...原始鏈接:http://www.ituring.com.cn/article/177529 董飛,Coursera數(shù)據(jù)工程師。曾先后在創(chuàng)業(yè)公司酷迅,百度基礎(chǔ)架構(gòu)組,Amazon 云計算部門,LinkedIn擔(dān)任高級工程師,負(fù)責(zé)垂直搜索,百度云計算平臺研發(fā)和廣告系統(tǒng)的架構(gòu)。董飛本科畢業(yè)...
...水平擴(kuò)容、分庫分表、異步削峰這樣的技術(shù)或者我所在的數(shù)據(jù)領(lǐng)域的中間件的出現(xiàn)和發(fā)展門檻是不是很高呢?是不是一個架構(gòu)師應(yīng)該有的核心競爭力? 在我看來,也不是,起碼不全是。 因為正確的技術(shù)選型,中間件的合理運(yùn)用...
...到幾十個。但是接下來另外一個瓶頸又出現(xiàn)了,他們用的數(shù)據(jù)庫也是單數(shù)據(jù)庫,同樣有擴(kuò)展性的問題。這個問題可以通過改用集群版數(shù)據(jù)庫來解決。最終雖然所有的問題得到了解決,但是耽誤了時間也產(chǎn)生了損失,他們在線人數(shù)...
...到幾十個。但是接下來另外一個瓶頸又出現(xiàn)了,他們用的數(shù)據(jù)庫也是單數(shù)據(jù)庫,同樣有擴(kuò)展性的問題。這個問題可以通過改用集群版數(shù)據(jù)庫來解決。最終雖然所有的問題得到了解決,但是耽誤了時間也產(chǎn)生了損失,他們在線人數(shù)...
...到幾十個。但是接下來另外一個瓶頸又出現(xiàn)了,他們用的數(shù)據(jù)庫也是單數(shù)據(jù)庫,同樣有擴(kuò)展性的問題。這個問題可以通過改用集群版數(shù)據(jù)庫來解決。最終雖然所有的問題得到了解決,但是耽誤了時間也產(chǎn)生了損失,他們在線人數(shù)...
...貸業(yè)務(wù)獲客、風(fēng)控管理已經(jīng)嚴(yán)重依賴于技術(shù)交易和現(xiàn)在的數(shù)據(jù)模型。所以這個領(lǐng)域?qū)τ诮鹑陬I(lǐng)域自身改革,金融數(shù)字化轉(zhuǎn)型基礎(chǔ)就是IT設(shè)施的支撐,無論從行業(yè)服務(wù)的需要還是我們自身發(fā)展的需要,我們迫切需要解決云計算應(yīng)用...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺階。哪里可以獲得...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關(guān)性能圖表。同時根據(jù)訓(xùn)練、推理能力由高到低做了...