回答:謝謝邀請(qǐng)!數(shù)據(jù)分析師通常分成兩種,一種是應(yīng)用級(jí)數(shù)據(jù)分析師,另一種是研發(fā)級(jí)數(shù)據(jù)分析師,區(qū)別就在于是否具備算法設(shè)計(jì)及實(shí)現(xiàn)的能力。應(yīng)用級(jí)數(shù)據(jù)分析師通常需要掌握各種數(shù)據(jù)分析工具,把業(yè)務(wù)模型映射到數(shù)據(jù)分析工具上,從而得到數(shù)據(jù)分析的結(jié)果。數(shù)據(jù)分析工具比較多,比如Excel就是一個(gè)傳統(tǒng)的數(shù)據(jù)分析工具,另外還有Minitab、LINGO、JMP等,要想全面掌握這些工具的使用需要具備一定的數(shù)學(xué)基礎(chǔ)和統(tǒng)計(jì)學(xué)基礎(chǔ)。通常...
回答:作為一個(gè)數(shù)據(jù)分析師來(lái)回答一下:我做這行兩年多了,剛開(kāi)始的時(shí)候用的多是MySQL數(shù)據(jù)庫(kù),當(dāng)然,Oracle數(shù)據(jù)庫(kù)也會(huì)用到,尤其是在金融行業(yè)或者國(guó)企都用Oracle,一般的公司使用MySQL數(shù)據(jù)庫(kù),可能是因?yàn)镸ySQL數(shù)據(jù)庫(kù)免費(fèi)吧。另外,在一家互聯(lián)網(wǎng)公司,我遇到了mongodb,目前一些新興的互聯(lián)網(wǎng)公司使用nosql的也比較多,這個(gè)當(dāng)時(shí)是現(xiàn)學(xué)現(xiàn)賣(mài)的。作為一個(gè)數(shù)據(jù)分析師,可能對(duì)數(shù)據(jù)庫(kù)的使用一般是存取數(shù)據(jù)...
回答:優(yōu)秀的數(shù)據(jù)分析師并不能速成,但是零經(jīng)驗(yàn)也有零經(jīng)驗(yàn)的捷徑。市面上有《七周七數(shù)據(jù)庫(kù)》,《七周七編程語(yǔ)言》。今天我們就《七周七學(xué)習(xí)成為數(shù)據(jù)分析師》,沒(méi)錯(cuò),七周。第一周:Excel學(xué)習(xí)掌握如果Excel玩的順溜,可以略過(guò)這一周。但很多人并不會(huì)vlookup,所以有必要講下。了解sum,count,sumif,countif,find,if,left/right,時(shí)間轉(zhuǎn)換等。excel的各類(lèi)函數(shù)很多,完全不...
回答:一名合格的數(shù)據(jù)分析師應(yīng)該掌握網(wǎng)頁(yè)爬蟲(chóng):Python或R數(shù)據(jù)存儲(chǔ):Excel或者Tableau、MangoDB等數(shù)據(jù)清洗:數(shù)據(jù)缺失處理等數(shù)據(jù)分析:線(xiàn)性回歸等數(shù)據(jù)可視化:Python或R的可視化包進(jìn)階級(jí)數(shù)據(jù)分析師:統(tǒng)計(jì)知識(shí)運(yùn)籌學(xué)知識(shí)機(jī)器學(xué)習(xí)知識(shí)掌握以上三個(gè)技能點(diǎn)便可稱(chēng)之為數(shù)據(jù)科學(xué)家至于面試要準(zhǔn)備些啥?Simply按照上面技能點(diǎn)一一準(zhǔn)備但是今天要說(shuō)的是一項(xiàng)奇淫技巧那就是--寫(xiě)一篇數(shù)據(jù)分析的推文在這篇推文...
問(wèn)題描述:關(guān)于財(cái)付通實(shí)時(shí)到賬什么意思這個(gè)問(wèn)題,大家能幫我解決一下嗎?
回答:大數(shù)據(jù)的技術(shù)大數(shù)據(jù)技術(shù)包括:1)數(shù)據(jù)采集: ETL工具負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。2)數(shù)據(jù)存取: 關(guān)系數(shù)據(jù)庫(kù)、NOSQL、SQL等。3)基礎(chǔ)架構(gòu): 云存儲(chǔ)、分布式文件存儲(chǔ)等。4)數(shù)據(jù)處理: 自然語(yǔ)言處理(NLP,Natural Language Processin...
...的正確性保證:Exactly once,原生支持事件時(shí)間,支持延時(shí)數(shù)據(jù)處理。由于Flink本身基于原生數(shù)據(jù)流計(jì)算,可以達(dá)到毫秒級(jí)低延時(shí)。 在愛(ài)奇藝實(shí)測(cè)下來(lái),相比Spark Streaming,Apache Flink在相近的吞吐量上,有更低的延時(shí),更好的實(shí)時(shí)計(jì)...
...的檢驗(yàn)后,2017年Flink開(kāi)始在阿里巴巴集團(tuán)范圍內(nèi)支持各項(xiàng)實(shí)時(shí)計(jì)算業(yè)務(wù), 到目前為止阿里巴巴基于Flink打造的實(shí)時(shí)計(jì)算平臺(tái),已經(jīng)支持了包括淘寶、天貓、支付寶、高德、飛豬、優(yōu)酷、菜鳥(niǎo)、餓了么等所有阿里巴巴集團(tuán)下的所有...
...薦這種商品的廣告和類(lèi)似商品的店鋪,這種就是屬于實(shí)時(shí)數(shù)據(jù)處理然后作出相關(guān)推薦,這類(lèi)數(shù)據(jù)需要不斷的從你在網(wǎng)頁(yè)上的點(diǎn)擊動(dòng)作中獲取數(shù)據(jù),之后進(jìn)行實(shí)時(shí)分析然后給出推薦。 流式數(shù)據(jù)的特點(diǎn) 數(shù)據(jù)實(shí)時(shí)到達(dá) 數(shù)據(jù)到達(dá)次序...
...前,首先定義一下我們的性能指標(biāo),由于我們暫時(shí)不考慮實(shí)時(shí)性,所以主要考慮的是卡頓率。卡頓指的就是觀眾在播放一個(gè)視頻的時(shí)候,由于網(wǎng)絡(luò)原因,播放器緩沖區(qū)中沒(méi)有接收到新的數(shù)據(jù)數(shù)據(jù)了,這個(gè)時(shí)候畫(huà)面就一直轉(zhuǎn)圈,然...
...術(shù)在以下四個(gè)層次都有發(fā)展: 數(shù)據(jù)采集數(shù)據(jù)存儲(chǔ)與管理數(shù)據(jù)處理與分析數(shù)據(jù)隱私與安全 但近幾年發(fā)展的大數(shù)據(jù)的最核心的技術(shù)多在數(shù)據(jù)存儲(chǔ)與管理層和數(shù)據(jù)處理與分析層,由此可概括的兩大核心技術(shù): ① 分布式存儲(chǔ) 解決海量...
...批量任務(wù)都是從 0 點(diǎn)開(kāi)始啟動(dòng),都是通過(guò) T+1 的方式去做數(shù)據(jù)處理,這會(huì)導(dǎo)致計(jì)算負(fù)載集中爆發(fā),對(duì)集群的壓力很大;第二,標(biāo)簽導(dǎo)入也屬于一種 T+1 批量任務(wù),每次全量導(dǎo)入都會(huì)耗費(fèi)很長(zhǎng)的時(shí)間;第三,數(shù)據(jù)質(zhì)量的監(jiān)控也必須...
...算中產(chǎn)生的狀態(tài)不止可以作為輸出結(jié)果使用,還能做真正實(shí)時(shí)的分析,搭配應(yīng)用里一些抽象的邏輯,我們可以在實(shí)時(shí)分析、計(jì)算產(chǎn)生狀態(tài)、結(jié)果輸出這三個(gè)方面形成一個(gè)服務(wù)線(xiàn)上業(yè)務(wù)的閉環(huán)。Loops & Cycles這里提到的是一個(gè)反饋閉...
...史event的,那么一分鐘可以產(chǎn)生消費(fèi)的event數(shù)量只受限于數(shù)據(jù)處理速度。另外event在分布式采集的時(shí)候也遇到有快有慢的問(wèn)題,一分鐘內(nèi)產(chǎn)生的event未必可以在一分鐘內(nèi)精確到達(dá)統(tǒng)計(jì)端,這樣就會(huì)因?yàn)椴杉难舆t波動(dòng)影響統(tǒng)計(jì)數(shù)據(jù)...
socket.io提供了基于事件的實(shí)時(shí)雙向通訊 歷史 Web端與服務(wù)器間的實(shí)時(shí)數(shù)據(jù)傳輸?shù)氖且粋€(gè)很重要的需求,但最早只能通過(guò)AJAX輪詢(xún)?cè)儗?shí)現(xiàn)。在WebSocket標(biāo)準(zhǔn)沒(méi)有推出之前,AJAX輪詢(xún)是唯一可行的方式(通過(guò)Flash瀏覽器也可以,但這里不...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺(tái)階。哪里可以獲得...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說(shuō)合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關(guān)性能圖表。同時(shí)根據(jù)訓(xùn)練、推理能力由高到低做了...