回答:謝謝邀請!數(shù)據(jù)分析師通常分成兩種,一種是應(yīng)用級數(shù)據(jù)分析師,另一種是研發(fā)級數(shù)據(jù)分析師,區(qū)別就在于是否具備算法設(shè)計及實現(xiàn)的能力。應(yīng)用級數(shù)據(jù)分析師通常需要掌握各種數(shù)據(jù)分析工具,把業(yè)務(wù)模型映射到數(shù)據(jù)分析工具上,從而得到數(shù)據(jù)分析的結(jié)果。數(shù)據(jù)分析工具比較多,比如Excel就是一個傳統(tǒng)的數(shù)據(jù)分析工具,另外還有Minitab、LINGO、JMP等,要想全面掌握這些工具的使用需要具備一定的數(shù)學(xué)基礎(chǔ)和統(tǒng)計學(xué)基礎(chǔ)。通常...
回答:如果追求功能豐富,就是Okular。如果想要簡潔,Evince。如果就想隨便看一下,拖到Chrome里打開也可以啊。
回答:作為一個數(shù)據(jù)分析師來回答一下:我做這行兩年多了,剛開始的時候用的多是MySQL數(shù)據(jù)庫,當(dāng)然,Oracle數(shù)據(jù)庫也會用到,尤其是在金融行業(yè)或者國企都用Oracle,一般的公司使用MySQL數(shù)據(jù)庫,可能是因為MySQL數(shù)據(jù)庫免費吧。另外,在一家互聯(lián)網(wǎng)公司,我遇到了mongodb,目前一些新興的互聯(lián)網(wǎng)公司使用nosql的也比較多,這個當(dāng)時是現(xiàn)學(xué)現(xiàn)賣的。作為一個數(shù)據(jù)分析師,可能對數(shù)據(jù)庫的使用一般是存取數(shù)據(jù)...
回答:優(yōu)秀的數(shù)據(jù)分析師并不能速成,但是零經(jīng)驗也有零經(jīng)驗的捷徑。市面上有《七周七數(shù)據(jù)庫》,《七周七編程語言》。今天我們就《七周七學(xué)習(xí)成為數(shù)據(jù)分析師》,沒錯,七周。第一周:Excel學(xué)習(xí)掌握如果Excel玩的順溜,可以略過這一周。但很多人并不會vlookup,所以有必要講下。了解sum,count,sumif,countif,find,if,left/right,時間轉(zhuǎn)換等。excel的各類函數(shù)很多,完全不...
回答:一名合格的數(shù)據(jù)分析師應(yīng)該掌握網(wǎng)頁爬蟲:Python或R數(shù)據(jù)存儲:Excel或者Tableau、MangoDB等數(shù)據(jù)清洗:數(shù)據(jù)缺失處理等數(shù)據(jù)分析:線性回歸等數(shù)據(jù)可視化:Python或R的可視化包進階級數(shù)據(jù)分析師:統(tǒng)計知識運籌學(xué)知識機器學(xué)習(xí)知識掌握以上三個技能點便可稱之為數(shù)據(jù)科學(xué)家至于面試要準(zhǔn)備些啥?Simply按照上面技能點一一準(zhǔn)備但是今天要說的是一項奇淫技巧那就是--寫一篇數(shù)據(jù)分析的推文在這篇推文...
回答:大數(shù)據(jù)的技術(shù)大數(shù)據(jù)技術(shù)包括:1)數(shù)據(jù)采集: ETL工具負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時中間層后進行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。2)數(shù)據(jù)存取: 關(guān)系數(shù)據(jù)庫、NOSQL、SQL等。3)基礎(chǔ)架構(gòu): 云存儲、分布式文件存儲等。4)數(shù)據(jù)處理: 自然語言處理(NLP,Natural Language Processin...
...提取出來,并且整理存儲到數(shù)據(jù)框中,以便于后續(xù)的數(shù)據(jù)分析。 問題 最近,讀者們在后臺的留言,愈發(fā)五花八門了。 寫了幾篇關(guān)于自然語言處理的文章后,一種呼聲漸強: pdf中的文本內(nèi)容,有沒有什么方便的方法提取出來呢...
摘要 在做數(shù)據(jù)分析的過程中,經(jīng)常會想數(shù)據(jù)分析到底是什么?為什么要做數(shù)據(jù)數(shù)據(jù)分析?數(shù)據(jù)分析到底該怎么做?等這些問題。對于這些問題,一開始也只是有個很籠統(tǒng)的認(rèn)識。 最近這兩天,讀了一下早就被很多人推薦的《...
摘要 在做數(shù)據(jù)分析的過程中,經(jīng)常會想數(shù)據(jù)分析到底是什么?為什么要做數(shù)據(jù)數(shù)據(jù)分析?數(shù)據(jù)分析到底該怎么做?等這些問題。對于這些問題,一開始也只是有個很籠統(tǒng)的認(rèn)識。 最近這兩天,讀了一下早就被很多人推薦的《...
《量化交易之路用Python做股票量化分析》PDF,407頁,文字可以復(fù)制;配套源代碼。阿布 著。 下載地址: https://pan.baidu.com/s/1IUsz...
...么辦呢?當(dāng)然是寫一個腳本來批量下載了。首先我們需要分析一下手工下載的流程:登錄自己的Coursera賬戶(有的課程需要我們登錄并選課后才能看到相應(yīng)的資源),在課程資源頁面里,找到相應(yīng)的文件鏈接,然后用喜歡的工具下...
...最后選擇的方案,至于為什么沒有選擇 from_url(),稍后等我分析完,就會明白了. from_string def from_string(input, output_path, options=None, toc=None, cover=None, css=None, configuration=None, cover_first=False): ...
...了,但是并不意味著我們馬上就要開始寫代碼,我們得先分析一下我們的網(wǎng)站都需要實現(xiàn)哪些功能,這樣我們才能針對如何實現(xiàn)這些功能進行編碼。 宣傳頁 由于網(wǎng)站的主要目的是校園內(nèi)部提供服務(wù),所以不是每一個人都能享受...
...蟲必備工具,掌握它就解決了一半的問題 中介紹過如何分析一個網(wǎng)頁上的請求。按照其中的方法,我們可以通過 開發(fā)者工具 的 Network 功能 找出專欄頁面獲取詳細(xì)列表的請求: https://www.zhihu.com/api/v4/columns/crossin/articles 觀察...
...話不妨也去爬爬我的博客園的文章,給我一份代碼(hhhhh) 分析可能的原因:博客園反爬蟲or爬取規(guī)則沒寫好 部門的前輩建議我去了解一下機器學(xué)習(xí),我也想擴展一下眼界,所以這陣子會去學(xué)一下簡單的機器學(xué)習(xí)知識。(當(dāng)然啦,我...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺階。哪里可以獲得...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關(guān)性能圖表。同時根據(jù)訓(xùn)練、推理能力由高到低做了...