{eval=Array;=+count(Array);}
說實(shí)話,這個(gè)很難去判斷,大部分的面試官其實(shí)都是事先準(zhǔn)備好了一些面試的題目和答案,而且面試的問題也基本是由淺入深,最終會深到什么程度,主要還是看面試官當(dāng)時(shí)對面試者的感覺,如果他覺得沒有必要繼續(xù)了,也就不會去問一些過于深入的問題了。
所以,單單想從面試時(shí)候的寥寥幾句就判斷一個(gè)人的水平難度很大。
如果實(shí)在想知道一些,那么可以在自己提問的環(huán)節(jié),對公司的團(tuán)隊(duì)配置,現(xiàn)在的項(xiàng)目情況進(jìn)行了解,然后判斷整體的水平,然后在詢問面試官是不是團(tuán)隊(duì)的負(fù)責(zé)人,從而側(cè)面的了解一下。
首先,面試官的個(gè)人能力并不會影響未來你在公司的發(fā)展,因?yàn)槊嬖嚬倏赡苁琼?xiàng)目負(fù)責(zé)人、可能是技術(shù)負(fù)責(zé)人,也可能是未來平級的同事,他的個(gè)人技術(shù)水平并不能夠代表這個(gè)公司的技術(shù)水平,也不會妨礙你的學(xué)習(xí)和發(fā)展。
所以,預(yù)期關(guān)心面試官的能力,還不如多關(guān)心一下公司的項(xiàng)目情況,發(fā)展前景和近期遠(yuǎn)期的團(tuán)隊(duì)規(guī)劃,這更能夠讓你對自己未來的定位做出判斷。
如果你覺得這個(gè)面試你鐵定沒戲了,那么你可以問問面試官他所提出的問題都應(yīng)該怎么解答,甚至可以問問你今天面試中哪些地方不盡如人意。但是,如果你覺得還行,就打住你要反問問題的念頭,因?yàn)檫@樣會顯得自己是個(gè)刺頭,甚至讓人感覺有點(diǎn)咄咄逼人。讓面試者本來可能比較好的感覺變差。
所以,面試者就老老實(shí)實(shí)的面試,別讓自己從一個(gè)面試者變成了面試官。
這個(gè)問題有點(diǎn)難,主要還是憑感覺吧!
首先,面試官一般會問你一些你面試的崗位相關(guān)的問題,根據(jù)你的回答,然后進(jìn)一步加深的問你,看你這一塊內(nèi)容具體掌握的怎么樣。比如最基礎(chǔ)的logistic回歸器,首先你要知道這個(gè)東西到底是什么吧,然后你要清楚它的具體用法以及使用場景吧,然后你要知道這個(gè)玩意是怎么來的吧。最后就是一些拓展問題。
當(dāng)然,針對你的問題,你想知道面試官的水平,那么你回答了他一個(gè)問題后,緊接著不讓讓他給你提問的機(jī)會,你就這一話題繼續(xù)拓展到其他的話題上,然后你說,看看面試官的反應(yīng),你可以故意的說錯(cuò)一個(gè)小知識點(diǎn),然后你反問面試官,我這樣理解的你看有沒有什么問題。
根據(jù)面試官的作答,一般能夠感覺到面試官的水平,能夠作為機(jī)器學(xué)習(xí)的面試官,那么他的知識面還是相對來說比較廣的,你說的基本上他都知道,只是看看他具體掌握的怎么樣。
作為一個(gè)合格的面試官,如果你問的問題他知道,那么他是很樂意給你解答的,如果他不清楚,那么也會告知你這一塊他不熟悉,如果他不懂裝懂,這個(gè)時(shí)候你有兩個(gè)打算,一是詢問他在項(xiàng)目組的職位,而是選擇終止面試。
其實(shí)面試是一種雙向選擇,技術(shù)知識學(xué)無止境,看你想進(jìn)入這家公司具體的目標(biāo)是什么?提升自己的專業(yè)水準(zhǔn)還是薪資待遇。
每個(gè)人都是不同的個(gè)體,最好不要以自己的能力去衡量一個(gè)面試官的能力。哪怕你真的比他強(qiáng)。
這個(gè)問題應(yīng)該反過來問才對。
在過去的一年里,我采訪了一些在Expedia Group擔(dān)任數(shù)據(jù)科學(xué)職位的人,職位從入門級到高級的都有。我想分享我的經(jīng)驗(yàn),這些經(jīng)驗(yàn)適用于對申請數(shù)據(jù)科學(xué)職位的人。在這篇文章里,我還會給出關(guān)于你可能在面試中會遇到的問題的一些提示。
面試候選人幫助我認(rèn)識了一些有廣泛背景和技能的人。從CS / ECE,統(tǒng)計(jì)/數(shù)學(xué)到土木/機(jī)械工程,這些領(lǐng)域的人我都接觸過。所幸我有機(jī)會能在這里與這些出色的人交談。
在我講更多細(xì)節(jié)之前,我想提一下,近年來,業(yè)界把“數(shù)據(jù)科學(xué)家”也叫做“機(jī)器學(xué)習(xí)科學(xué)家”或“應(yīng)用科學(xué)家”。雖然在一些公司中這些職位有著略有著不同的任務(wù)或者需要具備不同的技能,但對于大多數(shù)公司來說,這三個(gè)職位或多或少都指的是同一個(gè)東西。所以在這篇文章中,我提到的“數(shù)據(jù)科學(xué)”,跟上面的“機(jī)器學(xué)習(xí)”“應(yīng)用科學(xué)”是一樣的。
雖然每個(gè)人都有一套自己解決問題的技能,但是大多數(shù)公司都會要求數(shù)據(jù)科學(xué)候選人具備一些特定的基本技能。我將這些基本技能大概分為以下幾類,然后再討論這些技能具體是什么。根據(jù)公司和職位級別的不同,你可能會被問到以下提到的一個(gè)或多個(gè)相關(guān)問題:
1、關(guān)于你的簡歷和之前工作相關(guān)的問題
2、通用機(jī)器學(xué)習(xí)(和深度學(xué)習(xí))知識
3、通用統(tǒng)計(jì)和數(shù)學(xué)知識
4、編程和軟件工程技能
5、統(tǒng)計(jì)建模技巧
6、計(jì)算機(jī)視覺(CV),自然語言處理(NLP)和定價(jià)策略(Pricing Topics)
7、面試中溝通和表達(dá)能力
8、行為問題
9、系統(tǒng)設(shè)計(jì)技巧(取決于職位級別)
10、管理和領(lǐng)導(dǎo)技能(取決于職位級別)
你的簡歷在你面試時(shí)會被問到的那類問題中起著至關(guān)重要的作用。因此,請確保你對自己在簡歷中提到的任何內(nèi)容有足夠的了解,內(nèi)容包括從課程和研究項(xiàng)目到編程語言。如果被問到諸如“介紹一下你自己”,或者“介紹一下你現(xiàn)公司的工作” 的一般性問題是很常見的,不僅如此,你還會被問到關(guān)于你簡歷的問題。
例如,如果你在簡歷中提到幾個(gè)以前的與NLP相關(guān)的項(xiàng)目,那么你應(yīng)該對NLP有一個(gè)很好的理解,并且你很可能會在NLP上被問到一些技術(shù)問題,來評估你的技術(shù)含量。因此,如果你在一個(gè)項(xiàng)目上跟別人做了一些合作的東西,但對這項(xiàng)工作的貢獻(xiàn)很小,我建議你讓自己更熟悉該項(xiàng)目的技術(shù)方面。
或者,如果你提到Python或Scala作為你最喜歡的編程語言,請確保你足夠了解這些語言(至少在數(shù)據(jù)科學(xué)職位所需的范圍內(nèi)),以及每個(gè)語言中的一些機(jī)器學(xué)習(xí)相關(guān)庫。我看過很多候選人在他們的簡歷中提到了Scala / Python,但當(dāng)我問他們關(guān)于這些語言的一個(gè)簡單問題時(shí),他們根本不知道它,這會給我一個(gè)負(fù)面信號。如果你使用這些語言的經(jīng)歷非常有限,那么最好是誠實(shí)地告訴面試官,并且我相信大多數(shù)面試官都不會因?yàn)樵谀銢]有豐富經(jīng)驗(yàn)的事情上對你進(jìn)行評判。
雖然不同公司的數(shù)據(jù)科學(xué)工作可能涉及廣泛的問題和技能(包括數(shù)據(jù)提取和預(yù)處理,運(yùn)行SQL查詢,簡單數(shù)據(jù)分析,深度學(xué)習(xí),NLP和CV),但機(jī)器學(xué)習(xí)是一個(gè)基礎(chǔ),現(xiàn)在大多數(shù)頂級公司都希望這些“數(shù)據(jù)科學(xué)候選人”懂得這一概念。因此,如果你正在申請數(shù)據(jù)科學(xué)職位,請確保你對以下機(jī)器學(xué)習(xí)概念有充分的了解。諸如“統(tǒng)計(jì)學(xué)習(xí)要素”[1]和“模式識別與機(jī)器學(xué)習(xí)”[2]等書籍對這些主題非常有用。
上面列出的問題涵蓋了一些與數(shù)據(jù)科學(xué)職位相關(guān)的高級機(jī)器學(xué)習(xí)概念,但你可能會被問到有關(guān)上述某些主題的更詳細(xì)問題,例如你可能會被問到:
今天的許多數(shù)據(jù)科學(xué)家曾經(jīng)是統(tǒng)計(jì)學(xué)家和分析人員,許多機(jī)器學(xué)習(xí)的模型就是(重新包裝為)統(tǒng)計(jì)學(xué)習(xí)模型(如線性回歸,嶺回歸,LASSO,邏輯回歸)。因此,許多面試官喜歡在統(tǒng)計(jì)學(xué)或數(shù)學(xué)方面提出一些問題也就不足為奇了。
對于統(tǒng)計(jì)學(xué)和概率學(xué),如果你熟悉以下概念,那將是很好的:
對于數(shù)學(xué)問題,你可能會被問到以下問題:
任何數(shù)據(jù)科學(xué)家都需要會編程。在創(chuàng)業(yè)公司(員工人數(shù)較少)中,數(shù)據(jù)科學(xué)家可能需要自己做很多軟件工程,例如數(shù)據(jù)提取和清理以及模型部署。相比之下,在大公司中,還有其他人負(fù)責(zé)數(shù)據(jù)工程和模型部署,數(shù)據(jù)科學(xué)家主要負(fù)責(zé)培訓(xùn)和測試特定產(chǎn)品的模型。作為數(shù)據(jù)科學(xué)家,你還需要了解數(shù)據(jù)工程角色所需的一些術(shù)語和任務(wù),例如ETL(提取,轉(zhuǎn)換,加載)。在這里,我將介紹數(shù)據(jù)科學(xué)家使用的一些最廣泛使用的編程語言,庫和軟件。
Gayle Laakmann McDowell [3]的“Cracking the Coding Interview”等書籍讓你在解決軟件工程和算法問題上做好準(zhǔn)備非常有幫助。這里還有幾個(gè)很棒的網(wǎng)站,它們有一個(gè)很好的軟件工程問題數(shù)據(jù)庫,比如leetcode,hackerrank和geeksforgeeks。
4.1 編程語言
在編程語言方面,Python,Scala,SQL和R似乎是人們使用的最流行的語言,但我也看到人們使用其他語言,如Java,C ++和Matlab(盡管它不是一種編程語言))。
4.2 有用的Python庫
在這里,我將提到一些與數(shù)據(jù)科學(xué)職位最相關(guān)的Python包:
4.3 云服務(wù)
根據(jù)你要處理的數(shù)據(jù)規(guī)模,你可能需要在云服務(wù)上運(yùn)行代碼,例如AWS,Azure或Google Cloud。因此,擁有在云環(huán)境中運(yùn)行代碼的經(jīng)驗(yàn)可能是一個(gè)加分項(xiàng)。你絕對不需要了解所有不同的云服務(wù),但熟悉AWS中的EC2等計(jì)算服務(wù)可能是一個(gè)優(yōu)勢。
有些公司也可能在AWS或Azure之上使用其他大數(shù)據(jù)服務(wù),例如Databricks和Qubole,但我認(rèn)為不需要事先體驗(yàn)它們,因?yàn)檫@些很容易學(xué)習(xí)。
4.4 部署工具
在為任務(wù)訓(xùn)練模型(例如推薦系統(tǒng)或適度模型)之后,理想情況下,你希望在實(shí)際生產(chǎn)中使用它。因此,某人(可能是你,或你正在使用的工程團(tuán)隊(duì))需要將你的模型部署到生產(chǎn)環(huán)境中。為此,熟悉Docker和Python中的Flask可能會有所幫助。如果你想在AWS等云服務(wù)上部署模型,那么熟悉Sagemaker可能會有所幫助。我個(gè)人并不認(rèn)為熟悉部署工具對于入門級數(shù)據(jù)科學(xué)職位是必要的。
作為數(shù)據(jù)科學(xué)家,你需要為各種產(chǎn)品/問題構(gòu)建數(shù)學(xué)和ML模型,因此在面試過程中可能會遇到一些建模問題。這些問題通常與公司的域名有關(guān)。目標(biāo)是看看你是否可以將你在概念上理解的內(nèi)容應(yīng)用于特定問題。你可能會遇到的一些示例問題可能是:
根據(jù)你的答案,你可能還會被問到一些跟進(jìn)問題,包括你需要的數(shù)據(jù)類型,評估模型的方式以及如何隨著時(shí)間的推移改進(jìn)模型。如果你想查看更多問題,https://http://medium.com/acing-ai/acing-ai-interviews/等網(wǎng)站非常有用。
在面試過程中,重要的是你的思維過程以及你能想到為產(chǎn)品構(gòu)建ML模型的各個(gè)方面的能力。你絕對不需要給出最好或最完美的答案; 只要你對問題的高層次理解是合理的,你就是很棒的。
根據(jù)你申請的團(tuán)隊(duì)的重點(diǎn)產(chǎn)品,你可能還會被問到有關(guān)CV,NLP或產(chǎn)品定價(jià)的一些問題。因此,在面試之前,請確保對你申請的團(tuán)隊(duì)進(jìn)行一些研究,以便更好地了解他們的重點(diǎn)。面試官可能會問你關(guān)于NLP或視覺中非常高級的概念,一些其他面試官可能會提出更具挑戰(zhàn)性的問題。
以下是你可能獲得的一些與 NLP 相關(guān)的問題:
以下是你可能會被問到的一些計(jì)算機(jī)視覺相關(guān)問題:
數(shù)據(jù)科學(xué)職位通常涉及大量的溝通和演示。這可以用于與產(chǎn)品經(jīng)理討論新項(xiàng)目,或向你的團(tuán)隊(duì)展示你的模型。因此,能夠與其他人(技術(shù)人員和非技術(shù)人員)交流關(guān)于你的工作和想法是非常重要的。
有時(shí)你可能需要以非常技術(shù)性的方式向同事或經(jīng)理傳達(dá)你的新發(fā)現(xiàn),有時(shí)你可能需要說服產(chǎn)品經(jīng)理你的模型對他們有用,不用描述太多的技術(shù)細(xì)節(jié)。
面試官通常不需要問你一個(gè)具體的問題來評估你的溝通和表達(dá)能力,他們可以在面試過程中了解面試者的這些能力。我的建議是:
有些人在面試時(shí)也可能會問行為問題。這些問題可能包括你過去的工作經(jīng)歷(為了了解你是否具備工作所需的技能),以及你的個(gè)人興趣。這些問題也可以集中在你過去如何處理各種工作情況上。你對這些問題的回答可以展示你的技能,能力和個(gè)性。以下是你可能會被問到的一些示例問題:
根據(jù)你申請的職位級別,你可能還會被聞到一些系統(tǒng)設(shè)計(jì)面試(SDI)問題,這些問題主要是關(guān)于“設(shè)計(jì)大規(guī)模分布式系統(tǒng)”的問題。
由于缺乏足夠的開發(fā)大規(guī)模系統(tǒng)的經(jīng)驗(yàn),以及沒有標(biāo)準(zhǔn)答案的設(shè)計(jì)問題的開放性,這些問題可能具有挑戰(zhàn)性。
我不打算在這里談?wù)揝DI問題太多,因?yàn)樗皇沁@篇文章的重點(diǎn),但我會提供一些示例問題,以及一些有用的資源,如果你想在這方面得到更多的練習(xí)。
以下是一些示例系統(tǒng)設(shè)計(jì)問題:
以下是面試中,關(guān)于設(shè)計(jì)問題的一些有用資源:
如果你正在申請數(shù)據(jù)科學(xué)經(jīng)理職位(有時(shí)甚至是高級或主要職位),面試官將需要評估你的管理和領(lǐng)導(dǎo)技能,并了解你之前的管理經(jīng)驗(yàn)。
這個(gè)候選人的理想背景是在機(jī)器學(xué)習(xí)和預(yù)測建模等領(lǐng)域具有強(qiáng)大理論背景的人,以及良好的軟件工程技能。要成為有效的領(lǐng)導(dǎo)者,候選人還需要具備良好的溝通技巧和良好的規(guī)劃技能,以便能夠以考慮構(gòu)建數(shù)據(jù)驅(qū)動產(chǎn)品所帶來的許多風(fēng)險(xiǎn)的方式進(jìn)行優(yōu)先排序和規(guī)劃。
我不會談到太深入到管理技能的方面,但我將在這里提供一些示例問題:
在這篇文章中,我嘗試提供一些提示,以及你在DS面試期間可能遇到的一些高級問題。鑒于數(shù)據(jù)科學(xué)角色的范圍不斷擴(kuò)大,當(dāng)然有一些主題和問題在此未討論。但我試圖涵蓋一些對數(shù)據(jù)科學(xué)面試中非常重要的一般性主題。
我的最終建議是對你申請的團(tuán)隊(duì)/公司進(jìn)行更多研究,并更好地了解他們正在處理的問題。然后,你可以將主要重點(diǎn)放在為與該團(tuán)隊(duì)相關(guān)的主題做好準(zhǔn)備。
0
回答0
回答0
回答0
回答0
回答1
回答0
回答0
回答0
回答0
回答