很多同學(xué)來問小編,雖然疫情肆虐,嚴(yán)重影響了就業(yè)市場,唯獨(dú)一個(gè)神秘的職業(yè)——數(shù)據(jù)科學(xué)家。
作為Linkedin上增長最快的工作,數(shù)據(jù)科學(xué)的前景可謂是非常可觀,預(yù)計(jì)到2026年將創(chuàng)造1150萬崗位。
除此之外,數(shù)據(jù)科學(xué)也是收入最高的行業(yè)之一,根據(jù)Glassdoor網(wǎng)站統(tǒng)計(jì),數(shù)據(jù)科學(xué)家的平均年薪高達(dá)$113K。
又多金、崗位需求又大的神仙職業(yè),今天小編就帶大家來了解一下!!看看如果要?jiǎng)偃螖?shù)據(jù)科學(xué)家,你將要做哪些準(zhǔn)備?
崗位需求
雖然名字叫“數(shù)據(jù)科學(xué)家”,但是你別被名字嚇倒,實(shí)際上,數(shù)據(jù)科學(xué)家囊括了好幾類職業(yè)——
Business Analyst(BA)
在數(shù)據(jù)行業(yè),最基礎(chǔ)的職位就是Business Analyst(BA)。需要注意的是,在真正的招聘過程中,Business Analyst 可能會(huì)按照Data Analyst的Title來招。這類崗位一般只要有基礎(chǔ)的數(shù)學(xué)能力,Excel能力,和基本的Business Scene,就有希望拿到面試。
Data Analyst(DA)
Data Analyst(DA)與BA相比之下,顯得更Technical一點(diǎn),需要掌握SQL,有統(tǒng)計(jì)方面的知識(shí),以及會(huì)做一些簡單的模型,比如線性模型,回歸模型等。
Data Scientist(DS)
如果想再更進(jìn)一步,去做Data Scientist(DS)的崗位,除了掌握Data Analyst的技能,還需要掌握Python,Machine Learning,以及足夠的編程技能。
Research Scientist,MLE
如果有PHD學(xué)位,精通Research,或者很強(qiáng)的工程實(shí)踐能力,我們也可以考慮更上一層樓,去做Research Scientist,或者做Machine Learning Engineer(MLE)也是不錯(cuò)的選擇。
也如上圖金字塔模型所示,市場上具有BA、DA技能的人占絕大多數(shù),這也意味著求職競爭會(huì)非常激烈;而當(dāng)你掌握的技能足夠多之后,競爭的壓力也在逐步遞減。
技能掌握
統(tǒng)計(jì)學(xué)知識(shí)
統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析必須掌握的基礎(chǔ)知識(shí)。在具體工作中,尋找指標(biāo)之間的相關(guān)性、設(shè)計(jì)ab測試、顯著性檢驗(yàn)、結(jié)果分析、預(yù)測建模等都需要一定的統(tǒng)計(jì)學(xué)知識(shí)。
面試的時(shí)候,面試官一般會(huì)考察“什么是p-value 、什么是假設(shè)檢驗(yàn)、什么type 1/2 error、怎么解決違背了假設(shè)的問題、怎么看模型好不好、怎么test假設(shè)有沒有滿足”等問題通常是考察的重點(diǎn)。
統(tǒng)計(jì)學(xué)知識(shí)
對(duì)于想要從事數(shù)據(jù)科學(xué)工作的同學(xué)來說,機(jī)器學(xué)習(xí)是必學(xué)的學(xué)科。
工作面試當(dāng)中最重要的環(huán)節(jié)就是,通過情景或者白板問答的方式考察申請(qǐng)者對(duì)于機(jī)器學(xué)習(xí)算法的理論及應(yīng)用的了解。
為了能夠快速培養(yǎng)這方面的能力,最好的準(zhǔn)備方式就是在學(xué)習(xí)理論知識(shí)的同時(shí),通過課外的Project或者作業(yè)鍛煉自己,手動(dòng)實(shí)現(xiàn)算法/建立機(jī)器學(xué)習(xí)訓(xùn)練Workflow的能力。
深度學(xué)習(xí)
深度學(xué)習(xí)(Deep Learning)是機(jī)器學(xué)習(xí)中的一個(gè)分支方法。一般特指學(xué)習(xí)高層數(shù)的網(wǎng)絡(luò)結(jié)構(gòu)。
Deep Learning目前非常流行,因?yàn)樗麄冊(cè)趫D像,視覺,語音等各種應(yīng)用中表現(xiàn)出了很好的Empirical Performance。并且在模型相當(dāng)復(fù)雜,數(shù)據(jù)特別大量的情況下,依然可以達(dá)到很理想的學(xué)習(xí)速度。
算法工程師面試時(shí),經(jīng)常會(huì)通過以下幾個(gè)方面來考察深度學(xué)習(xí)的相關(guān)知識(shí)點(diǎn):
1、利用numpy從零搭建一個(gè)神經(jīng)網(wǎng)絡(luò)
2、手寫一個(gè)單隱層的神經(jīng)網(wǎng)絡(luò)
3、熟練掌握NLP,CV等常見應(yīng)用
4、手動(dòng)搭建深度神經(jīng)網(wǎng)絡(luò)(DNN)
面試準(zhǔn)備
從招聘現(xiàn)狀來看,大量的申請(qǐng)者涌入市場,且面試候選人的背景競爭力越來越強(qiáng),如果你對(duì)數(shù)據(jù)科學(xué)家的崗位感興趣,確實(shí)需要好好準(zhǔn)備。
但公司招人的優(yōu)先級(jí)基本上是統(tǒng)一的:經(jīng)驗(yàn)>學(xué)歷>潛力。
一般來說,公司是非常希望直接招到能Match到具有公司所需相關(guān)項(xiàng)目經(jīng)驗(yàn)的求職者的。這樣公司不要花精力培訓(xùn),即使是競爭者的其他背景更強(qiáng),但面試官還是會(huì)更加傾向于經(jīng)驗(yàn)的。
如果沒有相關(guān)經(jīng)歷,學(xué)歷就是下一步衡量的對(duì)象。如果對(duì)應(yīng)的學(xué)歷很好,包括在校課程、Research、實(shí)習(xí)等成績很好,也能表明求職者在相關(guān)領(lǐng)域有足夠的知識(shí)儲(chǔ)備,可以很快上手。
但如果學(xué)歷上也不夠,剩下的就只能看潛力,公司會(huì)希望能從過往的經(jīng)歷中看出求職者對(duì)數(shù)據(jù)行業(yè)的熱情,以及是否有很強(qiáng)的學(xué)習(xí)能力。
鑒于數(shù)據(jù)科學(xué)是跨學(xué)科的,跟商業(yè)等諸多領(lǐng)域都有交集,在真實(shí)的工作場景中,與其他團(tuán)隊(duì)合作,向上匯報(bào)展示都是基本操作。因此,對(duì)于數(shù)據(jù)分析的基礎(chǔ)知識(shí)了解與實(shí)踐、是否有足夠的商業(yè)嗅覺、是否有講故事的能力等,也是面試官看重的重點(diǎn)技能之一。
最后,雖然疫情仍在反復(fù),但是也順應(yīng)催生了一波科技行業(yè),也帶動(dòng)了數(shù)據(jù)科學(xué)家這一職業(yè)的發(fā)展,如果對(duì)這一職業(yè)感興趣的小伙伴,就快沖鴨!