大數(shù)據(jù)專(zhuān)業(yè)--新時(shí)代的“石油”
數(shù)字時(shí)代瞬息萬(wàn)變,層出不窮的數(shù)字科技正在快速改變我們的生活。如同蒸汽時(shí)代的蒸汽機(jī)、電氣時(shí)代的發(fā)電機(jī)、信息時(shí)代的計(jì)算機(jī)和互聯(lián)網(wǎng),人工智能正成為推動(dòng)人類(lèi)進(jìn)入智能時(shí)代的決定性力量。
不管是阿爾法狗戰(zhàn)勝人類(lèi)圍棋世界冠軍、無(wú)人超市開(kāi)店,還是自動(dòng)駕駛汽車(chē)不斷“上路”,人工智能已悄然來(lái)到人們身邊。什么是人工智能?創(chuàng)新工場(chǎng)董事長(zhǎng)兼首席執(zhí)行官李開(kāi)復(fù)的著作《人工智能》中給予了精辟的陳述——深度學(xué)習(xí)+大數(shù)據(jù)=AI(人工智能)
就業(yè)前景
據(jù)預(yù)測(cè),到21世紀(jì)30年代中期,僅在新西蘭就將有24%的工作實(shí)現(xiàn)自動(dòng)化,并將帶來(lái)許多富有開(kāi)創(chuàng)性的新興職業(yè)選擇。
為了應(yīng)對(duì)席卷而來(lái)的數(shù)字化浪潮,新西蘭政府在7月份頒布了The Digital Inclusion Blueprint,旨在促進(jìn)新西蘭全社會(huì)都能夠參與到新西蘭的數(shù)字建設(shè)中去,并且能從新西蘭的數(shù)字科技發(fā)展中獲益。
這也就意味著在新西蘭實(shí)行將所有公民納入數(shù)字化未來(lái)的指導(dǎo)方針下,對(duì)數(shù)據(jù)挖掘、分析與應(yīng)用方面的人才需求將不斷增長(zhǎng),數(shù)據(jù)科學(xué)專(zhuān)業(yè)的畢業(yè)生將擁有非常不錯(cuò)的職業(yè)前景。
坎特伯雷大學(xué)
Master of Applied Data Science
。☉(yīng)用數(shù)據(jù)科學(xué)碩士)
推薦指數(shù) *****
推薦理由
課程設(shè)計(jì)適合來(lái)自不同背景的學(xué)生
課程學(xué)制短1年,費(fèi)用相對(duì)便宜
課程涉及編程、Python,R、SQL,Database...含金量高
暑期的項(xiàng)目或者實(shí)習(xí)經(jīng)驗(yàn)
國(guó)際生學(xué)費(fèi)
2020年
$41,250
立思辰留學(xué)云老師介紹,MADS專(zhuān)業(yè)順應(yīng)時(shí)代需求,非常受歡迎,每年甚至每個(gè)學(xué)期的學(xué)生數(shù)量都在大幅增長(zhǎng),但是每年學(xué)費(fèi)漲幅穩(wěn)定,相對(duì)其它世界同等級(jí)一流高校學(xué)費(fèi)很有競(jìng)爭(zhēng)力,想要申請(qǐng)同學(xué)的建議盡早準(zhǔn)備。
注意:此學(xué)費(fèi)不包含student levy fee,每年1000刀左右,書(shū)本費(fèi)自理(下文會(huì)詳細(xì)介紹所需要的學(xué)習(xí)資料),如果需要在N年內(nèi)修完所有課程,那么必須支付的費(fèi)用即為學(xué)費(fèi)+(student levy fee*N)。
開(kāi)學(xué)時(shí)間
開(kāi)學(xué)季有兩次,分別為2月和7月
根據(jù)經(jīng)驗(yàn),學(xué)姐比較建議首選二月份入學(xué):
原因與學(xué)校課程設(shè)置有關(guān),如2019年的課程設(shè)置:STAT 448 Big Data這門(mén)課在第一個(gè)學(xué)期并沒(méi)有開(kāi)課,STAT 462 Data Mining在第一學(xué)期有開(kāi)課,而Data Mining的內(nèi)容對(duì)學(xué)習(xí)Big Data有著很大的幫助,因此二月份入學(xué)的學(xué)生會(huì)更加適應(yīng)。但是對(duì)于七月入讀的學(xué)生,建議入學(xué)前多解統(tǒng)計(jì)學(xué)等Data Mining相關(guān)知識(shí),以便做好充分準(zhǔn)備。
入學(xué)要求
學(xué)術(shù)要求:
本科學(xué)位, 最后2年課程平均分不低于B,即:
國(guó)內(nèi) 985 / 211 院校均分不低于75%
其它院校均分不低于80%
語(yǔ)言要求:
雅思 總分6.5,單科不低于6.0
PTE 總分58, 單項(xiàng)不低于50
CCEL EAP2 B+
NZCEL 5級(jí)
或同等其他英語(yǔ)要求
專(zhuān)業(yè)背景要求:
取得與數(shù)據(jù)科學(xué)相關(guān)學(xué)位,如生物科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)字人文、經(jīng)濟(jì)學(xué)、環(huán)境科學(xué)、金融學(xué)、地理學(xué)、地質(zhì)學(xué)、數(shù)學(xué)、物理學(xué)、心理學(xué)
具體要求可參見(jiàn)學(xué)校官網(wǎng),以官網(wǎng)為準(zhǔn):https://checkwhatyouneed.canterbury.ac.nz/checkrequirements/postgraduate
學(xué)期安排
一般情況下一年分三個(gè)學(xué)期,以2019年為例:
第一個(gè)學(xué)期從2月下旬開(kāi)始,到6月底結(jié)束;
第二個(gè)學(xué)期從7月中旬開(kāi)始,到11月初結(jié)束;
第三個(gè)學(xué)期是暑期,少數(shù)課程以及summer intern多發(fā)生在此階段。
備注:
第1、2學(xué)期分別有兩周的term break。
第3學(xué)期summer intern通常指公司實(shí)習(xí)或是導(dǎo)師研究項(xiàng)目。
畢業(yè)后技能
1. 數(shù)據(jù)科學(xué)領(lǐng)域的前沿知識(shí);
2. 利用數(shù)據(jù)解決問(wèn)題,給出solution的能力;
3. 設(shè)計(jì)、實(shí)現(xiàn)數(shù)學(xué)建模過(guò)程;
4. 具備編程能力,包括R和Python及其它技術(shù)。
技能包
Python,R, SQL,Database, Spark, Hadoop, MapReduce, Neural Network等等。
就業(yè)方向
商務(wù)分析師
Business analyst
數(shù)據(jù)分析師
Data Analyst
大數(shù)據(jù)解決方案架構(gòu)師
Big data solutions architect
數(shù)據(jù)工程師,大數(shù)據(jù)開(kāi)發(fā)人員
Data engineer, big data developer
數(shù)據(jù)科學(xué)家
Data scientist
技術(shù)/項(xiàng)目分析師
Technical / project analyst
數(shù)據(jù)庫(kù)協(xié)調(diào)/管理員
Database coordinator / administrator
信息情報(bào)顧問(wèn)
Intelligence advisor
專(zhuān)業(yè)內(nèi)容概要
MADS專(zhuān)業(yè)融合了數(shù)學(xué)課程(STAT開(kāi)頭),統(tǒng)計(jì)學(xué)課程(DATA開(kāi)頭),計(jì)算機(jī)課程(COSC開(kāi)頭),信息系統(tǒng)課程(INFO開(kāi)頭),商科課程(MBIS開(kāi)頭),以及生物學(xué),健康學(xué)等課程。
學(xué)姐認(rèn)為其中數(shù)學(xué),統(tǒng)計(jì)學(xué)和計(jì)算機(jī)課程是重中之重,如果不會(huì)編程,那么你無(wú)法成為一個(gè)優(yōu)秀的data scientist,如果只會(huì)編程但是不懂?dāng)?shù)學(xué)和統(tǒng)計(jì)學(xué),那么你永遠(yuǎn)都是一個(gè)碼農(nóng)。
學(xué)習(xí)內(nèi)容主要包括數(shù)據(jù)庫(kù)的知識(shí)掃盲、數(shù)學(xué)建模、如何用R以及Python,以及大數(shù)據(jù)和分布式計(jì)算,包括Hadoop和Spark,mapReduce算法如何在大數(shù)據(jù)framework下實(shí)現(xiàn)。
需要注意的是,老師會(huì)對(duì)coding做一定程度的指導(dǎo),但是更多情況下,需要自己多加練習(xí),以及閱讀大量的材料從而提升自己的coding能力。
官網(wǎng)鏈接:
https://www.canterbury.ac.nz/study/qualifications-and-courses/masters-degrees/master-of-applied-data-science
課程詳細(xì)介紹
MADS專(zhuān)業(yè)的課程一共分為3個(gè)部分:
背景課程:DATA401 Statistics統(tǒng)計(jì)學(xué),COSC480 Computer Programming計(jì)算機(jī)編程,以及MBIS 623 Data Management數(shù)據(jù)管理,如果有這些背景課程的學(xué)術(shù)背景或者工作背景,可酌情考慮不選擇背景課程,因人而異;
必修課以及部分選修課:
DATA 420 Scalable Computing
DIGI 405 Texts, Discourses and Data: the Humanities and Data Science
STAT 462 Data Mining
STAT 448 Big Data
項(xiàng)目/實(shí)習(xí):DATA 601(45個(gè)學(xué)分)
參與現(xiàn)實(shí)生活中的數(shù)據(jù)科學(xué)項(xiàng)目,學(xué)習(xí)和解決問(wèn)題。學(xué)生可以參與學(xué)校導(dǎo)師的項(xiàng)目或者自己可以提供實(shí)習(xí)的機(jī)會(huì)的公司。因?yàn)榛匠侵挥锌泊筇峁⿺?shù)據(jù)科學(xué)專(zhuān)業(yè),很多公司需要實(shí)習(xí)生都會(huì)聯(lián)系學(xué)校,所以學(xué)校會(huì)有不少的實(shí)習(xí)機(jī)會(huì)推薦。今年暑假,這個(gè)很多學(xué)生順利拿到公司帶薪實(shí)習(xí)。
部分課程詳細(xì)介紹
DATA401 Statistics:統(tǒng)計(jì)學(xué)基礎(chǔ),包括概率計(jì)算,密度分布等統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí),在后續(xù)的必修課程中,比如正態(tài)分布,偏態(tài)分布將會(huì)是處理數(shù)據(jù)的背景,如果缺乏類(lèi)似的數(shù)學(xué)基礎(chǔ)背景,后續(xù)課程會(huì)非常艱難。這門(mén)課是大課,與本科生一起上課,所以作為年齡稍大的研究生學(xué)生,可能會(huì)覺(jué)得老師的講課方式比較偏幼齡化,不過(guò)每次上課都會(huì)有recording,也可以自己去看recording,或者網(wǎng)上找些資料學(xué)習(xí)一下,總體來(lái)講,難度系數(shù)為2顆星。
COSC480 Computer Programming:主要學(xué)習(xí)Python編程,每周有作業(yè),提交自己的code驗(yàn)證過(guò)關(guān)就好,對(duì)于沒(méi)有任何編程經(jīng)驗(yàn)的學(xué)生,建議還是學(xué)一下這門(mén)課比較好,因?yàn)楹罄m(xù)的DATA 420 Scalable Computing需要使用大量的Python來(lái)完成,如果有Python經(jīng)驗(yàn)則可以略過(guò)這門(mén)課程。
MBIS 623 Data Management:主要學(xué)習(xí)數(shù)據(jù)庫(kù)管理,包括如何設(shè)計(jì)數(shù)據(jù)庫(kù),如何實(shí)現(xiàn)(授課使用MySql),以及關(guān)系數(shù)據(jù)庫(kù)和非關(guān)系數(shù)據(jù)庫(kù)介紹,這門(mén)課作業(yè)比較anoying,兩次作業(yè),分別要寫(xiě)4000字和3000字的論文,優(yōu)點(diǎn)是老師講課風(fēng)趣。如果有數(shù)據(jù)庫(kù)經(jīng)驗(yàn),建議略過(guò),后續(xù)課程主要用到的是Sql querry。
STAT 462 Data Mining:強(qiáng)烈推薦第一個(gè)學(xué)期選這個(gè)課,2019年上半學(xué)期教這門(mén)課的老師是Blair Roberston,老師課前準(zhǔn)備非常充足,上課條理清晰,數(shù)學(xué)術(shù)語(yǔ)解釋到位,及時(shí)聽(tīng)取學(xué)生反饋意見(jiàn),課下輔導(dǎo)認(rèn)真負(fù)責(zé),能夠給出比較專(zhuān)業(yè)的建議,作業(yè)設(shè)置合理,實(shí)驗(yàn)和作業(yè)難度稍高,需要一定的時(shí)間去理解消化,但是總體來(lái)講,學(xué)好這門(mén)課會(huì)對(duì)后續(xù)課程有著非常好的積極的影響,比如后續(xù)的大數(shù)據(jù)課程,某種程度上延續(xù)了此門(mén)課程的某些內(nèi)容,還有一些選修課程比如General Linear Model也是此課程中的一個(gè)小知識(shí)點(diǎn),只是學(xué)習(xí)深度更深。后續(xù)很多課程都會(huì)有這門(mén)課的影子,所以學(xué)習(xí)好這門(mén)課是小羊?qū)W姐的肺腑之言。難度系數(shù)4顆星。
這門(mén)課的主要內(nèi)容有:Linear Regression, Logistic Regression, Cross Validation, Bootstrap, Random Forest, K-means clustering, Association Rules等等。
DATA 420 Scalable Computing:主要講分布式計(jì)算,包括Haddop和Spark的Framework以及關(guān)鍵算法MapReduce的實(shí)現(xiàn),每周都有作業(yè)和實(shí)驗(yàn),老師給出一些code examples,根據(jù)這些code examples來(lái)實(shí)現(xiàn)其它功能。需要閱讀大量的參考資料,課程里面會(huì)講概念比較多,所以理解起來(lái)有一定的難度,而且因?yàn)榻Y(jié)合了編程、hadoop、spark、MapReduce算法、python、甚至JAVA、bash script、pig等多種技術(shù),難度較高,但是老師是有著實(shí)際經(jīng)驗(yàn)的公司老板(老師自己有一個(gè)咨詢(xún)公司),所以會(huì)給出比較專(zhuān)業(yè)的行業(yè)經(jīng)驗(yàn),提供多種視角,而且老師很樂(lè)意課后答疑,會(huì)積極回復(fù)學(xué)生的郵件,非常干練的一個(gè)老師。
選修課程DATA 422 Data Wrangling: 主要是講數(shù)據(jù)清洗這個(gè)領(lǐng)域,作為data mining的pre-step,其中一個(gè)授課老師Tomas澳國(guó)立畢業(yè),來(lái)UC教書(shū),因?yàn)槟贻p比較好溝通,人也很熱心,華人面孔但是不會(huì)講中文,老師技術(shù)很好,自己的研究方向是Neural Netowrk,學(xué)術(shù)內(nèi)的前沿消息可以找這個(gè)老師去打聽(tīng)。
其它的選修課程可到學(xué)校官網(wǎng)搜索,鏈接:https://www.canterbury.ac.nz/study/qualifications-and-courses/masters-degrees/master-of-applied-data-science
關(guān)于書(shū)本
大部分的課程其實(shí)不大需要買(mǎi)教材,原因如下:
老師上課會(huì)提供課件以及推薦閱讀資料,所有的推薦材料老師都會(huì)在UC Learn上post出來(lái),除了課件,實(shí)驗(yàn)課所需要的實(shí)驗(yàn)指南以及各種信息也都可以在UC Learn上找到,類(lèi)似于國(guó)內(nèi)的校內(nèi)網(wǎng),但是匯聚了所有老師想要分享的資源;
推薦的閱讀資料分為幾大類(lèi):學(xué)術(shù)期刊,專(zhuān)業(yè)書(shū)籍,網(wǎng)上一些有用的鏈接,其中學(xué)術(shù)期刊以及專(zhuān)業(yè)書(shū)籍可以在學(xué)校圖書(shū)館找到,學(xué)校圖書(shū)館有著非常豐富的藏書(shū)資源,包括紙質(zhì)書(shū)和電子書(shū),如果找不到的話(huà),可以提出申請(qǐng),要求圖書(shū)館出資購(gòu)買(mǎi),申請(qǐng)很簡(jiǎn)單,只需要填寫(xiě)想要購(gòu)買(mǎi)的書(shū)籍信息即可,圖書(shū)館一般會(huì)非常迅速地買(mǎi)好,并通知申請(qǐng)人;
有些教材是免費(fèi)給學(xué)生使用的,老師上課的時(shí)候會(huì)提供給學(xué)生這些免費(fèi)的教材資源,比如Data Mining的教材是由作者為斯坦福大學(xué),南加州大學(xué)的教授們寫(xiě)的一本名為“An Introduction to Statisticla Learning”的書(shū),這本書(shū)售價(jià)100多刀,但是可以免費(fèi)作為學(xué)術(shù)交流使用。