新聞中心
該如何學(xué)習(xí)大數(shù)據(jù)知識(shí)?
本人工作以來一直在大數(shù)據(jù)領(lǐng)域深耕,對(duì)于大數(shù)據(jù)的入門者有少許的建議。大數(shù)據(jù)領(lǐng)域的工作方向主要分為以下幾類:

成都創(chuàng)新互聯(lián)是一家以重慶網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計(jì)、品牌設(shè)計(jì)、軟件運(yùn)維、營銷推廣、小程序App開發(fā)等移動(dòng)開發(fā)為一體互聯(lián)網(wǎng)公司。已累計(jì)為廣告設(shè)計(jì)等眾行業(yè)中小客戶提供優(yōu)質(zhì)的互聯(lián)網(wǎng)建站和軟件開發(fā)服務(wù)。
1.計(jì)算平臺(tái)方向
2.數(shù)據(jù)處理方向
3.數(shù)據(jù)分析方向
4.算法應(yīng)用方向
目前大部分公司的子部門也基本按這些進(jìn)行細(xì)分,上述各個(gè)領(lǐng)域的側(cè)重點(diǎn)也不一樣。
1.計(jì)算平臺(tái)方向。自從07年hadoop技術(shù)橫空出世以后,使得廉價(jià)的機(jī)器也能部署成分布式計(jì)算環(huán)境,所以這塊技術(shù)主要圍繞著hadoop生態(tài)。這個(gè)需要學(xué)習(xí)hdfs分布式文件,hbase或hive分布式數(shù)據(jù)庫技術(shù),spark或者flink等分布式計(jì)算技術(shù),zookeeper等分布式協(xié)調(diào)技術(shù)等。根據(jù)個(gè)人喜好可以側(cè)重底層技術(shù)的優(yōu)化及維護(hù),或者基于這些技術(shù)的應(yīng)用開發(fā)。
2.數(shù)據(jù)處理方向,大致是指ETL工程師。該職位主要是加工處理各個(gè)數(shù)據(jù)源的數(shù)據(jù),包括日志收集的、業(yè)務(wù)庫產(chǎn)生的等。根據(jù)這些數(shù)據(jù)供其他工種的同學(xué)進(jìn)行使用,比如產(chǎn)生各種報(bào)表,或者拿來給算法做訓(xùn)練。這一塊側(cè)重sql技術(shù)或者python技術(shù),他們更側(cè)重于對(duì)業(yè)務(wù)的理解,技術(shù)相對(duì)弱化一點(diǎn)。
3.數(shù)據(jù)分析方向。這塊的崗位主要是數(shù)據(jù)分析師,實(shí)際中使用比較多的是sql和excel。如果把業(yè)務(wù)比喻成人,數(shù)據(jù)就是血液,而數(shù)據(jù)分析師就是通過血液進(jìn)行人體癥狀判斷的醫(yī)生。很多時(shí)候數(shù)據(jù)分析師比業(yè)務(wù)方還懂業(yè)務(wù),他們需要分析業(yè)務(wù)的痛點(diǎn),通過分析數(shù)據(jù)尋找解決方案。這塊需要很強(qiáng)的邏輯分析能力和溝通能力。
4.算法工程師。這個(gè)基本上處于大數(shù)據(jù)食物鏈頂端的工種。他們需要精通高數(shù)、高代、概率論與統(tǒng)計(jì)等等數(shù)據(jù)基礎(chǔ),同時(shí)需要掌握python或scala至少一門語言,需要掌握機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的知識(shí)。門檻相對(duì)其他工種稍高一點(diǎn)?;A(chǔ)的算法工程師一般調(diào)用算法開發(fā)包進(jìn)行業(yè)務(wù)開發(fā),同時(shí)進(jìn)行參數(shù)調(diào)優(yōu)。高級(jí)的算法工程師需要看論文自己實(shí)現(xiàn)算法,或者根據(jù)業(yè)務(wù)情況優(yōu)化數(shù)學(xué)公式。如果想從事這塊,你需要很扎實(shí)的數(shù)學(xué)基礎(chǔ),并且要熱愛數(shù)學(xué)才能持之以恒堅(jiān)持下去。
額,感覺你的問題問的有點(diǎn)泛。目前我也在學(xué)大數(shù)據(jù),個(gè)人建議可以從以下幾個(gè)步驟開始學(xué)習(xí)大數(shù)據(jù)。第一、先學(xué)習(xí)基礎(chǔ)知識(shí),基礎(chǔ)知識(shí)包括java se,Linux,數(shù)據(jù)庫之類的。第二、學(xué)習(xí)Hadoop,Spark,Yarn,MapReduce之類的,數(shù)據(jù)存儲(chǔ)和處理架構(gòu)。第三、開始做點(diǎn)稍微有含金量的項(xiàng)目之類的。這僅僅是個(gè)人的感覺,由于目前我也在學(xué)習(xí)階段,回答的可能有欠缺,歡迎各路大佬批評(píng)指正。
1.首先你需要對(duì)大數(shù)據(jù)有一個(gè)清晰地認(rèn)知,什么是大數(shù)據(jù)?大數(shù)據(jù)都能干什么?我對(duì)大數(shù)據(jù)感興趣嗎?能堅(jiān)持下來嗎?我要學(xué)習(xí)大數(shù)據(jù)現(xiàn)在有什么基礎(chǔ)?還有什么地方要補(bǔ)足?學(xué)習(xí)大數(shù)據(jù)之前千萬要想好這些,要不很有可能你學(xué)習(xí)到一個(gè)階段就半途而廢了。
2.如果你之前沒有編程的經(jīng)歷,那么你要選擇一門編程語言去輔助你做大數(shù)據(jù)項(xiàng)目。我建議學(xué)習(xí)Java,現(xiàn)在Java培訓(xùn)機(jī)構(gòu)很多,網(wǎng)上的視頻文章等學(xué)習(xí)資源也很多,而且大數(shù)據(jù)相關(guān)技術(shù)棧中有相當(dāng)一部分也是Java開發(fā)的,所以懂Java對(duì)于你學(xué)習(xí)大數(shù)據(jù)有很大的幫助。
3.如果你有Java基礎(chǔ),或者通過學(xué)習(xí)已經(jīng)掌握了JavaWeb相關(guān)的技術(shù),例如數(shù)據(jù)庫,數(shù)據(jù)結(jié)構(gòu),JQuery,Spring等,就可以開始接觸大數(shù)據(jù)相關(guān)的技術(shù)了。這一階段需要學(xué)習(xí)的知識(shí)很多,批處理框架Hadoop,分布式文件管理系統(tǒng)HDFS,流式計(jì)算框架Spark,交互式框架Hive等,另外你還需要惡補(bǔ)一些數(shù)學(xué)知識(shí),如概率論,離散數(shù)學(xué),統(tǒng)計(jì)學(xué)等。
4.實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn),理論知識(shí)充足時(shí)候一定要實(shí)踐,記住,實(shí)踐非常重要,最好結(jié)合身邊的應(yīng)用場(chǎng)景,做一到兩個(gè)大數(shù)據(jù)的項(xiàng)目,跟隨著項(xiàng)目,你才能以最快的速度成長。
5.不斷地學(xué)習(xí)新的知識(shí)技術(shù),多去拜讀大數(shù)據(jù)相關(guān)的論文,其實(shí)到大數(shù)據(jù)層面,更多的是解決問題的思路而不是解決問題的辦法。
謝謝邀請(qǐng)!
大數(shù)據(jù)是我的主要研究方向之一,同時(shí)也在帶大數(shù)據(jù)方向的研究生,所以我來回答一下這個(gè)問題。
學(xué)習(xí)大數(shù)據(jù)首先要根據(jù)自身的知識(shí)結(jié)構(gòu)選擇學(xué)習(xí)方向,比如數(shù)學(xué)和統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生可以選擇數(shù)據(jù)分析方向,而計(jì)算機(jī)專業(yè)的學(xué)生可以選擇大數(shù)據(jù)開發(fā)方向,不同的學(xué)習(xí)方向需要制定不同的學(xué)習(xí)計(jì)劃。
雖然不同的學(xué)習(xí)方向往往需要學(xué)習(xí)不同的內(nèi)容,但是對(duì)于零基礎(chǔ)的學(xué)習(xí)者來說,以下三方面基礎(chǔ)知識(shí)是都需要學(xué)習(xí)的:
第一:編程語言。不論是選擇大數(shù)據(jù)分析方向還是大數(shù)據(jù)應(yīng)用開發(fā)方向,掌握編程語言都是學(xué)習(xí)大數(shù)據(jù)的重要基礎(chǔ)。目前在大數(shù)據(jù)領(lǐng)域應(yīng)用比較廣泛的語言包括Java、Python、Scala、R和Go等,其中Java在Hadoop平臺(tái)應(yīng)用比較多,而Scala在Spark平臺(tái)應(yīng)用比較普遍。從目前的應(yīng)用趨勢(shì)來看,學(xué)習(xí)Python則是不錯(cuò)的選擇,既可以從事大數(shù)據(jù)開發(fā),也可以從事大數(shù)據(jù)分析。
第二:大數(shù)據(jù)平臺(tái)。學(xué)習(xí)大數(shù)據(jù)知識(shí)繞不過大數(shù)據(jù)平臺(tái),大數(shù)據(jù)平臺(tái)承載了分布式存儲(chǔ)和分布式計(jì)算的核心任務(wù),所以大數(shù)據(jù)平臺(tái)研發(fā)也是目前大數(shù)據(jù)領(lǐng)域的重要崗位。目前Hadoop和Spark是比較適合初學(xué)者學(xué)習(xí)的大數(shù)據(jù)平臺(tái),一方面是其開源的屬性,另一方面Hadoop對(duì)于硬件的要求也比較低。
第三:算法。大數(shù)據(jù)技術(shù)的核心訴求是數(shù)據(jù)價(jià)值化,而目前數(shù)據(jù)價(jià)值化的主要方式就是數(shù)據(jù)分析,所以掌握算法不僅對(duì)于數(shù)據(jù)分析崗位非常重要,對(duì)于大數(shù)據(jù)開發(fā)崗位也具有現(xiàn)實(shí)的意義??梢哉f,大數(shù)據(jù)產(chǎn)業(yè)鏈內(nèi)大量的崗位任務(wù)都要圍繞算法展開,所以掌握算法是學(xué)習(xí)大數(shù)據(jù)技術(shù)的核心任務(wù)之一。學(xué)習(xí)算法可以從一些經(jīng)典的算法開始,比如kNN、決策樹、樸素貝葉斯、支持向量機(jī)等等。
我從事互聯(lián)網(wǎng)行業(yè)多年,目前也在帶計(jì)算機(jī)專業(yè)的研究生,主要的研究方向集中在大數(shù)據(jù)和人工智能領(lǐng)域,我會(huì)陸續(xù)寫一些關(guān)于互聯(lián)網(wǎng)技術(shù)方面的文章,感興趣的朋友可以關(guān)注我,相信一定會(huì)有所收獲。
如果有互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等方面的問題,或者是考研方面的問題,都可以在評(píng)論區(qū)留言!
到此,以上就是小編對(duì)于ubuntu 安裝redis的問題就介紹到這了,希望這1點(diǎn)解答對(duì)大家有用。
新聞標(biāo)題:該如何學(xué)習(xí)大數(shù)據(jù)知識(shí)?(ubuntu如何安裝redis查看工具)
瀏覽地址:http://m.fisionsoft.com.cn/article/cohsipp.html


咨詢
建站咨詢
