亚洲免费一级高潮_欧美极品白嫩视频在线_中国AV片在线播放_欧美亚洲日韩欧洲在线看

您現(xiàn)在所在的位置:首頁 >常見問題 > 課程問題 > 2019年字節(jié)跳動招聘算法崗,他們最看重哪些新技術(shù)能力?

2019年字節(jié)跳動招聘算法崗,他們最看重哪些新技術(shù)能力?

來源:奇酷教育 發(fā)表于:

算法工程師必須具備的四個技能點:知識、工具、邏輯和業(yè)務(wù)。

  1
 
  ◆◆  四個技能點:知識、工具、邏輯和業(yè)務(wù)  ◆◆
 
  算法工程師必須具備的四個技能點:知識、工具、邏輯和業(yè)務(wù),我可以用一個實際例子中說明一下,比如我去面試“推薦算法工程師”的職位,具體是什么能力呢?
 
  知識:主流CTR模型以及預(yù)算控制,流量預(yù)估,bidding策略等模型算法的原理和技術(shù)細(xì)節(jié)
 
  工具:coding能力,大數(shù)據(jù)相關(guān)的spark、flink、深度學(xué)習(xí)tensorflow、pytorch、ps-lite等模型訓(xùn)練、serving相關(guān)工具
 
  邏輯:算法題,模型之間的演化關(guān)系
 
  業(yè)務(wù):推薦業(yè)務(wù)邏輯包括冷啟動、召回和排序等在構(gòu)建模型時的區(qū)別聯(lián)系,如何根據(jù)公司業(yè)務(wù)模型制定模型的目標(biāo)效果
 
  算法基礎(chǔ)是個基本功,需要在學(xué)習(xí)階段夯實,千萬不要在這個階段過于深究類似于SVM、EM、HMM等這些需要深奧的數(shù)學(xué)邏輯層面的理解,會把人耗死而且也極易讓你喪失信心。你需要量力而行,不是所有的算法都要搞清楚,抓住主流的算法模型,可以從各大公司的JD里發(fā)現(xiàn)面試官比較關(guān)心的算法模型有哪些,我總結(jié)了一些主流的算法如下:
 
  LR、決策樹、SVM、EM、Adaboost、PageRank、 FFM、隨機森林、 GBDT 、XGBoost 、聚類、CNN、RNN、LSTM、Word2Vec,F(xiàn)CN、RestNet、Fast R-CNN 、MobileNet、SSD
 
  我學(xué)習(xí)期間匯總了300+道NLP、搜索推薦、機器學(xué)習(xí)算法的面試常見題,總結(jié)一下:
 
  NLP項目——要寫上深度學(xué)習(xí)模型,19年面試NLP基本上都會問到Bert,Attention機制,最好準(zhǔn)備下。
 
  搜索推薦——相關(guān)崗位,感覺除了考察算法外,工程上考的也比較多,面一個做搜索的公司就讓設(shè)計一個方案統(tǒng)計商品近6小時實時點擊率。當(dāng)時有點蒙,回答的并不是很好,有回答使用Storm來實時計算,具體實現(xiàn)并不太熟悉。
   
  機器學(xué)習(xí)算法——GBDT基本上必問,Xgboost,LR、決策樹模型也問的很多,沒有遇到手推算法,常見機器學(xué)習(xí)模型的損失函數(shù)要清楚。
 
  GBDT的原理
 
  決策樹節(jié)點分裂時是如何選擇特征的?
 
  寫出Gini Index和Information Gain的公式并舉例說明
 
  分類樹和回歸樹的區(qū)別是什么
 
  與Random Forest作比較,并以此介紹什么是模型的Bias和Variance
 
  XGBoost的參數(shù)調(diào)優(yōu)有哪些經(jīng)驗
 
  XGBoost的正則化是如何實現(xiàn)的
 
  XGBoost的并行化部分是如何實現(xiàn)的
 
  為什么預(yù)測股票漲跌一般都會出現(xiàn)嚴(yán)重的過擬合現(xiàn)象
 
  如果選用一種其他的模型替代XGBoost或者改進(jìn)XGBoost你會怎么做,為什么?
 
  NLP:
 
  有沒有自己改過模型?類似Google Inception這種的;
 
  你了解attention機制嗎?seq2seq,有用到attention機制嗎?
 
  了解最新的bert,transformer嗎?
 
  怎么優(yōu)化深度學(xué)習(xí)模型性能?
 
  你們有用到哪些激活函數(shù)?NLP中有沒有用到?
 
  LSTM和GRU那個性能更好,什么情況下gru的效果會比lstm好?
 
  講一下Word2vec原理;
 
  商品購買評論,分成10個類,怎么聚類?把整個流程從頭到尾講一下。
 
  搜索推薦:
 
  設(shè)計一個系統(tǒng)來完成搜索詞類目預(yù)測,設(shè)計一個關(guān)鍵詞分類系統(tǒng),搜索行為日志中有搜索關(guān)鍵詞和對于的點擊,購買商品日志,每個產(chǎn)品知道具體的分類,怎么處理同一個關(guān)鍵詞多分類的情況?怎么處理誤點擊數(shù)據(jù)?
 
  廣度考察:
 
  Adaboost、 FFM、隨機森林、個別聚類算法,模型評估等知識的理解程度
 
  Spark的調(diào)優(yōu)經(jīng)驗,Model Serving的主要方法,Parameter Server的原理,GAN,Online Learning的基本理解
 
  Embedding方法,Attention機制,Multi task,Reinforcement Learning
 
 
  2
 
  ◆◆根據(jù)個人背景,調(diào)整簡歷,突出重點  ◆◆
 
 
  建議:面試過程中,面試官常根據(jù)你的簡歷追問一些細(xì)節(jié)問題,簡歷上寫的技能和知識點,自己一定要熟悉,不熟悉的不要寫上去。簡歷寫和目標(biāo)崗位相關(guān)的項目,之前工作中不太相關(guān)的項目可以去掉,簡歷整體項目經(jīng)歷要和目標(biāo)崗位匹配。
 
 
  3
 
  ◆◆  你該了解的算法崗面試環(huán)節(jié)和重點  ◆◆
 
  一個完整的算法崗面試過程主要有以下幾個主要環(huán)節(jié):自我介紹、項目介紹、算法推導(dǎo)和解釋、數(shù)據(jù)結(jié)構(gòu)與算法題(寫代碼)。
 
  關(guān)于自我介紹,主要就是簡單介紹下自己的教育背景,在?;蛟诼毱陂g的研究方向和所做的項目以及在項目中所充當(dāng)?shù)慕巧鹊?,為之后的面試做個鋪墊,讓面試官從中捕捉一些點來向你提問。
 
  項目介紹是最為重要的,這也是體現(xiàn)你綜合實力的地方,對項目背景、項目實現(xiàn)的方案,項目所實現(xiàn)的東西都要了如指掌,做機器學(xué)習(xí)的,必須準(zhǔn)備一到兩個重點的機器學(xué)習(xí)項目,關(guān)鍵是項目中間的技術(shù)細(xì)節(jié)都要了如指掌,比如你用了LR、或樹模型,就得知道所有LR或樹模型相關(guān)的推導(dǎo)和原理,一旦你說不太清楚,面試官就會對項目的真實性存疑。
 
  接下來就是機器學(xué)習(xí)算法原理和推導(dǎo),這也是要重點去準(zhǔn)備的,在面試前你需要能給你一張白紙,可以把推導(dǎo)的每一步寫的清清楚楚的,面試??歼壿嫽貧w和樹模型的推導(dǎo),關(guān)于原理面試官常會問你幾個樹模型之間的對比等等,其他的算法比如LR、SVM、EM、Adaboost、FFM、決策樹、隨機森林、 GBDT、XGBoost 、推薦算法、聚類、LSTM、Word2Vec等等,以及他們的適用場景。
 
  技術(shù)面主要會圍繞簡歷項目展開,大廠面試官問的很細(xì),阿里的基本上涉及到的每個模型每層參數(shù)結(jié)構(gòu)、原理、模型損失函數(shù),為什么要用這個損失函數(shù)等問題,所以簡歷上寫到的相關(guān)技術(shù)最好搞透徹。小公司一般會問一些工程上面的問題,一般算法崗位也會做工程相關(guān)的工作,如大數(shù)據(jù)和接口服務(wù)。
 
  最后就是寫代碼了,很多非計算機出身的大都會栽在這個地方,代碼寫得少,訓(xùn)練不到位,就會導(dǎo)致當(dāng)場思路不清晰,不知從哪寫起。
 
 
  4
 
  ◆◆2019年的算法崗面試的新套路 ◆◆
 
  面試算法崗的新套路,會有如下建議:
 
  講述項目的基本情況,項目的背景、規(guī)模、用時、用到的技術(shù)以及各個模塊。重點突出自己比較熟悉的技術(shù),防止在面試官打斷的提問的時候,問到自己最薄弱的環(huán)節(jié)。
 
  主動說出自己做了哪些事情,這部分的描述要盡量和自己的技術(shù)背景一致,描述自己在項目中的角色。描述模塊中用到的技術(shù)細(xì)節(jié),這部分一定要注意,一定要把話題引到自己最熟悉模塊的技術(shù)細(xì)節(jié)。
 
  一定要主動:作為面試者,應(yīng)該能夠主動并且邏輯清晰的說出自己的項目中有哪些亮點,能夠主動的把自己的閃光點在短短幾十分鐘的面試中都展現(xiàn)出來。
 
 
  總結(jié)
 
  真正合格的算法工程師一直是短缺的,努力做金字塔上部的那塊磚。