成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

算法工程師也會(huì)遇到 35 歲這道坎么?

新聞 前端 算法
這個(gè)問題其實(shí)對(duì)于大多數(shù)程序員都是適用的,國(guó)內(nèi)的互聯(lián)網(wǎng)公司,始終奮斗在一線寫代碼、跑算法模型的工程師實(shí)在是太少了。

[[327792]]

 導(dǎo)讀 :這個(gè)問題其實(shí)對(duì)于大多數(shù)程序員都是適用的,國(guó)內(nèi)的互聯(lián)網(wǎng)公司,始終奮斗在一線寫代碼、跑算法模型的工程師實(shí)在是太少了。每年的高校畢業(yè)生,持續(xù)不斷地在為這個(gè)行業(yè)輸入更年輕更新鮮的血液,對(duì)比 25 歲剛?cè)肼毟鼤?huì)加班更能吃苦,關(guān)鍵是薪資更便宜的年輕人,35 歲的算法工程師如果只是工齡更長(zhǎng)資歷更老,將全方位處于劣勢(shì)。

  想要跨過這道坎,要做的就是努力提升自己的相對(duì)不可替代性,從初級(jí)漸漸往高級(jí)的方向走,個(gè)人覺得大體可以分 3 個(gè)階段:

  01 初級(jí)算法工程師

  ——關(guān)鍵詞:高效執(zhí)行機(jī)器——

  算法入行的必經(jīng)之路,所謂的 SQL Boy、調(diào)參俠、數(shù)據(jù)搬運(yùn)工、煉丹師,都發(fā)生在這個(gè)階段。

  這個(gè)階段的算法工程師,很多時(shí)候都是在和數(shù)據(jù)打交道。數(shù)據(jù)漏報(bào)、數(shù)據(jù)重復(fù)上報(bào)、埋點(diǎn)有誤、多方數(shù)據(jù)統(tǒng)計(jì)口徑無法對(duì)齊、反作弊口徑定義和對(duì)齊、異常數(shù)據(jù)檢測(cè)和排查、數(shù)據(jù)缺失處理、樣本清洗、特征統(tǒng)計(jì)加工、線上指標(biāo)下降問題排查、bad case 歸因分析、數(shù)據(jù)標(biāo)注…聽起來是不是一點(diǎn)都不 fancy?對(duì)于一個(gè)負(fù)責(zé)業(yè)務(wù)落地的一線算法工程師來說,這些數(shù)據(jù)工作可能占了日常工作的很大一部分時(shí)間。

  可就是這些一開始被你看不起的各種所謂 dirty job,這些你在實(shí)驗(yàn)室和學(xué)校接觸不到的工業(yè)數(shù)據(jù)實(shí)踐,這些在 paper、書本和網(wǎng)絡(luò)永遠(yuǎn)不會(huì)教你的工作,正是你所累積的技術(shù)經(jīng)驗(yàn)和寶貴的財(cái)富,它是驅(qū)動(dòng)你往下一層級(jí)改造的主動(dòng)力。作為一個(gè)算法工程師,如果從沒有在底層有過基礎(chǔ)的開發(fā)和數(shù)據(jù)分析的從業(yè)經(jīng)驗(yàn),將來站在更高層的時(shí)候很難作出對(duì)團(tuán)隊(duì)方向有利的決策。數(shù)據(jù)決定了模型的上界,特征和算法只是在逼近這個(gè)上界。

  不了解你的業(yè)務(wù)數(shù)據(jù)特點(diǎn),很難成為一個(gè)好的算法工程師。在業(yè)務(wù)實(shí)踐中培養(yǎng)鍛煉數(shù)據(jù) sense,是一個(gè)初級(jí)算法工程師的必修課之一。

  這個(gè)階段的算法工程師,一般面臨的業(yè)務(wù)問題也比較明確,比如提升召回效果、提升線上 ctr / cvr / gmv / 時(shí)長(zhǎng)、提升搜索相關(guān)性、降低 bad case 率等等。這些明確的業(yè)務(wù)問題背后,在業(yè)界包括團(tuán)隊(duì)內(nèi)一般都有比較明確的技術(shù)方向,相對(duì)應(yīng)的就是一些比較明確的算法問題,比如信息流的 ctr 預(yù)估、用戶興趣建模、廣告出價(jià)預(yù)估、相關(guān)性模型、物品召回、圖文標(biāo)簽生成等。

  這些不同的算法方向根據(jù)團(tuán)隊(duì)形態(tài)不同,往往會(huì)分的更加明細(xì),比如召回方向的可能會(huì)有專門的團(tuán)隊(duì),落到每個(gè)人頭上就是負(fù)責(zé)其中一種召回策略:用戶標(biāo)簽召回、行為序列召回、主題召回、雙塔模型召回等。做排序模型的有專門的團(tuán)隊(duì),可能是每個(gè)場(chǎng)景有專門的人負(fù)責(zé),例如首頁 / 頻道頁 / 分類頁 / 熱門頁 / 子頻道頁等;也可能是每個(gè)方向的模型是專門的人負(fù)責(zé),比如 ctr 模型、gmv 模型、時(shí)長(zhǎng)模型等。機(jī)制策略也可能有專門的團(tuán)隊(duì),每個(gè)人負(fù)責(zé)不同的策略方向。

  具體業(yè)務(wù)和技術(shù)形態(tài)怎么分工,不需要初級(jí)算法工程師操心,那是更高層的算法工程師需要規(guī)劃和操心的事。這個(gè)階段的算法工程師的主要目標(biāo),是要使得自己具備能夠高效執(zhí)行具體任務(wù)落地的能力,這其中對(duì)動(dòng)手能力的要求是最高的。

  業(yè)界 XX 會(huì)議又又發(fā)表了一篇影響力很大的 paper,實(shí)驗(yàn)效果宣稱 ( chui niu ) 業(yè)界最牛;隔壁 XX 公司的 XX 團(tuán)隊(duì)又又又發(fā)表 ( PR ) 了最新的算法,聲稱效果提升巨大 ( 可能是 baseline 很低 );著名程序員大型交友網(wǎng)站某 hub 又開源了最新的模型代碼,號(hào)稱在多項(xiàng)任務(wù)中吊打當(dāng)前各種主流模型。于是老大一句話,你去調(diào)研下人家怎么做的,回來落地實(shí)現(xiàn)下啊。

  接下來就是發(fā)揮初級(jí)算法工程師能力的時(shí)候了。看論文、復(fù)現(xiàn)模型、跑實(shí)驗(yàn)、調(diào)參數(shù)、魔改網(wǎng)絡(luò)、效果不好接著調(diào)。這個(gè)過程其實(shí)也是拉開初級(jí)算法工程師們能力的時(shí)候,有些人只是做到會(huì)用工具,調(diào)調(diào) api,調(diào)調(diào)參數(shù)改改網(wǎng)絡(luò),或者直接 git clone 下載源碼編碼后改改直接跑,至于能否有效果完全看天,真真是在 " 煉丹 "。最終沒效果還要補(bǔ)充一句,論文作者們真的是在吹牛啊,這個(gè)算法在我們這里完全沒有效果啊。然后換個(gè)模型重新煉丹來過。

  有些人在這個(gè)過程中不斷累積經(jīng)驗(yàn),盡可能去找這些方法的共性。以 ctr 模型為例,embedding 參數(shù)對(duì)自己業(yè)務(wù)數(shù)據(jù)效果是否敏感、網(wǎng)絡(luò)層數(shù)的深度對(duì)效果的影響、不同正則化方法是否 work、bn/ln/dropout 等方法是否有效、當(dāng)前的特征體系對(duì)于高階特征交叉是否已經(jīng)刻畫足夠、attention 到底收益有多大等等。這些如果能從更本質(zhì)和通用共性的角度去分析總結(jié),大概率在同樣的數(shù)據(jù)分布上可以作為以后的先驗(yàn)判斷,經(jīng)驗(yàn)是可遷移的,不至于在每一次有新的模型出來就去盲目的做嘗試。

  判斷這個(gè)階段的工程師的標(biāo)準(zhǔn),就是對(duì)于一個(gè)明確的算法目標(biāo),是否具備足夠強(qiáng)的執(zhí)行能力將其落地。初級(jí)的落地能力只是快速實(shí)現(xiàn),更加高級(jí)和 solid 的落地能力,是能夠 know how 的落地,有無效果都能做出比較 solid 的分析,并且能夠?yàn)橐院蟮牡鷥?yōu)化提供經(jīng)驗(yàn)。

  02 中級(jí)算法工程師

  ——關(guān)鍵詞:算法選型和改造能力——

  經(jīng)過了第一階段之后,對(duì)于明確的算法問題已經(jīng)具備了足夠的經(jīng)驗(yàn),這個(gè)階段,需要自己根據(jù)在這個(gè)領(lǐng)域內(nèi)的技術(shù)累積,對(duì)已有的算法問題,進(jìn)行適當(dāng)?shù)母脑旌蛢?yōu)化。

  以用戶畫像為例,如果是剛搭建的團(tuán)隊(duì),初期可能更多需要搭建的是整個(gè)模型框架,和上下游團(tuán)隊(duì)協(xié)作溝通,以最小的代價(jià)迅速搭建起線上可用的基礎(chǔ) baseline。比如最簡(jiǎn)單的基于統(tǒng)計(jì)的方法,根據(jù)用戶主動(dòng)行為的物品標(biāo)簽作為用戶的統(tǒng)計(jì)畫像標(biāo)簽,如 24 小時(shí)的統(tǒng)計(jì)標(biāo)簽作為短期興趣,30 天的統(tǒng)計(jì)標(biāo)簽并做時(shí)間衰減作為長(zhǎng)期興趣。這個(gè)階段的算法工程師,如果不顧團(tuán)隊(duì)的現(xiàn)狀,一上來就想做能夠體現(xiàn)技術(shù)深度的各種模型,對(duì)團(tuán)隊(duì)的進(jìn)展其實(shí)是負(fù)向的。 確保算法能夠快速落地并取得收益才是主要目的。

  而團(tuán)隊(duì)發(fā)展到了一定階段,有了一定的基礎(chǔ)屬性畫像和統(tǒng)計(jì)畫像之后,可以根據(jù)團(tuán)隊(duì)的人力做些深度的發(fā)展,從基礎(chǔ)的統(tǒng)計(jì),可以做無監(jiān)督的隱語義理解 ( lda, w2c 等 )、有監(jiān)督的雙塔建模、加入特征的用戶興趣建模,到用戶序列建模,甚至各種圖方法知識(shí)圖譜的手段。而具體選擇哪些方法進(jìn)行嘗試需要中級(jí)算法工程師根據(jù)此前在初級(jí)階段累積的經(jīng)驗(yàn)做預(yù)判,例如假如還沒有用戶 embedding 的表示,將用戶的行為序列作為 sentence 嘗試在很多公司的業(yè)務(wù)都有過收益的 word2vec 可以作為 baseline;引入更多特征的雙塔模型得到用戶的行為 embedding 大概率能進(jìn)一步提升效果。而如果用戶有些社交屬性關(guān)聯(lián),可以考慮圖方法做進(jìn)一步的挖掘等等。

  作為該方向的負(fù)責(zé)人,需要根據(jù)團(tuán)隊(duì)發(fā)展階段,進(jìn)行合理的技術(shù)選型,并做適當(dāng)?shù)母脑臁@缭摬辉撚眯蛄心P停琹stm、rnn、transormer、bert 等序列模型如何選擇,位置特征如何設(shè)計(jì)融入等等。關(guān)于細(xì)節(jié)的參數(shù)調(diào)優(yōu)需要具體執(zhí)行的初級(jí)算法工程師進(jìn)行實(shí)驗(yàn),而大方向的技術(shù)選型以及改造方向,則需要中級(jí)算法工程師把握和指導(dǎo)。

  技術(shù)深度絕對(duì)不是考察中級(jí)算法工程師的主要手段,判斷這個(gè)階段算法工程師的標(biāo)準(zhǔn),主要是是否具備在某個(gè)算法方向,獨(dú)立承擔(dān)整個(gè)算法從選型、改造、應(yīng)用到落地取得成果的能力。

  03 高級(jí)算法工程師

  ——關(guān)鍵詞:業(yè)務(wù)抽象能力——

  前面兩個(gè)階段的工程師做的事情,嚴(yán)格意義上來說,都是在執(zhí)行這個(gè)階段的算法工程師定下來的算法指標(biāo)。這個(gè)階段的算法工程師,需要更多的是對(duì)整個(gè)業(yè)務(wù)的理解,去抽象和定義業(yè)務(wù)問題。比如當(dāng)前階段,業(yè)務(wù)是否需要專門的團(tuán)隊(duì)做用戶畫像,需要多少的人力做素材理解,rank 模型是否還有空間、需要投入多少人力持續(xù)優(yōu)化等。如果戰(zhàn)略目標(biāo)制定不明確,影響的將是整個(gè)團(tuán)隊(duì)的努力。

  對(duì)于更上層的管理層來說,算法團(tuán)隊(duì)的存在意義,絕對(duì)不是說一定需要有 ctr 預(yù)估團(tuán)隊(duì),需要有用戶畫像團(tuán)隊(duì)和視頻理解團(tuán)隊(duì),需要有人做 nlp、有人做特征等等。 整個(gè)算法團(tuán)隊(duì)存在的意義,就是能夠最終從算法的層面,解決實(shí)際的業(yè)務(wù)問題。 在某個(gè)階段需要做的是提升用戶點(diǎn)擊率,可能需要有 ctr 模型方向團(tuán)隊(duì)和有用戶畫像方向團(tuán)隊(duì)等;在某個(gè)階段引入更多的多媒體素材可能需要有團(tuán)隊(duì)做視頻理解和圖像理解;某個(gè)階段需要做用戶增長(zhǎng)和留存,可能需要有團(tuán)隊(duì)做專門的數(shù)據(jù)分析影響用戶留存的因素,有團(tuán)隊(duì)做留存模型有團(tuán)隊(duì)做增長(zhǎng)模型等等。

  這也就決定了不同時(shí)期,對(duì)于算法團(tuán)隊(duì)的目標(biāo)是不同的,需要的人員配備也不同,而這些,都需要高級(jí)算法工程師去站在整個(gè)業(yè)務(wù)層面去理解和拆解,然后將目標(biāo)層層傳遞到整個(gè)團(tuán)隊(duì)去。 判斷這個(gè)階段算法工程師的標(biāo)準(zhǔn),主要是對(duì)于所負(fù)責(zé)的業(yè)務(wù),能否制定合理的算法可達(dá)目標(biāo),并帶領(lǐng)團(tuán)隊(duì)完成實(shí)現(xiàn)。

  04 結(jié)束語

  ——關(guān)鍵詞:深耕崗位——

  個(gè)人覺得,如果 35 歲了還處在第一階段,也就是只能執(zhí)行明確的算法模型,和剛畢業(yè)的年輕人比可以說完全沒有競(jìng)爭(zhēng)力,個(gè)人職業(yè)生涯的進(jìn)一步發(fā)展會(huì)很受限。

  如果已經(jīng)進(jìn)入第二階段,不可取代性還是很強(qiáng)的,畢竟這個(gè)階段的合理算法技術(shù)選型和推動(dòng)落地能力,是很多剛畢業(yè)和工作不久的年輕算法工程師難以做到的。

  如果已經(jīng)到了第三階段至少已經(jīng)是業(yè)務(wù)方向的算法負(fù)責(zé)人了,都這種 title 了,考慮的是怎么往公司的中上層走了,根本不會(huì)擔(dān)心年齡這種坎。

  35 歲對(duì)于我個(gè)人而言還有幾年的時(shí)間,也只有幾年的時(shí)間。 無論是算法工程師還是其他崗位,深耕該崗位目前而言可能還是最優(yōu)的選擇,也可以說是沒得選的選擇。 持續(xù)不斷的去提升自己在技術(shù)、技能、經(jīng)驗(yàn)、資源上的累積,努力去提升自己的相對(duì)不可替代性。

  至于年齡,不過是個(gè)數(shù)字而已。就算是個(gè)坎,它也遠(yuǎn)不是終點(diǎn)。

  今天的分享就到這里,謝謝大家。

責(zé)任編輯:張燕妮 來源: DataFunTalk
相關(guān)推薦

2021-08-22 14:26:02

程序員IT網(wǎng)絡(luò)工程師

2019-12-30 09:03:49

職業(yè)阿里云網(wǎng)絡(luò)

2023-09-05 16:51:48

算力

2019-08-15 11:13:58

2020-01-20 09:49:58

華為騰訊百度

2018-04-16 08:59:11

程序員工程師提升

2021-06-15 15:00:25

碼農(nóng)編程開發(fā)

2017-11-09 14:12:44

大數(shù)據(jù)軟件工程師算法工程師

2021-07-03 23:40:27

CTR算法工程師

2009-02-26 10:49:29

軟件工程師職業(yè)生涯職業(yè)規(guī)劃

2018-03-19 09:59:24

數(shù)據(jù)保護(hù)大數(shù)據(jù)云計(jì)算

2009-04-07 10:49:12

印度雇員爆炸

2025-03-14 10:00:00

黑客AI網(wǎng)絡(luò)安全

2024-08-27 00:00:01

AI應(yīng)用框架

2021-03-09 10:24:46

數(shù)學(xué)計(jì)算機(jī)系統(tǒng)架構(gòu)師

2021-03-09 10:47:56

系統(tǒng)架構(gòu)師算法工程師人工智能工程師

2015-11-05 10:17:42

網(wǎng)絡(luò)工程師IT人員

2019-09-02 11:14:36

AI 數(shù)據(jù)人工智能

2021-06-21 08:19:26

碼農(nóng)工作工程師

2021-06-21 15:52:21

技術(shù)資訊
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 九九热国产精品视频 | 一区在线视频 | 日本一区二区高清不卡 | 在线观看中文字幕 | www.久| 国产高清久久久 | 精品国产乱码久久久久久闺蜜 | 91最新视频 | 久久中文视频 | 欧美综合在线观看 | 成人一区二区电影 | 国产日韩欧美91 | 91av在线视频观看 | 日韩中文字幕在线视频观看 | 久久国产秒 | 欧美一区二区三区,视频 | 日韩一区二区福利 | 国产精品乱码一区二区三区 | 亚洲精品综合一区二区 | 99re| 亚洲美女视频 | 欧美一级免费观看 | 亚洲最大av | 国产成人精品一区二三区在线观看 | 在线一区视频 | 亚洲aⅴ一区二区 | 999观看免费高清www | 一区二区在线免费播放 | 久在草| 国产激情视频在线 | 中文字幕亚洲一区二区三区 | 欧美乱码精品一区二区三区 | 久草院线| 国产在线观看一区二区三区 | 色综合99 | 看毛片的网站 | 亚洲狠狠爱 | 日韩精品在线播放 | 国产一区二区日韩 | 日韩欧美不卡 | 久久久在线视频 |