成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

皇帝選妃與推薦算法機制

大數據 數據分析 算法
這幾年隨著大數據,人工智能,機器學習,數據挖掘等等概念的興起,每一個數分析師都或多或少接觸過推薦算法相關的分析,做算法分析的前提是要明白目前“推薦算法” 的基本構成,掌握這些常規的業務知識,即使不懂具體的算法實現過程,也能對算法進行有效的分析。

[[393467]]

本文轉載自微信公眾號「數師兄」,作者數師兄。轉載本文請聯系數師兄公眾號。

這幾年隨著大數據,人工智能,機器學習,數據挖掘等等概念的興起,每一個數分析師都或多或少接觸過推薦算法相關的分析,做算法分析的前提是要明白目前“推薦算法” 的基本構成,掌握這些常規的業務知識,即使不懂具體的算法實現過程,也能對算法進行有效的分析。目前的推薦算法主要分為幾個核心步驟:召回,過濾,(粗排),精排。這都是什么意思呢?明白了皇帝是如何選妃的就明白了上述過程,廢話不多說,咱們來看他倆有啥區別。

召回=海選

召回從目前的資源池中將滿足條件的資源圈出來。就好比皇帝昭告天下開始選妃之后,各個省就開始從民間搜集年齡13-16歲之間的良家少女,由于是全國的普選,又受到評委眼光或者是指標的影響,所以這時候選拔的人可能是各種顏色的皮膚,各種顏色的頭發,嘴里說的念的都是“選我選我”的中國話~

除了普選還有一些特殊通道,比如,宰相家的外甥女,鄰國選送的公主,或者皇帝本人看上了大名湖畔夏老漢家的二閨女。那么這些特殊通道可以理解為多路召回。總之呢,在海選這一步,只要跟美稍微搭點邊就先眉毛胡子一把摟過來再說。

這個原理跟我們平時看新聞時一樣,召回的方式可以說是多方面的,如向量召回,協同過濾,其他多路召回等等。包含內容豐富,比如關注的博主發布的內容,熱度飆升的內容,熱點以及熱點周邊,從內容上來說又有娛樂,影視,政治等等。總之不管最后呈現給用戶什么內容,要在在保證“全”的基礎上,再去做“準”,召回這一步更關注“全”的問題。

過濾=復選

海選選中的美女就進入了復選階段,這么一大群人不可能全都應聘成功,而且人還是太多了。所以在進宮之前,負責選拔的太監要再淘汰掉一波人,比如太高的,太矮的,太胖的,太瘦的,學歷不夠的,性格不好,投機倒把的等等,這一操作在過濾掉質量較差選手的同時,也減輕下一環節工作人員的工作壓力

還是以新聞推薦為例,召回的內容中掛著熱點標題搞反動的,點贊率賊差的,過時的內容先干掉一波,濾掉了相當一部分召回中質量較差的內容,留下的內容更加精華。

粗排=三面

進宮面圣之前這一步其實并不是必須的,主要看宮內太監們的處理能力,如果經過復選之后剩下3000人,而宮內太監們的處理能力是5000人那就不用三面了,直接懟進來再說。但是如果處理能力只有1000人,這時候就要在進宮之前過濾掉一波人,減少宮內負責選拔的太監們的工作壓力,這時候根據佳麗們的家庭背景以及性格品德,儀容儀表,才藝見識等綜合打分,再過濾掉一波質量相對較差的,精益求精。

就推薦算法來說,這里處理能力一般指的是服務器的負載能力,數據量較少的小型app可能在召回階段資源量就不足,過濾之后資源又折損,最終需要展示給用戶的數據量已經不多,此時可以把精排和粗排一起來搞,但是對于大型app,過濾之后數據量依然較多,此時就需要用粗排繼續過濾一波數據來降低服務器的載荷。類比于太監給佳麗們打分一樣,粗排也是根據用戶的特征進行打分,目前打分的各種各樣的算法,其實相當于選妃過程中評委們湊一塊商量出來的幾種不同的評分規則。

精排=排班上崗

經過三面之后,剩下的人終于可以進宮了,哪些人能夠最終出現在皇帝的侍寢名單中,還需要再次評估,如果說之前的淘汰是一些普適性的特征,那么到精排這一步除了之前的靜態特征之外還會加入一些動態特征以及皇帝本身的偏好。

比如周期性考核觀察佳麗們的行為表現(儀容儀表,行為舉止,打不打呼嚕,說不說夢話,有沒有狐臭,甚至還有“探其乳,嗅其腋,捫其肌理,察其貞潔” 的說法);統計皇帝近年來的行為偏好(圓臉還是錐子臉,大家閨秀還是小家碧玉,文藝青年還是逗比青年)。再對這些特征進行綜合打分,最終選出這么五十個人展示在皇帝的侍寢列表中。

這就相當于新聞列表中除了之前所說的特征,還要結合內容的點贊,評論率,舉報次數,舉報率以及當前用戶的偏好(是更喜歡時政,科技還是娛樂)進行一個綜合的評分,將最適合當前用戶的內容排序曝光出來

以上就是我們瀏覽app時底層的推薦算法展示給我們內容的過程,看完之后是不是感受到了帝王般的待遇。在了解了上述步驟的基礎上,即使不懂算法的具體搭建實現過程也可以從上述的四個過程入手get到一些分析思路。比如用戶點擊率低,是召回過多但過濾特征不足導致質量較差的內容進入精排導致的,還是精排過程用戶特征過少所致

題外話

由于新用戶是沒有行為的,所以就不能判斷用戶的偏好,對于推薦引擎來說相當于冷啟動,這時推薦的內容相對比較雜亂,慢慢的隨著用戶的行為積累,算法學習出用戶的偏好,推薦的內容就越來越集中于某一些領域。

 

就如同抖音一樣,剛注冊的時候可能大家的曝光大差不離,刷一年之后可能差異就比較明顯。這樣做的優點在于取悅用戶,推薦的內容越來越準確,用戶留存越來越高。而缺點在于限制了用戶的視野,把每個用戶關在了他自得其樂的盒子里,你覺得這樣好么?

 

責任編輯:武曉燕 來源: 數師兄
相關推薦

2020-06-29 07:30:00

推薦算法推薦系統

2020-06-30 07:00:00

推薦算法推薦系統

2020-01-16 09:01:28

負載均衡算法加權輪詢

2018-06-20 14:26:07

ISISOSPFTLV

2016-09-30 15:03:13

推薦系統算法

2018-10-14 15:37:27

機器學習數據算法

2010-03-04 10:08:54

.Net垃圾收集

2009-05-21 15:47:57

打工皇帝唐駿職業經理人

2010-04-27 11:20:38

Fedora 12

2011-04-28 10:08:08

噴墨打印機

2020-08-17 07:50:09

阻塞CPU中斷

2023-10-31 16:46:45

2017-07-11 09:46:29

2020-06-28 07:30:00

推薦算法推薦系統

2009-09-10 11:11:07

互聯網

2010-08-27 10:02:14

碩士

2013-07-17 18:24:01

手游創業

2023-07-19 08:55:00

神經網絡推薦系統

2024-08-28 08:43:58

2016-11-22 08:50:23

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人精品国产免费网站 | 亚洲精品日本 | 国产激情网 | 福利国产| 国产免费一级片 | 日韩成人av在线 | 日韩精品在线一区 | 日韩中文一区二区三区 | 国产成人综合一区二区三区 | 2019天天操 | 日韩一区二区三区在线播放 | 久在线精品视频 | www.日韩 | 亚洲高清电影 | 成人免费视频网站在线观看 | 亚洲网站在线观看 | www国产亚洲精品久久网站 | 国产精品美女久久久久aⅴ国产馆 | 亚洲精品女人久久久 | 国产高清精品一区二区三区 | 国产精品久久久久久久久久免费看 | 欧美一级一 | 久久久一区二区三区四区 | av先锋资源 | 精品久久99| www.99re5.com| 国产精品久久久久久久久久久久 | 久色网| 女同久久另类99精品国产 | 欧美一二三 | 亚洲精品日韩欧美 | 欧美一区二区三区国产 | 成人在线观看免费视频 | 懂色中文一区二区在线播放 | 一级毛片大全免费播放 | 国产精品视频偷伦精品视频 | 激情久久网 | 亚洲色欧美另类 | 国产在线观看一区二区三区 | 成人一区av | 男人天堂999 |