成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

知乎艦橋平臺如何打造內容運營平臺提升業務能力?

人工智能 算法
本文將分享知乎艦橋平臺的三板斧-內容篇。艦橋平臺是一站式內容&用戶&創作者管理、運營、分析平臺。它包括篩選、打包、分析、監控、營銷、投放、干預等多種能力,專注于內容運營、內部營銷、創作者運營、內容供應鏈、數據中心和內容分層運營等場景。

一、關鍵詞

知乎、艦橋、內容池、內容管理平臺、內容分析平臺、內容監控&報警、內容干預、Doris、Elasticsearch(ES)、DOE(Doris On ES)、Spark、Flink、Golang

二、背景和由來

1、介紹

艦橋平臺是一站式內容&用戶&創作者管理、運營、分析平臺。它包括篩選、打包、分析、監控、營銷、投放、干預等多種能力,專注于內容運營、內部營銷、創作者運營、內容供應鏈、數據中心和內容分層運營等場景。為市場感知與前瞻預判、內容和創作者生態調節、頭部創作者關系維護、營銷和促進公司業務發展,知識分享和交流創造無限可能。本篇文章重點介紹艦橋產品體系中的內容運營平臺,下一篇會介紹內部營銷平臺。

2、由來

圖片

知乎社區產品系統,歸根結底,是一個以推薦算法和搜索引擎相結合的方式來匹配用戶與內容的平臺。這樣的平臺經濟是在市場經濟模型上運作,具備靈活高效的優點,同時也存在一定的盲目性和滯后性。在這一系統中,推薦策略充當著市場調節器的角色。然而,單靠流通側的調整,往往難以迅速和有效地使平臺朝向我們期望的方向發展。因此,運營系統的加入至關重要。

運營系統在產品系統之外工作,主要目標是構建和維護一個健康的內容生態。這一系統在內容生態中起著多個關鍵作用:

  • 內容質量維護:運營系統通過設置并維護內容標準,鼓勵優質內容的生成,同時抑制或減少低質量或有害內容的傳播。
  • 用戶引導:通過對用戶行為的分析與理解,運營可以有效引導用戶產生有價值的交互,促進優質內容的發現和分享。
  • 創作者培育與支持:運營系統提供對創作者的支持與培訓,尤其是新興和有潛力的創作者,以促進其成長和對平臺的內容貢獻。
  • 競爭機制優化:通過設計合理的獎勵和激勵機制,運營可以調節內容的競爭環境,激發創作活力和用戶參與。
  • 社區氛圍塑造和提升:運營團隊專注于激勵和鼓勵社區中的積極和健康行為。贊揚和獎勵良好行為,進一步推動社區的積極環境。同時任何可能破壞社區和諧或健康氛圍的行為,我們不予支持或提倡,并積極尋找解決方案,保持社區環境的良好運作。
  • 市場趨勢感知與反應:運營團隊需要對市場趨勢保持敏感,并能夠迅速調整平臺策略以順應變化,確保內容的時效性和相關性。
  • 除了以上所述的職責,運營團隊還負責品牌塑造、擴大規模等等多方面的工作,對這些點不在本文中詳細介紹。

3、能力地圖

圖片

本期文章中,我們介紹的重點是艦橋產品體系中的內容運營平臺。

三、解決方案和落地

1、業務架構

圖片

2、業務層拆解

為了更好地滿足當前的業務需求,我們在最頂層的業務結構上細化出了四類產品和對應的產品接口,以便與各團隊進行高效協同工作。

  • 內容池,該平臺接口層面向的是分發團隊。它具備多種實用的功能,包括點查、檢索召回、多特征粗排等。在使用時,團隊可以把它作為分發的召回源和粗排工具,或者僅作為召回源。供業務側根據實際需要調整和修改召回源和粗排邏輯。
  • 內容管理平臺,這是專門為運營團隊設計的。該平臺具備豐富的基礎功能,如內容篩選、整理打包等,還允許團隊對內容進行一系列操作,例如編輯內容、調整內容優先級(提升或降低權重),以及投放內容等。
  • 內容分析平臺,旨在為運營團隊提供分析工具。這個平臺可以進行單篇內容和內容集合的趨勢分析、構成分析,還能進行消費者畫像分析等深層次挖掘。根據不同的分析方式,可以獲得不同的數據結論,以幫助理解和優化業務運營效果。
  • 內容監控&報警,目標是為運營團隊提供及時的業務監控和報警能力。這個平臺通過內容和用戶的多種事件觸發,通過多種業務模版和靈活的配置,可快速搭建業務報警能力,比如關鍵詞輿情報警、發布&定級監控報警等。幫助運營團隊快速發現具有某種特征的業務表現。
  • 內容干預:運營使用做標記、打標簽等手段,將信號傳遞到分發渠道。通過對創作者以及內容打壓與推優的策略,篩選出優質的內容并將其優先推送給用戶,讓真正有價值、高質量的內容能夠被更多的目標用戶看見。

四、業務能力效果及架構

1、內容池

圖片

圖片

圖片

內容池:該平臺接口層面向的是分發團隊。它具備多種實用的功能,包括點查、檢索召回、多特征粗排等。在使用時,團隊可以把它作為分發的召回源和粗排工具,或者僅作為召回源。供業務側根據實際需要調整和修改召回源和粗排邏輯。

2、內容管理平臺

圖片

內容管理平臺,這是專門為運營團隊設計的。該平臺具備豐富的基礎功能,如內容篩選、整理打包等,還允許團隊對內容進行一系列操作,例如編輯內容、調整內容優先級(提升或降低權重),以及投放內容等。

3、內容分析平臺

內容分析平臺,旨在為運營團隊提供分析工具。這個平臺可以進行單篇內容和內容集合的趨勢分析、構成分析,還能進行消費者畫像分析等深層次挖掘。根據不同的分析方式,可以獲得不同的數據結論,以幫助理解和優化業務運營效果。

4、內容監控&報警

圖片

內容監控&報警,目標是為運營團隊提供及時的業務監控和報警能力。這個平臺通過內容和用戶的多種事件觸發,通過多種業務模版和靈活的配置,可快速搭建業務報警能力,比如關鍵詞輿情報警、發布&定級監控報警等。幫助運營團隊快速發現具有某種特征的業務表現。

5、內容干預

圖片

內容干預:運營使用做標記、打標簽等手段,將信號傳遞到分發渠道。通過對創作者以及內容打壓與推優的策略,篩選出優質的內容并將其優先推送給用戶,讓真正有價值、高質量的內容能夠被更多的目標用戶看見。

五、支撐層的選型和落地

根據我們面臨的不同業務場景,如內容池的構建、內容管理平臺的運行、內容分析平臺的發展,以及對內容的監控和報警等多元需求,我們總結出三種通用的底層支持設施,它們分別是流式內容定向及打包,批式內容定向及打包,和內容分析及預處理。通過這三種基礎設施,我們可以在上層搭建我們的業務模塊,以滿足具體業務需求。具體如下:

流式內容定向及打包以其“及時、快速”為主要特點,在秒級別的時間內完成內容打包的更新。然而,這種模式需要在生成內容包之前先詳細定義好檢索條件。

批式內容定向及打包提供了更為多元的設定條件,適合那些對自由度要求更高的業務場景。盡管如此,此種模式的時效性相對較低,需要“次日更新”的方式進行合適的調整和配合。

內容分析&預處理,在將這兩種內容打包方式與內容分析及預處理聯系起來時,我們的目標是保證分析能力的正常運行,并確保內容事實、用戶事實、流量事實等不同類型的特征口徑一致,鏈路對齊。

1、流式內容定向及打包選型

流式內容檢索利用消息隊列作為數據源,以內容的屬性、特征變更作為事件的觸發源。其復雜性主要體現在實時計算和處理方面。

為了解決內容重復計算的問題,我們采用了 Flink 對消息源進行聚合操作。通過使用窗口機制,同一窗口內的內容只會被計算一次,從而避免了短時間內同一內容的多次變更導致的重復計算。

為了提高內容出入池的性能,我們對已經滿足規則的內容進行了緩存處理,避免了頻繁的數據庫操作。這種優化策略可以顯著提升系統的響應速度和吞吐量。

2、批式內容定向及打包選型

不同于流式檢索,批式檢索的特點是條件更多,更適合探索性質的檢索。批式檢索需要在離線進行特征和屬性的計算與構造,然后再提供相應的檢索能力,因此時效性較低(T+1)。

鑒于批式內容檢索條件復雜且涉及正文等要素,我們選擇了 Elasticsearch(ES)作為實現方案。然而,由于 ES 在文檔更新時性能較差,為了解決這個問題,我們采用了每日新建索引并滾動切換索引的策略。通過利用 ES 的 Alias 特性,我們實現了無縫的索引切換。

圖片


3、內容分析&預處理選型

(1)個體分析

在對單篇內容進行分析時,艦橋提供了以下相關能力:

  • 內容基礎信息和內容畫像:站內各個業務方內容信息的集合,由業務方以在線接口的形式提供。這些信息包括內容的基本信息、標簽信息等。
  • 內容分發數據:每天離線計算內容截止到上一日的分日、分端、分渠道分發量和互動量。幫助了解內容的分發情況和受眾的互動情況。
  • 內容生命周期:采集各個業務方生產的內容信號,包括內容生產、打標簽、治理信號以及各個渠道的分發信號。這些信號貫穿內容從生產到消費的整個生命周期,方便了解內容的生命周期特征和趨勢。
  • 閱讀者畫像:利用 DMP 已有的用戶標簽能力,使用內容的分發歷史數據和用戶標簽關聯,分析內容的閱讀者偏好。包括性別、年齡比例、閱讀者興趣偏好等信息,可以了解不同閱讀者群體對內容的偏好和需求。

圖片

(2)群體分析

內容的群體分析是一種通過計算一組內容的數據統計信息來獲取洞察力的方法。在艦橋平臺中,根據不同的業務視角,可以采用領域分析、活動內容統計和 theme 信息畫像等方法進行群體分析。這些方法的共同點是將內容按照不同的角度進行分組,并分別計算各組內容的觀察指標,如曝光數、PV(頁面瀏覽量)和內容覆蓋數等。

為了實現從不同角度進行內容分組和群體分析的目的,使用了以下所示的架構:

  • 內容維度寬表建設:特點是大而全,覆蓋內容各個角度的屬性;
  • 內容的業務領域定義:使用統一 DSL,業務可以按需進行定義自己業務范圍內的內容;
  • 內容打包:按照領域定義,將內容進行分組打包;
  • 內容分析:使用內容指標叉乘內容分組信息,得到各個組的內容表現;對計算得到的觀察指標進行可視化展示。

六、未來趨勢

1、業務能力發展趨勢

(1)運營流程自動化&策略化

圖片

在艦橋產品體系的內容運營平臺中,目前所有的功能都基于原子化能力搭建,并且配備相應的接口。這種方式賦予了平臺靈活且強大的能力,但我們對未來有更大的期待。

我們計劃開發一個類似于上圖的策略化流程畫布的系統,通過這個系統,運營流程將被準確而高效地編排。這不僅意味著我們將進行自動化的調度和執行,更進一步地,我們能夠跟蹤每一次運營的效果,進行細致入微的觀察和分析。我們也將 AB 實驗引入到系統中,通過簡潔的實驗結果,為策略提供指導,以便在更廣闊的視野中找出最佳運行方案。

未來的運營流程將實現策略化的配置、流程的自動化、效果的可跟蹤可監控,以及實驗的數字化。這樣一套策略運營流程自動化和策略化編排的功能,將使我們的業務決策更加精準,并有助于提升公司的運營效率和業務表現。我們秉持對技術進步的信心,期待通過改變,開啟新的可能。

(2)運營流程 AI 化

借鑒 OpenAI 所倡導的 Assistants API 模式,并結合模型能力的不斷提升,使得 Assistants 加上 Function Call 的模式已經逐步變為可能。這為我們提供了一個全新的視角去思考如何使用人工智能技術去優化業務流程并提升運營效率。在這個原型上,我們期待構建出一種全新的、AI 化的運營流程模式。

這樣的模式會基于上述理念,構建屬于自身的 Assistants API,而底層則通過使用特定的數據和 Function 來提供基本的流程原子 API。這些原子 API 可以構建連貫的工作流,滿足不同場景下的豐富需求。

圖片

在這個架構中,Assistants 會扮演關鍵的角色,它需要循環地評估運營團隊所提出的問題和需求,并找出具有最優成效的解決方案。為了實現這一目標,Assistants 會不斷地通過 Function Call 來獲取和理解外部環境的信息和知識。下圖中,執行動作包括模型的思考、外部的 Function Call、本地沙箱運行 python 代碼等。

圖片

最終,Assistants 將應用這些知識,提供滿足運營團隊需求的方案和策略,以解決各類運營問題,并幫助運營團隊提升效率與成果。這樣的運營方式不僅提高了運營效率,同時也減輕了運營團隊的工作壓力,使他們可以更專注于策略性的工作和決策。

2、支撐層發展趨勢

(1)Doris + ES + DOE(Doris on ES)-> Doris 2.0 倒排索引

首先,倒排索引,也被稱為 inverted index,是信息檢索領域常用的一種索引技術。它將文本分割為許多單詞,然后構建從詞到文檔編號的索引,借此可以快速查詢某個詞項在哪些文檔中出現。

在 Doris 的倒排索引實現中,表的一行被視為一個文檔,列則對應文檔中的一個字段,所以可以利用倒排索引根據關鍵詞快速定位包含它的行,實現 WHERE 子句的高效檢索。

與 Doris 中的其他索引形式不同,倒排索引在存儲層面是使用獨立的文件,它與 segment 文件邏輯對應但存儲的文件是相互獨立的。這種設計的優點在于,我們在創建或刪除索引時無需重寫 tablet 和 segment 文件,因此大大降低了處理過程的開銷。

Doris 2.0 版本引入了新的特性 - 倒排索引,這具有很高的工程實踐價值。在此之前,我們使用 Elasticsearch(ES) 處理全文特征,指標特征則使用 Doris,二者以 Doris On ES 的方式結合。不過,隨著 Doris 倒排索引的引入,我們可以直接使用 Doris 進行處理,簡化了工程實施的復雜性。

(2)流式內容定向 + 批式內容定向的困境 -> 基于 Doris 的微批內容定向+打包

在目前內容運營的支撐層落地過程中,我們往往會面臨一個難題——如何找到最有效的方式以定向投遞內容?常見的策略有流式內容定向和批式內容定向,然而,這兩種方法各自存在一些限制。

流式內容定向:適用于對實時性要求高的業務場景,使得內容可以在用戶產生對應的行為后即時調整,以適應高時效性召回源的業務場景,進而解決實時策略和用戶的個性化需求。然而,這種方式目前面臨的情況就是服務器的負載大,特別是在用戶數據變化頻繁、內容信息和統計信息也有頻繁的變動性的情況下,數據流會比較大,計算壓力也較高。此外,由于實時變化的特性,流式內容定向需要持續不斷的投入,這樣也會使得整體成本顯著提高。

批式內容定向:適用于批量操作的方式進行,將大量的內容預先打包,然后定時推送。雖然這樣可以節省處理資源,降低運行成本,但缺乏實時性以及對用戶行為和內容信息變化感知低,無法滿足用戶對精準和即時內容的需求。批量推送的內容也無法緊跟用戶的實時行為變化,從而減低營銷效率。

目前從業務場景中出發,無論是用戶數據變化頻繁還是內容信息和統計信息也有頻繁的變動性,在實際的情況下并不是所有的業務場景都需要做到秒級別的更新,排除掉冷啟動、高轉高召等對時效性要求高的場景,多數的業務場景保持每 10 分鐘 ~ 20 分鐘更新一批就能很好的滿足業務需求。

面對流式內容定向和批式內容定向的挑戰,我們的解決方案是采用微批內容定向+打包的模式。使用 Doris 提供的微批內容定向 + 打包的解決方案,可以在流式內容定向與批式內容定向的困境中找到一個最優路徑。在這種模式下,我們可以利用 Doris 強大的實時數據查詢能力和索引支持,以細小的批次來處理和投遞內容,實時調整內容以適應用戶需求,同時降低服務器負載,優化資源運用。通過打包方式,我們可以有效地組織和發送內容,增加運行效率,降低運行成本。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2023-08-21 07:55:32

2019-11-25 11:03:19

互聯網數據技術

2020-12-10 15:28:29

知乎CTO平臺

2024-01-12 13:38:54

業務購物ToC

2010-07-26 13:44:49

Facebook移動應用軟件

2014-07-10 14:32:40

hybrisSAP電子商務

2018-09-03 08:36:04

知乎容器大數據

2017-12-05 17:39:37

語音識別人機交互HMM

2023-11-21 07:14:43

埋點大數據

2022-08-17 15:28:35

戴爾

2013-02-20 14:51:07

用友UAP動態建模建模平臺

2023-11-29 18:41:35

模型數據

2009-09-01 13:18:09

BTIM業務綜合管理平

2014-11-04 09:16:02

華為大服務華為

2009-09-24 17:49:23

多機系統業務融合思科

2014-10-09 09:59:38

京東京東云

2023-01-31 19:48:57

物聯網高并發
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲综合视频 | 久久精品一区二区 | 免费黄色成人 | 精品综合久久 | 欧美成人影院在线 | 精品视频久久久久久 | 亚洲欧美一区二区三区在线 | 国产欧美日韩在线 | 中国一级大黄大片 | 久久99精品久久久久 | 国产精品久久久久久久久久免费看 | 久久久精品一区 | 99久热| 欧美在线观看免费观看视频 | 日韩av一区二区在线观看 | 成人国产精品免费观看视频 | 热99| 国产区精品 | 欧美一区二区三区久久精品 | 欧美久久久久久久 | 亚洲精久久久 | 中文字幕精品一区二区三区精品 | 在线日韩精品视频 | 亚洲欧美在线视频 | 久久99精品久久久久久国产越南 | 91在线中文字幕 | 久www| 精品国产三级 | 日本一二三区高清 | 日本一区不卡 | 欧美一区二区在线 | 国产综合精品一区二区三区 | 中文字幕四虎 | 欧美淫 | 亚洲视频中文 | 中文在线一区二区 | 欧美 日韩 视频 | 亚洲欧美日韩精品久久亚洲区 | www日本高清 | 成人三级在线观看 | 欧洲色|