數據泄露?為什么互聯網產品總能“猜你喜歡”
1.個性化推薦的應用的實現原理
個性化推薦的核心在于聯系用戶和信息(包括商品、內容、服務等),對于用戶而言,幫助用戶找到感興趣的信息;對于企業而言,幫助企業將信息推送到可能感興趣的用戶面前,增加用戶黏性,提升營收。據數據分析,Netflix上三分之二被觀看的電影來自個性化推薦,Google新聞上38%的點擊來自個性化推薦。個性化推薦被廣泛運用于各個互聯網業務場景,包括音樂推薦、信息流推薦、商品推薦、外賣店鋪推薦等。如圖1所示,某音樂平臺根據用戶的過往聽歌記錄,提供了每日推薦、私人FM、推薦歌單、私人定制等功能。
▲圖1 某音樂平臺的個性化推薦
個性化推薦的實現原理簡單來說,是通過用戶畫像來設定人群特征,再加上算法模型,決策選出相應的該用戶感興趣的信息。以圖2為例,根據該用戶的畫像標簽:90后、喜歡傷感歌曲和喜歡周杰倫,選出其感興趣的歌曲,結合點擊率預估模型(即預測提供給用戶的歌曲用戶會不會點擊),就形成了每日推薦等推薦欄目。算法模型的類型比較多,包括基于相似的人、基于相似的信息等。總而言之,個性化推薦是用戶畫像和算法模型相結合,以個性化展示為結果。
▲圖2 個性化推薦音樂的原理示意
2.個性化推薦的合規指引
個性化推薦在我國相關立法以及國家標準中的描述不一致,例如《關于開展App違法違規收集使用個人信息專項治理的公告》中的定向推送、《信息安全技術 個人信息安全規范》中的個性化展示以及《個人信息保護法》中的自動化決策。
(1)透明度
除了用戶行為追蹤、用戶畫像需要滿足透明性要求外,個性化展示也需要滿足。按照《信息安全技術 個人信息告知同意指南(2020年1月征求意見稿)》附錄E中個性化推薦場景下的告知同意,應當告知用戶如下信息:
1)個性化推薦功能是否會對個人信息主體的權益或自主決策造成影響。
2)個性化推薦功能的原理或實現方式。
3)個性化推薦功能的提供方。
4)告知管理個性化推薦功能的方式。
5)如提供采用非個性化推薦的同類功能,則可以告知進入或開啟該功能的方式。
以圖3為例,在隱私政策中說明了使用了什么類型的個人信息,展示了為推薦算法建模、進行用戶行為分析及用戶畫像,提取數據主體的瀏覽記錄、搜索偏好、行為習慣等相關特征,同時告知管理個性化推薦、非個性化推薦的方式。
▲圖3 某網絡音樂產品的隱私政策中關于個性化展示的描述
(2)顯著區分個性化展示和非個性化展示
應當顯著區分個性化展示的內容和非個性化展示的內容,顯著區分的方式包括但不限于:標明“定推”等字樣,或通過不同的欄目、版塊、頁面分別展示等。
(3)退出機制
針對電子商務服務,根據消費者的興趣愛好、消費習慣等特征向其提供商品或者服務的搜索結果的,應當同時向該消費者提供不針對其個人特征的選項,尊重和平等保護消費者的合法權益。如圖4所示,電子商務平臺提供了個性化內容推薦的開關,以及搜索時可選擇通用排序。
▲圖4 某電子商務平臺提供的個性化內容推薦開關
針對新聞信息推送服務,在向個人信息主體推送新聞信息服務的過程中使用個性化展示的,應:
1)為個人信息主體提供簡單直觀的退出或關閉個性化展示模式的選項。
2)當個人信息主體選擇退出或關閉個性化展示模式時,向個人信息主體提供刪除或匿名化定向推送活動所基于的個人信息的選項。
需要注意的是,雖然《信息安全技術 個人信息安全規范》僅對電子商務服務和新聞信息推送服務做出了個性化展示退出機制的明確規定,但是《個人信息保護法》對于通過自動化決策方式向個人進行信息推送、商業營銷的,都要求同時提供不針對其個人的選項,或者向個人提供更便捷的拒絕方式。
更進一步地說,自動化決策方式做出對個人權益有重大影響的決定,如貸款申請時,個人有權要求數據控制者予以說明,且有權拒絕僅通過自動化決策的方式做出決定。
(4)畫像維度等自主控制機制
在向個人信息主體提供業務功能的過程中使用個性化展示的,宜建立個人信息主體對個性化展示所依賴的個人信息(如標簽、畫像維度等)的自主控制機制,保障個人信息主體調控個性化展示相關程度的能力。如圖5所示,某電子商務平臺提供了長按商品后可選擇對商品不感興趣和屏蔽更多同類,來實現后臺畫像維度管理。
▲圖5 某電子商務平臺提供的畫像維度控制功能
部分平臺以用戶標簽管理平臺的方式來控制畫像關聯維度,用戶可以查看并自主添加。如圖6所示,Twitter根據用戶的行為標記出用戶興趣愛好等特征。
▲圖6 Twitter提供的畫像標簽管理功能
(5)自動化決策的公平、公正
自動化決策應當保證結果的公平、公正,不得進行大數據殺熟等不合理的差別待遇。個性化推薦更類似于第一方定向廣告,更多地使用自有平臺收集的用戶行為,形成用戶畫像,結合算法模型,實現其業務內的內容、產品、服務等推薦。因此,個性化推薦在合規上應當考慮用戶行為追蹤的收集合規性、形成畫像以及個性化推薦的使用限制、自動化決策的要求,保障透明性與用戶可控制權。
本文摘編于《數據合規:入門、實戰與進階》,經出版方授權發布。(書號:9787111705369)轉載請保留文章出處。