成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

金融科技公司如何運用 AI 進行風控

原創(chuàng)
人工智能
21世紀以來的金融科技大潮洶涌澎湃。伴隨著人工智能和互聯(lián)網(wǎng)技術(shù)的興起,傳統(tǒng)金融行業(yè)受到了顛覆性的沖擊。特別是在金融風控領(lǐng)域,伴隨著機器學習理論的發(fā)展和成熟,以及人們對技術(shù)的信賴度逐漸增加,越來越多的金融企業(yè)和機構(gòu)采納了人工智能的方式來處理傳統(tǒng)的業(yè)務問題。

【51CTO.com原創(chuàng)稿件】21世紀以來的金融科技大潮洶涌澎湃。伴隨著人工智能和互聯(lián)網(wǎng)技術(shù)的興起,傳統(tǒng)金融行業(yè)受到了顛覆性的沖擊。特別是在金融風控領(lǐng)域,伴隨著機器學習理論的發(fā)展和成熟,以及人們對技術(shù)的信賴度逐漸增加,越來越多的金融企業(yè)和機構(gòu)采納了人工智能的方式來處理傳統(tǒng)的業(yè)務問題。

站在人工智能的角度上來說,風控本身是一個不均衡分類問題。所謂不均衡分類問題,是指在分類的過程中正負樣本的分布極為不均。因為在銀行借貸的過程中,欺詐用戶畢竟是少數(shù)人,互聯(lián)網(wǎng)金融公開的數(shù)據(jù)欺詐率在 10% 到 20%,傳統(tǒng)銀行業(yè)的欺詐率通常更低。所以金融科技公司要解決的就是如何在數(shù)據(jù)分布不均衡的情況下通過分類的方法把惡意用戶篩選掉。

因為本質(zhì)上是分類問題,所以只要是分類算法,都可以用來嘗試解決問題。像傳統(tǒng)的淺層模型邏輯回歸、隨機森林、xgboost 以及后續(xù)的混合模型和深度學習模型都可以用來做風控。這里分享恒昌利通的研究人員在 2018 年的國際會議 DMKD 2018 發(fā)表的一篇介紹金融行業(yè)風控的論文《Detection of fraudulent users in P2P financial market》。

論文作者的數(shù)據(jù)輸入主要是線下門店的用戶填表信息,包括用戶的家庭信息,工作單位信息,貸款信息等。作者嘗試使用隨機森林和 xgboost 的方法,并進行了對比。對比主要采用了 Grid Search 枚舉了模型參數(shù)。評測指標為 AUC 。

輸入數(shù)據(jù)總共有 97 個特征,其中有 33 個特征是類別特征。類別特征用 one-hot 的形式進行了處理。實驗數(shù)據(jù)分為訓練集、測試集和驗證集,數(shù)據(jù)比例為 4:1:1。因為數(shù)據(jù)總體維度較高,因此在分類前嘗試用 PCA 的方法進行數(shù)據(jù)降維處理,得到隨機森林 + PCA 的 Grid Search 效果圖如下所示:

隨機森林+PCA 在測試集上的 AUC 為 0.78 ,在訓練集上的 AUC為 0.797。隨后作者比較了 xgboost + PCA 的效果。因為數(shù)據(jù)集合的分布跨度很大,因此考慮采用 tanh 對數(shù)據(jù)進行歸一化處理,歸一化處理后 xgboost + tanh 的效果***,排除奇異點得到的 AUC基本在 0.88 左右,如下圖所示:

作者也嘗試了 PCA + tanh 結(jié)合的方式,但是效果并不如 xgboost + tanh 理想,所以最終采納的模型為 xgboost + tanh 。

風控反欺詐領(lǐng)域的人工智能探索持續(xù)了多年,早在 2000 年初期美國的研究者就已經(jīng)在研究相關(guān)領(lǐng)域的技術(shù)。然而相關(guān)技術(shù)真正得到人們的信任,也是等到了許多年的時間檢驗之后。直到人工智能技術(shù)日趨成熟的今天,仍然會有許多的門戶之見:例如只有精通金融業(yè)務的人才能真正做好風控,風控數(shù)據(jù)重要還是模型重要等帶有嚴重偏見的無聊辦公室政治話題經(jīng)常影響公司內(nèi)部正常的業(yè)務開展。

2018年 Kaggle 上 Home Credit 這家公司組織了一次反欺詐比賽,提供的基本數(shù)據(jù)都是一樣的,參賽的基本都是技術(shù)人員,差別只在大家對特征工程和模型的選擇和處理上,最終的結(jié)果千差萬別。這樣的比賽活動能夠打消許多人對于人工智能技術(shù)的偏見和誤解。所以說很多時候影響一項技術(shù)或者事業(yè)進步的,不是技術(shù)本身,而是人的固有執(zhí)念。

當然,這也并不是說技術(shù)不成熟就要硬上。比如深度學習模型在金融風控領(lǐng)域其實現(xiàn)在還沒有取得比 xgboost 或者淺層模型更好的效果。為了績效或者面子工程而拿深度學習模型作秀實屬浪費公司的資源和開發(fā)者個人的寶貴時間。

總之,金融科技行業(yè)近幾年來發(fā)展迅猛,但是在發(fā)展的過程中泥沙俱下。作為金融科技從業(yè)者對于自己的事業(yè)要有清晰的認知和定位。

作者簡介:

[[263763]]

汪昊,區(qū)塊鏈公司科學家,前恒昌利通大數(shù)據(jù)部負責人,美國猶他大學本科/碩士,在百度,新浪,網(wǎng)易,豆瓣等公司有多年的研發(fā)和技術(shù)管理經(jīng)驗,擅長機器學習,大數(shù)據(jù),推薦系統(tǒng),社交網(wǎng)絡分析等技術(shù)。在 TVCG 和 ASONAM 等國際會議和期刊發(fā)表論文 10 篇。本科畢業(yè)論文獲國際會議 IEEE SMI 2008 ***論文獎。

【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】

責任編輯:龐桂玉 來源: 51CTO
相關(guān)推薦

2021-06-17 10:27:03

人工智能AI機器學習

2016-10-24 09:48:02

大數(shù)據(jù)互聯(lián)網(wǎng)犯罪

2020-07-11 15:56:07

人工智能大數(shù)據(jù)云計算

2022-04-08 15:34:30

區(qū)塊鏈金融科技

2024-10-18 09:16:45

2021-12-02 15:17:42

大數(shù)據(jù)銀行應用

2021-06-18 10:06:08

客戶體驗金融服務數(shù)字化

2023-09-08 11:08:38

云計算醫(yī)療科技

2024-09-25 14:51:44

2020-10-19 17:34:16

Teradata科技企業(yè)

2018-04-17 10:37:20

高通

2017-04-21 14:04:50

互聯(lián)網(wǎng)

2009-12-04 18:05:05

PHP stristr

2022-01-26 13:26:40

加密貨幣金融數(shù)字資產(chǎn)

2024-02-04 11:59:09

AI模型人工智能

2019-10-17 08:58:27

金融

2019-04-18 22:40:42

蜂巢機器人金融機器人

2021-01-20 13:12:49

人工智能AI歐盟
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 成人欧美一区二区三区黑人孕妇 | 一级全黄少妇性色生活免费看 | 在线免费观看黄网 | 日韩精品免费一区 | 色综合国产 | 欧美一区二区三区四区视频 | 欧洲一区二区在线 | 一区二区三区国产在线观看 | 久久久99精品免费观看 | 久久久久久91 | 亚洲成人精品 | 高清免费av | 一区二区三区四区av | 毛片在线看片 | 成年人在线观看 | 久久一区视频 | 国产免费xxx | cao视频 | 逼逼网| 99久久婷婷国产综合精品电影 | 日韩成人av在线播放 | 国产成人免费视频网站视频社区 | 亚洲视频在线看 | 欧美乱码精品一区二区三区 | 久久久久久国产 | 精品国产一区二区三区性色av | 精品国产91久久久久久 | 偷拍亚洲色图 | 欧美成年黄网站色视频 | 久久中文字幕一区 | 国产成人精品免费视频大全最热 | 91在线成人 | 黄色一级毛片 | 超碰天天 | 亚洲视频欧美视频 | 欧美亚洲视频在线观看 | 国产福利在线 | 玖玖操 | 日韩中文字幕 | 日韩视频 中文字幕 | 九九九视频精品 |