信貸系統(tǒng)中如何使用征信數(shù)據(jù)?
前言
大家在借唄或者銀行的信用貸借錢的時候,第一步是讓你授信,看看你的信用能夠貸到多少錢?那么金融機構(gòu)是如何知道你的信用狀況呢?
圖片
在金融機構(gòu)開展信貸業(yè)務(wù)、進行風控管理的過程中,征信數(shù)據(jù)是十分關(guān)鍵且重要的基礎(chǔ)數(shù)據(jù),它客觀反映了征信主體的信用狀況。以人行二代征信數(shù)據(jù)為例,其中存在極其豐富的個人信息、信貸交易明細等數(shù)據(jù),那么如何從中快速挖掘衍生出有價值的指標成為了信貸業(yè)務(wù)開展、風險控制管理的重要工作,本文就講講金融機構(gòu)通常是如何使用征信數(shù)據(jù)的。
征信報告有什么?
征信報告究竟長什么樣子呢?以人行二代征信報告為例,征信報告分為簡版和詳細版本,簡版可以直接在人行官網(wǎng)發(fā)起查詢,而詳版需要線下去網(wǎng)點查詢。下圖是人行簡版的截圖:
圖片
通常人行征信報告包含以下內(nèi)容:
- 個人基本信息:包括姓名、身份證號碼、性別、出生日期、戶籍地址等個人身份信息。
- 信貸信息:包括個人的信貸記錄,如貸款、信用卡、抵押貸款等各類信貸產(chǎn)品的信息,包括信貸額度、貸款余額、還款記錄、逾期記錄等。
- 查詢記錄:列出對個人信用報告的查詢記錄,包括個人查詢和信貸機構(gòu)的查詢。個人查詢不會對信用評分產(chǎn)生影響,而信貸機構(gòu)的查詢可能對信用評分產(chǎn)生影響。
- 逾期記錄:顯示個人在還款方面的逾期情況,包括逾期天數(shù)和逾期次數(shù)。
- 異常信息:包括欺詐警示、異常交易等與個人信用相關(guān)的異常信息。
- 其他信息:可能包括個人擔保信息、征信提示等其他與信用相關(guān)的信息。
金融機構(gòu)如何獲取征信報文?
通常情況下,金融機構(gòu)的信貸系統(tǒng)不會直接連人行征信系統(tǒng),而是通過征信前置系統(tǒng)進行上報、查詢。
圖片
xml一般好幾M,內(nèi)格式大致如下:
圖片
不同廠商的征信前置系統(tǒng)會對原始的征信報文做簡單的加工,比如轉(zhuǎn)成json,或者去掉部分信息,然后給到信貸系統(tǒng)。
如何構(gòu)建征信指標體系?
現(xiàn)在獲取到征信指標的報文,可以利用里面的征信數(shù)據(jù)加工衍生出各種各樣的指標。基于對征信數(shù)據(jù)的充分挖掘,包含個人信息類、賬戶行為類、逾期類等12個指標大類,細分為37個指標小類,形成衍生指標1600多個,可實現(xiàn)對征信信息精細且全面的覆蓋。
圖片
如何搭建信貸征信指標平臺?
現(xiàn)在要基于征信數(shù)據(jù)構(gòu)建出一套征信指標體系,必然需要搭建一套系統(tǒng)去支撐,那么該如何做呢?
圖片
整個信貸征信指標平臺分為2個大模塊,管理模塊和執(zhí)行模塊。
1、管理模塊面向指標管理人員,主要用于指標通過SQL或者界面拖拉拽的方式快速開發(fā)出征信指標,然后發(fā)布出去。
2、執(zhí)行模塊面向行內(nèi)業(yè)務(wù)系統(tǒng),接收管理平臺的變量配置,負責將清洗解析后的原始報告數(shù)據(jù),按照管理平臺配置的變量邏輯進行同步并行計算,得到最終的變量結(jié)果。
整個征信數(shù)據(jù)處理流程如下:
圖片
征信報文接入
通常情況下,決策系統(tǒng)等外部應(yīng)用系統(tǒng)請求征信前置機獲取征信報文,返回的格式可能是xml、json或者html。征信報文通常包含身份信息單元、婚姻信息單元、信貸交易信息概要信息單元、借貸賬戶信息單元等內(nèi)容。然后調(diào)用征信指標衍生平臺暴露的接口,傳入相應(yīng)的征信報文。
征信報文解析
征信指標衍生平臺解析原始的報文數(shù)據(jù),轉(zhuǎn)換成平臺中的58張內(nèi)存表(數(shù)據(jù)模型)中,包括身份信息、婚姻信息、借貸賬戶基本信息、借貸賬戶最近24個月還款記錄信息等。
征信指標管理
利用接入的統(tǒng)一數(shù)據(jù)模型,通過sql或者界面拖拉拽的方式配置衍生指標的邏輯。
征信指標計算
征信指標的計算分成了實時和異步兩種方式。
實時即線上接口調(diào)用的場景,將決策所需的變量(一般50個左右,一般不超過300個)實時計算返回,對時效性要求較高,需要在內(nèi)存中進行計算解析。
異步,通俗來說就是“攢數(shù)”的場景,方便后續(xù)策略迭代時,對歷史變量的回溯,對時效性要求不高,但變量數(shù)量龐大(多達數(shù)萬)。為不影響線上決策,實時和異步往往要隔離資源進行計算。
具體的計算引擎采用基于Apache Calcite作為SQL處理引擎,Apache Calcite 這一個開源的SQL查詢引擎,提供標準的SQL語言,查詢優(yōu)化,連接數(shù)據(jù)源的能力,但是它不負責存儲和管理數(shù)據(jù),只需要編寫對應(yīng)的插件即可實現(xiàn)從內(nèi)存的表中計算出指標。采用Calcite方式的另外一個好處,相對于內(nèi)存數(shù)據(jù)庫,性能更好,因為即便內(nèi)存數(shù)據(jù)庫也需要有數(shù)據(jù)庫落庫的開銷,本身數(shù)據(jù)庫的ACID等特性也會影響到查詢的性能,Calcite就不存在這樣的問題。
征信指標結(jié)果獲取
對于實時場景下,指標直接通過接口返回,用于后續(xù)的決策。異步場景,指標計算的結(jié)果可以落到數(shù)據(jù)庫中,其他系統(tǒng)自己主動來獲取。由于單客戶單報告的變量變量能達到數(shù)萬甚至數(shù)十萬,累計一段后,數(shù)據(jù)量將會很大。一般建議只存儲近期數(shù)據(jù)。而存儲形式上,對每個變量做列式存儲是不現(xiàn)實的,將本次報告的所有變量以單層json的形式存儲在一個字段下。
總結(jié)
征信指標管理系統(tǒng)實現(xiàn)了一站式指標開發(fā)、計算、發(fā)布、迭代和管理功能,極大地降低了征信指標衍生加工的難度。而且采用內(nèi)存的計算方式,保證了系統(tǒng)的性能,后續(xù)還可以納入企業(yè)征信、稅務(wù)、工商、司法等更多外部數(shù)據(jù),為整個信貸業(yè)務(wù)賦能。