互金風(fēng)控進(jìn)化史:人工、實(shí)地到智能大數(shù)據(jù)走過哪些曲折?金融
NextCard是互聯(lián)網(wǎng)金融行業(yè)繞不過的一個(gè)案例。這家公司堪稱互聯(lián)網(wǎng)金融的祖師爺。
NextCard是互聯(lián)網(wǎng)金融行業(yè)繞不過的一個(gè)案例。這家公司堪稱互聯(lián)網(wǎng)金融的祖師爺。NextCard總部設(shè)在舊金山,通過互聯(lián)網(wǎng)發(fā)放信用卡的公司。公司提供一套VISA卡網(wǎng)上信用審批系統(tǒng),并為使用者申請者提供互動服務(wù)。
在這家公司的征信體系之中,信用資料較少的申請人,只需在這里存有一定額度的存款,就可申請到信用卡。和今天很多互聯(lián)網(wǎng)金融項(xiàng)目相似,NextCard主打短平快借貸,在當(dāng)時(shí)備受美國用戶的喜愛。從1996年推出到2001年的第三季度,NextCard積累了120萬個(gè)信用卡賬戶,未償余額達(dá)20億美元,其成本卻比傳統(tǒng)做法低70%。
NextCard幾乎擁有今天互聯(lián)網(wǎng)金融企業(yè)的所有特點(diǎn),甚至今天很多中國互聯(lián)網(wǎng)金融項(xiàng)目都與之相似。不過,遺憾的是,2002年9月,NextCard遭到聯(lián)邦證券監(jiān)察機(jī)構(gòu)的調(diào)查并宣告破產(chǎn)。破產(chǎn)的最大原因是因?yàn)樵摴镜目蛻糁饕际且恍┍黄渌刨J機(jī)構(gòu)拒絕的消費(fèi)者,導(dǎo)致欺詐、壞賬的激增。
然而,NextCard把許多屬于客戶故意拖欠不還的普通信用壞賬歸為“欺詐”損失(“欺詐”損失被歸納于一次性損失,財(cái)務(wù)上不需要相應(yīng)的儲備金),它需要大量增加儲備金來預(yù)備將來的信用損失,導(dǎo)致其喪失流動資金,不得不宣布破產(chǎn)。
回到15年前來看,NextCard錯(cuò)誤很明顯,主要是這三點(diǎn):
1、在征信把關(guān)層面上就已經(jīng)出現(xiàn)了漏洞
對于美國銀行來說,影響審批額度的主要因素包括客戶基本特征(包括男女、年齡、教育程度等等)、客戶風(fēng)險(xiǎn)暴露情況(社會收入、債務(wù)情況、還債能力綜合評估)、現(xiàn)有的社會表現(xiàn)(房貸還款情況、其他銀行信用卡使用情況等)。但NextCard高估了人性,明顯對用戶的信用水準(zhǔn)期待過高,忽略了信用欺詐的嚴(yán)重性,導(dǎo)致公司破產(chǎn)。
2、在風(fēng)控層面上也缺乏合理的預(yù)警機(jī)制
按道理來說,在公司出現(xiàn)壞賬時(shí),應(yīng)該加強(qiáng)儲備金,以此抵御風(fēng)險(xiǎn),但是NextCard幾乎沒有設(shè)置壞賬紅線,甚至也沒有為壞賬準(zhǔn)備對沖風(fēng)險(xiǎn)的儲備金,僅僅只是把壞賬歸納為一次性損失,這樣的損失過多的情況下,最終只會導(dǎo)致壞賬如滾雪球一般越滾越大。
3、迷信線上審批,缺乏線下人工風(fēng)控把關(guān)
在那個(gè)時(shí)代,線下人工把關(guān)是風(fēng)控不可缺少的一環(huán),很多小微企業(yè)的信貸甚至需要風(fēng)控人員到現(xiàn)場查看生產(chǎn)現(xiàn)場,結(jié)合生產(chǎn)工藝,了解生產(chǎn)組織情況,固定資產(chǎn)更新情況。風(fēng)控不僅僅是資本和金融層面的事情,更需要真正深入到產(chǎn)業(yè)之中,去了解一家企業(yè)的運(yùn)行狀況。顯然,NextCard缺乏對線下的把控,以至于全盤皆輸。
“人肉”風(fēng)控的必不可少與邏輯悖論
NextCard的垮掉本質(zhì)上是線上風(fēng)控、征信技術(shù)有限,無法戰(zhàn)勝人工的結(jié)果。在傳統(tǒng)金融機(jī)構(gòu)、小貸公司中,不僅僅有一整套嚴(yán)格的審核標(biāo)準(zhǔn),需要貸款人提供各式各樣繁瑣的資料,而且風(fēng)控人員甚至還會自己的經(jīng)驗(yàn)判斷,在面對一些特定行為特征、生活習(xí)慣的客戶會首先有一個(gè)自己的直觀打分判斷,這些是長期經(jīng)驗(yàn)累積的結(jié)果。想要拿到一筆貸款,金融機(jī)構(gòu)、貸款公司會付出很高的人力、物力、時(shí)間成本。
玖富作為中國最早的互聯(lián)網(wǎng)金融服務(wù)公司之一,如今已經(jīng)有11年的歷史,在行內(nèi)頗受好評。這家金融服務(wù)公司當(dāng)年為確保資產(chǎn)項(xiàng)目的真實(shí)、安全、可控,通過非常嚴(yán)格的完整審核體系的層層篩選,內(nèi)部建立了獨(dú)立的線上風(fēng)控模型,并引入了實(shí)地征信風(fēng)控合作。
不過,實(shí)地風(fēng)控體系依然會存在各式各樣的邏輯悖論。
對于金融企業(yè)來說,風(fēng)控模型和風(fēng)控體系需要非常有經(jīng)驗(yàn)的金融從業(yè)人士來進(jìn)行把控,比如說,銀行的風(fēng)控模型的出發(fā)點(diǎn)主要是測量借款方的還款能力,一般來講,模型包含了兩部分的評判,即客觀性的和主觀性的。客觀性的主要是數(shù)據(jù)類型,能量化的。如公司的年度審計(jì)財(cái)務(wù)報(bào)告,銀行流水,繳稅金額等,這些數(shù)據(jù)放在已設(shè)定好的模型里就能給出個(gè)分?jǐn)?shù)或等級,做為參考。
但光靠客觀數(shù)據(jù)還不夠,比如說這公司所在的行業(yè)是淘汰落后的行業(yè)(如鋼鐵、水泥等),那么評級可能需要有些降級,再比如說公司的管理人在該行業(yè)的經(jīng)驗(yàn)?zāi)晗薜拈L短,都會影響到這家公司的風(fēng)險(xiǎn),所以這部分就得靠人為主觀的去做些調(diào)整。
因此,人在傳統(tǒng)風(fēng)控體系中起到了很大的作用。比如說,需要人工標(biāo)記壞樣本的方式來記錄壞樣本訂單號,人工通過相關(guān)黑信息關(guān)聯(lián)找出來的標(biāo)記樣本。系統(tǒng)設(shè)計(jì)是盡可能多的和并且盡可能精準(zhǔn)的的收集到壞樣本。
但是人畢竟是計(jì)算能力有限,而且對復(fù)雜的征信環(huán)境缺乏整體把控能力。在人工審核過程中,很容易出現(xiàn)樣品偏差的問題。比如說,你發(fā)現(xiàn)騙子符合某些聚集特征,你指定策略1進(jìn)行打擊后,騙子的這種欺詐手段被控制,以后的損失案例都不具備這樣的聚集特征。如果壞樣本的收集時(shí)間在策略1上線之后,這個(gè)時(shí)候模型訓(xùn)練的結(jié)果極有可能出現(xiàn)滿足聚集特征的風(fēng)險(xiǎn)低,不滿足聚集特征的交易反而風(fēng)險(xiǎn)高,也就是說聚集特征的權(quán)重是負(fù)數(shù)。
另一個(gè)問題在于,金融行業(yè)的勞動力成本正在逐年上升。在傳統(tǒng)金融尤其是傳統(tǒng)信貸服務(wù)領(lǐng)域,我國傳統(tǒng)信貸能服務(wù)的客戶群僅占總?cè)丝诘?5%左右。傳統(tǒng)信貸服務(wù)需要依托線下網(wǎng)點(diǎn)展開,資質(zhì)審核、合同簽訂等流程都需面對面進(jìn)行,服務(wù)效率低下,最終的結(jié)果是一方面風(fēng)控人員不足,另一方面是單純的線下人肉風(fēng)控也缺乏對風(fēng)控體系的百分百把控。
智能風(fēng)控三階段究竟解決了哪些問題
對此的應(yīng)對方案是兩個(gè):一是引入在金融領(lǐng)域?qū)τ谡餍朋w系有能力建構(gòu)一整套完整風(fēng)控模型的人;第二個(gè)才是把大數(shù)據(jù)、人工智能引入到征信體系之中,進(jìn)行智能風(fēng)控。
今天BAT三巨頭上手互聯(lián)網(wǎng)金融的時(shí)候,幾乎都在不斷引入能夠駕馭風(fēng)控模型的人,以此根據(jù)不同行業(yè),不同數(shù)據(jù)建構(gòu)起不同的風(fēng)控模型。玖富也在不斷引入風(fēng)控模型的把關(guān)人,比如說首席數(shù)據(jù)科學(xué)家兼首席風(fēng)控官谷穎。谷穎博士在回國之前曾在華爾街投行工作達(dá)十年之久,其團(tuán)隊(duì)更連續(xù)六年在全美固定收益策略、量化研究領(lǐng)域排名第一。而且在一批成熟金融人才的研發(fā)下,玖富也構(gòu)建起了“火眼”風(fēng)控系統(tǒng)。
玖富的“火眼”風(fēng)控系統(tǒng)形成了線上化、機(jī)器化、模塊化的風(fēng)控構(gòu)架體系。充分利用大數(shù)據(jù)分析技術(shù)建立獨(dú)特的風(fēng)控體系,具有處理高效、風(fēng)險(xiǎn)可控、成本低、邊際效應(yīng)明顯等特點(diǎn),能夠可以提早發(fā)現(xiàn)用戶早期逾期表現(xiàn),并能有更多的時(shí)間進(jìn)行調(diào)整。
根據(jù)她的說法,人工智能應(yīng)用在金融領(lǐng)域有三個(gè)階段。第一個(gè)階段是機(jī)器學(xué)習(xí)(ML)階段,即互聯(lián)網(wǎng)金融為代表的金融機(jī)構(gòu)全面滲透到所有模型建設(shè)中;第二個(gè)階段是自然語言處理(NLP)階段,即國內(nèi)大量互聯(lián)網(wǎng)貸款和征信公司都在大量使用自然語言處理技術(shù);第三個(gè)階段是知識圖譜(KG)階段,即大量使用知識圖譜進(jìn)行反欺詐分析。“火眼”風(fēng)控系統(tǒng)恰恰覆蓋了這三個(gè)階段的所有應(yīng)用,也是目前比較完善的風(fēng)控系統(tǒng)。
機(jī)器學(xué)習(xí)(ML)階段解決的核心問題在于,讓風(fēng)控模型自動學(xué)習(xí)、自動匹配各項(xiàng)數(shù)據(jù),在模型內(nèi)發(fā)現(xiàn)異常,揪出信用黑戶。尤其是機(jī)器學(xué)習(xí)算法能夠根據(jù)數(shù)百萬消費(fèi)者案例,如:資產(chǎn)、履約、身份、偏好、社會關(guān)系及借貸情況等進(jìn)行開發(fā)和訓(xùn)練,利用算法評估預(yù)測用戶是否會違約、是否會按時(shí)歸還貸款等。
自然語言處理(NLP)階段解決的問題則是可以在個(gè)人及企業(yè)主頁、社交媒體中發(fā)現(xiàn)蘊(yùn)含著與違約風(fēng)險(xiǎn)深度關(guān)聯(lián)的深層含義,通過復(fù)雜的詞向量模型將文本轉(zhuǎn)化為計(jì)算機(jī)能夠識別和計(jì)算的詞向量表征,并基于深度學(xué)習(xí)技術(shù)對其進(jìn)行特征提取,最終運(yùn)用成熟的分類器網(wǎng)絡(luò)將文本數(shù)據(jù)與違約風(fēng)險(xiǎn)實(shí)現(xiàn)高度的風(fēng)險(xiǎn)掛鉤,而通過傳統(tǒng)方式很難充分挖掘其風(fēng)險(xiǎn)價(jià)值。
知識圖譜反欺詐(KG)分析恰恰是最重要的一個(gè)環(huán)節(jié),因?yàn)橹R圖譜反欺詐需要把所有技術(shù)融合在一起,構(gòu)建圖譜,從中發(fā)現(xiàn)欺詐行為。這也是很多互聯(lián)網(wǎng)金融公司目前在主攻的方向。
因?yàn)樵谶^去,反欺詐人員需要根據(jù)借款人提供的信息,查找多方面資料,進(jìn)行不同屬性的比對,從而發(fā)現(xiàn)不良征信人。這種工作復(fù)雜而枯燥,為了識別團(tuán)伙欺詐,往往需要收集、整理、分析各種維度的數(shù)據(jù),工作量更是成倍增加。而知識圖譜反欺詐能夠把把每個(gè)客戶的信息、以及網(wǎng)絡(luò)上公開的信息織成一張巨大的關(guān)系網(wǎng),并通過可視化的圖形將這種關(guān)系展示出來。結(jié)合反欺詐部門的經(jīng)驗(yàn),找存在欺詐的客戶。
寫在最后:
雖然如今大部分平臺都在采用“大數(shù)據(jù)技術(shù)”來做風(fēng)控,但審核結(jié)果嚴(yán)重趨同,現(xiàn)狀不容樂觀。真正大數(shù)據(jù)風(fēng)控技術(shù)需要多云數(shù)據(jù)源(平臺積累、征信機(jī)構(gòu)、同業(yè)共享)來支持風(fēng)控審核模型決策,這恰恰是中國互聯(lián)網(wǎng)金融企業(yè)最需要發(fā)展的方向,也是必然需要走過的曲折道路。
【來源:金評媒】
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。