商業銀行都在摸索大數據技術與銀行業務的融合路徑。本文以某城商行在防范金融風險、加強金融監管方面所做的三個大數據應用實踐案例,分別用于反洗錢、打擊非法集資、嚴查擔保圈等金融風險識別,為同業在大數據應用方面提供一些新的思路與技術路線。
2016年,“十三五”規劃綱要中明確將大數據作為國家基礎性戰略資源,指出要全面實施促進大數據發展行動,加快推動數據資源共享開放和開發應用,助力產業轉型升級和社會治理創新。人民銀行和銀監會分別在《中國金融業信息技術“十三五”發展規劃》和《中國銀行業信息科技“十三五”發展規劃監管指導意見(征求意見稿)》中提出,商業銀行要引入大數據等新技術,推進大數據基礎設施建設,加快推動銀行業務創新,加強風險控制能力。
2017年7月14~15日,全國金融工作會議針對銀行業特別強調了“防風險”與“嚴監管”兩個重要工作思路。在當前移動互聯網盛行的大環境下,銀行業務風險水平急劇上升,傳統風險管理體系存在靈活性差、防控手段較為落后等弊端。大數據技術的引入,使得更多體現風險因素的數據信息可以從更多分析角度與維度切入,并且在可以接受的時間內得以統計、分析與挖掘,比之傳統的數據分析方法能更快速有效地識別和防范金融風險,大數據技術已越來越受到銀行業的青睞。
為了積極響應國家戰略,切實落地監管思路,各家商業銀行都在摸索大數據技術與銀行業務的融合路徑。而在商業銀行現行的風險管理架構當中,反洗錢、打擊非法集資的技術手段略顯單薄,擔保圈風險由于與信用風險關系密切而受到一定關注,卻依然缺乏有力的識別技術。本文將列舉某城商行在防范金融風險、加強金融監管方面所做的三個大數據應用實踐案例,分別用于反洗錢、打擊非法集資、嚴查擔保圈等金融風險識別,為同業在大數據應用方面提供一些新的思路與技術路線。
一、方法論簡述
1.定義金融行為
在大數據應用領域內,用戶行為數據分析的課題研究相對成熟。電商、資訊等網站已成常態,基于用戶瀏覽、點擊、注冊等行為進行的客戶留存、客戶轉化率、活躍用戶數、客戶群體標簽等統計分析,其結論多用于精準營銷的場景。隨著移動互聯網的發展,銀行業逐步開始對手機銀行、網上銀行的客戶行為進行跟蹤、分析進而挖掘價值,并在推薦金融服務產品、改進客戶服務體驗等場景中逐漸發揮價值。
鑒于此,本文中的金融行為指商業銀行參與的各種金融場景下的各種行為,包括零售客戶常見的存款、取現、消費、轉賬等行為,購買理財、申請貸款、開具資產證明等資產行為,還有為企業客戶開立信用證等等。
2.定義金融行為數據
本文將金融行為數據定義為所有銀行業務發生時所產生的數據,包括賬單打印、更換聯系號碼等客戶行為。融資業務過程中登記的貿易對象、訂單信息、擔保方信息等,也納入金融行為數據體系討論范疇。
本文后續要分析的主要數據對象有網銀登錄信息、客戶交易信息、客戶關系網絡信息。其中,網銀登錄信息指客戶與銀行接觸網銀渠道所涉及的客戶行為信息,主要包括登錄時間、登錄IP、登錄設備。客戶交易信息指客戶的資金交易行為信息,主要包括客戶賬戶信息、交易金額、借貸方向、交易時間、交易渠道、交易柜員、對手方賬戶信息。客戶關系網絡信息指客戶關聯關系信息,包括根據對公客戶交易行為分析得出的上下游客戶信息、從客戶征信報告中貸款信息引出的的擔保客戶信息、客戶工商登記信息中披露的股東信息與對外投資信息等。
3.探索大數據應用價值
大數據技術的4V特征分別是大量、異構、低價值密度、快速,可以在足夠短的時間內處理海量規模的異構數據,進而得出有價值的結論。借助于以分布式計算框架為主要特征的大數據技術,某城商行以往當天無法進行深入分析的上億筆交易明細、上千億筆網銀服務,在短時間內通過多臺服務器并行處理即可達到分析目標。
本文基于金融行為數據進行了大數據技術應用實踐方面的探討,以推動商業銀行在防范金融風險、強化金融監管方面的業務應用。
(1)反洗錢行為模式識別
洗錢活動嚴重威脅金融體系的安全穩定,也對國家的政治穩定、社會安定、經濟安全構成嚴重威脅。隨著互聯網的普及,電子銀行已經成為商業銀行最重要的虛擬柜臺之一,在為客戶提供方便快捷的自助金融服務的同時,也不可避免地為不法分子提供了犯罪機會。他們只要用任何真實身份獲取到銀行賬號,就可以通過手機或者電腦完成不法資金的轉移。
雖然洗錢的行為模式多種多樣,但是其必然要涉及巨大數額的非法資金流動,交易行為與常人有所區別。鑒于此,本文將賬戶交易資金量與客戶登錄信息兩類要素進行交叉分析,引入大數據技術對海量的歷史數據進行分析,發現了若干賬戶行為異常。
(2)非法集資行為模式識別
非法集資以高回報為誘餌,以騙取資金為目的,嚴重損害群眾利益,且涉及面廣、危害極大。隨著對非法集資打擊力度的加強,非法集資的網絡分布越發隱蔽,趨于分散在多個銀行機構。這就給銀行機構識別非法集資行為造成了極大阻礙。
為此,我們基于銀監會要求各商業銀行報送的EAST標準化數據構建模型算法,從海量交易數據當中排查非法集資行為模式,發現了若干核心賬戶。
(3)廣義擔保圈識別
當前經濟形勢下,小微企業為了在不同銀行機構獲取到融資貸款,進行企業間互保,形成擔保鏈、擔保圈,這一現象給信用風險管理帶來巨大壓力。一旦發生過度融資風險,極其容易形成區域、行業的系統性風險,引發“多米諾骨牌效應”。傳統的擔保圈識別方法需要監管從4000萬家企業和數以億計的貸款主體的關系數據中利用嵌套循環或遞歸算法進行廣度和深度并進的搜索,風險識別效率極端低下。在引入大數據技術之后,在監管層面就可以快速地完成擔保圈與長擔保鏈的識別,大大提高了工作效率。
但是,對于各家商業銀行而言,擔保圈的企業客戶是割裂的,單一的業務風險識別策略難以在貸前發現被刻意隱蔽的擔保圈。如何在不完全擔保關系的數據支撐情況下甄別擔保圈風險,是商業銀行控制信用風險、加強風險監管的重要課題之一。本文認為,假設客群存在擔保圈,那么客群必然還存在著其他的關聯關系,否則擔保關系也不能夠成立。
鑒于此,本文嘗試通過擴大擔保關系的數據范圍來探查被刻意隱藏的擔保圈,將對公客戶之間的集團關系、投資關系、上下游關系、公司和個人的股東關系網絡、資金貿易網絡等納入分析范圍,利用圖分析手段,尋找復雜、密集的客戶網絡,尋找到潛在擔保圈。
二、案例實踐
本文中的實踐案例已做過數據脫敏與簡化,重點在于闡述分析思路。
1.結合網銀應用日志與核心交易登記簿進行反洗錢識別
本文對賬戶交易資金量與客戶登錄信息兩類要素進行交叉分析。
某客戶在2016年自6月23日至7月12日期間,平均每天資金累計交易額大于50萬元,平均交易次數大于200次(如圖1所示)。截取該時間段的網銀系統日志檢索該客戶登錄信息,發現該網銀賬號登錄時間段為21:00至次日9:00,登錄IP地址歸屬地在福建、馬來西亞、香港等地頻繁切換。疑似利用網絡代理工具訪問某行網上銀行,并進行大量的資金轉移活動。該案例已由該行業務主管部門上報人民銀行。
2.基于客戶交易歷史數據進行非法集資行為識別
(1)專家模型
在以EAST3.0為標準的報送數據的基礎上,提取某月交易流水數據和賬戶、客戶信息表,對約9000萬筆交易流水進行分析。依據專家規則對不同情況的交易統計信息進行評分(見表1),構建甄別模型,并加以人工輔助決策,調整賬戶風險級別。
圖2中客戶A的交易對手分為三種類型,n=1992,m=112,k=11。基于表1的評分卡模型,貸方交易對手個數n+k=2003,得分15分;借方交易中k=11,A與di(1≤i≤k)之間累計交易額超過4萬且不高于7萬,得分30分;借方交易中,m+k=123,其中小于5000元累計交易額的客戶數經統計有53人落入區間100~500,有57人落入區間500~1000,2人落入區間1000~2000,11人在2000以上,故取本項最高分40分。客戶A總得分為85分,預警后由人工審核判斷。
(2)無監督算法模型
首先,以賬戶為頂點,交易流水為邊,構建交易網絡圖。根據PageRank算法,計算得出客戶之間的權重系數。然后,結合入賬資金、出賬資金等指標應用聚類模型,得出聚集度較高的網絡子圖,找到核心賬戶后進一步排查,實現非法集資行為核心賬戶的定位。算法過程如圖3所示,甄別出來的子圖如圖4所示。
3.結合客戶交易歷史與客戶關系網絡識別廣義擔保圈
本文結合客戶的資金網絡、擔保關系、投資關系、股東關系、家庭關系等,構建出客戶的復雜關系網絡圖。圖5所揭示的是在某商業銀行業務過程中發現的隱式擔保圈。A、B為自然人,C為企業。授信客戶A1、A2、A3與某對私客戶B2有資金關系。案例中B2為該行客戶,追尋B2的資金關系源B3,發現B3與A1存在同名關系。本文假設B3=A1,依據A1的身份信息可以基于工商信息進行深入探查,發現了B3與企業C2的隱藏關系。本文認為圖5中主要風險要點如下:
第一,不同個體經營融資行為的主要擔保方聚集為某一企業客戶;
第二,融資客戶的資金來源方與擔保方存在長鏈路的關聯關系。
本案例經業務主管部門核查后,認定存在極大的風險隱患,涉及的授信余額已提前回收。
三、前景展望
從宏觀上看,商業銀行肩負著維護金融穩定、努力減少金融犯罪的重要責任,這也是銀行監管的具體目標之一。隨著大數據應用技術的日趨成熟,未來可以從風險排查的效率入手,更及時地發現洗錢活動,更深入地探查非法集資,更智能地甄別擔保圈。
1.基于流計算的洗錢活動實時甄別
近幾年,移動網絡支付極其便捷,伴之而來的是高發金融詐騙。為解決該問題,各家金融機構引入大數據的“流”式處理技術,旨在實現海量交易的實時反欺詐。
可以借鑒的是,將洗錢活動模式識別技術從批量數據分析同樣轉換到實時計算場景,當賬戶資金活動觸發洗錢活動模式發出實時告警時,通過監管的實時計算框架,由計算機應用實現監管層面的自動排查,然后返回。如果確實為洗錢行為,則及時提升賬戶風險級別,并進行賬戶凍結等操作。
2.基于大數據構建的金融知識圖譜
近年來,許多銀行開始通過知識圖譜技術整合內外部的結構化、非結構化數據以及互聯網采集數據,構建對公客戶與零售客戶之間的復雜關系網絡,包括企業之間的集團關系、投資關系、上下游關系、擔保關系以及企業與個人之間的任職、實際控制、一致行動關系等。然后,基于圖計算方法排查各種以往難以發現的異常金融行為。本文著重對非法集資、擔保圈進行了些許探索,并嘗試應用圖算法和無監督聚類方法進行目標甄別,未來隨著機器學習與圖計算方法的成熟運用,對這些風險因素的識別將更加準確及時。
3.基于人工智能的智能金融風控
隨著大數據技術的不斷進步,以深度學習為代表的人工智能技術也逐漸滲透到金融領域,圍繞人工智能技術構建金融風控系統已經被很多初創企業所嘗試。商業銀行可以通過獲取足夠多、足夠新且具有表征能力的數據,經過有效的數據治理與整合,抽取精細化的維度特征,基于深度學習算法來訓練各類風控模型,從而準確識別風險因素,并且不斷地采集模型應用反饋信息進行迭代改進,不斷優化模型。
(文章來源:中國金融電腦雜志)
掃碼即可手機
閱讀轉發此文