- 快捷搜索
- 全站搜索
" />
近10年來,中國互聯網金融處于一個高速發展的階段,傳統商業銀行也紛紛融入發展洪流當中。2015年3月,工商銀行在北京發布了互聯網金融品牌“e-ICBC”,推出”融e購”電商平臺、”融e聯”即時通信平臺、”融e行”直銷銀行平臺三大平臺,推進了工商銀行互聯網金融業務的發展速度。
然而,在互聯網金融給人們生活提供便利的同時,欺詐風險也隨之增大,欺詐事件也隨之增加。騰訊QQ安全情報中心發布的2016年第一季度《反電信網絡詐騙大數據季度報告》中顯示,今年一季度全國網絡詐騙金額高達9.7億元。欺詐手段呈現多樣化,如電話詐騙、木馬病毒、偽基站、釣魚網站等。其中,釣魚網站占據互聯網安全風險事件的64%。欺詐涉案金額高、受害者多,如“e租寶”事件涉案金額達到500多億元,造成90多萬投資者的資金損失。此外,網絡欺詐已形成了一套完整的黑色產業鏈,其規模龐大、行動迅速、協同化程度高、大數據應用加快、犯罪行為滲透互聯網金融業務各個環節,每年斂財或超千億元。
嚴峻的欺詐形勢給互聯網金融的風險防控帶來了巨大挑戰。為此,互聯網金融機構采取了相應的風險防控措施:①終端保護,與殺毒廠商合作,在終端及時查殺木馬病毒、封殺假冒網站等;②用戶認證,通過實名管理、黑名單、人臉識別、二代U盾、電子密碼器等手段對客戶進行身份認證;③隱私保護,進行信息分級,對信息存儲、訪問和傳輸進行安全控制;④賬戶保護,通過數字證書和動態口令進行賬戶保護;⑤交易保護,對交易行為進行監控及識別,交易風險實時控制。
在欺詐手段多樣化、網絡欺詐黑色產業化、人力成本上升的背景下,現有的風險防控措施已難于滿足精準化管理的需求,因此迫切需要建立基于大數據處理技術的智能風控模型,形成定量標示和定性分析的風險防控模式,實現精準的欺詐風險識別。本文將以智能風控模型中的神經網絡模型為出發點,針對互聯網金融欺詐案件特征,著重介紹神經網絡模型在互聯網金融反欺詐領域的研究與實踐,探討未來互聯網金融的實踐拓展。
一、互聯網金融欺詐案件特征分析
互聯網金融一方面強調客戶交易的便捷性,另一方面卻降低了交易的安全性,給欺詐分子帶來可乘之機。本文以2015年8月至12月實際發生的風險事件為例,從欺詐手段、資金流向、注冊時間、欺詐金額、欺詐發生地區來分析案件特征。
1.欺詐手段及典型案例
對欺詐手段進行分析可知,釣魚網站是欺詐分子采取的主要手段,占總風險事件的70.2%;木馬病毒占8.2%。
釣魚網站典型案例:客戶稱其收到銀行發送的短信,內容為“尊敬的用戶,您的××銀行賬戶因未核實個人身份信息,已被凍結,請登錄:wap.lczno.com按提示核實認證解凍。”客戶登錄該欺詐網址,輸入姓名、卡號、身份證號、手機號等要素之后,賬戶資金即被盜取。
木馬病毒典型案例:客戶稱其收到一條短信,內容為“××您好!這是您孩子本學期各科學習情況和我校評語t.cn/RqLomI。”客戶點開短信,手機屏幕呈白屏狀態,卡內資金即被盜取。
2.資金流向
被欺詐資金主要流向與商業銀行對接的第三方商戶,特別集中在一些高風險商戶,例如,迅付和網銀在線兩家公司約占總風險事件的51.6%;此外,這些被欺詐資金往往用于購買可以快速折現的商品,如游戲充值、話費充值、賬戶充值等,其中游戲充值占比最大,達到43%。
3.注冊時間
在約有25%以上的欺詐風險事件中,客戶的快捷支付注冊與風險事件案發日期為同一天;也就是欺詐分子盜取客戶信息后,先開通快捷支付,然后在同一天進行作案。
4.欺詐金額
基本都在5000元以下,呈現出欺詐金額小的特征。其中,2000元以下的欺詐交易2372筆,占總風險事件的71.4%。
5.欺詐發生地區
客戶正常交易地區與欺詐發生地區通常是不同的,欺詐發生地區主要集中在海南、廣西南寧、廣西玉林等,具有顯著的地域性特征。
通過上述案件特征分析可知,欺詐風險事件通常具備客戶、商戶、產品、渠道等多維度的風險特征,而單個維度難于識別欺詐交易。因此,需綜合考慮多維度風險特征,建立基于大數據處理技術的智能風控模型,實現精準識別欺詐交易。
二、神經網絡模型在反欺詐領域的技術研究
神經網絡模型是一種常用的智能風控模型,是以神經元(其結構如圖1所示)為基礎單元、模仿動物神經網絡行為特征的數學模型,其關鍵要素包括學習規則和拓撲結構。其中,向后反饋(Back Propagation,BP)算法是神經網絡模型的一種常用學習規則,具有很好的持久性和適時預報性。

神經網絡模型的拓撲結構由輸入層、隱含層和輸出層共同構成。輸入層的每個節點分別對應預測變量,輸出層的節點對應目標變量,在輸入層和輸出層之間是隱含層,各層之間通過激活函數和節點權值(或權重)連接在一起,形成一個學習網絡拓撲結構,然后利用此結構進行反復神經網絡學習,直至達到預期目標,所得的權值就是由BP算法學習得到的最優結果。
在金融交易反欺詐領域中,神經網絡模型是一種欺詐風險量化模型,它運用大數據分析和模型挖掘技術,從客戶、商戶、產品、渠道等維度挖掘出風險特征,對金融交易進行風險評分,預測未知欺詐概率。模型方法論的核心思想是:通過學習海量客戶的歷史交易數據以及相關信息(如客戶、商戶等信息),獲取客戶自身的歷史交易行為模式,將當前交易行為與歷史交易行為模式相比較,分析差異性,預測當前交易的風險程度;差異性越大,風險程度越高。
神經網絡模型的數據建模過程如圖2所示,可分為五個步驟:數據采集、數據探索、風險特征挖掘、模型訓練以及模型測試,這五個步驟之間逐層遞進并可向前反復迭代。

1.數據采集
基于Hadoop開源式的大數據分布式處理技術平臺,整合內外部豐富的基礎數據,包括本行的客戶個人數據信息、電子銀行賬戶聚合數據信息、線下金融交易數據,以及相關的各類交易日志如線上渠道的交易與結算日志、服務交付類日志等;還包括外部數據信息,涉及人民銀行、法院、公安部、檢察院、工商總局、環保總局、海關總署等多個數據源,收集了刑事犯罪信息、商業犯罪信息、金融詐騙涉案賬戶信息、網絡犯罪信息、單位違法賬戶信息,以及來自國際銀行安全組織、國際反欺詐組織、國際銀行同業的各類欺詐信息等。
2.數據探索
所采集的交易數據涵蓋了網上銀行、手機銀行、電話銀行、短信銀行、ATM、POS、智能終端等各個渠道,這些渠道又覆蓋了存折、借記卡、準貸記卡、貸記卡等介質;因此,需要對各渠道、介質的關聯關系進行分析與探索,將這些數據按照時間緯度、金額緯度、交易類別、交易狀況等分別進行統計,分析交易行為的主要特征。對于客戶數據,應跨越不同渠道來歸集客戶相關的屬性,如年齡、賬齡、教育程度、地域等要素,建立客戶畫像檔案,描述客戶特征。對于商戶數據,應根據商戶信用評級信息、產品銷售量、商戶類別等要素,建立商戶檔案,劃分商戶風險等級。
3.風險特征挖掘
在對交易、客戶、商戶、設備、地理位置等數據進行深入分析之后,以時間、頻率、金額、距離、比例等統計口徑,初步構建了10 000多個風險特征,如近30分鐘交易總金額、近1小時同一設備登錄次數等;運用大數據處理技術,計算每個風險特征對欺詐識別的貢獻能力,以及風險特征之間的相關性;然后選取出貢獻能力強、相關性弱的風險特征,作為神經網絡模型的預測變量。
4.模型訓練
訓練樣本是由正常交易數據與欺詐交易數據組成的,其中,欺詐交易數據與正常交易數據之間比例相差非常懸殊(欺詐交易占比不到萬分之一)。為了提升欺詐交易在訓練樣本中的占比,對正常交易數據按照一定比例抽樣,而欺詐交易數據則全部選取。由于模型訓練是一個多次反復的過程,并且涉及的訓練樣本數據量巨大,運用大數據技術處理平臺,可以加快神經網絡模型的訓練速度。
5.模型測試
測試樣本由沒有參與模型訓練的生產數據構成,對訓練好后的神經網絡模型進行測試,評估模型的性能表現。評價模型的性能主要有兩個指標:ADR和AFPR。其中,ADR指欺詐賬戶的檢測率,這個比率越高,說明偵測到的欺詐賬戶越多,從而減少了“漏網之魚”;AFPR指模型檢測出的欺詐賬戶中假欺詐賬戶(即正常賬戶)與欺詐賬戶的比率,這個比率越低,說明將正常賬戶誤判為欺詐賬戶的事件就越少,從而減少干擾正常客戶。通常單獨觀察ADR或AFPR其意義不大,需將兩者統一考慮;AFPR與ADR的關系就相當于成本與收益的關系,因而,一個較好的模型是在保持AFPR不變的情況下具有更大的ADR。
如圖3所示,圖中“20:1的AFPR可以達到52%的ADR”表示的業務含義為:在“每次正確抓住1個欺詐賬戶就會把20個正常賬戶誤判為欺詐”的條件下,可將欺詐賬戶中的52%賬戶識別出來;最終該效果已達到了業務的要求。

三、神經網絡模型在互聯網金融交易反欺詐的應用實踐
工商銀行在互聯網金融反欺詐領域的探索和研究開始較早,積極打造了新一代智能化風險監控平臺,除了實時接入了全渠道交易數據,還整合了客戶信息、設備信息、地理位置信息、交易日志等數據;部署了超過1000個風險特征,選取其中約100個風險特征作為神經網絡模型的輸入(神經網絡模型的計算結構如圖4所示);其模型計算耗時為毫秒級別,能夠實時判斷每筆交易的欺詐風險,劃分風險等級,并根據不同風險等級采取對應的風險控制策略,實現事中干預交易,及時挽回欺詐資金損失。

神經網絡模型在互聯網金融交易反欺詐的應用場景如圖5所示。該模型于2016年1月16日正式部署上線,截至3月15日,已準確攔截欺詐交易近百筆,涉及金額超過百萬元,模型的實際準確率達26.3%,達到業界的先進水平,互聯網金融風險防控水平提升到了一個新的階段。隨著后續模型持續優化,還將進一步提升模型的命中率。

四、神經網絡模型在未來互聯網金融的實踐拓展
AlphaGo圍棋人機大戰激發了人們對人工智能的極大關注和熱情,特別是對神經網絡技術的興趣。2016年3月,AlphaGo以4:1戰勝世界圍棋冠軍,顯示出神經網絡的強大學習能力,其工作原理主要采用了深度學習方法,并且該方法在圖像處理、語音識別、自然語言處理等領域取得了巨大突破。在互聯網金融領域中,同樣可以運用深度學習方法來訓練神經網路模型,進一步提升模型的性能。此外,還可構建神經網絡模型在線自學習能力,實現自動調整模型的權值參數,以應對不斷變化的欺詐風險。
神經網絡模型還可以拓展到互聯網金融營銷應用領域。業務人員需要對互聯網金融客戶進行精確評價和定位,以提升營銷的成功率。預測客戶營銷的成功率與預測交易的欺詐概率在本質上是相通的。同樣地,可以運用神經網絡模型來挖掘出客戶的生活消費習慣,預測出客戶營銷的成功率,為業務人員提供參考,有利于降低銀行的營銷成本,提高營銷效益。
(文章來源:中國金融電腦雜志)
掃碼即可手機
閱讀轉發此文
商業銀行IT風險管理(信息科技風險管理)常談常新,而從IT風險管理與內控相
近年來,眾多商業銀行漸次啟動了前后臺業務分離模式的業務集中處理改革并相