工商銀行大數(shù)據(jù)與人工智能實(shí)驗(yàn)室將繼續(xù)開展大數(shù)據(jù)及人工智能領(lǐng)域的前瞻性研究,以扎實(shí)的技術(shù)研究快速推進(jìn)IT架構(gòu)轉(zhuǎn)型及應(yīng)用成果轉(zhuǎn)化,將服務(wù)業(yè)務(wù)、服務(wù)客戶作為最終目標(biāo)。
近年來,大數(shù)據(jù)及人工智能發(fā)展迅速,分布式技術(shù)的完善、機(jī)器學(xué)習(xí)算法的豐富使得復(fù)雜任務(wù)處理準(zhǔn)確率得到大幅提升,各類應(yīng)用實(shí)踐案例和效果在各行各業(yè)逐步顯現(xiàn)。國家在“十三五規(guī)劃”中提出了“重點(diǎn)突破新興領(lǐng)域人工智能技術(shù)”,國家層面和地方層面相繼出臺(tái)各項(xiàng)政策對(duì)發(fā)展大數(shù)據(jù)和人工智能進(jìn)行有力支持。工商銀行一直堅(jiān)持以聚焦能力建設(shè)、保持科技領(lǐng)先為導(dǎo)向,持續(xù)加大創(chuàng)新投入,深入開展前瞻性技術(shù)研究,通過技術(shù)創(chuàng)新推進(jìn)業(yè)務(wù)模式創(chuàng)新,將科技優(yōu)勢轉(zhuǎn)變?yōu)闃I(yè)務(wù)優(yōu)勢。
根據(jù)“主動(dòng)跟蹤大數(shù)據(jù)、人工智能等新技術(shù)的發(fā)展動(dòng)態(tài),開展各項(xiàng)新技術(shù)在銀行業(yè)務(wù)的前瞻性研究,根據(jù)有意義前景推動(dòng)新技術(shù)落地實(shí)施,實(shí)現(xiàn)前瞻性研究成果的價(jià)值轉(zhuǎn)化,探索智能科技,打造智慧金融”的相關(guān)指導(dǎo)思想,工商銀行大數(shù)據(jù)與人工智能實(shí)驗(yàn)室(以下簡稱“實(shí)驗(yàn)室”)應(yīng)運(yùn)而生,深入開展大數(shù)據(jù)技術(shù)框架、大數(shù)據(jù)服務(wù)云平臺(tái)、機(jī)器學(xué)習(xí)、自然語言處理、圖像識(shí)別等大數(shù)據(jù)及人工智能領(lǐng)域新技術(shù)的研究與探索,把握金融科技創(chuàng)新趨勢,助推工商銀行IT架構(gòu)轉(zhuǎn)型。
一、順應(yīng)趨勢,構(gòu)建研究體系新局面
為把握趨勢,在金融領(lǐng)域保持領(lǐng)先地位,大數(shù)據(jù)及人工智能實(shí)驗(yàn)室構(gòu)建了技術(shù)基礎(chǔ)框架、大數(shù)據(jù)服務(wù)云平臺(tái)、人工智能機(jī)器學(xué)習(xí)平臺(tái)三大研究體系。
1.構(gòu)建全面豐富的技術(shù)框架
現(xiàn)有的大數(shù)據(jù)技術(shù)復(fù)雜度高,應(yīng)用門檻高,不便于快速應(yīng)用于各業(yè)務(wù)系統(tǒng)。為屏蔽復(fù)雜技術(shù),加快業(yè)務(wù)落地,實(shí)驗(yàn)室研究梳理大數(shù)據(jù)領(lǐng)域的基礎(chǔ)技術(shù)組件、基礎(chǔ)服務(wù)組件和配套服務(wù)組件進(jìn)行組合與封裝,明確技術(shù)框架范圍和各技術(shù)組件的定位。通過引入新型的組件,進(jìn)一步增強(qiáng)存儲(chǔ)引擎、計(jì)算引擎和基礎(chǔ)設(shè)施的技術(shù)支撐能力,以產(chǎn)品組合的方式解決原先單一產(chǎn)品專業(yè)化程度偏高、無法滿足各種靈活的數(shù)據(jù)使用場景的問題。致力于提高大數(shù)據(jù)服務(wù)云及人工智能平臺(tái)的易用性,以達(dá)到快速、靈活的設(shè)備供給,滿足業(yè)務(wù)快速增長的需要。
2.打造彈性拓展的大數(shù)據(jù)服務(wù)云平臺(tái)
隨著工商銀行業(yè)務(wù)不斷創(chuàng)新發(fā)展,各業(yè)務(wù)部門、境內(nèi)外分行對(duì)大數(shù)據(jù)應(yīng)用提出了更高要求,自主搭建大數(shù)據(jù)平臺(tái)存在技術(shù)投入和硬件投入等方面的困難,同時(shí)也會(huì)造成資源浪費(fèi),無法形成規(guī)模化效應(yīng)。
在挑戰(zhàn)與困難面前,實(shí)驗(yàn)室借鑒公有云思路,搭建全行統(tǒng)一的、高容量、易擴(kuò)展、強(qiáng)計(jì)算的大數(shù)據(jù)服務(wù)云(如圖1所示)。具備多租戶的資源動(dòng)態(tài)調(diào)配及PB級(jí)海量數(shù)據(jù)存儲(chǔ),提供高效、成本可控的大數(shù)據(jù)分析挖掘能力、高速的大數(shù)據(jù)實(shí)時(shí)計(jì)算能力、強(qiáng)大的大數(shù)據(jù)離線處理能力,為我行客戶營銷與服務(wù)、風(fēng)險(xiǎn)管控、經(jīng)營管理等提供數(shù)據(jù)支撐。
工商銀行通過大數(shù)據(jù)服務(wù)云的建設(shè),支持未來大數(shù)據(jù)發(fā)展數(shù)據(jù)多樣化、服務(wù)能力實(shí)時(shí)化、算法引擎智能化、基礎(chǔ)平臺(tái)云化的四大趨勢與要求,具備“全、快、準(zhǔn)、共享”的特征。
3.搭建自主可控的人工智能機(jī)器學(xué)習(xí)平臺(tái)
實(shí)驗(yàn)室緊跟人工智能相關(guān)前沿技術(shù)步伐,實(shí)現(xiàn)機(jī)器學(xué)習(xí)、自然語言處理、圖像識(shí)別等人工智能技術(shù)在工行反欺詐、智能客服等領(lǐng)域的原型驗(yàn)證和試點(diǎn)應(yīng)用,取得一定業(yè)務(wù)效果。通過原型研究成果,結(jié)合業(yè)務(wù)未來發(fā)展需要,工商銀行堅(jiān)持以自主可控原則,集成機(jī)器學(xué)習(xí)、自然語言處理、圖像識(shí)別等技術(shù),搭建適合的機(jī)器學(xué)習(xí)平臺(tái)(如圖2所示)。
而根據(jù)人工智能各垂直領(lǐng)域特點(diǎn),基于機(jī)器學(xué)習(xí)平臺(tái)開展研究,并構(gòu)建了語義分析、圖像識(shí)別等原子服務(wù),降低垂直應(yīng)用使用機(jī)器學(xué)習(xí)平臺(tái)門檻,使其無需關(guān)心人工智能技術(shù)和底層算法的實(shí)現(xiàn),只需分析業(yè)務(wù)場景并基于服務(wù)構(gòu)建業(yè)務(wù)應(yīng)用即可,推進(jìn)機(jī)器學(xué)習(xí)平臺(tái)在各垂直領(lǐng)域的應(yīng)用,助力智慧銀行建設(shè)。
二、勇攀高峰,豐富研究領(lǐng)域新成果
在明確的研究方向的指引下,實(shí)驗(yàn)室以研究—原型—落地為研究思路有條不紊地開展研究工作,在各領(lǐng)域均取得了階段性的成果。
1.構(gòu)建全面豐富的技術(shù)框架,提升企業(yè)級(jí)技術(shù)服務(wù)能力
實(shí)驗(yàn)室對(duì)大數(shù)據(jù)框架下商業(yè)、開源、自主研發(fā)的技術(shù)組件包括存儲(chǔ)、計(jì)算引擎、NOSQL數(shù)據(jù)庫、分析工具、搜索技術(shù)、流技術(shù)、對(duì)象存儲(chǔ)等技術(shù)進(jìn)行跟蹤,對(duì)各組件的適用場景、工商銀行現(xiàn)狀,組件交叉關(guān)系、發(fā)展規(guī)劃等進(jìn)行梳理研究,完成《大數(shù)據(jù)技術(shù)框架綜述》。
同時(shí)對(duì)人工智能相關(guān)的AI算法、深度學(xué)習(xí)框架、語音識(shí)別、計(jì)算機(jī)視覺、自然語言處理、知識(shí)圖譜、圖計(jì)算、GPU加速等技術(shù)進(jìn)行業(yè)界技術(shù)跟蹤,對(duì)人工智能在客戶營銷、風(fēng)險(xiǎn)防控、客戶服務(wù)、經(jīng)營管理等業(yè)務(wù)應(yīng)用場景進(jìn)行規(guī)劃,完成《人工智能技術(shù)研究綜述》,進(jìn)一步明確了人工智能技術(shù)在工商銀行的規(guī)劃思路。
以上基礎(chǔ)技術(shù)框架的研究為大數(shù)據(jù)服務(wù)云平臺(tái)和人工智能機(jī)器學(xué)習(xí)平臺(tái)的搭建提供有效支持。
2.打造彈性拓展的大數(shù)據(jù)服務(wù)云平臺(tái),提升工商銀行大數(shù)據(jù)基礎(chǔ)平臺(tái)服務(wù)水平
經(jīng)過多年建設(shè),工商銀行已經(jīng)進(jìn)入大數(shù)據(jù)2.0階段,有力地支持了各項(xiàng)業(yè)務(wù)的開展,主要涵蓋了經(jīng)營分析、風(fēng)險(xiǎn)管理、監(jiān)管報(bào)送、內(nèi)部管理、客戶營銷、互聯(lián)網(wǎng)金融等各個(gè)領(lǐng)域。
在風(fēng)險(xiǎn)管理方面,基于大數(shù)據(jù)服務(wù)云實(shí)時(shí)計(jì)算服務(wù)支持企業(yè)級(jí)反欺詐管理平臺(tái)、企業(yè)級(jí)業(yè)務(wù)運(yùn)營風(fēng)險(xiǎn)監(jiān)控平臺(tái)、實(shí)時(shí)數(shù)據(jù)處理平臺(tái)、支付清算應(yīng)用等研發(fā),完成覆蓋境內(nèi)外的電子銀行事中監(jiān)控、業(yè)務(wù)運(yùn)營風(fēng)險(xiǎn)監(jiān)控、黑名單檢測等建設(shè),目前日均承接近5億筆主機(jī)交易和7億筆平臺(tái)交易,峰值交易量每秒超萬筆,平均響應(yīng)時(shí)間為毫秒級(jí)。
在客戶營銷方面,基于大數(shù)據(jù)服務(wù)云,實(shí)現(xiàn)客戶畫像信息的整合與服務(wù)(如圖3所示),其中個(gè)人客戶營銷畫像面向全行客戶提供大數(shù)據(jù)信息服務(wù),近一個(gè)月的累計(jì)使用客戶數(shù)達(dá)100多萬,日均使用用戶數(shù)超過5萬人次,同時(shí)通過傳統(tǒng)PC端、客戶經(jīng)理營銷PAD和融E聯(lián)渠道展現(xiàn)客戶畫像,為客戶經(jīng)理營銷工作提供有力抓手,截至目前全行客戶經(jīng)理累計(jì)使用客戶畫像次數(shù)近1000萬次,近一個(gè)月使用近500萬次,日均使用超過1萬次,而個(gè)人客戶風(fēng)險(xiǎn)畫像則在融e借白名單與授信管理、卡部營銷及授信使用方面發(fā)揮積極作用。
在監(jiān)管報(bào)送方面,借助于工商銀行大數(shù)據(jù)云平臺(tái)實(shí)現(xiàn)全自動(dòng)化報(bào)送,今年以來EAST數(shù)據(jù)報(bào)送工作開展高效穩(wěn)定,快速滿足監(jiān)管要求,報(bào)送數(shù)據(jù)量達(dá)上百億,報(bào)送周期從一個(gè)月縮短到一周。
在經(jīng)營決算方面,根據(jù)減值撥備管理需要,基于大數(shù)據(jù)服務(wù)云,新建減值測算系統(tǒng),測算范圍覆蓋信貸、金融市場、票據(jù)、信用卡及消費(fèi)貸款等業(yè)務(wù)系統(tǒng),該系統(tǒng)承擔(dān)全行約2億筆債項(xiàng)的減值測算功能,為業(yè)務(wù)部門研究減值模型參數(shù)對(duì)減值結(jié)果及全行利潤的影響提供預(yù)測手段,在減值撥備管理上起到了重要的作用。
3.搭建自主可控的人工智能機(jī)器學(xué)習(xí)平臺(tái),優(yōu)化工商銀行金融服務(wù)流程
在機(jī)器學(xué)習(xí)平臺(tái)建設(shè)方面,深入研究開源、商用機(jī)器學(xué)習(xí)平臺(tái),基于開源H2O機(jī)器學(xué)習(xí)框架自主搭建工商銀行機(jī)器學(xué)習(xí)平臺(tái),并將其運(yùn)用到智能營銷、反欺詐等場景中。反欺詐場景根據(jù)機(jī)器學(xué)習(xí)模型生成的1000條名單,在外呼量相同的情況下,模型可識(shí)別的欺詐交易比專家規(guī)則識(shí)別率高出50%以上,在識(shí)別相同筆欺詐交易的情況下,模型可比專家規(guī)則減少更多的外呼量,呼叫準(zhǔn)確率顯著提高;在使用模型的情況下,智能營銷場景理財(cái)產(chǎn)品營銷響應(yīng)率和基金產(chǎn)品營銷響應(yīng)率均顯著提高,可覆蓋更多目標(biāo)營銷客戶。
在GPU技術(shù)研究方面,深入研究GPU工作原理及CUDA底層實(shí)現(xiàn)技術(shù),并將其運(yùn)用到金融計(jì)算密集型場景,涉及蒙特卡羅模擬計(jì)算的資本壓力測試性能提升15倍;將其運(yùn)用到大數(shù)據(jù)處理中提升3倍查詢性能。后續(xù)將建設(shè)GPU服務(wù)云,為機(jī)器學(xué)習(xí)平臺(tái)及其它金融密集計(jì)算場景提供計(jì)算資源。
在自然語言處理方面,深入研究語義分析相關(guān)技術(shù)和產(chǎn)品,并將研究成果應(yīng)用于手機(jī)銀行語音導(dǎo)航、轉(zhuǎn)賬要素識(shí)別等智能客服場景,以及運(yùn)管查詢查復(fù)場景,進(jìn)一步提升智能客服的智能化服務(wù)水平,降低運(yùn)管人力資源成本,后續(xù)將基于機(jī)器學(xué)習(xí)平臺(tái)構(gòu)建自然語言處理相關(guān)服務(wù)(如圖4所示),實(shí)現(xiàn)智能客戶機(jī)器人等垂直應(yīng)用。
在計(jì)算機(jī)視覺方面,啟動(dòng)OCR手寫體識(shí)別研究及原型驗(yàn)證工作,建設(shè)業(yè)務(wù)集中處理影像字符識(shí)別場景原型,大小寫金額建模優(yōu)化后,識(shí)別率達(dá)90%以上。后續(xù)基于機(jī)器學(xué)習(xí)平臺(tái)實(shí)現(xiàn)OCR識(shí)別技術(shù)等圖像識(shí)別技術(shù)并進(jìn)行服務(wù)化。
在圖計(jì)算技術(shù)研究方面,通過產(chǎn)學(xué)研方式與清華大學(xué)和合作研究和開展Gemini高性能圖計(jì)算技術(shù)及其在工商銀行轉(zhuǎn)賬反欺詐場景的原型驗(yàn)證工作,將圖計(jì)算挖掘的圖特征作為機(jī)器學(xué)習(xí)特征的補(bǔ)充,提升機(jī)器學(xué)習(xí)模型的準(zhǔn)確率,后續(xù)將圖計(jì)算技術(shù)與機(jī)器學(xué)習(xí)平臺(tái)對(duì)接,提升機(jī)器學(xué)習(xí)平臺(tái)的智能分析和預(yù)測能力。
三、全面布局,引領(lǐng)技術(shù)路線新風(fēng)向
展望未來,實(shí)驗(yàn)室將繼續(xù)開展大數(shù)據(jù)及人工智能領(lǐng)域的前瞻性研究,以扎實(shí)的技術(shù)研究快速推進(jìn)IT架構(gòu)轉(zhuǎn)型及應(yīng)用成果轉(zhuǎn)化,將服務(wù)業(yè)務(wù)、服務(wù)客戶作為最終目標(biāo)。
1.促進(jìn)大數(shù)據(jù)與人工智能應(yīng)用成果的快速轉(zhuǎn)化
構(gòu)建工商銀行的智數(shù)市場,形成成果展示、經(jīng)驗(yàn)交流平臺(tái)、以及數(shù)據(jù)和能力復(fù)用與輸出的生態(tài)體系,促進(jìn)全行大數(shù)據(jù)與人工智能的運(yùn)用,并為各合作方賦能。
2.提供面向業(yè)務(wù)可感知、可使用的大數(shù)據(jù)與人工智能服務(wù)
實(shí)現(xiàn)以大數(shù)據(jù)規(guī)模進(jìn)行機(jī)器學(xué)習(xí)、從邊到邊緣的基于容器的AI部署,快速、橫向擴(kuò)展的協(xié)作式試驗(yàn),基于Spark、Docker、TensorFlow、Caffe等框架實(shí)現(xiàn)支持AI的數(shù)據(jù)整理。用戶可使用無服務(wù)器的拖放開發(fā)模式和無代碼的直觀試驗(yàn)在幾分鐘內(nèi)完成Web服務(wù)部署。
3.提供自主可控的智能服務(wù)
構(gòu)建OCR識(shí)別、客服機(jī)器人、自然語言理解等服務(wù)體系。推出識(shí)別率在90%以上的英文和數(shù)字OCR識(shí)別服務(wù),并基于業(yè)務(wù)集中處理中心憑證核對(duì)場景試點(diǎn),力爭將雙人手工核對(duì)模式提升為一手工一機(jī)器核對(duì)模式,將憑證核對(duì)工作的人力投入減少一半;完成自然語言人機(jī)交互技術(shù)在智能客服領(lǐng)域的試點(diǎn)應(yīng)用,以優(yōu)化和完善工商銀行智能客服體系。
(文章來源:《中國金融電腦》雜志)
掃碼即可手機(jī)
閱讀轉(zhuǎn)發(fā)此文