- 快捷搜索
- 全站搜索
目前,以機器學習為代表的人工智能技術在全球興起熱潮,其理論、技術和應用場景都有了長足發展。特別是依靠海量數據和強大的分布式計算能力,人工智能已在語音識別、圖像識別、自然語言處理、人機對弈、自動駕駛等領域取得顯著或者突破性進展,使得傳統的經驗密集型行業迎來了智能化改造的歷史機遇。
人工智能在銀行領域的影響也在不斷擴大,已形成了量化投資、智能柜臺、智能客服等新型業務模式,為客戶提供了嶄新的體驗。銀行服務智能化已經是大勢所趨。商業銀行的工單處理是與客戶體驗息息相關的重要工作,要求處理人員具有豐富的金融知識和很強的分析能力,是一項經驗密集型工作,適合進行智能化改造。本文結合實際工作,就人工智能在商業銀行工單處理系統中的應用進行探討。
一、 商業銀行工單處理現狀及問題
大型商業銀行每年需要處理數以萬計的工單。目前的工單處理系統僅在工單報送、審批、存檔等辦公事務性環節實現了自動化,在最主要的問題分析處理環節,還是主要依靠人工。
隨著IT系統規模日趨龐大以及新業務功能與日俱增,大型商業銀行每日需處理的工單數量呈上升趨勢,維護人員處理工單的難度逐漸增加。從我們處理工單的實際情況看,以下幾方面問題日益突出:
(1)工單所屬系統的識別準確性不高。目前工單分派是根據業務人員填寫的工單所屬系統進行自動分派,導致工單分類的準確度不高,經常出現工單分派錯誤的情況,影響了工單的順利流轉。
(2)問題定位不夠準確。由于處理人員經驗不足,可能造成問題定位不準確,形成有偏差的解決方案。這不但無助于解決問題,還進一步降低了客戶體驗,增加了系統運行風險。
(3)不能快速匹配歷史工單。由于軟件缺陷、客戶誤操作等問題,相似的工單會重復出現,這是工單處理工作中的常見現象。有經驗的處理人員經歷了長時間的經驗積累,或者知識總結,能很快找到類似的歷史工單,參照歷史處理方案進行處理,確保處理高效率。由于人員的流動性,新的人員無法在短期內具備這種能力,造成了低效的重復勞動。
這些問題,對工單流轉效率和處理質量造成了影響。特別是需要多個團隊配合的工單,如果部分環節處理不及時,會延長工單處理的時間,從而降低服務質量,影響銀行形象。
二、 商業銀行工單處理智能化概述
1.工單處理智能化需求
客戶是銀行賴以生存和發展的基礎,完善客戶體驗是銀行提高服務質量的根本目標。作為銀行信息科技體系技術支持部門,和客戶最直接的聯系就是工單處理系統,維護人員通過工單處理系統接收、分析、處理客戶反映的問題。工單處理的效率和質量,直接影響到客戶對銀行的認可度。鑒于目前工單處理系統中存在的問題,有必要考慮在工單處理系統中應用人工智能技術,以提高工作效率和質量,提升客戶體驗。
同時,商業銀行積累了大量的歷史工單數據,這些數據既有問題描述信息,又有問題歸屬分類,還有問題解決方案,構成了工單問題及處理方案的全景信息。海量歷史工單數據中蘊含了工單處理需要的大部分業務知識和處理規則,為人工智能特別是機器學習提供了極好的數據來源。從必要性及可行性上看,商業銀行工單處理智能化改造正逢其時。
從商業銀行同業情況來看,工單處理智能化目前處于研究和起步階段。隨著各銀行對提高工單處理的效率和質量日益重視,工單處理智能化將展現出很好的應用前景。
2.工單處理智能化涉及的技術領域
工單處理智能化是在傳統的工單處理流程基礎上,用人工智能技術手段分析、處理工單,實現自動匹配類似工單、自動推送解決方案、自動匯總工單類型等功能,達到減少工作量、提高工作效率和提升服務質量的目標。
工單處理智能化首先要解決的問題是:如何從非結構化的工單描述(一連串語言符號)中獲取問題工單描述信息特征和解決方案信息特征。因此工單處理智能化技術首先涉及人工智能的自然語言處理領域。當然,工單智能化的語言識別不同于一般的機器翻譯或者專家系統自然語言接口,它描述的內容有很強的領域范疇,即銀行業務領域、IT技術領域,工單描述語言中的上下文關聯和語義環境,和專業領域有很強的關聯關系。同時,工單描述語言分析還需要減少無效詞匯對語義理解的干擾,使得銀行工單處理智能化需要適合自身特點的自然語言處理能力。
在獲取工單描述文字的特征信息后,智能工單處理系統需要對特征進行分析、分類,以確定工單歸屬系統或者所屬類型。同時,還需要從歷史工單數據中匹配出該類型工單及其解決方案,供處理人員參考。這里涉及的特征提取、分類和匹配,屬于人工智能的機器學習領域。
三、 智能工單處理系統簡介
為了提高工單處理的效率和質量,提升客戶體驗,也為了順應人工智能技術在銀行領域應用的潮流,我們在現有的銀行工單處理系統中引入了人工智能技術,設計、開發了智能工單處理系統。該系統將大量非結構化的工單描述信息和知識庫中的知識條目,通過機器學習算法加以分析處理,實現工單自動轉派及方案智能推薦。同時,通過對工單描述主題歸類,挖掘出有價值的信息,為工單分派與處理方案提供數據與決策支持,提升分派工單的準確性。
智能工單系統采用常見的WEB+MySQL for AIX架構。為便于實現統計分析功能,采用R語言為開發語言。
1.應用架構
通過運維流程管理平臺擴展接口,可以設置參數實現工單處理智能化實時切換,實現了運維流程管理平臺和智能工單處理系統的松耦合協同工作。圖1為應用架構系統邏輯關系。

2.系統功能
(1)批量功能
智能工單處理系統定期通過批量接口從運維流程管理平臺獲取歷史工單數據,包含工單內容、解決方案和所屬系統等內容。導入觸發條件可以指定為一段時間(如每周或每月),也可以指定新增歷史工單達到一定數量(如新增1000個工單)。
智能工單處理系統對導入的歷史工單數據進行特征提取和分類批量計算,用計算結果修正現有的主題模型。
主題模型每次更新后,通過統計批量程序繪制出當前的工單主題特征全景圖,同時更新工單主題庫和知識條目庫。
(2)聯機功能
聯機功能是向運維流程管理平臺的工單分派、工單處理提供的自動化功能。
平臺分派工單時,先調用智能工單處理系統提供的聯機接口,輸入待分派工單的信息;然后智能工單處理系統返回該工單所屬系統信息,運維流程管理平臺將該工單分派給相應的團隊處理。
維護人員在處理工單時,平臺先調用智能工單處理系統的接口,輸入工單信息,智能處理系統返回該工單所屬知識條目、最匹配類似歷史工單等相關信息,供處理人員參考。
四、 系統中的人工智能技術及實現
在智能工單處理系統中,工單主題模型及主題庫是體現系統“智能”的功能模塊。智能化功能模塊采用的模型和算法,就是人工智能應用在本系統的關鍵技術;模塊的智能水平決定了本系統工作的效率和質量。
從理論上講,本系統的智能化功能模塊是以統計論和概率論為基礎,利用機器學習算法讓機器具有類似人類的自動“學習”能力——對已知的訓練數據做統計分析從而獲得規律,再運用規律對未知數據做預測分析。其基本過程是:標注——利用人工對一批文檔進行了準確分類,以作為訓練集(進行機器學習的材料);訓練——計算機從這些文檔中挖掘出一些能夠有效分類的規則,生成分類器(總結出的規則集合);分類——將生成的分類器應用在有待分類的文檔集合中,獲取文檔的分類結果,該系統以海量歷史工單數據為訓練集,進行了文本分詞、去干擾等預處理;在此基礎上進行特征分類訓練,實現了特征向量的自動匹配。
本系統智能化機器學習功能主要流程圖2所示。

1.確定訓練樣本集
為保證足夠的訓練樣本數量,也為保證較新的數據時效性,我們確定以運維流程管理平臺近幾年的工單數據作為智能工單處理系統的數據訓練樣本集,總量約5萬。
工單數據的主要字段包括:工單ID、類別、子類、條目、請求描述、所屬系統、處理團隊、申請來源類別、申請來源名稱、報送原因分類、處理方式分類、解決方案描述、是否變更等共50個左右的數據項。
歷史工單導出后的數據為XML純文本,便于后續的文本分析和web展現。
2.工單文本預處理
文本預處理主要包括文本分詞和分詞過濾兩項工作,主要作用是按照行業詞匯集將工單文本進行詞匯劃分,然后將結果中那些對語義識別無效或者有害的分詞去掉,以實現工單特征信息的充分暴露,便于下一階段的特征分析、分類工作。
(1)中文分詞
在使用向量模型表示文檔時,首先要對文檔進行詞匯化處理。我們選用了常見的Rwordseg作為智能工單系統的文本分詞工具,它的核心算法采用隱馬爾科夫模型(Hidden Markov Model, HMM),適用于人名識別、地名識別、組織機構名識別、多級詞性標注、關鍵詞提取、指紋提取等領域,并能很好地支持R語言及中文字符集。
為突出工單數據的金融行業特征,我們使用了CFA金融專業詞典作為自定義詞典,使得系統具備了良好的金融行業分詞能力。
(2)分詞過濾
工單描述文本中有大量的問題特征無關詞匯,比如大部分的感嘆詞、形容詞、連詞,以及客戶姓名、地名等停用詞、公共詞,或者低頻詞、專有詞。這些詞匯經常出現,但幾乎不包含任何工單問題特征信息,還可能弱化工單特征信息的表現,影響特征分析和分類。我們收集了此類詞匯(含規則)數百個,形成了干擾詞匯(規則)集,便于對分詞結果進行過濾操作。
經過文本預處理之后,工單數據已初步顯現出主題特征信息,可以進行主題特征分析、分類工作了。
3.設置特征向量權值
由于每類詞匯對工單主題的影響是不一樣的,因此工單主題特征的每個向量的權重值也是不同的。在完成分詞之后,我們對詞語的位置信息做進一步的發掘,需要確定記錄位置信息的方式以及各個位置的詞在反映主題時的相對重要性。標題、摘要和結論、正文等文章各個部分的位置權重是各不相同的,當軟件逐詞掃描統計詞頻時,記錄每個詞的位置信息。適當的、有區分的設置特征向量權值,能夠顯著提高特征分析的準確性。
4.主題特征提取
主題特征提取是人工智能模式識別領域的重要方法,它通過分析不同文檔中的各類詞匯出現的頻率或者概率,找到文檔類型和詞匯之間的內在關聯規則,從而實現對文檔特征的分析和提取。
在智能工單處理系統采用了主題模型在海量訓練數據中自動尋找出文字間的語義主題,以及對工單中的主題進行分析。
主題模型就是將工單數據訓練集中每篇文檔的主題以概率分布的形式給出,從而通過分析一些文檔抽取出它們的主題后,便可以根據主題進行主題聚類或文本分類。主題模型中,一篇文檔是由一組詞構成,詞與詞之間沒有先后順序的關系。此外,一篇文檔可以包含多個主題,文檔中每一個詞都由其中的一個主題生成。
從概率模型上講,每個工單文檔的每個詞都是通過“以一定概率選擇了某個主題,并從這個主題中以一定概率選擇某個詞語”這樣一個過程得到的。那么,如果要生成一篇文檔,它里面的每個詞語出現的概率為(p為加權后的概率):

上面這個式子,可以矩陣乘法來表示,即:
![]()
對任意一篇文檔,左邊的矩陣是已知的,右邊的兩個矩陣未知。而主題模型就是用大量已知的“詞語|文檔”矩陣,通過一系列的訓練,推理出右邊的“詞語|主題”矩陣和“主題|文檔”矩陣。
我們選擇用線性判別式分析算法(Linear Discriminant Analysis, LDA)進行工單主題分類。LDA也叫做Fisher線性判別(Fisher Linear Discriminant ,FLD),是模式識別領域的經典算法。LDA的基本思想是將高維的模式樣本投影到最佳鑒別矢量空間,以達到抽取分類信息和壓縮特征空間維數的效果,投影后保證模式樣本在新的子空間有最大的類間距離和最小的類內距離,即模式在該空間中有最佳的可分離性。工單主題特征屬于高維向量空間,適合采用LDA算法進行主題分類。
5.訓練分類器
計算機從這些文檔中挖掘出一些能夠有效分類的規則,生成分類器(總結出的規則集合);工單主題的分類是通過對分類器進行大量有標簽的數據訓練實現的。
五、 智能工單處理系統的成效
我們對智能工單處理系統的智能模塊進行了訓練,并將訓練好的系統投入運維流程管理平臺進行了試運行,取得了良好效果。
1.自動預測工單歸屬分派,減少流轉次數
工單分配歸屬系統時,不再簡單依靠報送人填寫的系統名稱,而是結合工單具體描述問題,確定工單歸屬系統,并分配到相應團隊。統計結果顯示,應用智能工單處理系統后,工單首次分配錯誤率大幅降低,顯著減少了誤分配次數。
2.統計工單主題分布,挖掘潛在生產問題
智能工單處理系統可以通過批量方式統計提取指定工單集的主題分布全景圖。通過主題分布全景圖,可以直觀地看出每個主題對應的工單分布情況,包括數量以及變化。維護人員通過重點關注分布全景圖中那些工單數量很多,或者近期數量變化顯著的工單類型,分析此類工單的產生原因,比如是否存在系統問題,或者用戶誤操作問題等,利于及時處理問題,提高系統的可用性及穩定性,提升客戶體驗。
3.匹配歷史工單,提高處理效率
智能工單處理系統可以對每個新報送的工單進行通過特征提取,從歷史工單庫中匹配出最類似的工單。處理人員可以參考歷史工單的問題描述、解決方案等重要信息,大大提高了工單處理效率。智能工單處理系統已成為了維護人員常用的實用工具。
4.提供知識條目預測,提升解決方案準確性
智能工單處理系統通過優化工單處理流程,建立并豐富了流程平臺知識庫中知識條目。系統通過對每一張工單對應知識庫知識條目的學習,不斷提高推薦知識條目的準確性。隨著工單種類的數量的不斷增多,知識庫條目的不斷豐富,解決方法匹配程度也會越來越高。
實踐表明,在銀行工單處理系統中應用人工智能技術,能夠顯著提高工單處理效率,減少流轉環節,并挖掘潛在生產問題,促進生產維護工作。
我們的智能工單處理系統使用了機器學習的主題模型實現了工單主題特征的提取、分類和匹配。而在當前人工智能熱潮中,神經網絡特別是深度學習網絡的應用領域越來越廣泛。深度學習是近十年來人工智能發展的新成果,在近期贏得了廣泛關注,適合解決復雜、非線性的分類或者回歸問題,比如圖像識別、語音識別、語音合成、人機對弈等。隨著分布式計算資源的增長,深度神經網絡朝著網絡更多、層次更深、訓練算法更復雜的方向發展,復雜特征的提取能力更強。我們下一步將關注和研究如何將深度學習應用于智能工單處理并取得更好效果。主要研究工作包括擴展訓練數據集、確定技術框架選型、調整神經網絡參數值以及解決訓練中的優化問題。
為順應智慧銀行的發展潮流,將來還可以開展人工智能技術在更多銀行領域的應用和研究,為業務部門提供更多有價值的信息。比如,在海量金融業務交易記錄中進行數據挖掘,自動發現模式,實現交易風險識別、客戶價值分析以及授信決策支撐等功能。人工智能技術在銀行領域的應用,將促進應用系統維護工作智能化轉型,推動商業銀行的產品和服務競爭力邁上新臺階。
(文章來源:中國金融電腦雜志)
掃碼即可手機
閱讀轉發此文
作為支撐比特幣發展的底層技術,區塊鏈的出現預示著互聯網的用途可能從傳統
商業銀行發展互聯網金融,其實對既有的技術體系規劃和設計提出了新的要求。