A. 中國科學技術大學哪些專業最值得讀
18級一年生報到。
王牌中的王牌不敢講,但生物專業我們是首屈一指的。
來看看青塔統計的數據:
(不完全統計,但是生院有著幾乎最高比例的女生哦,還等什麼,不快來讀生物專業嗎?)
B. 五大賽道、八位專家,銀行局中人眼裡的AI江湖
誰說大象不能跳舞?
2020於全體銀行而言,是一場無預告的終極考驗,一輪最直觀的金融 科技 對決。疫情讓網點流量驟降到接近於0,全方位挑戰銀行線上服務水平,檢驗那些連年增加的 科技 投入,有多少真正變作數字化、智能化的一點一滴。
踏進2021,銀行們迎來周密復盤、整裝待發的最好時間節點。
在過去這一年,銀行更努力地擺脫大象轉身的刻板印象,告別以往被各路創新推著走的窘況,試圖在金融 科技 和數字新基建的浪潮里承擔更主動、開放的角色,以輕快敏捷的步伐持續向前。
沒有一家銀行不想擁抱AI,沒有人願意錯過數智化轉型的未來。在梳理數十家銀行AI全布局,以及 「銀行業AI生態雲峰會」 多位嘉賓的分享過程中,我們逐漸發現銀行業AI的那些挑戰和困境,那些艱險之處同樣是機遇所在。
數據安全與隱私保護
銀行業AI,首先被AI本身正面臨的數據困境,和日漸收緊的數據監管尺度攔住。
在技術維度不斷向前奮進的同時,銀行必然要思考的一個議題是:業務創新與隱私保護如何兼顧?
雷鋒網AI金融評論主辦的 《聯邦學習系列公開課》 曾對這一問題展開過系統深入的探討。第一節課上, 微眾銀行首席人工智慧官楊強 就直接點明:「人工智慧的力量來自於大數據,但在實際運用過程中碰到更多的都是小數據。」
平安 科技 副總工程師王健宗 也在課上指出,「傳統的AI技術必須從海量的數據中學習或者挖掘一些相關的特徵,利用數學理論,去擬合一個數學模型,找到輸入和輸出的對應關系,比如深度學習中訓練網路的權重和偏置,模型效果與數據量級、質量、以及數據的真實性等有著密切的關系。」
一個典型例子就是銀行信貸風控:現在大部分AI應用都由數據驅動,信貸風控更需要大量數據訓練,但大額貸款風控的案例又非常少。「要是來做深度學習模型,只用少量這種大額貸款的樣本遠遠不夠。」楊強解釋。
小數據需要「聚沙成塔」,同時又面臨侵犯隱私的可能。為此,網路安全與數據合規領域的立法進入了快車道,濫用數據和爬蟲也受到過嚴厲整治。
雖然目前《數據安全法》還只是處於草案的狀態,但是草案明確提出要關注數據本身的使用,需要在保護公民組織、相關權益的前提下,促進數據為關鍵要素的經濟發展。
數據被稱作是新時代的油田,但銀行該怎樣通過AI摸索出更高效、更合規的開采工具?
在「銀行業AI生態雲峰會」第一場演講中, 微眾銀行區塊鏈安全科學家嚴強博士 就對銀行必備的數據安全與隱私保護思維,進行了深入討論。他指出:
在數字經濟時代下,銀行業AI發展 必須要尊重「數據孤島」作為數據產業的原生態,隱私保護技術則是打破數據價值融合「零和博弈」的關鍵,需要打通隱私數據協同生產的「雙循環」。
而 區塊鏈 是承載數據信任和價值的最佳技術,對於隱私計算和AI應用中常見的數據品質等難題,都可以通過區塊鏈進行互補或提升效果。
聯邦學習、TEE可信計算、安全多方計算等多個AI技術路線也正嘗試落地於銀行的核心業務場景。
AI金融評論了解到,除了微眾銀行, 江蘇銀行 2020年也已開展聯邦學習方向的 探索 ,他們與騰訊安全團隊合作,基於聯邦學習技術對智能化信用卡經營進行聯合開發和方案部署,在聯邦學習技術支持下進行金融風控模型訓練。
銀行資料庫
以「數據」為線,銀行前中後台的升級軌跡清晰可見。
如果說前些年的銀行 科技 ,討論度更集中在前台智能化應用,那麼如今中後台建設開始更多地來到聚光燈下,討論它們為銀行數字化轉型呈現的價值和意義。
這當中的一個重要模塊,就是 銀行資料庫 的改造升級。
我們曾經報道,Oracle自進入中國市場以來,在銀行資料庫市場,一直具有壓倒性優勢,也是許多銀行的采購首選。
由於長期使用Oracle,不少銀行形成較嚴重的路徑依賴。平安銀行分布式資料庫技術負責人李中原也曾向AI金融評論表示,系統遷移和重新建設需要大量成本,從單機變為多機群體,故障發生的故障發生的概率和維護成本都會加大,對整體系統運維將是巨大挑戰。(詳見 《銀行業「求變」之日,國產資料庫「破局」之時》 )
但隨著銀行業務創新需求愈發復雜,傳統資料庫在技術邊界、成本、可控性方面越來越不相匹配;采購資料庫的來源單一也讓銀行陷入非常被動的處境。
而雲計算的出現,讓Oracle在資料庫市場接近壟斷的地位有所動搖,各大互聯網雲廠商殺入戰場。
騰訊雲副總裁李綱就表示,雲化資料庫勝在成本低、易擴容兩大特點,任意一台X86的PC伺服器就可以運行,理論上也有著無限的橫向擴展能力,這都是Oracle等傳統資料庫難以企及的優點。
中國數千家銀行由此獲得更多選擇餘地,開始從集中式資料庫遷移到分布式資料庫,一場事關「大機下移」的漫長征途就此展開。
這場變革已有先行者,例如 張家港行 在2019年就將其核心業務系統放在了騰訊雲TDSQL資料庫上,傳統銀行首次為核心系統選用國產分布式資料庫;2020年,平安銀行信用卡的核心系統也完成切換投產,新核心系統同樣採用了國產資料庫。
在「銀行業AI生態雲峰會」上, 騰訊雲資料庫TDSQL首席架構師張文 就深入分享了張家港行和平安銀行這兩個典型的資料庫遷移轉型案例。
以 平安銀行 為例,其體量之大,意味著應用改造更具挑戰性。張文解釋道,為了配合此次改造,應用引入了微服務架構對應用進行了拆分和解耦。對賬號的分布進行了單元化劃分,以DSU為一個邏輯單元,單個DSU包含200萬個客戶信息,單個DSU同時處理聯機和賬務兩種業務。
但國產分布式資料庫也同樣還在成長當中,張文也指出了目前金融級分布式資料庫面臨一系列挑戰點,除了有可伸縮、可擴展的能力,更要解決高可用性、數據強一致性,同時 探索 更具性價比的性能成本,以及為金融機構打造更易上手的、更產品化的成熟解決方案。
中台建設
「中台建設」這個熱門關鍵詞,不再是互聯網公司的專屬。銀行也不例外,甚至更需要中台。
銀行這樣的大型機構,架構極其復雜,還有跨部門多團隊的協作,海量數據日積月累之下如同年久失修的危樓,更需要及時、持續的治理。
在看來,銀行擁有大量的數據、技術和人才,資源卻往往「各行其是」,部門之間沒有配合意識、獨立造煙囪;技術流於表面,無法鏈接、深入,這造成了銀行資源的大量浪費。
中台 的體系化建設和順利運轉,才能將這龐大體系中的「死結」一一梳開。
建設銀行 監事長王永慶就曾指出:中台建設是商業銀行數字化經營轉型的關鍵環節,認為商業銀行數字化轉型的必然歸宿是生態化、場景化。
盡管商業銀行在多年經營過程中沉澱了一定的競爭優勢,形成了各具特色的內部生態系統,但目前仍是封閉的、高冷的,還無法滿足數字經濟對開放式生態化經營可交互、高黏性、有體感、無邊界的要求。
因此,建行也已在數據中台先行一步,其落地上概括為5U(U是統一的意思),包括統一的模型管理、統一的數據服務、統一的數據視圖,統一的數據規范以及統一的數據管理。
為求輕松支撐億級用戶,實現高時效、高並發場景化經營, 招商銀行 近兩年也在中台和技術生態體系的建設上持續發力。去年年底發布的招商銀行App 9.0,迭代需求點超過1800項,「10+N」數字化中台建設就占據了相當的比重。
如何構建金融機構需要的數據中台?
在「銀行業AI生態雲峰會」上, 360數科首席科學家張家興 就用「三通三快」概括了數據中台的標准:
金融機構面對著海量用戶、復雜業務,一個優秀的數據中台,必須是達到多業務打通,內外數據互通和用戶關系連通,同時還要做到數據的實時處理快、使用快、需求響應快。
他進一步強調,數據與AI融合得非常緊密,如果數據中台和AI中台各自建設,兩者之間將不可避免地存在割裂的現象。
基於此,360數科也推出了自己的數據AI融合中台,將最上層數據平台,到中間數據服務支撐的平台服務,再到整個數據資產的管理,到最下面整個數據技術架構的設計都進行調整,並且將自身沉澱的AI能力嵌入其中。
張家興也在雲峰會的演講上透露,360數科研發了一項聯邦學習技術——分割式神經網路,通過神經網路在高維空間,Embedding不可逆的特性,使得不同參與的數據合作方只需要傳遞Embedding向量,見不到原始數據,但最終可以使模型產生目標效果。
銀行信貸智能風控
而在過去一年裡,銀行信貸風險管理,仍然是最引人關注的方向之一。
關注度一方面來自於,受疫情影響而劇增的貸款逾期和壞賬風險,如何藉助技術手段「端穩這碗水」,把握好信貸支持尺度,成為銀行、消金公司和風控技術服務商們的開年大考。(詳見 《信貸戰「疫」:一場給風控的開年大考》 )
而另一方面,2020年下半年起,針對金融 科技 或是互聯網金融的監管「紅線」逐漸清晰。例如《商業銀行互聯網貸款管理暫行辦法》,其中就明確提出了對商業銀行的風險管控要求,和對合作機構的管理規范。
盡管結合AI、大數據的智能風控在銀行 科技 應用中不再新鮮,但這並不意味著智能風控已經足夠成熟—— 數據資源壁壘、自有數據累積、數據特徵提煉、演算法模型提升 ,被認為是大數據風控目前所面臨四大困境。
某商業銀行負責人就曾表示,在模型建設和模型應用過程中普遍存在數據質量問題,包括外部數據的造假(黑產欺詐)和內部數據的濫用等,在模型迭代方面,很多銀行只追求迭代的速度和頻次,而忽略了最終效果。
前網路金融CRO、融慧金科CEO王勁 進一步指出,數據規范和治理體系不健全,數據質量差且缺失率高,技術能力不足,復合型 科技 人才匱乏等因素都是銀行等金融機構無法做好模型的重要原因。
王勁曾在有著「風控黃埔軍校」之稱的美國運通工作17年,負責過全球各國各類產品相關的700餘個模型提供政策制度和獨立監控。在雲峰會上,他也結合自身二十餘年風控經驗,剖析了金融風險管理中的那些理念誤區。
「很多人並不是特別理解,風險管理永遠是一個尋找平衡點的科學。」王勁認為,風險管理平衡有著這樣的核心三問:
他也解析了銀行等持牌金融機構做好風險管理平衡的核心要素,談到風險管理最重要的就是對數據的把控,「金融公司成立之初就要思考數據的生命周期。首先要從對業務產品和客戶的選擇當中,決定需要什麼樣的數據。」
數據戰略是一個相對長期的落地過程,機構首先要立下數據選擇的原則和條件:要考慮的不只是數據的合規性、穩定性和覆蓋率,更要考慮數據的新鮮度、時效性和時間跨度。
從模型建設的角度出發,王勁指出,一個卓越的風控模型應當具備辨別力、精準度、穩定性、復雜度和可解釋性五大要素,「原材料」數據、模型架構和演算法的選擇,衍生變數的出現,對模型的監控和迭代,以及對y的定義和樣本的篩選,無一不影響模型的「鍛造」。
在他看來,銀行等金融機構如果能在身份識別和控制、數據安全管理、風險模型管理,和自動化監控體系方面,做到高效完善,將會是非常理想的一種狀態。
RPA與內部流程優化
還有一個關鍵詞,在各家銀行年報中出現頻率越來越高,那就是RPA(機器人流程自動化)。此前AI金融評論也曾舉辦 《RPA+AI系列公開課》 ,邀請到五位頭部RPA廠商高管分享RPA與金融碰撞出的火花。
RPA的定義,很容易聯想到2012年左右的「流程銀行」轉型潮。當時的流程銀行,意為通過重新構造銀行的業務流程、組織流程、管理流程以及文化理念,改造傳統的銀行模式,形成以流程為核心的全新銀行經營管理體系。
如今銀行的轉型之戰,全方位升級為「數字化轉型」,內部流程的優化改造在AI和機器人技術的加持下持續推進,RPA也迅速成為銀行數字化轉型不可缺席的一把「武器」。
達觀數據聯合創始人紀傳俊 在「銀行業AI生態雲峰會」上指出,RPA+AI為銀行帶來的價值,最明顯的就是減少人工作業、降低人工失誤,提升業務流程效率,同時也提高風險的預警和監控能力。
AI金融評論注意到,已有多家國有大行將RPA投產到實際業務中。
以 工商銀行 為例,RPA在工行的應用覆蓋了前台操作、中台流轉和後台支撐等多個業務場景,在同業率先投產企業級機器人流程自動化(RPA)平台並推廣應用,全行累計46家總分行機構運用RPA落地實施120個場景。
建設銀行 同樣也引入了RPA,建立國內首個企業級RPA管理運營平台,敏捷研發業務應用場景 100 個,實現人工環節自動化、風險環節機控化。
農業銀行 方面則透露,農行目前還處於技術平台建設階段,之後將以信用卡業務、財務業務等為試點落地RPA需求。其實施策略,是建設全行統一的RPA技術平台,面向總分行各部門輸出RPA服務。
中國銀行 在2017年底,旗下公司中銀國際就已有RPA的概念驗證,團隊成功投產20個機器人,分別在不同崗位執行超過30個涉及不同業務流程的自動化處理工作,也與RPA廠商達觀數據展開了合作。
紀傳俊也在雲峰會上分享了目前AI+RPA在銀行各大典型場景的落地:
例如智慧信貸,面向的是整個銀行最核心的流程——信貸流程,分為貸前、貸中、貸後三大階段。其中涉及數據查詢、數據處理、財務報表、銀行流水等專業環節,需要完成基礎信息的錄入、盡調報告的審核,而這些環節中的大量重復勞動,可以基於AI、OCR、NLP等技術自動化完成。