EN

杨强:为什么要用联邦学习来做风险控制? | 北大汇丰金融前沿讲堂

  2021年3月17日晚,应巴曙松教授邀请,微众银行首席人工智能官杨强教授做客“北大汇丰金融前沿讲堂”,带来主题为《用户隐私、数据孤岛和联邦学习》的精彩讲座。本文节选了部分讲座视频和文字实录,以飨读者。

  以下为视频部分文字实录

  数字化的普惠金融正在中国蓬勃发展,是未来希望的曙光。中国也在做类似于尤努斯模式的微型信贷,而且在一些农村做得不错。除此之外,一些企业也在做。中国的网络银行、互联网银行比如网商银行、微众银行等,这些大型的数字化机构的效率非常高,两三年的时间覆盖了2000万到3000万的客户。

  我们举几个例子给大家看,首先看一下传统的金融行业,这就是为什么要用联邦学习来做风险控制。

  风险控制现在不是靠专家了,现在是靠数据了。

  这个数据往往是永远不够的,一个是不够全面,一个是非结构化,很难解析处理,还有一个是滞后的,那么怎么办呢?我们就可以利用联邦学习和各方的实时大数据建立一个联邦学习的网络来进行各种各样的金融的活动,这里列举了风险控制、投研、营销、理赔、保险、支付等等,我就不一一过了。

  国家层面对联邦学习也开始重视起来,像《中国智能金融发展报告》在2019年就专门有一个chapter(章节)来讲联邦学习的特点。

  这个例子就是怎么用联邦学习来做反洗钱,我们知道洗钱是一个非常小概率的事件,大部分人都不会去洗钱,因为我们都没有这么多钱要洗。但是真正洗钱的人是非常精的,不会在一家银行去洗钱,会在很多家银行,每个银行做一点点的操作,除非能够把这些银行串起来,否则发现不了洗钱的动作。

  联邦学习可以让银行之间数据不出库,打消很多顾虑,同时建立一个横向联邦。因为他们之间的特点,特征都是类似,因为贷款类型都类似,特征都类似,transaction也类似,但是他们的用户不同,这就是我们所说的“横向联邦”。

  他们的用户里面有很多行为实际上并没有,因为银行的特征特别特别少,我可以借用互联网公司有很多行为,但是却没有我们所说的“Y”,也就是目标。我们就可以和互联网公司建立一个“纵向联邦”,通过互联网公司把我们的特征空间特别特别强地壮大,这样的一个系统可以发现一些特别难以发现的洗钱的行为。这个是和央行(人民银行)一起合作做的项目。

  在做贷款的时候很多银行没有自己的数据做风险控制,只有靠关系,我们现在知道国家现在推广的是小微企业的扶持、小微企业的贷款。如果能够应用上大数据就能够把贷款周期大大缩短,需要这些数据能够联合建模。

  大家看右图,这个蓝线代表联合建模的效果,引用的数据集增多的情况下,效果也是也是增加的,增加到红线以上,这个模型以上就可以用了,也就是就超过人的能力,就可以被上线去使用。

  我们用在什么样的公司呢?有很多例子,比如说金融科技、数据服务、互联网公司、支付公司以及其他的公司,加在一起形成一个联邦的数据网络。

  摄像:谢凤

  视频:熊熊