主讲嘉宾:李崇纲
主持人:中关村大数据产业联盟金融大数据专业委员会 副主任 李灵隐
承 办:中关村大数据产业联盟、金融大数据专业委员会
整 理:王维
嘉宾介绍:
李崇纲:金信网银常务副总经理,曾任北大方正舆情产品总经理;中国计算机学会大数据专家委员会委员,北京新媒体协会媒体融合论坛副秘书长,中国网络版权维权联盟副秘书长,中关村大数据产业联盟成员; 10多年网络数据挖掘分析经验,网络舆情分析经验;10多年舆情服务一线市场经验;专注大数据在政府、金融等行业领域应用;国内首款舆情监测系统的设计者,长期跟踪互联网大数据行业变化。
以下为分享实景全文:
李崇纲:大数据监管是互联网金融监管的新范式
今天的分享分为四个部分。第一个部分, “异军突起”的互联网金融如何监管。在第二个部分里,我带大家回顾一下互联网金融行业出台的政策和行业现状。在去年年底今年年初,国内的第三方评级机构相继出台了一些行业评级报告,我们对其认真研究、分析,也发现这些报告利弊并存。第三个部分是我今天分享的核心部分,即大数据监管是新形态的互联网金融监管模式。最后一个部分是重点。我们公司通过大数据技术已成功建立监测平台,可以对P2P问题平台风险预警,同时也可以用于金融行业其他机构或产品的风险分析。
今年两会上,对互联网金融监管的提案很多。招商银行前行长马蔚华希望加快落实P2P行业监管,出台P2P行业的监管政策。中央财经大学教授贺强提出采用数据量化、分级管理等更为科学的方式来监管。同时,我们也看到银监会对互联网金融监管的思路有所转变。今年年初,银监会设立普惠金融部,加快落实监管政策。
互联网金融行业里,P2P发展最快,呈现出来的问题也最多,具有代表性。近年来,P2P的野蛮生长缺乏管理,导致大公司不敢创新,而小公司胡乱创新,也对行业的有序发展带来了不良影响。实际上,对P2P监管政策落实的最大受益者是守规矩的企业。
纵观P2P行业,国内与国外发展差异很大。在美国,LC和Prosper成双头垄断形态,由SEC监管,主要是个人消费贷款。在中国,P2P成“三无”监管真空状态。据公开信息统计,截止今年2月份,近400家P2P平台跑路。
这页PPT展示的是网贷之家2014年P2P年度统计信息。(昨天,网贷天眼也及时发布了2015年第一季度的P2P分析报告。)图中显示,截止2014年底共有1575家网贷运营平台。(有行内人士估计不下三千家。)
按照地域划分,广东、浙江、北京、山东等省市是P2P发展最快地地区。也同时看到,2014年275家平台由于借款人逾期、投资人撤资等原因,造成很多平台面临兑付压力、提现困难,2014年也是问题平台集中爆发的一年。
近年来监管部门规范P2P行业的信号越来越浓,但至今仍未出台一份正式的规范文件。
每一次监管层释放监管信号,都会引来热议。我们通过网络舆情分析,对P2P相关报道和舆论,我们发现今年两会有关互联网金融监管的声音达到了前所未有的高峰。
信用体系的建设与互联网金融行业的监管是相辅相成的,是互联网监管重要的一部分。2014年,国务院出台关于信用体系建设纲要,其中从三个方面阐述并着重指出金融领域信用建设。
去年年底今年年初,大公国际、融360等机构发布了评级报告。经过仔细研究,我们认为其仍然缺乏足够的数据支撑,很难有足够的公信力,也很难对行业从业者有充分的说服力。比如,融360是一个理财超市,与很多P2P平台有业务上的合作,其出台报告本身就耐人寻味。
站在行业角度反观第三方评级的做法,我们认为,要真正做好网贷的评级需必备四个重点,分别是:
第一,评级机构必须是独立公正的第三方;
第二,需有客观、公正、准确的网贷评级体系;
第三,公信力建立也是必要的准则;
第四,需要联合行业、平台、监管等多方共同努力。
传统金融和互联网金融既融合,又竞争。所以,对传统金融的监管办法并不能完全适用于互联网金融业态。传统金融的监管逻辑是产品逻辑、机构逻辑和分业监管,而互联网金融的快速发展促进金融服务碎片化、产品去中心化,更多崭新的互联网产品服务和平台正在诞生,金融进化速度不断加快。对于互联网金融的监管,我们认为应该向大数据模式过渡。
大数据概念到落地,需要一个过程,不是技术问题,而是管理,组织,流程的问题,归根到底,是思维的转变。
金融监管的模式转变、大数据监管的落地,与其他行业的大数据模式落地有共同点。应用大数据监管,互联网金融可实现主动、精准、动态、实时、协同监管,并创新社会治理模式。
大数据通过对金融机构的画像,构造金融机构的信用图谱,实现对行业的风险监测,从而达到创新监管。同时,这需要监管机构有相应的思维方式的转变,需要用大数据思维构造新的监管模式、业务流程,构造新的组织管理机构,当然也需要大数据的技术支撑和具备复合知识的人才素养。
下面看一下P2P问题平台存在的风险。通过对历史上出现的问题平台的剖析,我们发现它们存在的风险特征有欺诈风险、市场风险、操作风险、信用风险、政策风险和流动性风险等。
前面我们分析过互联网金融和传统金融的差异性,P2P问题平台呈现出新的特点,包括平台信息透明度、项目进展透明度、融资方式等。而传统方式难以及时发现和预警问题平台。
那么如何及早发现问题的P2P平台?及早介入调控,避免投资人资金损失呢?我们收集了数百个问题平台的信息,总结出相关规律和风险点,利用机器学习的方式对这些风险点归纳总结,建设风险模型。同时,我们还与政府部门的数据比对和回测,不断调优模型。
用大数据辅助监管的原理如下:
首先,我们对财经网站、P2P网站、政府网站、工商税务、社交媒体等数据源大规模采集。然后,根据行业、区域、产品自动分类、标引、存储在金融风险分析大数据平台中。同时,我们积累了风险信号库、预警模型库,通过多个模型分析风险预警,辅助金融监管,做风险信用评估。
在我们构造的金融大数据平台中,有三个关键技术点需要突破,分别是数据采集、数据挖掘和风险模型。
对网贷平台的特征点信息采集主要从平台特征、项目特征和安全特征三方面。
平台特征包括公司信息、关联企业、团队构成等;
项目特征包括项目情况、收益情况、项目期限等;
安全特征包括技术保障、担保保障、法律保障等。
对采集到的信息进行挖掘主要通过文本语义识别技术,通过对大量的文章做信息的抽取,把非结构化信息转化为机构化或半结构信息。如图,我们把这段文字抽取之后,自动识别机构简称、机构全称、地址、网址和注册资金等。
风险模型需要根据不同问题平台的情况而分别建立的。网贷问题平台的跑路有两种类型,主动型和被动型。主动型最主要指平台的欺诈行为。被动型主要由于经营不善,资金不能兑付。
我们主要依托TRS的成熟的技术,构建了大数据防范金融风险的平台,以下简要介绍TRS技术:
第一,应用TRS海量异构数据采集的技术对网络新闻、财经媒体报道、百度贴吧、社交网络信息等实时、精准采集,同时应用此技术可获取经授权的工商税务数据、法院诉讼数据等信息。
第二,使用大数据挖掘分析平台对每家公司分析和挖掘它们的公示信息、招聘信息、网络投诉,并对这些信息数据清洗,便于量化处理,构造风险模型。
第三,基于TRS的Hybase大数据管理平台,训练分析样本,采用机器学习的方式,设计了针对金融风险高发领域的多个风险模型。
基于以上三大技术,我们构建了金融大数据分析平台,这个平台分为四个层次。
数据收集:分别从金融运营平台信息、电商数据、工商税务数据、社交媒体信息等收集;
预处理:根据表征信息、行为信息、状态信息、利益信息等几个方面进行分词、褒贬义分析、关联关系分析等;
数据分析:通过对预处理过的数据进行机器学习;
数据应用:对数据从风险面进行全面分析解读。
目前这个平台已经应用到了一些金融行业管理机构,并且初见成效。
下面介绍下这个平台的一个典型应用,对P2P跑路的监测预警。
针对识别出的P2P跑路风险,系统提供工商注册验证、实时预警、事件追踪、案件分析、涉案信息挖掘、案件取证、信息检索、专题分析、等功能,全方位挖掘嫌疑企业的网上关联信息,为金融管理部门以及公安部门提供情报线索与线上证据。
针对平台跑路的涉嫌非法集资行为,我们设计提出冒烟指数模型,可以发现疑似非集的经营行为。冒险指数从特征词命中指数、传播力指数、投诉举办指数、收益偏离指数和合规性指数五个维度来考量。
针对问题P2P平台的的经营跑路全过程,我们还可以进行360度的历史回溯。从公司的注册、推广、经营、股东变更、关联方表态等关键节点的时间点追踪,可以全面展现这个平台的历史信用图谱。
经过一段时间的跟踪和监测,我们总结出一些风险高发特征点,比如股东背景含糊不清、标的期限搭配不合理、允许信用卡充值等。系统与相关政府部门数据共享,实现向公安和银监局报送30多家疑似问题平台。
以上是以P2P问题平台的预警机制建立作为一个案例,我们认为大数据必将驱动金融业的体制变革和创新。比如,利用大数据可以对银行客户进行画像、精准营销、风险管控和运营优化。同时,大数据在反洗钱、反欺诈、打击非法集资、辅助金融安全监管、完善征信体系和风险把控都具有重要意义。