9月28日,保监会下发《保险资金运用内部控制应用指引(第4号-第6号)》(征求意见稿),要求保险机构在股权投资时,需要关注五大风险点。具体包括:市场风险;投资范围、交易结构及投资标的合规风险;法律风险;操作风险;道德风险。针对前面的投资标的合规风险部分,平安科技刚刚完成第一期针对上市公司智能合规检查工作,首期推出20多个维度50多个事件检查点已成功开发完成并上线应用。
上市公司的合规监管无论是对监督部门、上市公司还是投资者都是非常重要的;而传统的合规督察工作异常繁琐,需要极强的专业知识和大量的人工作业。平安集团有万亿级资金在市场流动,安全是首要需求。平安科技作为平安集团的高科技内核,肩负集团万亿资金保驾护航的使命——有没有办法将专业化的专家经验转化成智能科技手段进行智能监控呢?平安科技的实践验证是可行的。
从数据层面看,证券市场的监管是艰难的,原因在于证券市场的对象主体是企业。企业数据分析的症结至少有以下三个方面的问题。
第一是结构化数据分析中的个体差异问题。与个人样本规模动辄几十万的“大数据”相比,企业样本数据能有几百个就算很不错了;若再加上分析时需要对行业、规模、发展阶段、产品形态等维度进行“切片”处理,一系列细分之后样本可能所剩无几。这对以大数定理作为统计学命脉的支撑逻辑是重大挑战。
第二是大量的非结构化数据的处理问题。企业经营过程中会产生大量的文本、图像、音频、地理位置、连续信号等复杂格式数据,这些数据中富含大量高价值信息,但前提是需要用有效的技术手段进行提取。
第三是数据之间的相互连接问题。这一问题主要表现在如何关联第一类和第二类问题中的数据,如果是采用传统的数据表格来记录,一方面是数据稀疏问题,另一方面更为严重的是这里的关联形态存在强度大小、关系强弱问题。
上述三点是企业数据处理实践中无法回避的基本问题,这些问题的存在启示企业分析工作需要用不同的数据组织和分析范式。平安科技在此方面进行了开拓性的大胆尝试,并取得业界领先的积极成果。
平安科技的解决方案是知识图谱技术。从两年来的实践来看,这似乎是一条正确的解决路径。欧拉图谱是一款基于关系网络的企业知识图谱产品,分析员可以透过对企业经营相关的企业、人物、事件、行业四大方面的“穿透式”分析,及时捕捉企业营销、风控、投资的机会和风险信号点。
相对于前面的问题,知识图谱技术需要结合监管实际需求开展工作。
第一,以产业链为中心解决数据组织和分析的关联逻辑问题。以企业产业链为中心,数据的关联和衔接以网络结构关系为核心存储和关联逻辑,这样的处理可以有效规避数据稀疏和关联强弱问题。在监管上面主要体现在,全面动态监测企业上下游供应链及整体行业产业链状况,发掘上市公司的违规经营行为并进行及时披露;结合知识图谱技术识别关联群体和交易行为,提升分析工作效率和产能。
第二,以语义理解和推理解决非结构化数据(尤其是文本)的利用问题。当然这需要利用复杂的自然语言处理、语义理解和推理技术。具体到监管工作上面,先通过语义理解捕捉事件线索,接下来进入推理稽核环节。在事件识别之后,系统会自动分析该事件的直接主体还是关联影响方,比如识别当事企业是债券违约主体还是承销方;除此之外还有很多的工作内容是对后台多方数据进行校验、比对,比如自动抽取财务数据、第三方供应商或客户数据,对抵押、担保方披露数据进行冲突检验(例如财务粉饰、造假、异常)等,这样的多方稽核才更容易发现疑点和问题。
第三,利用案例模型库智能类比来解决专家经验的智能化问题。市场上已有曝光的企业债券违约、监管处罚、破产、摘牌、退市等案例是宝贵的分析资源,这些案例的问题发现和分析蕴含了大量的专家经验和智慧,通过人工智能技术,可以对历史案例进行学习,充分利用智能化对比分析,快速获知目标企业与风险案例库中的企业对比状况,及时判别风险;同时,有了风险案例企业的对比,可以极大的提升用户对目标企业的潜在风险破坏力和演变趋势的判断力,降低学习门槛,提升监管效能。
在具体应用案例中,这里以债务分析为例来展示相关监管技术的实现逻辑。传统的上市公司财务分析不仅依赖专业的财务知识,而且财务指标细碎繁多,如果有公司有意对报表加以粉饰,不用说普通人,即便是专家也很难快速察觉到财报中的异常之处。既然有历史案例,那么借助专家经验,我们就能高效学习,快速发现类似案例中的蛛丝马迹。我们通过解读国际金融专家的分析逻辑,抽取其中关键的步骤,利用欧拉图谱的智能企业关联分析,形成了基于推理的专家分析逻辑,让财务异常的挖掘更加智能化。图示给出了基于专家思维模式的上市公司债务推理逻辑,从负债异常检测、资金去向检索以及违约破产可能性方面做逐步剖析。
上述案例主体工作步骤有3个,检查数据点超过千个,扫描包括供应商、客户、合作方、股东、投资、担保、债券发行等关系类型近20种,涉及企业一度关联方3000多个,覆盖企业新闻报道、公告、法律诉讼、第三方公司舆情上万篇,但整个稽核过程只需要几分钟即可生成报告或风险提示信号。
从图示二可以看到,通过结合欧拉图谱多个功能模块的分析,监管部门或投资机构能迅速地理清该公司负债高的原因以及偿债能力。需要强调的是,这个案例只是历史案例库里众多案例中的一个,并且这一套分析的流程已经整合到平安科技欧拉图谱的合规检测模块,对所有公司都会同时监控并扫描风险。
平安科技欧拉图谱内置的合规检测模块,已经实现了数百万条上市公司公告数据的自动解析、关键事件探测、关联线索提取、信披合规检测等工作;数据覆盖范围包括定期报告、财务报表、业绩快报、重大诉讼、处罚(处分)监管措施、公告原文等结构或非结构化数据。通过上万条法规库的智能解读,可依据相关法律法规、政策、规定条文,从对外担保、资金占用、会计差错等几十个维度近百个项检查点对上市公司信息披露的真实性、准确性、完整性、及时性、合法合规性和公平性进行自动评估。目前,可对3000多家上市公司的信息披露合规情况做到日更新,这种自动化、智能化的监控和预警无疑是给监管部门以及投资者提供很大的便捷。
中国“一行三会”对监管科技需求之迫切振奋人心,前不久中国证监会刘士余主席还在监管国际研讨会上提出“交易所如何用好大数据、人工智能等新技术,发展监管科技(RegTech)”的思路;国庆节前夕,深交所旋即重磅推出自主研发的大数据监察系统、债券风险监测系统。平安科技作为“金融科技”的参与者、建设者和受益者,愿与社会各界一道贡献科技智慧,为中国资本市场的健康发展添砖加瓦!