【教授观点】邱慈观:金融科技赋能ESG数据

高金金融研究院 2020-11-20 4192

与传统投资相比,ESG投资面临数据挑战:它需要的非财务类数据,不仅特性差异大,而且披露不充分,也未标准化。那么怎样才能解决ESG投资的数据困境呢?近日,上海交通大学上海高级金融学院教授邱慈观与上海高级金融学院社会责任投资专项基金研究员张旭华受邀撰文,分享观点:金融科技可以赋能ESG数据,助ESG投资一臂之力。


据联合国负责任投资原则的最新统计,其签署机构已超过三千家,总资产管理规模近一百万亿美元,其中主要涉及ESG投资。传统投资以投资风险和收益为主要关切,ESG投资则除此之外,还在投资分析和决策流程中,纳入了环境(E)、社会(S)和公司治理(G)三个因素。然而,把投资从二维空间扩展到三维空间,只加了一个维度,复杂性却增添很多。

投资分析和决策需要数据,传统投资的主要依赖财务类数据及其他基本数据,譬如股价、交易量、财务报表、新闻公告等。这些数据常通过定性和定量的形式,被提供给投资者。

与传统投资相比,ESG投资面临数据挑战:它需要的非财务类数据,不仅特性差异大,而且披露不充分,也未标准化。各项调查结果也反映了这个事实,譬如毕马威联合会计师事务所针对全球近五千家大企业所做的调查,就发现非财务类数据的报道标准很不一致,造成数据比较上的困难。新兴国家方面,非财务类数据的披露就更成问题了,不仅披露频率低,覆盖面少,标准不一致,另加上公关导向严重,内容五花八门,其中真正ESG数据的含金量并不高,而难以满足ESG投资者的数据需求。今年6月平安数据经济研究院针对国内ESG信息披露的报告,就指出这种情况,表示信息不足导致ESG投资的执行困难。

那么,怎样才能解决ESG投资的数据困境呢?有关于此,各方看法虽然未必一致,但金融科技常被提及,认为它可以助ESG投资一臂之力。

金融科技的英文FinTech,由金融(Finance)与科技(Technology)两字组成,显然融合两者而形成的产物。依照金融稳定理事会的定义,金融科技是指在金融服务领域的技术创新,由此形成新的商业模式、应用、流程或产品,而对金融服务供给产生重大影响。

金融科技是一个不断演进的概念,甚至可以用“苟日新、日日新、又日新”来形容。放在上个世纪,金融科技能够实现的无非是金融机构内部业务流程的电子化,而后随着互联网的发展,金融科技在信息共享、渠道拓展上发挥优势。放在今天,人工智能、区块链、云计算、大数据等技术的出现,使得金融领域在数据获取、投资决策和风险评估方面,得以更上一层楼。在ESG投资方面,各界对金融科技如何可以赋能这类投资,目前虽然看法不一,但相关数据的获取与信息的提取,显然被认为是最可能的方向。

ESG投资的数据挑战

ESG投资需要的非财务类数据,关乎一家企业及其利益相关方的可持续发展,却并不反映于公司的财务报表。ESG三个维度下,各有细化议题和指标。例如,MSCI的ESG研究及评级框架就包含了三大维度、十大主题和37个关键议题,而每个关键议题还分风险暴露指标与风险管理指标。MSCI的研究方法以定量为主,各指标的计算都有赖海量的基础数据。

以社会维度为例,重要议题包括产品安全与质量、员工健康安全、供应链劳工标准等,各议题下又有一些细化指标,最终须以定量或定性指标来体现。譬如,”产品安全与质量”这个议题的细化指标就包括产品召回率、产品安全事件、客户投诉次数等。

图1:ESG相关指标

这些信息如何提取?传统方式能满足吗?有关于此,首先需要理解ESG数据的特征,然后才能理解金融科技能如何助力。

ESG数据具备大数据的三个重要特征,而可以三个以英文字母v开头的单词来代表:数据量大(volume),数据多样性(variety),数据实时性(velocity)。

ESG数据量大且来源分散

ESG数据来自多种渠道,除了企业的CSR(企业社会责任)报告和财报外,还有政府部门、监管部门、新闻媒体、社交网络等来源。一些数据不直接来自于企业本身,而是分散于供应商、客户、股东等利益相关方等来源。例如,证监会对证券公司的处罚和劳动纠纷的仲裁结果,信息就来自于不同渠道。此外,一些和公司管理层相关的事件,最开始可能出现于社交网络,随后又出现于新闻报道。

特別是,另有一些数据来自于非营利组织。譬如,笔者曾在《从苹果的另一面,谈谈手机行业的ESG》中提及,中国公众环境研究中心和联合自然之友等民间环保组织,先后发布了两份报告,揭露苹果在华供应链中存在的诸多问题。

ESG数据格式多样化

数据有结构化与非结构化之分,前者包括可用二维表结构来表示的数据,譬如医药公司的股价和成交量数据、微软公司近五年的财报数据等,我们可以利用这类数据进行搜索、计算、统计和分析。后者包括文本、图片、音频、视频等,形式繁多。

ESG数据里有大量的非结构化数据,需要借助金融科技的力量来进行提取。例如,当企业公开发行债券时,会编制募集说明书,其中有发行条款、募集资金用途、发行人的基本概况、财务状况及资信状况等,这些信息大多以文本或表格形式提供,而盖章页甚至属于图片格式。

数据实时性要求高

企业CSR报告的更新频率是每年一次,数据有严重的滞后性,但ESG投资所关注的问题常需要在相关事件发生后,第一时间就进行处理。譬如,突发的环境污染事件、监管处罚的通告等,都具有实时性,会对企业产生实质性影响。

金融科技如何赋能ESG数据?

ESG投资必须决定是否要将某个标的公司,依据所界定的ESG标准纳入投资组合。ESG数据围绕着标的公司而展开,投资人要从海量的数据中,寻找与标的公司相关信息,以此作为决策的基础。

在数据获取环节,ESG数据量大且来源分散。除了可通过接口途径获得的数据外,网络爬虫等技术可从多方渠道获得ESG相关的重要数据,如政府部门、监管部门、新闻媒体的网站。此外,流处理(streaming)技术亦可满足ESG数据的实时性要求。

在信息提取环节,ESG数据格式多样,而其中如公司招股说明书和CSR报告等非结构化数据,通常以PDF形式出现。在此,我们可借助PDF处理技术,识别文件内容,提取其中的文本、图片及表格,而文本里的信息更可通过自然语言处理(natural language processing, NLP)技术,来提取关键信息。

到了这一步,ESG数据的问题似乎还没有完全解决。以一家企业而言,它有多种利益相关方,涉及多层关系及信息,业务方面有供应商和客户,融资方面有股东和债权人,内部有管理层和员工,下面可能还有分支机构,此外还会受到行业政策、监管法规、新冠疫情等外部因素的影响。

这些关系及影响的挖掘,可以利用“知识图谱”(knowledge graph)技术来实现。知识图谱能够帮助梳理企业及其利益相关方间的关系及影响路径。

知识图谱的概念由谷歌于2012年推出,企图描述真实世界中不同实体或概念之间的相互关系。知识图谱以网络形式展现,其中的节点(node)是实体、概念或属性值,而边(edge)则描述了节点之间的关系或属性。这类图谱早在上世纪就已发展出雏形,由罗斯•奎林于1968年提出语义网络(Semantic Network)的概念。语义网络用相互连接的节点和边来表示知识,本质上是一种存储知识的数据结构。

图2:知识图谱发掘关系及影响

知识图谱怎么获取和体现一家企业ESG相关的数据和信息呢?知识图谱需要经过知识抽取、知识融合、知识表示等一系列步骤,才能完成构建。以一家能源公司为例,从年报、企业社会责任报告等非结构化数据中,我们要进行知识抽取,获得实体、属性、关系等。但是,文本中提及的能源公司及其关联公司,可能是简称也可能是全称。因此我们还需要进行知识融合,完成实体对齐。

获得知识图谱后,我们就能清楚地看到能源公司的客户、供应商、子公司等情况,也能知道子公司的供应商、供应商的供应商等关系。如此一来,当能源公司子公司的供应商因为排放废气废水而遭受处罚,限产停产时,我们就能迅速评估该处罚对能源公司的影响。因此,知识图谱可以协助ESG投资在海量数据中挖掘信息,去繁从简。

金融科技在ESG数据方面的实践

事实上,ESG数据公司、机构投资者和大型资产管理公司,都已经对金融科技做了相当多的应用,而其中的ESG评级和指数公司MSCI、新涌现的fintech公司、老牌资管公司路博迈等,都是知名案例。

MSCI在ESG领域提供ESG研究、评级和指数,这些产品和服务基于庞大的数据信息。除了常规数据,MSCI会密切跟踪上千家主流媒体的新闻报道,提取与公司相关的负面事件和争议事件,例如商业道德问题、环境污染、消费者集体诉讼等。2019年MSCI收购了Carbon Delta,获得了丰富的气候相关数据和模型,更扩充了它在气候变化方面的风险估值能力。

国内方面,专注于ESG数据的金融科技公司也已出现,联合国负责任投资原则的签署方妙盈科技即为其一。妙盈利用人工智能技术,覆盖了80万家中国企业,在投资、风险、量化等方面提供ESG数据。

除了ESG数据和产品提供商,一些资源比较富丰的ESG投资机构更会自建内部研究体系。以总部在纽约曼哈顿的路博迈为例,它有八十年历史,员工2300人,投资经理650名,所管理的资产规模高达3500亿美元,而ESG策略已融入投资流程中的各阶段。在进行ESG分析时,路博迈在内部储备了金融科技力量。从数据来源看,除了传统的公司披露信息、第三方数据库,路博迈还有自己的大数据团队,可以获取另类数据,为投资决策提供额外信息。

总的来说,金融科技可以较好地解决ESG投资现阶段在数据获取和信息提取方面的问题。限于篇幅,本文只论及金融科技在ESG数据方面的应用。金融科技不断发展的同时,ESG投资也在持续扩大和深化。未来金融科技与ESG投资的融合,必将会有更多的机遇和挑战。