明略科学院知识工程实验室 张杰

HAO图谱是基于明略科技集团多年积累的知识图谱套件(包括结构化数据库治理工具CONA,非结构化文本标注工具Raptor,大规模秒级响应图数据库NEST,人机交互可视化工具SCOPA等),结合近100TB增量数据的日处理能力与十多个行业经验沉淀,形成的一系列技术、软件组成的工具包,可面向不同行业,快速定制化构建领域知识图谱。

HAO图谱,源自于HAO智能。HAO智能,是2018年由明略科技集团创始人、董事长兼CEO吴明辉和明略科技集团首席科学家、明略科学院院长吴信东提出的一个计算体系,目的是把人类智能(Human Intelligence)、人工智能(Artificial Intelligence)还有组织智能(Organizational Intelligence)进行集成,打通感知、认知和行动三类不同的系统。

其中,感知系统,包括从多维感知数据汇聚、治理、管理、开发到共享服务的平台。认知系统,包括关联挖掘、知识图谱的构建,以及基于知识图谱的检索、推荐平台。行动系统,除了交互式BI,面对行业的小程序或者APP,还有一些硬件产品,比如机械臂、电子工牌等。

目前,HAO图谱,能够把语音或者文本这类一维的序列翻译成高维的图结构,形成由实体和关系组成的图谱。在图谱中,找出重点,做图谱摘要或者事件抽取,然后把重点的关系和实体,映射到后台大的知识图谱中。后台的知识图谱包括由一些实体组成的数据图谱,由行业经验积累而成的因果图谱,以及半自动的特定领域的概念图谱和语义工具。在这些数据图谱和知识图谱基础之上,可以实现可视化、预测和内容生成。

HAO图谱的四大关键技术

HAO图谱主要涉及四大关键技术。第一,句子级实体关系抽取。目前可以实时的把句子翻译成图谱。例如,从视频中把语音提取出来,然后转成文字。如果转成的文字,准确率不理想,则基于后台行业的语义工具,进行修正,再实时生成图谱,正在说的那句话,相关的节点就会点亮,然后做裁剪,生成一个图谱摘要。该项技术可以用于呼叫中心和短视频舆情监控。

第二,在句子级实体关系抽取的基础之上做篇章级图谱摘要。例如,一篇关于火灾的新闻,抽取和火灾相关的所有要素信息转成图谱。

在篇章级的图谱摘要基础之上,还可以做跨篇章的事件关联,比如,融资信息、招投标新闻,可以密集地对时间、类型进行抽取,然后拼装,形成一个摘要图谱。

第三,知识表示,向量化地表示信息丰富的整个网络结构。例如,在金融个人信贷领域,正常的借款人的社交关系可能是一个网状结构,而经过中介包装之后,可能是曲块状结构。这类网络静态结构需要向量化地进行知识表示。

第四,人机交互决策,包含关联分析、社会网络分析、递进推演、隐性关系推断、探索式BI、客服辅助等。例如,某金融集团的母公司高管被刑拘,导致母公司出现舆情危机,过段时间子公司可能发生债务违约。这一关联分析洞察可通过用户交互的探索式可视化图谱展示出来。

HAO图谱的应用场景

HAO图谱如何在商业场景中应用落地?在社交媒体舆情分析场景中,基于知识图谱,可以把用户产生的评论,与后台提前设计好的品牌相结合,去看品牌有哪些产品,特定产品有多少维度,特定维度的用户舆情走势是什么,然后把这些结果整合到BI系统,为运营人员提供用户需求洞察。在此基础之上做千人千面的个性化广告生成。

比如,一位博主,发微博说最近天气忽冷忽热,小孩经常感冒发烧。采集这条微博信息后,做文本分析,可以知道这个客群属于哪个阶段,关注点是什么,后台哪个产品维度与之匹配,然后为其量身定制一款广告,比如,某款奶粉不含添加因素,可以提高宝宝的免疫力,然后在社交平台上定向推送给这位用户。

在线下客单价比较高的行业中,比如珠宝、家具、汽车,普遍存在获客成本较高,线下导购人员年轻化、销售技能跟不上,导致大比例流单的现象存在。在线下导购场景中,通过佩戴明略科技的电子工牌,在尊重和保护用户隐私的前提下,把销售人员面向客户的沟通内容,经过语音转成文本,进行话题分类,形成一个话题转移的知识图谱,计算出话题之间转移的概率,帮助销售人员复盘,分析流单的主要环节,改善话题转移和引导,提高成单率。

因此,通过知识图谱,企业可以把本身产生的结构化信息和外界的互联网信息打通,把结构化和非结构化信息融合、汇聚,在数据维度上进一步拓展,同时,把人类专家的先验经验,总结的因果关系,沉淀至知识图谱,使数据图谱演化为知识图谱,真正发挥大数据的红利,帮助企业实现从数据到知识的智能化升级。