近日,香侬科技李纪为受邀担任清华大学互联网产业研究院研究员。

清华大学互联网产业研究院是清华大学正式批准成立的校级研究机构。研究院的宗旨是以“互联网+产业”为核心,开展创新性的研究和产业实践,在研究传统互联网的基础上,重点研究传统产业向互联网转型的模式、方法和路径。研究院基于清华大学多学科的优势,整合了清华大学15个院系的优秀科研团队,设立有10个产业研究中心和5个实验室。

香侬科技李纪为,斯坦福计算机学院历史上用时最短、第一位破格三年毕业的博士,以第一作者何通讯作者在国际顶级会议发表论文30余篇,发表量居世界第一。同时也获得了《福布斯》“30位30岁以下精英、《麻省理工科技评论》“35岁以下科技创新35人”、《财富》“中国40位40岁以下商界精英”。创立香侬科技以来,他始终希望打造出有中国文化特色、立足于中国本土的全球技术领先人工智能公司。

在研究技术落地的过程中,他发现中文在自然语言处理中的弱势,所以带领香侬科技成为了第一家针对中文提出基于中文语义分析自然语言处理模型的AI公司。该方法显著提升了对中文处理的准确率,且已广泛应用于中文文本表征学习、从源文本中提取结构化信息、对话及文本生成等诸多方面,现已大规模在落地产品中使用。

香侬科技经过不到2年的发展,将自然语言处理技术的研发积淀用在了金融领域,目前要金融类产品包括智能投研、财经舆情、全球资本市场信息提供商见微数据等,未来希望打造智能投研产业链闭环生态。

见微数据专注于提供全球资本市场的信息,为广大从业人员提供公告、法律法规、财务数据、尽职调查等方面的检索、筛选等信息服务,信息覆盖国内外所有主要市场信息,同时信息可追溯且更新及时,最早可追溯至2000年。此外,在金融领域,文本大多是以PDF文件的形式存在的,为了让大家的使用上更为方便,见微提供了在站内即可对PDF文件直接进行编辑使用的服务,同时利用NLP技术显著提升了问题智能搜索度。

此外,还有舆情投研数据库,之所以做这个产品,是因为除了一级市场和二级市场公开的信息外,目前市场上跟金融相关的第三类渠道数据量越来越多,这些信息在一定程度上影响了投资决策但又不属于市场统计范围之内的数据,是智能投研、金融舆情的原材料,但以新闻舆情、财经资讯报道、自媒体言论等为代表的第三类渠道信息很多并没有被相关领域的从业者重视。香侬科技认为,智能投研所揭示的规律实际上是一种“变量间的相关关系”,而不是准确的因果关系,所以对于信息关系的掌握度越完善,越能有效的把控投资决策的走向。

因此,香侬科技内部专业金融业务专家在充分了解金融市场运行和客户需求的基础上,结合技术对于所有的第三类数据进行了处理。他们会从海量新闻中识别出对应公司,同时运用自然语言处理技术自动识别出行业标签和事件标签,目前香侬梳理出了将近 200 个公司事件标签,基本上涵盖了所有重要的金融事件,比如生产情况、供给情况、并购情况等,通过打上这些事件标签,可以迅速的帮助投资者了解新闻内容,同时用于新闻筛选、风控和投资。

此次李纪为博士受邀担任“清华大学互联网产业研究院研究员”,正是清华大学互联网产业研究院对李纪为博士技术创新实力以及商业落地能力的肯定。“未来,不仅会在清华互联网产业研究院中和各位专家一起做更多的科学研究,同时我所代表的香侬科技也将会继续专注于自然语言处理技术的研发以及商业化落地的探索,为行业和社会做出更多的贡献。” 李纪为说道。