与Seeed、BeagleBoard合作开发,「赛昉科技」发布全球首款基于RISC-V的AI单板计算机「星光系列」_详细解读_最新资讯_热点事件

近日,RISC-V处理器供应商赛昉科技有限公司(简称:“赛昉科技”)发布了一款新产品:星光AI单板计算机(简称:“星光”)。该产品是一款用于边缘计算的、为Linux操作系统量身定做的RISC-V AI单板计算机,面积为85mm x 70mm,价格为149美金。该产品将于2021年3月正式推向市场。

在发布会上,赛昉科技联合创始人兼CEO徐滔介绍了星光的特性。这款新品赛昉科技与开源硬件方案商及分销商Seeed,以及开源社区运营商BeagleBoard共同合作开发, 融合了Linux与RISC-V,具备了当今台式机的所有可扩展性功能,适合所有开发人员使用。

具体来说,星光星拥有8GB内存空间,提供40pin GPIO header和端到端的硬件+软件的基础架构,采用了赛昉科技惊鸿7100系列SoC芯片。这款芯片是全球首款基于RISC-V的人工智能视觉处理芯片,由赛昉科技于2020年发布,搭载了四核CPU,共享2MB的二级缓存,工作频率可达1.5GHz,支持Linux操作系统。

在应用领域方面,星光AI单板计算机可应用于工业机械、数据中心、人工智能AI及边缘云端计算等领域,可以为企业及个人的产品及项目开发提供强有力的软硬件支持,缩短项目开发周期。在视觉应用处理方面,星光还采用了赛昉科技自主研发的ISP,可以用适配主流的摄像传感器,能实时处理4K分辨率的图像,实现视觉应用和神经网络算法的部署优化,满足边缘端的多种视觉实时性处理需求。 

RISC-V是开源的一个计算机指令集规范(Specification),其灵活性、开发成本和开发门槛上,都有一定优势。因而也被认为是我国实现芯片产业的变道超车的重要机会。

全国政协常委、恒基兆业集团主席暨赛昉科技联合创始人李家杰就在发布会上表示,中国要赢得这一场科技时代的竞争,就必须在核心领域有自主研发的核心技术。并希望产业链上的合作伙伴一起携手,长期投入,支持RISC-V开源芯片企业做大做强,共同推动国家RISC-V产业之快速发展。

此次发布的星光进一步补齐了RISC-V硬件供应链,也丰富了RISC-V产品系列及配套体系,为特定应用场景的产品创造了更多可能性。 开源的特性,也意味着RISC-V社区生态建设也极为重要,一个开源指令集得以存续和发展的根本就是更多的开发者、更多稳定应用。

在社区生态拓展上,赛昉科技与合作伙伴Seeed及BeagleBoard会将星光推向硬件开发板社区,并提供与之相匹配的基于Linux的底层软件开发环境及不同行业应用所需的完善软件基础框架,全面支持业界知名的开发工具。BeagleBoard作为开源开发社区,能够凭借其知名度及影响力,通过三方的渠道加速产品商用化的进程。 赛昉科技也将进行大规模的推广,推动中国开源芯片行业的创新发展,促进国内企业尽快形成自主化技术及产品。 

此外,在发布会上,赛昉科技也与紫光展锐、港华能源签属了战略合作协议就RISC-V的应用、市场及指令集标准上进行深度合作。

相关阅读:

完全开源、无专利掣肘,「RISC-V」会是芯片自主的关键解吗? | 年度行业研究

AI独角兽抱团IPO:心比天高,命没“造车新势力”好_详细解读_最新资讯_热点事件

编者按:本文来自微信公众号“锦缎”(ID:jinduan006),作者:革鼎,36氪经授权发布。

2020年尾声,一众AI独角兽集体冲击IPO,包括依图科技云从科技云知声云天励飞旷视科技也刚和中信签了上市辅导协议,算起来,“AI四小龙”就商汤科技还未明显表露“出关”打算。

2021年,是AI行业“水大、鱼多、浪急”的一年:水大,ROI(投资回报率)促使AI普及。鱼多,新生代和老司机共舞。浪急,AI新生代可没造车新势力命好。

01 水大

自首个AI机器人AphaGo战胜人类围棋世界冠军李世石(2016年3月)开启一轮AI狂潮已五年,见证过幻灭,亦看到涅槃重生的契机。

2016-2017年,中国新创立AI公司峰值数量228家,一级市场投融资峰值数量455次。

蜂拥而上必有泡沫:

1、to VC的ppt公司,率先露馅;

2、商业化扩张不及预期,烧钱不止导致资金链断裂;

3、外部因素抑制,旷视科技受制裁是其中缩影。

其中“2”是主要因素,不仅是中国初创AI公司倒下许多,国外一样,去年年中做芯片的号称能与英伟达(NVIDIA)一战的Wave Computing已申请破产清算。

然而希望总是在绝望中孕育,风起于青萍之末,浪成于微澜之间。2020年起,趋势变化的草蛇灰线已显现。

与五年之前相比,AI基础设施进步显著。

Huang’s Law(黄仁勋定律),即AI算力逐年翻倍,当真是很给力。 

图1:黄仁勋,来源:网络

这几年间AI芯片算力成本不断下降:TOPS(Tera Operations Per Second每秒可进行一万亿次运算)从千元,到数百元,到200多元(比如2019年上市的“华为Atlas 300 AI”价格为13699元,具备64TOP计算能力,相当于214元/TOP)。进入2020年,AI芯片算力成本已经进入100元级。

不只是算力,算法也提升很快。见下图,在ImageNet的视觉任务上,EfficientNet模型相比原模型AlexNet,6年效率提高44倍,也就是16个月翻倍。4-16个月翻倍的算法效率,甚至比算力的突破还要快。

图2:算法效率提升,来源:申万宏源

算法和算力提升带来成本降低,不断的成本降低,叠加AI企业持续累计Know-How(行业秘诀)使产品及服务加速落地,让AI赋能迎来转折——企业AI数字化转型带来的ROI贡献变得可观。

以申万宏源研究海康威视在商超行业的便利店鲜食缺货AI应用为例:便利店日营业额1.4万元,利润1000元,鲜食利润占比40%,采用缺货AI检测之后,鲜食周转率提高100%。摄像头1000元,AI套装年1000元,年度ROI(投资回报率)约140%。以海康威视官方提供的AI案例为计算依据,计算客户采购后ROI大多为50%-150%。

当价格合适,也确实行之有效的带来资本回报大幅提升,企业/商户有动力持续的进行AI数字化升级,这是产业升级的关键转折点:

就像光伏平价上网之于隆基股份的意义;

就像微信体系低获客成本匹配下沉市场低客单价之于拼多多的意义;

就像盲盒软性赌博改造亚文化特性之于泡泡玛特的意义。

从国际视角看,我们交易平台(阿里、拼多多、美团、贝壳等)不弱于美国,但在广义数字经济的规模,以及广义数字经济占GDP比重都远低于美国——这即代表着落后,也代表着巨大的机会,AI行业的巨大机会,也就是我们说的“水大”。 

图3:广义数字经济,来源:中金点睛

02 鱼多

由于AI公司起步及发展的技术领域(视觉和语音)大同小异,行业布局(智慧城市、金融、零售等)也比较相近。此处不再一个个的介绍它们让人昏昏欲睡的普遍性,而是谈谈独特性。

【1】依图科技,最无序的扩张

在商汤、旷视、云从、依图为代表的AI公司里,依图科技覆盖的技术类别——人脸识别、图像识别、文本识别——最少,场景——安防、金融、零售、医疗——最少。这在边际成本低,关键要素可重复利用的AI行业里,打法很另类,很让人看不懂。

更另类的是,依图是AI四小龙里唯一向AI芯片领域扩张的公司,且不是自主研发,而是通过外购——2019年5月支付5000万元购买熠知电子“求索”芯片51%的知识产权及相应收益权。 

图4:求索芯片,来源:依图科技招股书

这就决定了依图科技的财务模型很差:2019年人均工资为47.8万元,人均创收为42万元,人均工资是人均创收的1.14倍,显然这是非常不合理的商业行为,使企业长期存续压力非常大。2017-2020H1,依图科技营收总计14.7亿元,亏损高达72.2亿元。

【2】商汤科技,最有潜力的AI新势力

商汤的AI商业化落地能力很强,在场景中拥有不俗的市占率,尤其是智慧城市、智能汽车、智能手机领域。如果把AI公司发展阶段分五级:

  • 1-5亿元营收,在一两个下游应有落地产生收入,云知声、云天励飞处于这个阶段。

  • 5-20亿元营收,拥有三四条产品线并逐步形成解决方案,云从科技、依图科技处于这个阶段。

  • 20-50亿元营收,在某些细分领域份额领先或在通用领域有较多产品线,申万宏源预计商汤营收7.5亿美元,处于这个阶段的极限值。

  • 50-150亿元营收,在原有行业市场地位较稳固并开始优化成本提升利润,科大讯飞处于这个阶段。

  • 150亿元以上营收,产品线、解决方案和客户比较全面,开始布局新的领域,管理全面优化,海康威视处于这个阶段。

商汤正追赶科大讯飞这个A股老牌语音AI龙头,已展现出将其他AI新势力拉在身后的潜力。 

图5:商汤人工智能计算平台,来源:网络

【3】云知声,最被边缘化的竞争者

云知声已经在竞争中被边缘化了,如果没有奇遇翻盘的机会很小。

营收绝对值较低的情况下,相对同行来说增速慢。2019年营收2.2亿元,yoy+11.5%。其它未掉队的公司增长都是百分之好几十、几百。

当然,如果利润率非常高,增速慢点也无所谓。但云知声的利润情况也是最低的一档:2019年毛利率仅26.3%,要知道行业平均值在40%-60%。这基本上就是我们之前说的价值毁灭了。

【4】云从科技,最稳的“国家队”

云从科技成立于2015年,创始人周曦是中科院背景,股东里国有资本参与较多,to G项目的商业化相对来说开展难度更小。云从50%的研发占比相对较低,更注重商业化,它在近几个月额申报IPO企业中有最高的人均创收(48.7万)。

从财务层面看,云从三费把控的不错(2019年大幅亏损是由于13亿元的股权激励),2019年营收增长87%。按照近几年的财务模型来看,云从营收能持续增长的话,盈利的希望不小,从各个层面来看它都比较稳。

图6:云从科技财务情况,来源:申万宏源

【5】旷视科技,最时运不佳的AI独角兽

旷视科技一度领跑市场,据其2019年冲击港交所上市批文的招股书,2018年:

按收入计,是最大的聚焦AI的城市物联网解决方案提供商。

占中国云端人脸识别60%的市场份额;

超过70%在中国生产的配备身份验证的安卓手机应用旷视的人脸识别解锁解决方案。

财务非常漂亮,连续几年营收翻几倍增长,2017-2019年分别为0.7亿元、3.1亿元、14.3亿元。2018H1-2019H1营收为3.1亿元、9.5亿元。同时,毛利率持续走高,从31%一路上升到64.5%。经调整净利润基本能打平,盈亏平衡。 

图7:旷视科技财务情况,来源:招股书

然后被制裁了。

最终旷视科技没能成功登陆港交所。现在一批AI独角兽都在A股发了招股书,旷视科技才(1月12日)和中信证券签署上市辅导协议,准备登陆A股。可谓起了个大早,干了个晚集。

03 浪急

中国广义数字经济的水很大,能养出乎很多的大鱼。所以市场上形成了一个策略:买包括“四小龙”在内的新生代AI公司,就像这两年买“理想汽车、蔚来汽车、小鹏汽车”这等造车新势力,它们都经历过泡沫破灭,在这新生期的2021年一定很有钱途

以上策略,可能错的离谱。

因为AI赋能和新能源汽车这俩行业,差异非常大。

新能源汽车打的是“不对称战争”。

本质而言电动车分控制域和智能座仓域,关于控制域,即独立ECU到车身、底盘、动力等分域(合并于同一个域的ECU)的控制,到控制网关跨功能连接域、再到最终的“车辆集中(虚拟域控制、减少专属硬件),这个分布式到域集中到车辆集中的过程中,大家都在求索。

而关于智能座仓域,传统主机厂很吃亏,互联网出身的造车新势力是个中高手,这是不对称战争缘起,所以造车新势力能在当前阶段的竞争中取得不错的结果。

AI赋能则不存在不对称战争,八仙过海各显神通,甚至一定程度上“越老越吃香”。

你知道,AI芯片可外部采购,算法在开源基础上大家去优化,最终效率差异肯定是有的,但不会大到无法弥合,新玩家并没有与老司机打响“不对称战争”。反而新生代的AI玩家们,对于行业的改造,一部分仍处于“算法→产品→系统→解决方案”靠前的阶段。 

在简单的行业应用中,算法+产品即可解决问题。在复杂的行业应用中,系统和解决方案决定最终的实施效果,需要AI厂商具备更丰富的Know-How和系统设计开发经验。在这一方面,海康这样的老司机具备明显的先发优势,商汤这样的新玩家也做的很好,但还有大量的新玩家急需补上短板。

所以我们认为对多数AI新玩家们来说,浪很急。海康威视、科大讯飞等老司机环伺左右。

而从行业发展的角度来看,随着开放平台能力的不断增强,最终市场会再度整合,T0P5可能占据60%-70%的市场。一套30元-40万的法院AI辅助系统,阿里能去做,并且随着数据累计和解决方案迭代会做的更好,为什么还要去找其它实力一般厂商去做呢?所以老司机也没法掉以轻心,互联网大厂的巨浪也很急。 

图7:马化腾、马云、李彦宏,来源:网络

当然,不能说大部分新生代AI公司没机会。你知道,AI公司本质是咨询公司,本质是出卖智力的。此时此刻号称掌握Know-How并做出解决方案,往往是在业务单元进行提效升级,只是智力运作的一般阶段。高级阶段是AI公司引领行业认知,更深入的从组织、业务、战略层去赋能公司,在此刻的AI行业关键窗口期如果能做到这些,更有机会脱颖而出。

本文基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。

龙泉寺贤超法师:用 AI 为古籍经书识别、断句、翻译_详细解读_最新资讯_热点事件

编者按:本文来自微信公众号“HyperAI超神经”(ID:HyperAI),作者:神经小兮,36氪经授权发布。

内容提要:来自最强科研寺庙龙泉寺的贤超法师,近年来一直在研究人工智能与文献古籍的融合,目前,他已带领的《大藏经》团队实现 AI 自动标点、文白翻译、古籍文字识别等技术实践。

关键词:NLP,LSTM,自动标点

坐落在京郊凤凰岭脚下的龙泉寺,称得上全国甚至全球科研实力最强的佛教寺庙。

凭借当年学诚法师的一句「佛教是古老的,但佛教徒是现代的」,推动了龙泉寺里的高僧们搞科研、写代码,将佛学与新技术结合,将项目大众化、国际化。成果不断,屡上热搜,被外界持续关注。

近期龙泉寺的贤超法师,参加了国内某技术大会,分享了使用人工智能对《大藏经》进行整理和校勘的技术实践。

佛系 AI 的诞生:让佛经更易读

贤超法师原是北京大学物理学院凝聚态物理硕士,2007 年他从北大毕业,2008 年在龙泉寺皈依,此后一直致力于龙泉大藏经的编修与佛学义理研究。

2016 年,AlphaGo 在战胜李世石的历史性事件,引起了贤超法师对 AI 的关注。从那时候起,他便开始尝试将 AI 和自己正在研究的 OCR 技术以及自动标点相结合。

贤超法师在 Techo Park 开发者大会上介绍其研究成果

佛原生 AI 解决古籍经文痛点 

龙泉寺在整理和校勘的《大藏经》为佛教经典的总集,也称为一切经。在汉传佛教的两千多年里,历朝历代都对《大藏经》进行了翻译、增补、修订。

流传至今有数十个版本,少的有五千多万字,多的有一亿两千万字。

《乾隆版大藏经》的修订参与官员、学者、高僧等 60 余人,

刻字、刷印和装帧等工匠 860 余人,历时六年完成

(图为《乾隆版大藏经》雕版)

2012 年,龙泉寺就着手整理《大藏经》,计划用整整十年的时间完成。因为传统方法对古籍的整理主要有版本校对、校勘、标点,这些步骤能够保证当代读者,也可以尽可能理解晦涩、生僻的经文。

三年后,龙泉寺整理出版了《南山八大部》;再次年,龙泉寺的藏经办公室成立,旨在探索利用人工智能技术,研发出基于深度学习的单字识别引擎;

2017年,龙泉寺成立人工智能与信息技术中心,研发出能识别各种不同大藏经版本的整列识别引擎,并成功的将《六十华严》的大藏经版本进行电子化。

贤超法师目前担任藏经办公室主任,负责《大藏经》的整理工作。

自动标点:OCR +深度学习 

为了降低人们阅读古文典籍的门槛,提高学者的工作效率,在近年来贤超法师团队,运用了包括深度学习、OCR 在内的技术改变传统《大藏经》的解读方式,目前已经取得了颇为惊艳的效果。

现代汉语中,句号、引号、书名号等常用标点近十种,

古汉语中仅有的句号、顿号,经文中也很少出现,难以阅读

贤超法师介绍道,所谓自动标点,是指在没有人工干预的前提下,根据算法给古籍文本自动标注现代中文标点的技术,这主要是为了方便现代读者阅读。

此前,已有人工智能为古文加标点的相关研究,不过贤超法师表示,之前基本只是为古文加句号,他认为这个做法「比较保守,比较学术性」。

而他的团队将深度学习运用到了自动标点上,可以以更高的准确性,给古文添加句号、逗号、问号、感叹号、冒号、分号和顿号其中标点符号。经过验证,他们所研发的 Transformer 标注结果,和人类的标注结果「几乎已经无法区分」。

RNN+LSTM+ResNet 效果全面提升 

自动标点,在 NLP 领域来说,就是一个简单的序列标注问题。解决这类问题的标准方法,就是使用循环神经网络(RNN)。

为了增强 RNN 的性能,在此基础上又发展出来了双向 RNN,也就是每一时刻的输出不仅仅取决于之前时刻的所有输入,而是同时取决于之前和之后的输入。之后,贤超法师团队又将 LSTM 方法引入。

但是此前基于这些技术所实现的自动标点,效果仍不是很令人满意。贤超法师团队之所以达到出乎意料的效果,是因为他们在此前的基础上,引入了 ResNet 残差网络(Residual network)。

团队 2019 年发表论文

《大藏经的汇编:当 AI 遇见佛教》,介绍了其自动标点技术

贤超法师解释道,以往的神经网络最多就是十几层、二十多层的结构,如果层数再多,训练结果就不太容易收敛了。而残差网络动辄几百层,甚至上千层。更深的网络有助于捕捉到更深层的语义信息,这是其大获成功的关键。

团队也曾尝试使用卷积神经网络(CNN),最终效果是,残差网络比卷积神经网络的标点准确率平均高出 20-30% 左右。

AI 自动标点工具效率如何呢?贤超法师用一天时间完成了 2 万字左右规模的古文标点,按照古籍标点每千字 15 元的一般稿酬水平,相当于一天创造了 300 元的经济价值。即使自动标点的准确率只按照 60% 来算,其每天也创造了 180 元的价值。

团队对该自动标点工具也在不断升级

目前最新一代的准确率达到 93.3%

目前,由于贤超法师团队的训练数据多取自佛经,因此其自动标点更适合标点佛教典籍。不过,他表示,未来该技术也将应用在,经史子集等更多领域的古文献整理工作之中,从而让学者们摆脱机械、重复性的劳动。

今后的古籍点校工作模式有希望改为:AI 先断句、加标点;专业学者进行后期校对、修改。

贤超法师团队在 18 年就开源了这一自动标点的在线服务,访问古籍·酷(http://gj.cool)可以试用,还可以申请免费调用 API。

识别、翻译:AI 成为佛经汉化百宝箱

除了自动标点,贤超法师还将 AI 应用古籍研究的多个方面。

文白对句:对齐 & 翻译 

文白对句,也就是古文到现代文的对齐和翻译。为了实现 AI 文白对句,贤超法师首先构建了一个文白对齐的语料库,然后设计了一个对齐算法,取得了很好的效果。根据相似度和差异度这两个独立指标,可以非常容易地定位出对齐错误的句子。

将《大藏经》翻译并单句分离开对齐

有助于人工后期检索与校对

由于《大藏经》专业名词众多,且历代翻译著作语料繁杂,因此并非古文相关专业就能搞定。《大藏经》的总字数以亿计,如果仅依靠有限的几位专家,工作量将十分巨大,所以,AI 的介入,为专家们分担了不少工作量。

基于深度学习的 OCR,识别古籍文字 

目前市面上的 OCR 软件都是针对印刷体的,因此不能很好地识别古籍文献中的字体。

贤超法师及其合作团队,基于 CNN+LSTM+CTC 框架,开发了新的 OCR 引擎。然后基于《大藏经(高丽版)》的七万多张整图,168 万条文本行图像的数据集进行训练。

基于弱监督学习的精确文字分割

最终,其开发的 OCR 方法能够进行古籍的单字识别、单列识别和半自动的多列识别,能够有效地完成各类古籍的电子化工作。

OCR 软件识别古文将其数字化

贤超法师还在其公众号「贤超小和尚」(微信号:xianchaofashi)中,分享了更多项目实践和学佛感悟,感兴趣的朋友可以关注。

科技与佛法:以悲悯为内核的不同外化

佛法与科技,距离并不遥远。

我们也曾在《本世纪,佛祖派机器人来弘扬佛法》一文中,对佛教与科技融合的趋势做出过报道,近年来涌现的贤二机器人、机器观音、智能佛珠等等,早已讲科技深刻和谐地融入进佛法。

科技与佛学的融合中佳作频出,吸引关注

龙泉寺的另一位知名高僧、IT 禅修营的创办者贤信法师,在一次访谈里被提问佛法和科技的关系。

他回答:「科技,是追求物质世界的真。佛法,是内心世界的真。很多在科学上做出探索、在技术上做出探索的人,最开始是抱着想为人类做贡献的心,跟佛教提出最慈悲的追求也是相共的,这就是科技与佛法的共同点。」

参考资料:

贤超小和尚公众号:《人工智能与中华文明的碰撞交融》

2050 云栖大会:《贤度法师——龙泉寺的科技实践》

龙泉寺贤超法师:用 AI 为古籍经书识别、断句、翻译_详细解读_最新资讯_热点事件

编者按:本文来自微信公众号“HyperAI超神经”(ID:HyperAI),作者:神经小兮,36氪经授权发布。

内容提要:来自最强科研寺庙龙泉寺的贤超法师,近年来一直在研究人工智能与文献古籍的融合,目前,他已带领的《大藏经》团队实现 AI 自动标点、文白翻译、古籍文字识别等技术实践。

关键词:NLP,LSTM,自动标点

坐落在京郊凤凰岭脚下的龙泉寺,称得上全国甚至全球科研实力最强的佛教寺庙。

凭借当年学诚法师的一句「佛教是古老的,但佛教徒是现代的」,推动了龙泉寺里的高僧们搞科研、写代码,将佛学与新技术结合,将项目大众化、国际化。成果不断,屡上热搜,被外界持续关注。

近期龙泉寺的贤超法师,参加了国内某技术大会,分享了使用人工智能对《大藏经》进行整理和校勘的技术实践。

佛系 AI 的诞生:让佛经更易读

贤超法师原是北京大学物理学院凝聚态物理硕士,2007 年他从北大毕业,2008 年在龙泉寺皈依,此后一直致力于龙泉大藏经的编修与佛学义理研究。

2016 年,AlphaGo 在战胜李世石的历史性事件,引起了贤超法师对 AI 的关注。从那时候起,他便开始尝试将 AI 和自己正在研究的 OCR 技术以及自动标点相结合。

贤超法师在 Techo Park 开发者大会上介绍其研究成果

佛原生 AI 解决古籍经文痛点 

龙泉寺在整理和校勘的《大藏经》为佛教经典的总集,也称为一切经。在汉传佛教的两千多年里,历朝历代都对《大藏经》进行了翻译、增补、修订。

流传至今有数十个版本,少的有五千多万字,多的有一亿两千万字。

《乾隆版大藏经》的修订参与官员、学者、高僧等 60 余人,

刻字、刷印和装帧等工匠 860 余人,历时六年完成

(图为《乾隆版大藏经》雕版)

2012 年,龙泉寺就着手整理《大藏经》,计划用整整十年的时间完成。因为传统方法对古籍的整理主要有版本校对、校勘、标点,这些步骤能够保证当代读者,也可以尽可能理解晦涩、生僻的经文。

三年后,龙泉寺整理出版了《南山八大部》;再次年,龙泉寺的藏经办公室成立,旨在探索利用人工智能技术,研发出基于深度学习的单字识别引擎;

2017年,龙泉寺成立人工智能与信息技术中心,研发出能识别各种不同大藏经版本的整列识别引擎,并成功的将《六十华严》的大藏经版本进行电子化。

贤超法师目前担任藏经办公室主任,负责《大藏经》的整理工作。

自动标点:OCR +深度学习 

为了降低人们阅读古文典籍的门槛,提高学者的工作效率,在近年来贤超法师团队,运用了包括深度学习、OCR 在内的技术改变传统《大藏经》的解读方式,目前已经取得了颇为惊艳的效果。

现代汉语中,句号、引号、书名号等常用标点近十种,

古汉语中仅有的句号、顿号,经文中也很少出现,难以阅读

贤超法师介绍道,所谓自动标点,是指在没有人工干预的前提下,根据算法给古籍文本自动标注现代中文标点的技术,这主要是为了方便现代读者阅读。

此前,已有人工智能为古文加标点的相关研究,不过贤超法师表示,之前基本只是为古文加句号,他认为这个做法「比较保守,比较学术性」。

而他的团队将深度学习运用到了自动标点上,可以以更高的准确性,给古文添加句号、逗号、问号、感叹号、冒号、分号和顿号其中标点符号。经过验证,他们所研发的 Transformer 标注结果,和人类的标注结果「几乎已经无法区分」。

RNN+LSTM+ResNet 效果全面提升 

自动标点,在 NLP 领域来说,就是一个简单的序列标注问题。解决这类问题的标准方法,就是使用循环神经网络(RNN)。

为了增强 RNN 的性能,在此基础上又发展出来了双向 RNN,也就是每一时刻的输出不仅仅取决于之前时刻的所有输入,而是同时取决于之前和之后的输入。之后,贤超法师团队又将 LSTM 方法引入。

但是此前基于这些技术所实现的自动标点,效果仍不是很令人满意。贤超法师团队之所以达到出乎意料的效果,是因为他们在此前的基础上,引入了 ResNet 残差网络(Residual network)。

团队 2019 年发表论文

《大藏经的汇编:当 AI 遇见佛教》,介绍了其自动标点技术

贤超法师解释道,以往的神经网络最多就是十几层、二十多层的结构,如果层数再多,训练结果就不太容易收敛了。而残差网络动辄几百层,甚至上千层。更深的网络有助于捕捉到更深层的语义信息,这是其大获成功的关键。

团队也曾尝试使用卷积神经网络(CNN),最终效果是,残差网络比卷积神经网络的标点准确率平均高出 20-30% 左右。

AI 自动标点工具效率如何呢?贤超法师用一天时间完成了 2 万字左右规模的古文标点,按照古籍标点每千字 15 元的一般稿酬水平,相当于一天创造了 300 元的经济价值。即使自动标点的准确率只按照 60% 来算,其每天也创造了 180 元的价值。

团队对该自动标点工具也在不断升级

目前最新一代的准确率达到 93.3%

目前,由于贤超法师团队的训练数据多取自佛经,因此其自动标点更适合标点佛教典籍。不过,他表示,未来该技术也将应用在,经史子集等更多领域的古文献整理工作之中,从而让学者们摆脱机械、重复性的劳动。

今后的古籍点校工作模式有希望改为:AI 先断句、加标点;专业学者进行后期校对、修改。

贤超法师团队在 18 年就开源了这一自动标点的在线服务,访问古籍·酷(http://gj.cool)可以试用,还可以申请免费调用 API。

识别、翻译:AI 成为佛经汉化百宝箱

除了自动标点,贤超法师还将 AI 应用古籍研究的多个方面。

文白对句:对齐 & 翻译 

文白对句,也就是古文到现代文的对齐和翻译。为了实现 AI 文白对句,贤超法师首先构建了一个文白对齐的语料库,然后设计了一个对齐算法,取得了很好的效果。根据相似度和差异度这两个独立指标,可以非常容易地定位出对齐错误的句子。

将《大藏经》翻译并单句分离开对齐

有助于人工后期检索与校对

由于《大藏经》专业名词众多,且历代翻译著作语料繁杂,因此并非古文相关专业就能搞定。《大藏经》的总字数以亿计,如果仅依靠有限的几位专家,工作量将十分巨大,所以,AI 的介入,为专家们分担了不少工作量。

基于深度学习的 OCR,识别古籍文字 

目前市面上的 OCR 软件都是针对印刷体的,因此不能很好地识别古籍文献中的字体。

贤超法师及其合作团队,基于 CNN+LSTM+CTC 框架,开发了新的 OCR 引擎。然后基于《大藏经(高丽版)》的七万多张整图,168 万条文本行图像的数据集进行训练。

基于弱监督学习的精确文字分割

最终,其开发的 OCR 方法能够进行古籍的单字识别、单列识别和半自动的多列识别,能够有效地完成各类古籍的电子化工作。

OCR 软件识别古文将其数字化

贤超法师还在其公众号「贤超小和尚」(微信号:xianchaofashi)中,分享了更多项目实践和学佛感悟,感兴趣的朋友可以关注。

科技与佛法:以悲悯为内核的不同外化

佛法与科技,距离并不遥远。

我们也曾在《本世纪,佛祖派机器人来弘扬佛法》一文中,对佛教与科技融合的趋势做出过报道,近年来涌现的贤二机器人、机器观音、智能佛珠等等,早已讲科技深刻和谐地融入进佛法。

科技与佛学的融合中佳作频出,吸引关注

龙泉寺的另一位知名高僧、IT 禅修营的创办者贤信法师,在一次访谈里被提问佛法和科技的关系。

他回答:「科技,是追求物质世界的真。佛法,是内心世界的真。很多在科学上做出探索、在技术上做出探索的人,最开始是抱着想为人类做贡献的心,跟佛教提出最慈悲的追求也是相共的,这就是科技与佛法的共同点。」

参考资料:

贤超小和尚公众号:《人工智能与中华文明的碰撞交融》

2050 云栖大会:《贤度法师——龙泉寺的科技实践》

亏损近百亿股东中途退出,旷视科技IPO是真缺钱还是真有货?_详细解读_最新资讯_热点事件

编者按:本文来自微信公众号“深潜atom”(ID:deepatom),作者:深潜atomer,36氪经授权发布。

2017年,“AI四小龙”之一的旷视科技创始人印奇曾透露,“上市这是会发生的,我们希望我们会是第一个。”

但实际情况是,AI已经进入“挤泡沫”阶段。风口过后,资本市场日渐趋于理性,依图、云从抢先一步,离“AI第一股”仅一步之遥。而自2019年8月港股上市计划搁浅后,旷视在2021年1月12日选择以公开发行CDR的形式在科创板上市,宣告重启IPO。完成五轮超12亿美元(约为77亿人民币)融资,却又在3年半亏损近百亿的旷视,这次能否如愿以偿在科创板顺利上市呢?

今年是旷视成立的第十个年头,在过去的十年里,旷视科技已经从一个三人校园小团队,发展成估值超过60亿美金的独角兽企业,成为了中国“计算机视觉四小龙”之一。而相比较另外三家友商,旷视对于上市的渴望尤其强烈,早在2019年8月就在港交所提交上市资料,最终放弃。

△上市辅导基本情况表

以人工智能为核心的智能化浪潮席卷全球下,旷视科技也取得了巨大的市场,根据数据显示,旷视科技在国内计算机视觉市场份额高居第二。

△2020H1中国计算机视觉市场份额

从港股到科创板,市场领先,融资顺利的旷视科技,为何如此执着于上市?

01

世界属于年轻人,旷视科技的快速奔跑

世界是我们的,也是你们的,但归根结底是你们的。科技时代,年轻人正在改变各个产业的既定轨道,并赋予其全新的业态。

2004年,扎克伯格在寝室里和室友一起搭建起了Facebook的原型,改变了传统社交的方法,让年轻人的社交更加轻松。2012年还在清华读书的印奇看到了一则新闻,“Facebook以1亿美元的价格收购以色列人脸识别技术公司face.com”。在此之前,印奇已经和同班同学唐文斌、师弟杨沐开始了创业的尝试,曾研制出一款体感互动游戏《乌鸦来了》。而这则新闻让印奇十分震惊,原来人脸技术可以这么值钱,正式打开了旷视科技的大门,印奇主攻视觉识别,唐文斌搞定图像搜索,而杨沐则负责系统架构与数据挖掘。

同年,在ImageNet 赛场上,基于深度学习Alexnet取得突破发展,打破了过去人工智能在图像识别领域的桎梏,让图像识别能够进入消费级市场的可能。在印奇看来,消费级机器人、无人驾驶汽车及智能家居等将马上成为现实,这都将是万亿级别的市场。

△旷视部分产品应用场景

2012年11月,三个技艺高超的年轻人,很快就在全新的领域崭露头角,在当年创业黑马大赛年度总决赛获得冠军。在那个年代,人工智能还远远未曾普及,算法工程师毕业甚至还要面临找不到对应工作岗位而踌躇,这也造成了算法工程师的数量十分稀少。旷视全是技术的核心团队,直接获得了联想创投总裁贺志强和李开复的青睐。很快,资本大佬就将启动资金注入到了旷视的账户里,至于后续的资源的附加值,对于刚刚起步的旷视来说,更是弥足珍贵。

李开复曾在参加活动时公开表示,在早期帮助旷视科技公司找了包括美图和蚂蚁金服等合作伙伴,让他们拿到了大量的人脸数据,并在随后的摸索过程中找到了几个有价值的商业化方向。虽然之后各方跳出反驳,但是事情的真相各人自有判断。

2014年,蚂蚁金服的入股,对于旷视来说是一个分水岭,接入了支付宝的系统后,刷脸登录和支付的方式很快便普及开来。在这个过程中旷视科技积累了大量的人脸数据,为其后续进入安防领域夯实了数据基础。

△人脸识别

2016年,或许是因为第一波深度学习的学生开始实习或者毕业,再加上AlphaGo的横空出世,人工智能行业开始躁动起来,从资本市场到消费市场,人工智能都被当成了香饽饽。2016年开始,旷视将触手伸向安防领域。

在印奇看来,自己的team是搞技术的,很难快速切入一个陌生的领域,因此他提出了全新的理念,四类人组成一个项目团队,包括CEO、CTO、CAIO(首席AI官)和CMO。除了首席AI官,另外三类人都需要有一定的行业经验,尤其是CMO。为了能够进入安防市场,旷视从海康威视和大华挖来了大批符合自己公司理念,并且看好人工智能在安防领域发展的人才,开始了疯狂的扩张。

另外在研究领域值得一提的是,2020年3月,旷视科技宣布Brain++启动开源、开放计划,并正式开源自研深度学习框架天元MegEngine,同时开放数据和算力平台,为客户提供一站式 AI 生产全流程服务。核心服务包括数据的处理、清洗和管理能力,算力的共享、调度和分布式能力,算法的训练、推理及部署能力。未来这一部分业务依然存在商业化的潜力。

02

曲折的上市之路,旷视钻规则空子?

上文我们提到过,与其他行业不同,人工智能相关的创业公司,技术背景是一个极强的参考对象,这也衍生了人工智能创业公司算法研发能力评判的独特估值办法,这种方法更多的在于对人才的投资,而不像是对企业的投资。

2014年年初,谷歌创始人拉里佩奇亲自操刀了一宗收购案,斥资5.4亿美元,收购一家名为DeepMind的人工智能公司,也就是后来研发AlphaGo的公司。而彼时更像是研究室的DeepMind在商业化上几乎没有任何的探索,坊间传闻这则收购就是为了收购人才,弥补谷歌在人工智能领域的短板和不足。

这一年,与支付宝展开合作后,让旷视的身价暴涨。根据企查查统计,2014年后旷视累计融资金额超过11亿美金。

△融资情况

这么多年过去了,人工智能的算法工程师虽然还是缺失,但已经没有了当初那种窘迫,因此,目前对于人工智能企业的考验则变成了商业化。近日,加拿大《环球邮报》报道,因为商业化不利,图灵奖得主、深度学习三巨头之一的约书亚·本吉奥创立的Element AI面临着被“贱卖”的可能。Element AI签署了一项将自己出售的合约,最终价格可能会降至1.95亿美元,而这家公司过去四年的融资金额高达 2.575 亿美元。

在深度学习领域巅峰的本吉奥所建立的公司,都不曾抵得过商业化的不顺。更遑论技术地位更低的印奇。

但是,旷视的表现却好于Element AI。进入到物联网领域后,旷视的商业化进展开始加快,招股书显示,公司2016年收入6780万元,2017年收入3.13亿元,2018年收入14.26亿元,2019年前半年收入9.48亿。2016年到2018年的复合年增长率达到了358.8%。

△损益表

不过,在整体上,旷视科技依然亏损。2016年、2017年、2018年以及2019年上半年,公司分别亏损3.4亿元、7.58亿元、33.5亿元、52.0亿。每赚3块钱就花掉1块钱的ROI,在光鲜的数据下,旷视的亏损十分严重。

主要面向B端大客户的旷视科技还面临账款回收周期长的问题,根据公开的财务数据得知,2017年,旷视的应收账款为1.5亿、2018年涨至10.9亿,2019年则上涨到了13.8亿。除此之外,半年到一年期的应收款项从1.2亿元上涨至19年上半年的6.8亿。这使得旷视科技的现金流持续为负,从2017年的-1.5亿元,上升到2019年上半年的-6.8亿元。头顶巨额亏损的旷视只能选择另外一条道路来缓解现金流压力——IPO。

2019年5月,在旷视科技上市前夕,其股权发生了十分怪异的行为。所有投资企业全部撤出,公司投资人仅剩三位创始人,印奇、唐文斌、杨沐分别持股75%、12.5%、12.5%。然而其招股书中显示,蚂蚁金服持股比例为14.33%,淘宝中国的持股比例为15.08%,国风投持股11.3%。而联想和阿里则是旷视的大客户,这种操作或许是为了规避关联交易的风险。

△旷视股东

2018年,旷视科技融资时,其中7.35亿元用于回购可转换可赎回优先股,3.8亿元用于回购普通股。这意味着旷视科技的创始团队已套现了3.8亿元,参与前期投资的资本也收回了接近8亿元投资。不过,旷视科技方面并未给予解释。

2019年8月,旷视科技在香港提交了上市申请。在香港提交招股书后,旷视的港股上市之路并不顺利。由于旷视科技遭遇了国际贸易和采购方面变数,港交所要求旷视提供更多信息,最终旷视放弃在香港上市。印奇表示,“我们可以找一个更好的时机再去上市,一个上市后股价能保持稳定的时机。”

科创板对目前盈利能力有限但具有硬科技实力的企业更为包容等独特、良好的制度环境。相比较严格的港股,科创板更加适合旷视科技。

03

商业化不足,旷视不上市能撑多久?

2017年,为了更高的深度参与智能安防,旷视推出了自己研发的硬件设备——智能安防摄像头。也让旷视科技顺利的进入到更大的物联网行业,个人物联网解决方案、城市物联网解决方案,以及供应链物联网解决方案成为了旷视的三大业务线。全球成功注册的大概250项人工智能相关的专利,和正在申请约900项人工智能相关专利也成为了旷视科技的护城河。

对于城市互联网解决方案来说,一个企业很难解决庞大繁杂的服务,因此旷视选择的是与服务商合作,通过技术输出的方式参与城市物联网的建设。2016年、2017年及2018年和2019年前6个月,公司的五大供应商采购额合计占总采购额的33.4%、36%、22.6%及36.8%。

截止到2019年6月30日,其城市物联网解决方案客户数339个,供应链物联网解决方案客户数1102个,个人物联网设备34个。

△旷视合作伙伴

2016年、2017年及2018年12月31日和2019年6月30日,公司员工分别为264名、665名、1965名及2349名。印奇称,目前旷视团队中,AI、行业与职能人员配比是4∶4∶2。虽然这成为了他认为,最适合发展的组织架构,但是这直接增加了旷视的运营成本。2018年,销售成本4.96亿,行政支出3.01亿,研发支出6.13亿,综合成本较2017年大幅度提升。

新基建时代,纯人工智能的企业,已经不再是资本市场关注的焦点。结合了人工智能技术的细分领域,则成为了企业的试金石,这也让一些高估值的人工智能企业十分艰难。正如《财经》报道,一家头部的AI公司,老股东想按现有估值7折转手,找不到买家,“6折且确定能很快上市,才有可能卖出去”。现在的人工智能企业,已经被架在火上烤,上不去下不来,着实难受。

在安防领域,海康威视的营收498亿,是其营收的数十倍。上市能够大大缓解旷视短时间内的资金问题,但是核心的商业化问题。人工智能并不能独立改变一个产业,它的本质还是赋能,这也就意味着基于人工智能的企业的增长曲线是满周期的增长,很难爆发式增长。

现在AI企业普遍面临研发成本高、商业落地难的现状,在巨额亏损、隐私旋涡之下,旷视能否继续讲好AI故事,证明这个行业的价值所在,这需要打个问号。虽然AI是未来是热点,但互联网巨头已经开始亲自试水AI行业,旷视面临的市场前景变数大增,市场和资本还会为这种连续亏损的企业烧多久的钱,恐怕大家都心知肚明。未来是属于年轻人的,但是旷视科技的前路并不好走。

又一个赛道悄悄崛起:华为字节抢人、软银红杉腾讯投出独角兽_详细解读_最新资讯_热点事件

编者按:本文来自微信公众号“投中网”(ID:China-Venture),作者:张丽娟,36氪经授权发布。

为什么说人工智能浪潮堪比工业革命?看看AI制药大概就知道了。

由人工智能制造出人类吞下去的药物,真是个梦想照进现实的过程。现实越来越近了。

首先是国内顶尖的科技公司在用钱投票。近的有字节和华为:上个月,字节跳动 AI Lab的三地团队传出了在招揽AI 制药领域的人才,在此之前,该AI Lab的定位是作为字节跳动内部的研究所和技术服务商。与此同时,华为也发布了药物研发算法工程师的招聘启事。在此之前,谷歌、百度、阿里、腾讯都已先行落子。

风险投资市场也非常活跃。剂泰医药在成立短短不到一年的世界,就完成了三轮融资,融资金额超过亿元;晶泰科技更是获得了创造全球AI药物研发细分赛道最高融资额—超3亿美元的C轮融资。

到了2020年12月,一下有四家AI制药相关赛道的企业都拿到了融资,AI制药变得炙手可热起来。

看看晶泰科技上一轮的投资方阵容:软银愿景基金2期、人保资本、晨兴资本、中金资本、招银国际招银电信基金、Mirae Asset(未来资产)、中证投资、中信资本、海松资本、顺为资本、方圆资本、imo Ventures、Parkway 基金等多家来自全球的投资机构跟投,腾讯、红杉中国、国寿股权投资、SIG海纳亚洲等早期股东继续追加投资。

这条赛道上,几乎所有你能想到的名字都入场了,当然商业前景还有待验证,但这至少说明了一个不容争辩的事实:AI制药,当下是没人敢错失的赛道。

投资密集期到来

AI制药有多热?

2020年12月,字节跳动向AI制药人才伸出了橄榄枝;9月,腾讯推出首个AI驱动药物研发平台“云深智药(iDrug), 百度也宣布成立“百图生科”;更早的1月,阿里与全球健康药物研发中心(GHDDI)合作;华为也开始招聘药物研发算法工程师,为其AI研发平台医药智能体(EIHealth)搭建团队。

不仅科技巨头加入了这一场技术赋能医疗的竞技中,更多的初创企业也在源源不断地浮出水面。

据相关数据显示,AI制药领域的投资正在持续增加。2019年全年该领域1亿美元以上的投资只有1项;到了2020年上半年,1亿美元以上的投资有2项;2020年下半年至今,该领域1亿美元以上的投资有4项。

与此同时,企业融资的速度在不断加快。

Insitro继2019年4月获得超过1亿美元的A轮投资之后,2020年5月宣布已通过超额认购的B轮融资筹集了1.43亿美元;

继2020年5月获得了2500万美元的新投资之后,一个多月后,2020年6月30日,Owkin从Mubadala Capital和Bpifrance又获得了1800万美元的融资,其A轮融资达到7000万美元。

而在2020年7月拿到1.21亿美元C轮融资之后,2020年9月9日,Recursion Pharmaceuticals又宣布获得了2.39亿美元超额认购的D轮融资。

随着时间到了2020年9月,2015年才从美国麻省理工大学走出的晶泰科技,获得超3亿美元的C轮融资。这一数字直接创造全球AI 药物研发领域融资额的最高纪录。

乃至进入到了12月,AI制药的投资变得更加密集:

METiS 剂泰医药宣布其完成过亿元的天使+轮和Pre-A轮融资;AccutarBio冰洲石宣布完成近亿美金新一轮融资;未知君宣布完成数千万美元B+轮融资;星药科技宣布完成最新两轮数千万美金融资。在过去四个月内,星药科技已连续完成三轮融资。

站在这几家AI 制药公司的背后,其投资机构名单则是星光熠熠:红杉资本、峰瑞资本、源码资本、光速中国、春华资本、鼎晖资本、高榕资本、五源资本、君联资本、DCM……甚至连同在产业中的晶泰科技、依图科技也下场了。

对此,剂泰医药CEO赖才达透露,投资方看重的,一是 AI 技术在生物制药领域所取得的重大突破,将 AI 算法应用到药物递送环节;二是中美一二级市场对于 AI 制药的认可,AI + 制剂是AI 制药链条中的重要一环。

为什么现在来争夺AI制药公司?

“现在排名前10的药企,每年的研究经费都在50亿美元以上。” 晶泰科技联合创始人温书豪分析,而创新投入的回报率在逐年下降。

国际著名期刊《自然》(Nature)有一个数据:新药的研发成本大约是26亿美元,耗时约10年,成功率不到十分之一。

为此,截止目前,几乎所有的顶尖制药公司,阿斯利康、拜耳、诺华、辉瑞、赛诺菲等公司都与AI技术公司有明确的合作,充分地利用AI带来的机遇。 

这就是因为,对于药企而言,新药研发周期长、投入大、持续时间久、效率低,一直是他们的“心头之痛”。

根据塔夫特药物发展研究中心的数据,一款新药的面市从药物发现到获得FDA批准平均大约需要96.8个月。而在成本上,德勤的数据显示,自2010年以来,12家主要制药公司的获批药物开发成本已经增加了33%,每年约16亿美元。

德勤的数据显示,自2010年以来,12家主要制药公司的获批药物开发成本已经增加了33%,至约每年16亿美元。在2015年,FDA报告了60种获批药物,每种获批药物的研发成本平均高达6.98亿美元,并且有将近420亿美元用在了失败药物研发上。

但AI的加入,则让人看到了可喜的改变。TechEmergence的研究报告就指出,AI可以将新药研发的成功率从12%提升至14%,这2%的增长可以为整个生物制药行业节省数十亿美元,同时,还可以省下很多研发时间。

此前在峰瑞资本生物医疗创投峰会上,峰瑞资本执行董事马睿也分享到,在AI制药和计算制药领域,峰瑞有三个观察:

一是,在中美资本市场,AI制药这个领域在一二级市场热度高。二级市场美国在2020年上市了两个公司,一个是薛定谔(Schrodinger),一个是Relay Therapeutics。薛定谔的股价从首发价17美元,一度涨到近百美元。

投资的热度从美国传导到中国。在中国一级市场上AI制药主题的公司受到追捧,晶泰科技近期完成了三亿美金的超大额融资,估值达到10亿美金,晋升独角兽。市场上还有若干一亿美金左右估值的公司。

赖才达也表示,大家最近为什么对AI制药这个产业这么有兴趣,其实来源于整个医药开发效率性的问题,就是Eroom’s Law(反摩尔定律)。医药产业要面临的一个场景是,大约每九年药物研发的成本会翻倍。

至于AI 制药为什么这么热?为什么是现在?晶泰科技联合创始人赖力鹏则表示,AI制药的驱动力一方面来自药物研发工业的挑战,另一个驱动力来自计算机技术的发展。

“制药成本一直增加,但成功率却逐年下降,非常不平衡。另一方面,在药物市场里,不管是患者的需求,还是国家的一些政策,都在期待更有创造性的、更高质量的药物出现。”

在最近的一期《今日AI》播客中,葛兰素史克公司消费者保健业务美洲创新和新兴技术负责人Subroto Mukherjee,也指出,受到新冠疫情和寻找有效疫苗竞赛的推动,人工智能和机器学习发挥了重要的作用。

“我们面临着过敏、感冒和流感等季节性疾病的威胁。商业用例使用了一个预测模型,该模型可以预测即将到来的过敏、感冒和流感季节在不同地区的行程情况,并且预测高峰和低谷将在何时出现。”

Subroto Mukherjee举例道,“人工智能和机器学习最大的用途在于,找出新冠肺炎的生物秘密,既减少药物发现的时间,也减少临床试验开发以及最终FDA批准的时间。看看现在疫苗开发的速度和敏捷程度——从鉴定出新型冠状病毒基因组到第一项疫苗研究出炉只花了300天,而之前这类研究通常平均要花费8-10年。”

收购潮将开启?

新年伊始,著名AI科学家吴恩达曾回顾2020年AI领域的一些重大事件,不少与生物医学有关,包括AI应对新冠疫情、AlphaFold预测蛋白质三维结构。

他预测,2021年 AI 药物公司将被大型制药公司以超高价收购。因为大型制药公司已经意识到这样一个事实,即机器学习提供了革新药物发现和开发的潜力。一家主要的制药公司将出资收购一家 AI 药物初创公司,将其技术和人才引入到公司内部。

毕竟,以成立于2015年的AccutarBio冰洲石来说,其就正致力于各类癌症靶向药物的研发,特别是针对前列腺癌和乳腺癌的药物,已列入2021年临床实验计划。

药物和靶点的结合就像钥匙和锁孔的关系,有效的药物像一把专为靶向蛋白配置的钥匙。但寻找靶点有多难?数据显示,肿瘤的靶向药物有数百种之多,即使只是两两组合,组合也多达数千种之多;有时,患者还可能同时使用数种药物才能抑制肿瘤转移。所以,目前最制约抗癌药物研发的难点,是药物筛选。

李开复就表示,“我们投资了一家AI制药公司,利用生成化学和对抗神经网络技术,寻找最合适的小分子,优化药物发现和生产顺序,提升通过临床实验的概率,大幅加速新药小分子研发,让药物发现阶段的研发速度提升5倍,而该阶段的研发费用能降低3-5倍。”

这或许可以解释在行业发展之上,投资机构的蜂拥而至。

DCM 的曾振宇就在投中网的采访中提及,“或许AI制药完全取代传统制药公司的路会很长,但在局部进行优化,这个时间节点可能会很短,并且已经处在了真正的商业化前沿,也已经有一些公司慢慢地探出了一些路子,所以自然就进入了我们关注的视线之中。”

押注在AI制药领域的经纬中国合伙人左凌烨也对投中网表示到,“今年大的主题的确是硬科技、医疗这些,经纬以前也有覆盖这些赛道,但今年很明显更加重视了,我们也新招募了很多新人才。二级市场本身也对这些领域的项目更加包容和重视,例如以前创新药的投资周期非常长,甚至都超出一支基金的生命周期,但随着香港对这方面的政策放开,我们看到今年有很多不错的退出案例,所以这方面的投资也变得火热。”

“资本市场就已经很火,只是疫情推高了,资本市场科创板典型预期,有预期在大家就会改变,大家就会尝试着进入,估值一轮又一轮推高,然后都能退出,形成一个正循环的状态。”身处一线机构的投资人这样对投中网说道。

比如,在红杉中国就选择向下深耕更底层的药物研发,收获晶泰科技、深度智耀星亢原、硅康医药4家AI制药企业,他们可以从根源上为提升新药研发速率提供关键助力。

《麻省理工科技评论》的年度“十大突破性技术”之中,AI发现药物分子技术登上榜单,就指出,“AI药物分子发现”入选为年度突破性技术,认为该行业的成熟期为3-5年。

正如GGV纪源资本管理合伙人符绩勋所言,“现在的AI变成了先发优势,是通过AI来直接定义产品或服务。先发优势在于要用AI作为技术来改造行业,比如利用AI来进行药物发现,基于AI来主动定义产品和服务,而不是靠先有了产品和服务再去通过AI来增强效果。这意味着,AI和大数据在未来会继续发挥着更重要的作用。”

AI巨头旷视科技官宣科创板上市 概念股名单来了|易华录

旷视科技与中信证券签署辅导协议,将以CDR方式在科创板上市。券商认为2021年将是人工智能企业IPO大年,政策支持行业快速发展。

此消息并未空穴来风,财联社去年曾报道称旷视科技寻求在科创板上市。

公开资料显示,旷视科技以深度学习为核心竞争力,与商汤、依图、云从并称AI计算机视觉领域“四小龙”。携AI与IoT两大基因,旷视科技是算法的领军者,全栈式人工智能解决方案先行人,拥有自研深度学习框架,已成功注册了250项AI相关专利,主要提供个人物联网解决方案、城市物联网解决方案、供应链物联网解决方案。

国海证券宝幼琛等人1月11日发布的研报指出,2021年将是人工智能企业IPO大年,政策支持行业快速发展。算法算力数据三要素持续改善,疫情推动商业化场景加速落地。

我国人工智能行业发展走在世界前列,2019年中国人工智能行业市场规模约为1372.4亿元人民币,预计2024年将达到7993.9亿元人民币,未来5年的年均复合增长率高达42.25%,高于世界平均水平。

人工智能即将步入黄金发展期,国海证券建议关注六大落地方向:1)机器人石头科技(扫地机器人)、九号公司(平衡车、服务机器人);2)智能汽车:锐明技术(商用车车载视频监控)、四维图新(自动驾驶);3)语义识别:科大讯飞(智能语音);4)图像识别:虹软科技(计算机视觉);5)文本识别:拓尔思(互联网空间治理);6)智慧安防:海康威视大华股份同为股份;以及拟IPO的企业:海天瑞声、依图科技、云知声、云从科技、云天励飞等。

财联社梳理相关概念股:

皖新传媒去年7月1日在互动平台表示,与旷视科技等合作参与投资人工智能产业基金。

福光股份在互动平台表示,旷视科技是公司安防类领域产品的客户。

易华录与旷视科技成立合资公司,合作投资建设山东聊城城市数据湖项目,易华录为该公司最大股东,持股比例35%;旷视科技为第二大股东,持股比例25%。

信雅达与旷视科技有技术和解决方案等方面的合作,“基于人脸识别的生物识别平台”的应用解决方案,是为了满足银行类客户的新需求。

旷视科技计划以CDR方式登陆科创板,聚焦三大落地场景_详细解读_最新资讯_热点事件

编者按:本文来自微信公众号“IPO早知道”(ID:ipozaozhidao),作者:Stone Jin,36氪经授权发布。

据IPO早知道消息,北京证监局官网1月12日晚间披露,旷视科技已与中信证券签署上市辅导协议,计划以公开发行中国存托凭证(CDR)的方式在科创板上市。

成立于2011年的旷视科技作为“AI四小龙”之一,长期以来主打“1+3”的战略——“1”是指自研的AI生产力平台Brain++,“3”则是指消费物联网、城市物联网和供应链物联网三大落地场景。

其中, Brain++主要帮助企业和开发者提升AI生产效率以及规范生产流程,其核心能力包括数据的处理、清洗和管理能力,算力的共享、调度和分布式能力,算法的训练、推理及部署能力。

值得一提的是,2020年3月,旷视科技宣布Brain++启动开源、开放计划,并正式开源自研深度学习框架天元MegEngine,同时开放数据和算力平台,为客户提供一站式 AI 生产全流程服务。

商业化落地方面,旷视科技的的消费物联网解决方案主要为手机等智能终端设备提供人脸识别解锁与计算摄影功能,以完善用户体验;城市物联网解决方案主要连接和赋能智能摄像头与传感器,帮助城市与楼宇园区的管理者改善城市资源规划;供应链物联网解决方案则主要帮助企业仓储、工业的自动化、智能化,从而提高供应链整体效率。

此外,旷视科技在过去一年中还陆续发布一系列软硬件产品,包括面向城市智慧建筑的云边端产品体系、面向供应链物流的七款智慧物流机器人新品及升级河图系统等。

旷视科技计划以CDR方式登陆科创板,聚焦三大落地场景_详细解读_最新资讯_热点事件

编者按:本文来自微信公众号“IPO早知道”(ID:ipozaozhidao),作者:Stone Jin,36氪经授权发布。

据IPO早知道消息,北京证监局官网1月12日晚间披露,旷视科技已与中信证券签署上市辅导协议,计划以公开发行中国存托凭证(CDR)的方式在科创板上市。

成立于2011年的旷视科技作为“AI四小龙”之一,长期以来主打“1+3”的战略——“1”是指自研的AI生产力平台Brain++,“3”则是指消费物联网、城市物联网和供应链物联网三大落地场景。

其中, Brain++主要帮助企业和开发者提升AI生产效率以及规范生产流程,其核心能力包括数据的处理、清洗和管理能力,算力的共享、调度和分布式能力,算法的训练、推理及部署能力。

值得一提的是,2020年3月,旷视科技宣布Brain++启动开源、开放计划,并正式开源自研深度学习框架天元MegEngine,同时开放数据和算力平台,为客户提供一站式 AI 生产全流程服务。

商业化落地方面,旷视科技的的消费物联网解决方案主要为手机等智能终端设备提供人脸识别解锁与计算摄影功能,以完善用户体验;城市物联网解决方案主要连接和赋能智能摄像头与传感器,帮助城市与楼宇园区的管理者改善城市资源规划;供应链物联网解决方案则主要帮助企业仓储、工业的自动化、智能化,从而提高供应链整体效率。

此外,旷视科技在过去一年中还陆续发布一系列软硬件产品,包括面向城市智慧建筑的云边端产品体系、面向供应链物流的七款智慧物流机器人新品及升级河图系统等。

三位学霸要去IPO敲钟:出身姚班,做出300亿估值_详细解读_最新资讯_热点事件

编者按:本文来自微信公众号“投资界”(ID:pedaily2012),作者:刘博 闫启,36氪经授权发布。

科创板又将迎来一家AI独角兽敲钟。

昨晚(1月12日),北京证监局备案公告显示,旷视科技正在接受中信证券上市辅导,拟以公开发行中国存托凭证(CDR)的方式在科创板上市。随后,旷视科技方面也向投资界确认了此消息。

这是一家由三位清华大学学霸联手打造的AI独角兽。2011年,相识于清华大学姚班的印奇、唐文斌、杨沐三人,因为一场创业大赛走上了创业之路,共同创办了旷视科技。历经十年,旷视科技从专注人脸识别到为客户提供人工智能产品和解决方案,成长为一家估值300亿的独角兽。

至此,“AI四小龙”都陆续奔赴科创板——依图科技于2020年9月提交了科创板上市申请,云从科技也提交科创板招股书,唯有融资约40亿美元的商汤科技,还没迈出IPO实质性的一步。这些AI独角兽曾经席卷一级市场,打了一场又一场融资竞赛,现在又要掀起一场上市竞赛。

三位清华学霸创业:出身姚班,9年做出300亿独角兽

这是三个天才少年合伙创业的故事。

旷视科技联合创始人兼CEO印奇,是名副其实的理科学霸。1988年出生于安徽芜湖的他,以中考“裸分状元考入芜湖市一中理科实验班。2006年,印奇高中还没毕业便被清华大学相中,成为清华自主招生中的一员。而他不仅通过清华大学自主招生考试,还以680多分的高分顺利进入清华自动化专业,并进入了赫赫有名的“姚班”。

姚班有多厉害?这是由美国图灵奖得主、享誉世界的姚期智院士于2005年创办的,清华曾流传一句话,“全国英才聚清华,而清华一半英才在姚班”。能进入姚班的学生,不是数学、物理及信息学竞赛的金牌选手,就是各省高考前三甲。也正是在这里,印奇收获到了旷视科技另外两位联合创始人——唐文斌和杨沐。

唐文斌与杨沐两人,是和印奇同级别的天才少年。杨沐从初中到高中,一路获得无数的编程比赛一等奖,更是斩获过国际信息编程奥林匹克竞赛的金牌。而唐文斌一入清华,就成为清华信息学奥林匹克的总教练,一担任就是7年。

学校的一次挑战杯创业大赛让三人走到了一起。印奇他们研制出了一款体感互动游戏《乌鸦来了》,玩家可以通过摇晃头部控制游戏里的稻草人,拦截从天而降偷食的乌鸦。从技术上来说,这款游戏是通过手机的前置摄像头进行人脸识别和人脸追踪等视觉识别算法判断人物的运动姿势,从而操控游戏中的角色。

能够做出这款游戏,得益于印奇在微软亚洲研究院(MSRA)的实习经历。从本科开始,印奇便在微软亚洲研究院开始了半工半读。从那时开始,他便已经开始接手重大项目,当时为微软研发了核心的人脸识别系统,后来被广泛应用在X-box和Bing等微软产品中。

这款游戏不但让他们一鸣惊人,甚至意外地冲到了中国区苹果App Store游戏排行榜前五名。就在此时,Facebook以高达1亿美元的价格收购了以色列一家成立不满一年的人脸识别公司,这让印奇受到了极大的触动,“人脸识别竟然这么值钱,我们不是捧着金饭碗要饭吗?”就这样,2011年10月,旷视科技正式成立。

成立12个月后,旷视科技推出了基于云端的视觉开放平台Face++。2017年以来,旷视科技在各项国际人工智能顶级竞赛中累计揽获28项世界冠军,创下COCO (计算机视觉领域权威的国际竞赛之一) 三连冠的记录。

对于外界而言,第一次听到旷视科技Face++,大概就是马云亲自展示刷脸支付。2015年3月16日的德国汉诺威IT博览会上,马云通过“刷脸”支付在淘宝购买了一枚1948年的汉诺威纪念邮票。这其中支付宝所用的人脸识别模块,正是旷视科技所开发。据说,2014年支付宝开始研发人脸识别支付技术,找来找去发现全国只有旷视科技能做到这项技术。

后来,旷视科技还开始将业务范围拓展到城市物联网和供应链物联网领域。胡润研究院2020年8月发布的《2020胡润全球独角兽榜》显示,旷视科技估值已达300亿元,在“AI四小龙”中已位居第二。

上市之路一波三折,曾一年收入14亿,这只独角兽成色几何

实际上,旷视科技早已开启了上市之路。

早在2019年8月,旷视科技就正式向港交所提出申请,拟在香港主板上市,融资规模预计为10亿美元,但时隔三个月后,便有消息爆出旷视科技未通过港交所聆讯,当时旷视科技回应“报道不实”。2020年2月,又有消息称旷视科技的港股IPO申请已经失效,旷视科技则回应“上市进程仍在正常推进中,正在更新材料”;

4个月后,再次传出旷视科技中止港股上市计划的消息。彼时,旷视科技方面曾向投资界回应:“科创板支持和鼓励“硬科技”企业上市,是中国科技企业发展的好机遇,旷视正在积极考虑。”

直至此次北京证监局备案公告,旷视科技的上市进程终于浮出水面。昨晚(1月1日,)旷视科技也向投资界证实,公司正在接受中信证券上市辅导,拟以公开发行中国存托凭证(CDR)的方式在科创板上市。

上市之路一波三折,旷视科技到底做着一门怎样的生意?

官网资料显示,旷视科技定位于全球领先的人工智能产品和解决方案公司,向客户提供包括算法、软件和硬件产品在内的全栈式、一体化解决方案,帮助客户及终端用户降本增效。据了解,旷视科技拥有全球最大的计算机视觉研究院,并基于其研发实力,深耕于个人物联网、城市物联网、供应链物联网三大核心场景。

最新数据显示,旷视科技商业化产品已在国内超100座城市落地,并在全球范围内服务了数十万开发者与超过3,000家行业客户。

但作为AI独角兽,旷视科技同样无法回避亏损问题。此前提交港交所的招股书显示,旷视科技2016年、2017年、2018年和2019年上半年的营业收入分别为人民币6780万元、3.13亿元、14.27亿元和9.49亿元,对应的亏损分别为人民币3.43亿元、7.58亿元、33.52亿元以及惊人的52亿元。

对此,旷视科技曾解释,巨额亏损是由于优先股的公允价值变动及持续的研发投资。招股书中显示,旷视科技2016年、2017年、2018年和2019年上半年的研发投入分别为7820万元、2.04亿元、6.13亿元以及4.68亿元。

在此之后,旷视科技并无新的财务数据公布。不过,旷视科技的业务布局一直动作不断。

2019年初,旷视科技宣布战略升级,将公司名称由“Face++”改为“MEGVII”;2020年3月,公司正式对外推出人工智能生产力平台Brain++,并开源其深度学习框架天元MegEngine。紧接着,在去年10月,旷视科技又进军智慧物流业务,发布了河图2.0版本、7款AI+智能物流硬件新品,并发起成立了人工智能物流产业联盟。

正如印奇曾说过,他坚定地认为物联网是人工智能技术应用的主要场景,而旷视科技的愿景是构建连结及赋能百亿物联网设备的人工智能基础设施。

一度刷新AI融资纪录,VC/PE阵容豪华,阿里是最大股东

这几年,人工智能一直是炙手可热的风口,但是在旷视科技成立之初的2011年,却是不折不扣的寒冬,那时看好AI前景的人寥寥无几。可以说,没有早期风险投资机构的支持,就不会有如今的旷视科技。

背后的融资故事颇为精彩。印奇团队做出《乌鸦来了》游戏后,在小圈子内吸引到了多家早期投资机构注意,联想之星就是其中之一。联想之星对印奇三人的技术能力赞赏有加,而且看好人工智能的未来,当即决定作为天使投资人扶持三位年轻人走上创业之路。此后,联想之星还邀请唐文斌加入联想之星创业CEO特训班进行学习,培训了基本的商业和管理素养。

“我觉得学生创业好的一点就在于没有什么可害怕可失去的,何况还有人给买单,我们觉得蛮值得试一试。”后来唐文斌吐露了当时的想法。2012年8月,旷视科技拿下了数百万元的天使轮融资,投资方除了联想之星,还有联想创投。坊间流传着一个细节,当时联想创投总裁贺志强找到旷视科技的办公室,直接说,“这几百万先拿着,不够尽管说话”。

至此,姚班“三剑客”的创业大幕正式拉开。不到一年后,旷视科技再度获得了创新工场数百万美元的A轮融资。一手创建微软亚洲研究院的李开复,很早就看好AI,而印奇又恰巧在微软亚洲研究院实习过,旷视科技获得李开复创新工场的投资顺理成章。

此后,创新工场继续下注,2014年11月和启明创投共同完成对旷视科技4700万美元的B轮融资。启明创投创始主管合伙人邝子平曾感慨,“2012年第一次和旷视科技团队在他们的小阁楼办公室见面时,感觉是一群很酷的年轻人在做一件很酷的事情,时隔多年之后,感觉依然如此。”

随后几年,人工智能在一级市场爆红,旷视科技的融资节奏越来越快,金额也越来越大,估值一路飙升。2017年10月,旷视科技完成4.6 亿美元C轮融资,由中国国有资本风险投资基金领投,蚂蚁金服、富士康集团联合领投,同时引入包括中俄战略投资基金、阳光保险集团、SK 集团等新的重要投资者,一举刷新了国内人工智能领域融资纪录。

那是中国AI独角兽疯狂的融资竞赛岁月,旷视科技尤为耀眼。但更为瞩目的是阿里的入局——此前旷视科技在港股提交的招股书显示,阿里是旷视科技的最大股东,持股29.41%,其中蚂蚁金服持股15.08%,淘宝中国持股14.33% 。正是阿里给旷视科技提供了一个扫脸支付的应用场景,才让其人脸识别开始从技术走向落地。

AI独角兽上市潮,现在,留给大家的时间不多了

“AI四小龙”中,谁将成为国内人工智能领域第一股?

就目前上市进展而言,“AI第一股”或将从依图科技与云从科技中产生。综合来看,依图科技于2020年9月提交了科创板上市申请,同年11月递交招股书,目前显示为“已问询”状态,标志着上市进程进入了实质性审核阶段。

而另一家AI独角兽云从科技,也在冲刺科创板。2020年最后一个工作日,云从科技IPO审核状态更新为“已问询”。尽管云从科技是“AI四小龙”中成立时间最晚的一家,但其脱胎于中科院,相较其它三家企业,它是纯内资股权结构,或许上市之路会更加顺利。

而作为国内“吸金”最多AI独角兽,迄今已经融资约40亿美元的商汤科技,在上市进程方面略显安静。资本市场曾多次传出商汤科技IPO计划的消息,但均被商汤科技方面否定。2020年3月28日,商汤科技官方发布消息称,并无上市具体时间表。

为何这些AI独角兽会竞相加入到上市的追逐赛中?数据显示,2015年-2018年,AI领域的投资频次和投资总额均快速增长,在2018年最高峰时,这一领域投资总额过千亿元,投资笔数接近500笔。与之对应的是,烧钱是AI独角兽们绕不过的通病。

由于AI领域落地项目周期较长、研发成本高、回报较慢,诸多AI独角兽还处于亏损状态。公开资料显示,依图科技在2017年至2020年上半年累计亏损近73亿元,云从、云知声同期分别也亏损近23亿元、9亿元,云天励飞则在2017年至2020年前三季度合计亏损超16亿元。

曾有一级市场投资人感叹:“现在的形势是哪里能上就上哪里。AI公司做各个行业的落地,摊子铺得很大,成本投入很高,上市肯定是为了确保有持续的现金流注入。”

因此,在未能实现自身大规模造血,商业化落地上也尚未打开更广阔空间的前提下,上市则成为了这些独角兽们共同的选择,希望通过二级市场拿到更多“弹药”。

但是,由于AI独角兽们估值高,而盈利能力又不足,一旦登陆资本市场是否会出现倒挂的情况难以保证,这可能也是一部分AI独角兽选择观望的重要原因。云从科技联合创始人姚志强曾表示,尽管人工智能处在一个高速发展的风口,但这并不意味着收入的爆发,主要因为眼下的技术还不能达到行业应用的水平,技术整体还有待优化。

可以肯定的是,无论哪家AI独角兽率先完成上市,势必会产生一定的品牌效应,从而在行业内确立更高的知名度,掌握市场话语权。所以,谁能拿下AI第一股的重要性不言而喻。2021年,一场AI独角兽上市潮即将杀到。