清华系 NLP 公司哄抢未停:深言被曝估值已 1 亿美元,此前陷王慧文收购传闻
火热的大模型创投潮里,又有初创公司拿钱了。
量子位独家获悉,清华系 AI 初创公司深言科技(DeepLang AI),快速完成新一轮高估值融资,最新市场估值约 1 亿美金。并且,深言科技更新的一轮融资又火速开启。
公开资料显示,深言科技创始团队几乎均出自清华大学自然语言处理实验室(THUNLP)。
除了面向大模型,又师出名门,深言科技最近受万众瞩目还有一个原因 —— 此前陷王慧文的收购传闻。
AI 科技评论报道,王慧文在收购一流科技、开启第二轮融资的同时,对两家孵化自清华 NLP 团队的初创公司很感兴趣,这两家公司的核心创始团队都属清华孙茂松、刘知远一脉,其中一家就是深言科技。
孵化自清华反向词典项目
扒一扒可以发现,深言科技算是国内较早入局大模型的玩家,成立于去年年中。
公司主要面向 AI 和 NLP,目标是以自研中文大模型构建工业级中文信息处理引擎。
创始人兼 CEO 岂凡超,系清华大学电子工程系 2013 级本科,计算机科学与技术系 2017 级博士,主要研究方向为 NLP,研究工作曾在 EMNLP 等发表。
联合创始人兼 COO 李潇翔,清华电子工程系 2017 级博士。红杉中国合伙人张涵也是公司董事之一。目前,欧洲科学院院士孙茂松担任公司首席科学家。
公司公开的现有产品,包括 WantWords、WantQuotes 等。
WantWords,其实就是 2021 年 11 月在微博爆火,服务器多次被挤爆的神器反向词典。
2019 年,岂凡超和同学合作研发该产品,支持中文及跨语言查询,已经开源。该项目的指导教师之一,正是孙茂松。
所谓“反向”,指和常规词典不同,不是按词寻义,而是反过来给词典一段描述,让它来帮你找词。
具体操作上,在词典的搜索框中输入想表达的意思,就能得到几十上百个答案。背后的核心 AI,名为多通道逆向词典模型,相关论文中选过 AAAI 2020。
爆火的小程序背后,似乎是 THUNLP 早就在产学研融合上布局的一盘棋 ——2022 年,岂凡超博士毕业,随即从 THUNLP 孵化出深言科技,核心团队均为清华硕博士背景。
同时,实验室的反向词典和后续推出的据意查句(WantQuotes)等,也划归深言名下。
扒完公司,再聊几句孵化出团队的 THUNLP。
它成立于上世纪 70 年代,是国内第一个开展 NLP 研究的科研单位。实验室牵头人是国内 NLP 研究领域的泰斗黄昌宁,孙茂松是他的学生。
反向词典另一名项目指导教师刘知远,则是孙茂松的弟子,同属 THUNLP 实验室。
实验室此前推出的项目,颇受关注的主要有三:
-
2017 年,中文诗歌自动生成系统九歌 MixPoet,它训练过程中学习了 80 万首中国古诗;
-
语言表征模型 ERNIE(没错,和文心大模型同名),可与当时任务最优的 BERT 媲美;
-
以中文为核心的预训练大模型清源 CPM,是智源研究院大模型悟道・文源的前身。
上述项目的研发过程中,岂凡超等人尚未毕业,仍身处 THUNLP。
大牛带队,高额融资推进顺利
王慧文收购传闻中涉及的另一家公司,面壁智能,也孵化自 THUNLP。
公司同样成立于 2022 年,专注大模型加速与应用落地。
创始人兼 CTO 曾国洋在大二时加入 THUNLP,是刘知远的学生。公司核心成员都曾参与智源研究院“悟道・文源”大模型研发,目前刘知远担任联合创始人,孙茂松、刘洋担任顾问。
△ 曾国洋
此前,面壁智能联合 THUNLP、智源研究院发起了 OpenBMB 开源社区,推出的 BMList 大模型趋势图跟踪了大模型的演化趋势。
此外,面壁智能还针对产业落地推出了 CPM-Live 百亿中文大模型直播训练项目,以及大模型全流程加速平台 ModelForce。
股权结构显示,智谱 AI 也在面壁智能持股 5.22%。
关于王慧文收购传闻的后续消息是,雷峰网从多处信源获知,王慧文与面壁智能的接触和交流最终以合作流产告终,“面壁智能还是综合考虑决定独立发展”。
像深言科技和面壁智能这般“名门出身”的 AI 初创公司,高额融资推进得十分迅速。
据爆料,前文所提智谱 AI,身家价格已经在原有基础上翻了 3 倍不止,而 AI 大牛周明创建的澜舟科技,也在上月中旬刚刚完成了新一轮融资。
不过,据量子位得到的消息,如火如荼的这一波创业,除了商业大佬或技术大牛带队号召的团队,多数在达到 3000 万美元后,融资进展都会放缓甚至停滞。而应用层的创业项目,估值天花板也就在几千万美金上下。
甚至有 VC 投资人告诉量子位,不少美元基金考虑到项目质量和技术差距,已经半放弃国内 AI 创业项目,转身前往硅谷挖人。
看来,轰轰烈烈的 AI 创业潮里,并非所有的公司都是抢手的当红炸子鸡。
本文来自微信公众号:量子位 (ID:QbitAI),作者:衡宇