争抢垂直大模型机遇,创业公司们拼了

2024-01-18 08:42:55 金融百科 投稿:一盘搜百科
摘要时代的大幕已然拉开,灿若繁星。文丨猎云精选 ID:lieyunjingxuan作者丨盛佳莹“尽管在泡沫期,贴上大模型标签的公司都很贵,冲上十几亿甚至数十亿估值,但这依然是出手的窗口期。”
时代的大幕已然拉开,灿若繁星。时代的大幕已然拉开,灿若繁星。

文丨猎云精选 ID:lieyunjingxuan

作者丨盛佳莹

“尽管在泡沫期,贴上大模型标签的公司都很贵,冲上十几亿甚至数十亿估值,但这依然是出手的窗口期。”常年看AI赛道的天堂硅谷高级合伙人王伟兴奋地说道,他坚信,将大模型的思想和技术武装到牙齿,必然会建立起一个全新的商业帝国。

由ChatGPT掀起的这一波大模型浪潮中, 百度、阿里等大厂相继下场,王慧文、王小川、李开复等大佬也纷纷入场,而创业公司在这波浪潮里的最大机会在哪里?

大多数人都并不看好创业公司入局通用大模型,远望资本创始合伙人程浩就曾公开表示,大厂肯定比创业公司有流量、有钱,而重要的是大厂的核心优势是自带场景,不论是百度的问答和搜索,还是腾讯的微信、阿里的天猫精灵和钉钉,都具备成熟的落地场景。

既然通用大模型机会鲜少,不少创业公司瞄准了垂直大模型。

如今,通用大模型数据来源于公开互联网场景,但互联网数据并不等同于全世界的数据,尤其在垂直赛道,依然有很多私有数据。

而深耕垂直领域的创业公司已经积累大量数据和know-how,具备核心优势,而大厂的基因并不在垂直领域。范特科技CTO郭长柱表示,大模型对于大厂而言在通用和垂直领域之间是鱼和熊掌不可兼得,“做通用大模型的大厂,它要的是生态,让众多的企业接入它的大模型,以它的大模型作为底座去赋能百业,这个时候它自己也下场踢球就和它的身份不符,所以它们一般不会轻易这样做。”

如果在互联网时代,每个行业都值得用互联网重做一次,那么在大模型时代,每个行业依然如此,甚至此前在互联网时代依然保守的赛道,极有可能被大模型重塑。

这让投资人足够兴奋,在奇绩创坛2022年11月举办的秋季路演日中,陆奇投了55个项目,其中有16个是“预训练大模型”方向,而彼时ChatGPT还未发布。

而到今年,前四个月国内AI领域就已经完成融资243起。面对越来越热的风口,创业公司们都拿出浑身解数,捕捉这轮机遇。

垂直大模型:变革的生产力

在ChatGPT爆火前,大模型已经默默发展了数年,极验AI实验室负责人曹佳豪坦言,多模态大模型的核心技术本质并没有发生大的改变。但是在训练规模大到一个量级以后确实出现了一些感受上是质变的效果。最终大模型能否走到通用人工智能,还是一个未知数。

三维家CEO蔡志森也表示,大模型是AI从量变到了质变的阶段性里程碑,最大价值在于通过千亿数据训练,其生成的内容超出想象,验证了这条路径是正确的。

可以说,这波热浪更多得益于ChatGPT商业和营销方面的成功,而不是技术迭代。

但不可否认的是,大模型会改变很多垂直行业的业务和商业模式。

对于验证码这个行业而言,垂直大模型可以帮助验证码厂商管理图集,也可以诞生新的验证形式,甚至基于文生图和图生图模式,可以与客户共创图集,增强交互体验。

但对于这样一个需要人机对抗的领域,大模型也极有可能被用于验证识别,为黑产所用,这也更推动极验在垂直大模型领域进行投入,从防御角度而言,只有了解黑产的工作模式,才能精准研发破解手段。

从目前的情况而言,极验已小规模上线一批由垂直大模型自动生成的图集,用于验证码图形,极验发现,虽然大模型对防御黑产程度有限,但却可以缩小对抗领域,进而优化对抗资源,从被动防御转变为主动防御。

而像金融行业而言,过去长尾算法数据收集难、标注时间长、数据不均衡导致落地效果差,即便一些拥有算法自训练平台的AI基础设施供应商,像范特科技,其长尾算法的落地难度依然大且周期长。

郭长柱告诉猎云网,主要是因为其中包含了大量的人工工作。而如今结合CV大模型的能力之后,对于常见物体的检测和分割可以实现全自动训练,对于特殊物品也可以借助CV大模型把人工作业降到最低。

“不仅工作量降低了,工作难度也降低了。” 郭长柱表示:“原来做分割时需要沿着物体边缘仔细描边,现在只需要点一下就能自动分割,这样我们把系统私有化部署到客户那里,打通内部网络的云边两端,客户自己坐在办公室里就可以对模型进行升级和维护,而我们专注做基础算法和底层平台能力建设,这样实际上分工也产生了变化。”

这意味着,垂直大模型将作为基础能力对外标准输出,端到端的解决用户需求。目前,范特科技已完成语言类大模型、视觉大模型以及多模态大模型的技术预研,将于近期推出相关产品进行落地。

而像家居和电商内容这样的行业,垂直大模型可以赋能全流程。

聚焦电商内容解决方案的极睿科技创始人武彬告诉猎云网,在电商内容生成全领域,从拍摄-场景图-种草-直播切片-短视频,过去的AI解决方案只能赋能部分流程,而垂直大模型可以全流程自动生成,这可以极大地降本增效。

专注家居行业的三维家CEO蔡志森也表示,不论在设计场景、营销场景还是制造场景,垂直大模型可以生产3D矢量化的内容,做到“所想即所见”、 “所见即所得”,甚至在生产制造端,垂直大模型将取代规则驱动,生产自动化提效,优化人员结构和人机交互模式。

目前三维家已构建起室内空间大模型、定制家居大模型等垂类模型,应用于户型识别、智能样板间、智能柜体、智能硬装、智能水电、智能家居布置等多种设计环节。

基于室内空间大模型通过可配置的AI知识图谱和大规模神经网络,深度学习海量家居家装方案,可以自动完成智能设计。

而基于真实柜体数据的定制家居大模型,则可根据尺寸输入、对话文本生成参数化的定制衣柜、橱柜设计,生产合理的柜体方案,可直接对接生产,将大大缩减复杂易出错的柜体设计时间。

对于各行各业来说,垂直大模型是一种全新的生产力,底层能力的突破不仅可以降本增效,长期来看必然带来上层应用的跃迁和变革。

如蔡志森所说,一方面,在当前中国的智能化浪潮下,产业侧数字化革新本就有广阔的市场需求;另一方面,在toB生态下,基于垂直大模型的应用实践也有利于形成数据飞轮与场景飞轮。

天堂硅谷高级合伙人王伟也表示,大模型最大的价值在于建立新的商业模式和新的经营思想,重新改造商业组织的每一个环节。

这也是为什么创业公司纷纷拥抱大模型的原因。

创业公司垂直大模型第一仗:控本增效

虽然大模型“很香”,但众所周知,过去大模型的一次性投入成本极高。此前,有市场消息称GPT3单次训练的成本为400万美元,因此,不少声音认为训练大模型门槛至少在数千万元。

但在垂直行业,盲目追求“大”规模没有意义,OpenCSG创始人& CEO陈冉将大模型比作一块“玉”,“如何用好大模型能力,也就是说雕琢这块玉更为重要。”

郭长柱也提到,大模型的标准并不能以参数规模一概而论,核心在于其是否具备“涌现”能力,即其准确率是否达到突然跃升的阶段。“在垂直领域,同样的效果,通用大模型要千亿甚至万亿参数,垂直大模型百亿数据也可以达到。”

参数规模的指数级下降,叠加这段时间涌现的众多开源模型和蒸馏法等变革性技术,过去千万级的训练大模型“门票”已降至百万级。

但这对于创业公司们而言,这仍然是一笔不大不小的开支,控制成本和提升效率成为各家公司在百模大战中的第一仗。

极验在优化投入产出比方面,采取弹性计算环境,以按量计算完成前期零碎的探索任务。在明确方向后,再转化为周期性训练。

极睿科技则联合清华大学人工智能研究院,由学术团队提供算力支持,优化投入产出比。

而三维家则打造了一套多服务器、多GPU并行的计算网络,优化算力调配和运行机制,同时,三维家作为英伟达的高级初创会员,得到高效利用GPU的技术支持,这也加速了三维家垂直大模型的迭代速度。

范特科技在成本和生成效率方面,一方面,通过在现有的产品中整合大模型能力,大幅提升了内部创新效率;另一方面,通过自研的推理引擎优化技术和并行计算技术最大限度的提升大模型推理速度和硬件利用效率,通过自研业务流编排引擎解决最后一公里的业务流自定义问题,完成基于大模型的端到端的解决问题完整闭环。

事实上,控制成本不仅仅是为了控制投入,小苗朗程合伙人俞佳伟坦言,对于用户侧而言,成本太高也难以被接受,尤其是在算力低、功耗低的终端场景。

垂直大模型:数据和know-how为王

训练大模型的成本下降,对于创业公司而言,只是拿到了入场券。对于垂直大模型而言,核心和关键离不开算力、算法和数据。

在一定程度上,钱可以解决算力和算法,但却很难买到数据,尤其是在垂直领域,很多都是私有数据,能买到的数据意义并不大。

这对一直深耕在垂直行业的公司而言,是天然的优势。

蔡志森告诉猎云网,依托其在线的3D设计软件和3D制造软件,三维家已经具备2800万+覆盖全国小区的户型数据、8100万+软硬装、家具家电、材质饰品素材库、16.3亿+风格种类多样的设计方案库,此外,还拥有数千万参数数据的真实定制柜体数据集。

与此同时,用户不断使用,这些数据集仍按照三维家定义的方向在自动实时生成。

和三维家一样,深耕电商内容领域的极睿科技每年都在产生数百万乃至数千万的电商内容数据。

除了数据壁垒,定位清晰的应用场景、掌握垂直大模型落地的全流程也是核心竞争力,这对了解行业know-how提出了极高的要求。

实际上,大模型提供的是基础能力,具体业务则是专有能力的组合。

在郭长柱看来,目前基于大模型的模型即服务(MaaS)是一种创新的模式,即把大模型作为基础能力对外标准输出,端到端的解决用户需求。但直接使用大模型端到端的解决问题相对较少,尤其是在CV领域,更多的是在基础能力之上针对垂直领域做定制。

“比如使用大模型自动标注训练垂直领域小模型,使用大模型更加general的特征做VQA、检测、分割和识别等二次开发。除此之外,部分业务可能涉及多项大模型能力的组合,甚至需要语言和视觉特征对齐的多模态能力。这就要求我们在实际的业务中必须支持多种大模型的自定义业务流,实现大模型的自由组合和业务的深度定制。”

OpenCSG也从实践中积累了大量大模型落地通用行业的实践,包括垂直行业语料产生,大模型微调,业务结合等方面。

王伟也表示,投资大模型他看好在核心行业有海量行业数据,懂行业know-how的企业。

俞佳伟则看好有实际落地场景的企业,尤其是需求强、专业性强的场景,例如医疗、金融、法律等行业。

在陈冉看来,大模型具备了推演、举一反三的能力,在一定程度上,具备类似人类的脑神经,可以替代不少人类的工作。“过去最大的创业成本是人,而利用好大模型,重塑工作流,可以极大降低创业成本,这对创业公司来说是极大的利好。”

王伟也持相同观点:“将大模型的思想和技术武装到牙齿,必然会建立起一个全新的商业帝国。”

时代的大幕已然拉开,灿若繁星。

声明:一盘搜百科所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系 88888@qq.com