今年,ChatGPT、midjourney等大模型技术的发展,越来越多的企业开始关注并参与这场竞赛。
大模型,依赖巨量的训练数据和计算资源,以及上亿甚至数十亿的模型参数和大量层数,用以实现高性能的模型。然而,这并不是一场简单的速度赛跑,而是对技术能力和商业应用的双重考验。
过去的几个月,国内已经涌现出了数十个所谓的大模型,互联网世界沉浸在一片丰收的喜悦中。这场热潮让我不由自主地想起了曾经的元宇宙、区块链。那时的互联网,也是一片锣鼓喧天,赛道内的企业个个风光无限。但残酷的现实告诉我们,国内外只是不断在炒概念噶韭菜,只有少数企业还在这个赛道中坚持前进。
面对持续火热的大模型,小V喜的是国外已经有了成功的技术基础和商业化案例,忧的是国产大模型目前看来面临的挑战重重。
主要面临挑战主要有两个:一是如何获取高质高量的训练数据;二是大模型的应用场景是什么。这两个问题不仅对技术挑战巨大,同时也对商业应用提出了严峻的考验。
如果我们无法找到高质量的训练数据,大模型的性能将大打折扣。
如果我们无法找到合适的应用场景,那么,即使有最强大的模型,也无法实现商业化的价值。
在这个问题上,小型公司显然是无法承受的。因此,当前许多公司都在烧钱抢占大模型市场,但真正能够坚持到最后的,只有少数。
借鉴科大讯飞刘庆峰的说法,我们评估大模型的商业价值,也需要三个标准:一是有没有看得见摸得着的真实应用案例;二是有没有能够规模化推广应用的产品;三是有没有统计数据能够证明的应用成效。
在这个标准下,大模型需要满足G端、B端和C端的不同需求:
G端用户,大模型需要围绕需求进行针对性的私有化部署;
B端用户,需要将AI能力结合到企业生产各环节中,帮助提升效率;
C端用户,需要利用市场渠道和消费者对品牌的认知,提高使用频次,进行流量转化。
总的来说,大模型热潮的背后,是每个公司对于新技术和新商业机会的渴望。这一次,不仅是技术的比拼,也是商业化应用的竞争。
发布现场
拿最近刷爆圈内的科大讯飞的星火认知大模型为例,这是首个面向全体公众大规模开放的大模型,所有用户仅需注册即可体验。据媒体报道,科大讯飞的大模型不仅在模型本身的能力上有所表现,还在教育、办公、汽车、数字员工等多个方向展示了商业应用成果。
看来科大讯飞打算在大模型上走出了一条区别于其他厂商的路线,接下来的关键在于能否得到市场的认证。首席执行官刘庆峰承诺,星火大模型将在未来几个月内实现多项技术突破,包括开放式问答、对话能力和数学能力的再升级,代码能力会上大台阶,多模态交互能力再升级。最终,星火大模型将在中文能力上超过ChatGPT,在英文能力上与ChatGPT相当。
然而,无论是科大讯飞还是其他公司,要想在大模型的战场上取得胜利,都必须面对一个关键的问题:就是上文小V所提到的“如何将大模型的技术能力转化为商业应用的实际价值”。这需要深入理解用户需求,找到大模型的合适应用场景,同时也需要不断提高大模型的技术性能。在这场竞赛中,大模型将可能成为未来生活的最基础工具,就像我们现在使用Word工作、使用搜索引擎获取信息一样。大模型的竞争,不仅是技术的竞争,也可能是对未来生活定义权的争夺。