过去一年,以大模型为代表的生成式人工智能驱动了产业变革,随着通用大模型的性能持续提升,生成式人工智能在不同行业的应用持续丰富。2024年,模型层竞争格局将会进一步清晰,而应用层则有望迎来爆发,诞生高价值、高影响力的人工智能原生(ai native)应用。本文基于近期调研并参考其他权威研究成果,对人工智能大模型及应用发展动态与趋势进行深入分析,并提出相关建议。
一、大模型发展概览
自2023年chatgpt推出以来,生成式人工智能实现了快速发展和普及。与前代分析式人工智能相比,基于大模型的生成式人工智能兼具低使用门槛、高拟人化等优势,初具实现“通用人工智能”的潜力。
进入2024年,海外大模型持续迭代,国产大模型走向成熟,基础大模型及基于大模型构建的各类应用均有望超预期推进。随着底层技术升级和应用端的持续探索,大模型应用形式将进一步丰富:b端,大模型逐步融入日常业务和工作流程中,加速赋能医疗、金融、制造等各个行业;c端,聊天机器人、搜索、内容生成为当前核心应用方式,其余场景也在加速渗透。
二、基础大模型发展现状及趋势
(一)闭源模型门槛持续提升,行业寡头格局初步显现
2024年初至今,头部大模型创业公司和各科技巨头持续快速进行技术迭代与升级,不断拓展大模型性能边界。放眼海外,openai于2024年年初发布文生视频大模型sora,并于5月中旬发布全新大模型gpt-4o,模型初步具备了人物识别、情感识别、空间理解等高阶能力;google上线gemini 1.5,长文本、情景学习等能力大幅提升;meta发布llama 3,多模态版本随后即将上线;suno ai引发产业界对音乐gpt时刻到来的畅想。在国内,以月之暗面kimi为代表的国产大模型长文本能力提升显著,讯飞、智谱、阶跃星辰等纷纷发布全新的多模态大模型。
闭源大模型开发依赖大算力和大数据,资源需求持续增加,算力和数据获取难度与日俱增。算力方面,预计到2025年,开发领先的大模型至少需要10万张高性能gpu,若使用英伟达h100,构建算力集群的成本将达到40亿~50亿美元。数据方面,随着高质量网络开源文本资源逐渐耗尽,大模型公司必须寻找新的数据来源。openai已开发专用模型将网络视频中的语音转录为文本,目前已处理超过100万小时的视频内容;meta的ai团队正考虑支付图书sbobet利记官网的版权费或收购大型出版商以获取更多高质量数据。
随着产业的成熟以及竞争的加剧,大模型的资金门槛也将不断提高,融资环节马太效应明显,行业格局将迎来进一步收敛。未来,大模型技术竞赛的参与者将由科技巨头和顶尖创业公司组成,最终形成寡头竞争格局:中美两大市场中,能够持续迭代的闭源大模型最终或将不超过5个。
(二)开源模型持续追赶,开源闭源两种生态互补共存
多数研究人员认为大模型研发遵循scaling law,即模型的性能与参数量和训练数据量呈正相关。然而,在模型参数超千亿后,其训练成本呈指数上升,资源的投入产出比呈现递减之势。目前,头部闭源大模型已能够满足大多数场景的智能需求,除推动模型性能的进一步提升外,低成本落地、个性化适配已成为行业的另一个重要议题。
开源模型兼具低成本及高可定制性,已成为产业的重要环节,为开发者提供经济有效的方式进行试错和商业化部署,也满足了用户对定制化和数据私有化的需求。根据a16z调研,美国企业开始逐步尝试“多模型 开源模型”的应用模式,以满足数据安全可控、模型可定制的需求。2024年,开源模型将进一步提升其市场份额,有望与闭源模型平分秋色。
未来,开源和闭源的模型生态系统或以互补的形式共存:开源模型凭借其广泛的用户基础和生态系统优势快速迭代、适配不同需求,闭源模型利用其性能优势完成更多复杂场景中的任务。头部开源大模型如llama、mixtral的性能持续提升,已能够执行复杂推理、精确遵从指令和解决复杂问题,进一步缩小了与头部闭源大模型的性能差异,拓宽了开源模型的应用范围。而对于我国大模型公司来说,一方面要追赶头部的闭源大模型,另一方面还要维持开源模型的性能优势,确保模型即服务(maas)商业模式的可持续性。
(三)大模型创业公司融资需求持续扩大,云厂商和大型科技公司成为投资主力军
随着生成式ai的发展,大模型创业公司融资需求持续扩大,云服务商和大型科技公司积极参与,已逐步取代传统的vc基金成为ai投资主力军。例如,微软对openai的投资超过100亿美元,亚马逊和谷歌对anthropic的投资超70亿美元。我国大模型投融资市场呈现相似情况,头部科技厂商如阿里巴巴和腾讯广泛布局,投资足迹覆盖头部大模型创业公司。相比之下,传统vc提供的资金体量在本轮大模型技术革命中略显逊色。
云服务商和大型科技公司积极参与的背后有两大原因:一是资金充足,风险承受力高;二是业务协同,投资兼具财务及战略价值。大模型以十亿美元计的融资需求已经超出了传统vc基金的投资范畴,相比之下,云厂商对ai的投资与其业务收益相比,只是冰山一角。例如,微软azure每季度收入为250亿美元,对openai约100亿美元的投资仅相当于azure六周的收入。此外,ai投资还存在较强的业务协同效应,azure的收入受生成式ai的促进已于年内增长了6%,增加50亿~60亿美元。扶持大模型厂商将会推动模型参数规模增大、模型应用进一步渗透,云服务需求大幅增加,促进头部云厂商的业绩增长。
(四)多模态和多模型联用成为未来重要发展方向
大模型面临的主要挑战包括适配场景有限和实际部署成本高,多模态和多模型联用逐渐成为解决现有技术痛点的关键发展方向。
多模态模型通过整合不同种类的数据(如视觉、语音、文本等)使模型能够适配更多任务场景。尽管多模态大模型技术栈尚未收敛,但当前主流方式基本以大语言模型为核心,将其他模态数据统一转化为大语言模型能够理解的向量表征,从而实现语言与其他模态数据在理解和输出方面的对齐。以自动驾驶和安防为例,通常涉及多种数据形式,而多模态能显著提升模型信息摄取及整合的能力,打开更多应用场景。
以moe(混合专家)架构为代表的多模型联用有望降低模型的部署和使用成本。具体来说,moe通过在多个专家模型之间动态分配任务,优化计算资源的使用,降低运行成本并提升模型的应用效果。moe的核心是门控模型,用于接收输入信息并判断该任务由哪个专家模型处理,分配每个专家模型的处理权重。训练时,门控模型将任务分配到不同的专家模型;推理时,不同专家模型的输出会按初始权重加权组合形成最终结果。与传统的单模型架构相比,moe计算效率更高,可解释性更强,尤其适合处理大规模数据和复杂任务。
三、大模型应用发展现状及趋势
(一)b端应用渗透赋能加速
1.b端商业化进程快于c端,短期b端业务将是大模型公司主要收入来源
与c端用户相比,b端企业客户使用大模型提升生产力的需求更为迫切,对能够实现降本增效的产品付费能力强、付费周期长。a16z的调研结果显示,受访企业2023年基础模型api、自主托管和模型微调的平均支出约为700万美元,多数企业对生成式ai的尝试取得了较好的初步成果,并计划在2024年将支出提高2~5倍。
b端用户需求明确、配合度高,ai产品更容易快速落地。具体来说,企业通常具有清晰的业务痛点和优化目标,如优化供应链管理等,这使ai公司能够针对性地开发sbobet利记官网的解决方案。b端客户对行业知识和业务流程了解深入,能够明确表述需求,与ai供应商共同探索和实施sbobet利记官网的解决方案,同时企业用户更能理解和接受ai技术带来的潜在价值和风险。
对于大模型公司而言,b端订单确定性高、波动性小,是扩大营收的有效手段。以国内市场为例,千亿大模型本地私有化部署的费用超千万元,云端私有化部署的费用也在数百万元级别。此外,模型版本迭代以及针对具体场景的模型微调或ai原生应用构建也将为大模型公司带来持续稳定的收入。
2.“ai焕新”推动大模型渗透,ai应用的长期企业价值仍待检验
2024年2月,国务院国资委召开“ai赋能产业焕新”中央企业人工智能专题推进会,推动央企智能化转型。会议要求开展“ai ”专项行动,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能平台到sbobet利记官网的解决方案的大模型赋能产业生态。
国资央企是政企端ai应用最大客户源之一,将在政策引导下为国内ai应用厂商提供更广阔的b端应用场景,加速国内ai商业化落地。2024年或将成为生成式ai技术在b端发展的元年,能识别客户痛点并构建aisbobet利记官网的解决方案的公司有望迎来高速发展。
生成式ai在b端落地也面临重要挑战:一是企业数字化程度低,二是产品形态与生产需求不匹配。我国企业在过去数十年中业务高速发展,但智能化程度仍然有限,多数企业无法实现数据的有效采集和管理,这使得基于数据提取知识的大模型难以发挥效用。以制造业为例,工业生产要求操作可重复、结果稳定,与生成式ai提供的创造性答案无法形成较好适配。目前,大模型在制造业的应用多限于知识问答、规章制度问答、数据管理等场景,尚未大规模影响一线生产。政策无疑将促进产业启动,但长远来看,ai应用在企业端的发展仍取决于能否为企业带来真实的实用价值。
3.模型公司提供通用智能,具备行业认知的应用层公司将其转化为生产力
企业在采购ai应用及服务时,除了模型性能外,能够实施落地也是关键考量之一。为了帮助企业启动和运行ai模型,基础大模型厂商需要同时提供基座模型和后续服务(如本地部署、微调、版本迭代),以满足用户的个性化需求。根据a16z预估,定制模型的开发将成为基础大模型公司收入中的重要组成。
然而,由于大模型生成的内容具有不确定性和不可重复性,微调大模型或训练垂直大模型无法满足企业的所有需求。采用ai agent、检索增强生成(retrieval-augmented generation,rag)等方式将大模型与原有数字化基础设施及软件平台相结合是目前众多企业正在探索的sbobet利记官网的解决方案。由于客户企业中很难找到合适的生成式ai技术人才,能够提供端到端的服务,直接完成应用落地部署的公司将具备更强的业务增长潜力。除了提供通用智能的大模型公司外,熟悉行业需求并且理解大模型能力边界的中间层或应用层公司也将在b端生态中占据重要位置。
(二)c端应用场景持续泛化
1.c端超级应用空间巨大,行业各方积极探索产品形态
对于应用开发而言,生成式ai带来了三个根本性变化:一是内容生产效率提升,包括文本、图片、视频的生成等;二是交互方式变为自然语言交互,降低了用户的使用门槛;三是产品初具智能,能够更好地理解用户意图。ai原生应用是指在设计、开发、部署、运营和维护过程中,具有内在安全、可信的ai能力应用,其中ai是功能的自然组成部分。实现一个ai原生应用的过程,往往需要利用数据驱动和基于知识的生态系统,在这一过程中,数据与知识将被消费和生产,以实现新的基于ai的原生功能。在需要时通过学习和自适应的ai增强能力,来替代以往静态的、基于规则的机制。
生成式ai的发展仍处于早期阶段,可类比2008~2011年的移动互联网,而在此期间诞生的超级公司如airbnb、uber等产生了超2000亿美元的市场价值。目前,c端应用多利用生成式ai对现有场景进行优化,尚未产生全新的业态或商业模式。目前的重要探索方向可分为“创意”和“效率”两大类,前者包含音乐生成、内容生成等应用,后者包括聊天机器人、代码生成器等应用。未来随着模型性能的提升,创意类应用将会拥有更多可能性,拓宽aigc的边界;效率类应用将会持续提升性能,形成真实生产力。
2.大模型公司具备先发优势,模型能力或非打造现象级产品的充要条件
通过b端应用形成早期营收已逐步成为大模型赛道内的共识,但长远来看,由于大模型开发存在先期投入大、边际使用成本低的特点,能够辐射更广泛用户群的c端应用较b端应用具备更大的市场空间及发展潜力。零一万物ceo李开复直言,大模型推理成本的下降会推动中国ai大模型进入“落地为王”的阶段,今年会迎来“大模型应用爆发元年”。据调研,国内头部大模型公司中b端业务发展最为迅猛的智谱ai也已于近期确立“构建超级应用”的中远期战略目标。然而,c端用户结构复杂、需求多变,产品设计及开发难度较b端更大。openai的sam altman指出,当前产业中最具挑战的两个问题,包括构建通用人工智能(agi)和开发“超级应用”(killer app)。基础大模型公司发展初期多为技术团队主导,若想同时解决上述两项任务,公司的组织结构、sbobet利记官网的文化以及人才和资源管理都需要及时作出调整。
大模型时代的应用开发有别于传统互联网时代,“产品-工程-研发”三大关键环节相互影响、联系紧密。大模型公司在进行ai原生产品开发时具备一定先发优势。首先,大模型公司对于llm的性能边界及未来发展具有更清晰的认知,更有可能设计出具备前瞻性、创新性的产品。回看过去一年的创业生态,多数互联网基因团队选择“ai ”策略切入,将通用大模型封装进图形界面中进行微创新,该类型项目多数都随着基础模型的能力提升被淘汰。此外,具备模型研发能力的公司如果发现某类任务处理不佳,可以通过特定的数据调整和模型优化来解决问题,具备较强的灵活性;反观不具备模型开发能力的团队,遇到类似问题则只能选择指令微调等方案,效率低于修改底层模型。
除去少数具备超强能力的大模型外,ai产业的价值未来或仍将集中在应用环节。底层模型环节的竞争仍然激烈,api价格持续下探,尽管大模型公司具备更深的底层技术认知,但日趋丰富的基础设施给予了应用层公司大量的开发便利,竞争者持续涌入,大模型公司能否将技术优势转化为现象级产品尚存在较大不确定性。
四、相关建议
(一)建议关注b端具备生态位优势的公司
b端产品为当前阶段大模型产业主力,占据大模型市场营收的八成。产业关注点已逐渐转向模型赋能产业、场景结合、行业结合。多数b端场景需求明确、价值较高,但同时也具备鲜明的行业特点,具备特定行业知识积累的公司有望率先落地,积累工程经验与独家数据。建议关注面向b端大行业(如能源、医疗、制造)或大场景(如营销、销售)的ai产品及公司。
(二)建议关注具备较强产品能力的大模型公司
底层通用大模型可能最终仅剩少数玩家,应用层的创业生态会相对繁荣。并且ai应用层竞争格局较基础模型层将会更加分散。目前,各家大模型公司都已展开积极探索,现阶段每个产品的试水其实都是在做爆发前夕的“跑马圈地”。
多数通用大模型公司最终需要依靠产品而非单一的api调用或maas实现商业闭环,因此,在密集推进模型能力的同时,团队也必须建立起有变现能力的产品护城河。建议关注研发与应用“双轮驱动”的大模型或应用公司。
(国新基金)
免责声明
本文的分析及建议所依据的信息均来源于公开资料,我们对这些信息的准确性和完整性不作任何保证,也不保证所依据的信息和建议不会发生任何变化。我们已力求文章内容的客观、公正,但文中的观点、结论和建议仅供参考,不构成任何投资建议。投资者依据文章提供的信息进行投资所造成的一切后果,概不负责。文章未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用、刊发,需注明出处为国新资讯,且不得对文章进行有悖原意的引用、删节和修改。
- 低空经济发展现状与趋势及央企布局与投资机遇2024-06-04
- 国外数据要素实践对我国的启示2024-06-04
- 教育信息化行业发展趋势及投资机遇2024-05-24