企服国际观察,2025人工智能发展现状报告——超级智能与中美大模型PK的挑战与超越
本报告主要关注人工智能发展现状,特别是超级智能与中美大模型的竞争态势,报告分析了人工智能技术的最新进展和面临的挑战,探讨了超级智能的潜力和限制,报告还对比了中美两国在人工智能领域的发展差异,并指出了超越现有技术限制的策略和方向,企服国际观察认为,人工智能的发展前景广阔,但仍需克服技术和市场等多方面的挑战。
图片系AI生成
日前,AI领域投资人、风投公司Air Street Capital联合创始人内森·贝奈奇(Nathan Benaich)与其团队共同发布了《人工智能现状报告 2025》。该系列报告已连续发布八年,而本次报告长达300多页,由业界和研究领域的顶尖AI从业者进行评审,涵盖了技术研究与产业、政策与安全、用户市场调研等多个维度。
基于此,内森·贝奈奇对下一年度给出预测,他在报告中写道:“对前沿AI模型的研究,中国的研究机构会超越美国;开放式AI智能体(Agent)更值得获得进一步科研发现;AI安全领域,基于AI生成欺诈视频的网络攻击事件将引发国际间讨论;美国某头部AI研究架构会最终转向开源生态以获得其政府支持。”
笔者根据该报告调研数据及分析,梳理出三大类关键信息。
过去一年,超级智能与中美大模型PK
2024年末至2025年,随着GPT-o1的发布,迎来基于深度推理的大模型发展热潮,各家大模型厂商快速面世了多个推理模型。
期间,以Meta为代表的科技巨头定义了“超级人工智能”(Superintelligence)一词,“通用人工智能”(AGI)成为过去时。
请输入图说
报告认为,开源模型与闭源模型之间的差距虽曾一度缩小,但当前最顶尖的模型仍保持闭源,如GPT-5、GPT-o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok4等。其中,OpenAI凭借其最新的GPT-5在多个基准测试中保持领先,继续巩固在基础模型领域的优势地位。
尽管中国基础模型尚未取得突破性进展,但在开源模型领域却颇具竞争力。相比之下,美国的开源模型表现令人失望,OpenAI的开源模型性能远逊于GPT-5。
随着中国DeepSeek、Qwen和Kimi等模型的崛起,市场竞争愈发激烈。特别是在推理和编程任务方面,中国厂商正逐步缩小与领先者的差距。报告强调,开源为中国厂商提供了快速追赶的契机,越来越多的开发者选择基于Qwen进行开发。中国的大模型不仅在智能水平上有所提升,还呈现出多样化的特点。相比之下,曾作为开源模型标杆的Meta Llama,其市场份额已从2024年末的约50%大幅下滑至目前的15%。
报告指出,近期推理模型的方法改进完全处于基准模型的误差范围内,这或许意味着推理模型的进步并不真实。而且,强化学习(RL)带来的实际收益也微乎其微,且容易过拟合。
针对此,报告援引一篇论文,深入剖析了研究人员间的争议焦点:推理模型在应对复杂问题时表现欠佳,究竟是源于实验设计本身的缺陷,还是仅在特定领域才能展现出超越基准模型的优势?
当前,前沿AI实验室正积极探索将强化学习、基于可验证的奖励机制、可验证推理与新环境相结合,赋予模型规划、反馈、自我修正以及在更长时间跨度内执行任务的能力。
报告还提到,AI研究目前正考虑利用小语言模型(SLMs)构建智能体(Agentic AI)。鉴于大多数智能体的工作流存在局限性、重复性且高度依赖格式,小语言模型已能满足实际操作需求,且成本显著降低。因此,采用小语言模型构建有限的异构智能体架构,仅在必要时调用大模型,成为一种可行的策略。
作为构建AI智能体的软件平台,AI智能体框架发展同样迅速。尽管LangChain仍广受欢迎,但如今已只是众多选择之一,目前市面上各细分领域已涌现数十种框架,如研发领域的AutoGen、camel,软件工程领域的MetaGPT等。
此外,AI智能体的研究正赋予其记忆能力,实现从拓展上下文窗口到结构化、持久性终身记忆的转变,并且进一步延伸至动态整合、遗忘和反思,旨在使智能体在交互、任务乃至整个运行周期中保持连贯性。
报告还提到,AI如今在跨学科领域的应用价值日益凸显。例如,在生物领域,DeepMind的AI系统“Co-scientist”,基于Gemini 2.0构建,能够生成、辩论并进化其假设生成与实验规划过程。
AI智能同样涌现物理世界。如艾伦人工智能研究所Ai2发布的针对于具身智能系统的模型MolmoAct,谷歌的Gemini Robotics 1.5,与大模型“思维链”相呼应,能够显著提升物理机器人的可解释性和可靠性。
产业进展:更便宜的智能,限制与竞争
当前,AI产业应用正迅速普及。AI优先企业营收远超其SaaS同行,并且在各个行业展现出发展势头。2025年,随着AI采用率上升,用户留存率上升,企业支出增加。特别是在音视频、虚拟形象、图像生成领域,AI公司的收入有望实现爆发式增长。
在企业内部,AI应用场景以内容生成、代码生成、研究及分析密集型任务最为常见。
ChatGPT、Claude、Gemini/Google和Perplexity成为使用频率最高的工具。尽管Meta的AI工具覆盖面广,但其使用频率远不及Mistral Le Chat或Midjourney。值得注意的是,DeepSeek虽然覆盖率略低,但使用频率相对较高。
在开发者工具方面,Cursor、Claude Code和GitHub Copilot备受青睐;而在非编程工具中,Deep Research、ChatGPT、ElevenLabs、Perplexity和Claude的使用频率也非常高。
然而,AI编程工具的应用也伴随着一定风险。例如,AI编程工具可能会主动覆盖企业生产代码,导致开发成果受损。同时,从事AI编程开发的初创公司仍面临严峻的单位经济效益挑战,其盈利状况受制于上游模型价格和竞争对手。这可能导致初创公司在提高利润时,除了技术降本外,还可能采取突然提价或限制用户功能等措施。
浏览器正成为AI应用的最新焦点和企业竞争的新战场。目前,OpenAI、Google、Anthropico和Perplexity均推出了助手功能,不仅能解答用户关于网页内容的问题,还能代表用户在浏览器中进行导航和操作。这一转变将浏览器重新定义为互联网的智能操作系统。此外,谷歌公司在其产品中嵌入Gemini能力,让更多用户体验到AI检索服务。据谷歌公司声称,其每月Token消耗数量在2025年同比增长了50倍,达到千万亿个Token。
事实上,AI的工业时代已经到来。
但在这其中,电力供应正成为制约AI发展的新因素。报告称,若电力供应不足,国家AI计划将面临崩溃风险。未来1-3年内,美国几个主要地区可能会出现电力短缺。美国能源部(DOE)警告称,由于电力供应不稳定和AI需求增长,到2030年,停电频率可能会增加100倍。
报告提到了2024年末DeepSeek对整个AI市场的搅动,市场重新认识“杰文斯悖论”,即更便宜的智能,带来更高的需求,更高的需求又会提高对芯片的消耗。
无论是在公有云、私有云还是本地化部署环境中,GPU都至关重要。英伟达的市值突破4万亿美元,占据90%的AI研究论文市场份额,定制芯片与新云服务同步崛起。除了英伟达之外,随着客户对优惠价格、灵活合同条款及AI专用软件套件的需求增加,上市公司Coreweave、Nebius以及私企Lambda、Crusoe正实现快速增长。同时,报告指出TPU和AMD的GPU普及程度并不高。
报告还首次对1183名AI从业者进行了调研,结果显示,95%的专业人士现在在工作或生活中使用AI,76%的人自掏腰包购买AI工具,且大多数人表示生产力持续提高。这充分证明AI的真正普及已成为主流趋势。
报告指出,目前AI主要挤压的是入门级岗位市场,其中在软件和客服领域,这类岗位极易受AI技术影响,其招聘岗位持续下降,经验丰富的劳动力暂时保持工作稳定性。
报告还指出,研究发现当前劳动力市场变化早于2022年ChatGPT的问世,AI自动化目前并未削弱经济领域对认知型劳动力的需求。
AI政策“反复”,安全风险加剧
整体来看,美国推行“美国AI优先”的战略并调整出口政策,中国则加速推进自主研发与本土芯片制造,以中美为代表的AI竞赛愈演愈烈。
2025年,特朗普政府将人工智能安全研究所更名为人工智能标准与创新中心(CAISI),并启动了5000亿美元的“星门计划”。与此同时,美国政府发布《人工智能行动计划》力求保持其在全球AI领域的主导地位。
与中国最密切相关的是AI芯片出口限制的相关政策,报告用“反复”来形容。事实上,美国政府在国家安全目标与供应链依赖、供应商游说这见寻求平衡,这使得英伟达和AMD成为政治焦点。报告指出,英伟达在中国市场并未达到稳定状态。
与此同时,美国监管措施在巨额投资浪潮中被边缘化:国际外交陷入僵局,《人工智能法案》实施遭遇重重阻碍。
AI数据中心建设陷入了新的瓶颈:邻避主义(NIMBYism)。在最新事件中,美国公众对新建大规模数据中心的反对声日益高涨。
而尽管政府《人工智能行动计划》提及需自主AI领域”基础科学“,但其核心研发资金远低于专家建议的2026年320亿美元投资目标。
与此同时,硅谷科技巨头目前采取了“逆向”并购政策:通过快速引进人才(创始人及团队高薪)以规避并购限制,同时保留原业务精简的公司转型拓展小众市场。其原因在于,特朗普政府以来的并购增长预期尚未到来,同时又受制于前拜登政府推行的反垄断审查。例如,微软收购Inflection,谷歌收购Character AI,亚马逊收购Adept,Meta收购Scale AI(貌似最近的Manus并购案也存在同样模式)。
目前美国联邦贸易委员会(FTC)对这类“逆向”并购行为的担忧日益加剧。
与此同时,美国就AI安全相关的政策议题也在发生转变,加之实验室间日益激烈的商业竞争,某些安全规程已被列为非优先事项。
外部安全机构年度预算甚至不及顶尖实验室单日总支出,曾以安全为核心的机构开始将重点转向产品化。报告估算,外部AI安全研究投入仅约1.3亿美元,而同期全球AI研发支出接近千亿美元,比例极低。
AI实验室为防范生物安全风险和网络攻击部署了空前防护,部分实验室却因错过自我设定的截止日期或悄然放弃测试方案。
报告指出,网络攻击能力每五个月翻一番,远超防御措施的更新速度。犯罪分子利用AI智能体的勒索软件已渗透至世界500强企业。
涉及生成式AI的安全事件正呈急剧增长态势。其中,大量报告事件涉及AI换脸技术,这与大模型的滥用密切相关。与此同时,AI代理正日益成为网络安全防御的重大挑战。(作者 | 杨丽,编辑 | 盖虹达)
报告来源:https://www.stateof.ai/
作者:访客本文地址:https://nbdnews.com/post/9481.html发布于 2026-01-12 16:19:26
文章转载或复制请以超链接形式并注明出处NBD财经网



还没有评论,来说两句吧...