本文作者:访客

美团发布LongCat-Flash-Omni,尖端开源技术,总参数达56亿超大规模

访客 2025-11-04 10:04:48 28436 抢沙发
美团发布LongCat-Flash-Omni,这款产品的总参数规模高达5600亿,代表了目前开源领域的最先进水平,该产品具备出色的性能和稳定性,旨在为用户提供更高效、更便捷的服务体验,LongCat-Flash-Omni的发布标志着美团在技术研发方面取得了重要突破,有望引领行业的技术创新和发展方向。

11月4日消息,昨日,美团LongCat(龙猫)团队正式推出全新开源大模型LongCat-Flash-Omni。

该大模型总参数规模高达5600亿,实现全模态能力突破,登顶开源领域最先进水平(SOTA)。

美团发布LongCat-Flash-Omni,尖端开源技术,总参数达56亿超大规模

今年9月1日,美团正式发布LongCat-Flash系列模型,并开源了LongCat-Flash-Chat和LongCat-Flash-Thinking两大版本。

此次LongCat-Flash-Omni是系列全新家族成员。它也是业界首个实现全模态覆盖、端到端架构、大参数量高效推理于一体的开源大语言模型,首次在开源范畴内实现了全模态能力对闭源模型的对标。

美团发布LongCat-Flash-Omni,尖端开源技术,总参数达56亿超大规模

该模型的核心突破在于破解了大参数与高效率的行业矛盾。

该模型总参数达5600亿(激活参数270亿),却依托LongCat-Flash系列创新的ScMoE架构(含零计算专家)作为LLM骨干,结合高效多模态编解码器和分块式音视频特征交织机制,最终实现低延迟、高质量的音视频处理与流式语音生成。

模型支持128K tokens上下文窗口及超8分钟音视频交互,在多模态长时记忆、多轮对话、时序推理等能力上具备显著优势。

美团发布LongCat-Flash-Omni,尖端开源技术,总参数达56亿超大规模

实测显示,其图像理解性能与闭源全模态模型 Gemini-2.5-Pro 相当,且优于开源模型 Qwen3-Omni。短视频理解性能超越同类模型,长视频处理能力比肩Gemini-2.5-Pro。

落地体验上,LongCat官方App现已正式发布,支持联网搜索,还可以发起语音通话(视频通话功能敬请期待)。

美团发布LongCat-Flash-Omni,尖端开源技术,总参数达56亿超大规模

文章版权及转载声明

作者:访客本文地址:https://nbdnews.com/post/4469.html发布于 2025-11-04 10:04:48
文章转载或复制请以超链接形式并注明出处NBD财经网

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

验证码

评论列表 (暂无评论,28436人围观)参与讨论

还没有评论,来说两句吧...