LongCat AI
手机版访问入口 LongCat AI手机版入口扫码访问
浏览:1K 留言:00

LongCat AILongCat AI

LongCat AI 是美团于 2025 年 9 月开源的 560B 参数 MoE 架构大模型,平均仅激活 27B 参数实现 100+ tokens/s 推理速度与 5 元 / 百万 Token 低成本,在智能体任务、中文指令遵循上表现全球领先,自带美团业务适配能力,已通过 MIT 协议开放给行业使用。

LongCat AI官网网页版入口是:longcat.chat

LongCat AI美团开源大模型,重新定义 AI 高效推理时代。随着 AI 大模型竞赛进入深水区,美团于 2025 年 9 月 1 日正式发布自研大语言模型LongCat AI(全称 LongCat-Flash-Chat,中文名 “龙猫”),同步在 Github、Hugging Face 平台开源,并上线官方网站(https://longcat.ai/)。这款带着 “美团基因” 的大模型,凭借创新性架构设计和极致性能表现,迅速成为行业焦点,为企业级 AI 应用落地提供了全新选择。

LongCat AI 官网
LongCat AI 官网

一、LongCat AI 核心技术:MoE 架构打造 “高效算力引擎”

LongCat AI 的突破核心在于采用混合专家模型(Mixture-of-Experts,MoE)架构,通过 “动态激活” 机制实现算力与性能的平衡,彻底改变传统大模型 “全参数参与计算” 的资源浪费问题。

1. 创新参数分配:560B 总参数,仅激活 27B 实现高效推理

LongCat AI 总参数量高达 5600 亿(560B),但基于对每个 Token 重要性的智能判断,仅激活 18.6B-31.3B 参数(平均约 27B)。这种设计源于 “零计算专家(Zero-Computation Experts)” 机制 —— 部分 Token 可根据上下文需求 “做空” 复杂计算,实现算力按需分配。

为进一步控制算力消耗,美团团队引入PID 控制器实时微调专家偏置,将单 Token 平均激活量稳定在 27B 左右,既保证性能不缩水,又大幅降低硬件成本。

2. 工程优化:100+ tokens/s 推理速度,30 天完成 20 万亿 Token 训练

在架构层面,LongCat AI 通过Shortcut-connected MoE(ScMoE)设计扩大计算与通信的重叠窗口,配合定制化底层优化,实现数万张加速卡的高效并行训练。最终,模型仅用 30 天就完成 20 万亿 Token 的预训练,刷新业内纪录。

推理速度方面,LongCat AI 在 H800 显卡上实现100+ tokens/s 的生成速度,远超同类模型;同时,输出成本低至5 元 / 百万 Token,为长周期、高复杂度的智能体任务提供了低成本解决方案。

二、LongCat AI 性能表现:多维度评测位居全球前列

通过权威基准测试验证,LongCat AI 在通用知识、智能体能力、编程效率、指令遵循四大核心领域表现卓越,部分指标超越国际顶级模型。

1. 通用知识:中文能力领先,比肩国内头部模型

  • MMLU(多任务语言理解基准):得分 89.71,展现扎实的跨领域知识储备;
  • CEval(中文通用能力评估基准):得分 90.44,在中文语境理解、文化适配性上优势显著;
  • 数学推理(MATH500):得分 96.4,复杂计算与逻辑推导能力突出。

2. 智能体能力:复杂场景处理全球第一

作为 LongCat AI 的核心优势,其智能体(Agentic)能力在多个专业基准中位列榜首:

  • VitaBench(复杂场景智能体基准):得分 24.30,超越所有参评模型,擅长处理多步骤、高交互的业务场景;
  • τ²-Bench(智能体工具使用基准):即便与参数规模更大的模型对比,仍保持性能领先,工具调用准确率高;
  • TerminalBench(终端命令行任务基准):得分 39.51,位列第二,可高效完成服务器运维、自动化脚本执行等技术任务。

3. 指令遵循:中英文场景 “零偏差” 执行

在指令理解与执行可靠性上,LongCat AI 表现出极强的严谨性:

  • IFEval(指令遵循评估基准):得分 89.65,全球第一,能精准识别复杂指令中的细节要求;
  • COLLIE(中文指令遵循基准):得分 57.10,Meeseeks-zh(中文多场景指令基准):得分 43.03,两项均获最佳成绩,适配中文商业场景需求。

三、LongCat AI 应用场景:从美团业务到行业开源生态

1. 美团内部落地:降本增效覆盖全业务链

LongCat AI 已在美团客服、销售、研发、无人配送等核心业务中规模化应用:

  • 智能客服:运营效率提升 20%,自动解决 80% 以上的常见咨询;
  • 商家助手:为 120 万美团商家提供营销策划、库存管理建议,降低中小商家运营门槛;
  • 研发工具:AI 代码生成效率提升 27%,支持多语言开发与 bug 自动修复;
  • 无人配送:优化无人车、无人机路径规划,已完成数百万次配送任务并拓展至海外市场。

值得注意的是,LongCat AI 自带 “美团基因”—— 在生成营销文案、策划方案时,会自动结合美团业务场景(如 “美团买菜”“美团出行”),提供可直接落地的商业建议,这一特性使其成为商家与企业用户的 “定制化助手”。

2. 开源生态:MIT 协议降低行业使用门槛

LongCat AI 采用MIT 开源协议,允许开发者自由下载、修改模型,甚至通过蒸馏训练衍生新模型。美团同步提供基于 SGLang 和 vLLM 的两种部署方案,普通技术团队无需复杂配置即可快速上线模型服务。

这一举措打破了 “大模型仅由 AI 公司主导” 的行业认知,为中小企业、科研机构提供了低成本接入高性能大模型的机会,推动 AI 技术在生活服务、零售、物流等领域的普惠应用。

四、LongCat AI 背后:美团 AI 战略的 “三步走” 布局

LongCat AI 的诞生并非偶然,而是美团 “AI at Work(赋能员工)、AI in Products(升级产品)、Building LLM(自研大模型)” 三层战略的落地成果。早在 2023 年,美团就通过整合光年之外团队积累 AI 技术;2024 年明确大模型研发方向后,投入数十亿元建设 GPU 资源与基础设施,最终实现 “30 天高效训练 + 高性价比推理” 的工程突破。

美团 CEO 王兴表示,LongCat AI 是公司 “技术驱动业务” 的核心载体,未来将持续加码 AI 投入,推动线上线下业务的全面数字化升级。

LongCat AI官网网页收录于2025年9月2日,链接来源于网络,在收录时内容合规合法。同时,对于该外部链接的指向,不由本站实际控制,请甄别该网站上出现的内容,警惕违规信息和不良广告。后期该网页如果出现违规内容,可以直接联系网站管理员进行删除,本站不承担任何责任。

相关推荐

暂无评论

none
暂无评论...
想要以后继续访问本站,按住Ctrl+D键,把aoxox.com收藏起来吧!