阿里发布新一代大模型Qwen3.5,混合架构提升推理效率
每经AI快讯,2月16日,阿里千问正式发布Qwen3.5,并推出Qwen3.5系列的第一款模型Qwen3.5-397B-A17B的开放权重版本。该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,实现出色的推理效率:总参数量达3970亿,每次前向传播仅激活170亿参数,在保持能力的同时优化速度与成本。

声明:如有信息侵犯了您的权益,请告知,本站将立刻删除。
每经AI快讯,2月16日,阿里千问正式发布Qwen3.5,并推出Qwen3.5系列的第一款模型Qwen3.5-397B-A17B的开放权重版本。该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,实现出色的推理效率:总参数量达3970亿,每次前向传播仅激活170亿参数,在保持能力的同时优化速度与成本。

声明:如有信息侵犯了您的权益,请告知,本站将立刻删除。
平台近期正式启动海内外短信服务供应商的公开招募,旨在通过引入多元化服务商优化其通信服务能力,这一举措将推动其国际化服务网络的构建与现有短信业务的全面升级。
该产品在短短两个月内便实现了C端月活跃用户突破一亿的里程碑,这一数据清晰地展现了其市场接受度的迅猛提升与用户规模的爆发式增长。
全球范围内,AI购物功能已进入实测阶段,用户现可体验通过人工智能完成点外卖、购物及订机票等操作,标志着AI与日常消费场景的融合迈出了关键一步。
最新实测显示,AI助手已深度集成外卖、订票及支付等核心生活服务。用户无需跳转应用,直接通过对话即可完成下单与支付,标志着AI正从问答工具向一站式“办事”平台演进...
大模型商用化正引爆对高效推理的迫切需求,推动行业探索多元算力解决方案。头部企业通过巨额合作押注新型硬件,旨在以更低成本、更快响应提升用户体验与商业化潜力,预示着...