0573-84699996  我的订单     登录 |  注册  |  帮助中心  |  收藏网址        
     
我的购物车 
新闻资讯
           公司动态
           新闻动态
           常见问题
           技术方案
           AI客服
           AI报价
产品推荐
联系我们


总 机: 0573-84699996
邮箱:weiding@wrtauto.com


   

 
 首页 ->新闻资讯 ->新闻动态更多  

DeepSeek 再放降本大招:NSA 官宣发布,加速推理降低成本,并且不牺牲性能


IT之家 2 月 18 日消息,DeepSeek 今日官宣推出 NSA(Native Sparse Attention),这是一种硬件对齐且原生可训练的稀疏注意力机制,用于超快速长上下文训练与推理。


NSA 的核心组件包括:

  • 动态分层稀疏策略

  • 粗粒度 token 压缩

  • 细粒度 token 选择

DeepSeek 官方表示,该机制可优化现代硬件设计,加速推理同时降低预训练成本,并且不牺牲性能。在通用基准、长上下文任务和基于指令的推理上,其表现与全注意力模型相当或更加优秀。


  日期:2025-02-19   
  
  
联系服务
新手指南
购物指南
关于维鼎
 客服电话: 0573-84699996用户注册如何下单公司简介
 服务邮箱: weiding@wrtauto.com忘记密码如何支付联系我们
 服务时间: 周一至周五 9:00-18:00企业认证如何配送供应商合作
 如何登录关于发票投诉建议
  关于退换货 
    
首页 |  走近我们 |  公司文化 |  公司愿景 |  联系我们 |  返回页首 
  嘉兴维鼎智能科技有限公司   浙江省嘉善县魏塘街道万乐路39号   联系电话:0573-84699996
  版权所有@2014-2018   ICP备案号:浙ICP备2023001642号-1    | 管理
X