资讯
长文本处理能力的测试结果更是亮眼。在64k上下文的”大海捞针”测试中,NSA在所有位置都实现了完美的检索准确率。在LongBench基准测试上,NSA取得了0.469的平均分,不仅超越了全注意力基线(+0.032),更是大幅领先其他稀疏注意力方法。
【新智元导读】2025年ACL盛会于维也纳落下帷幕!今年会议规模空前,投稿量超过8000篇,其中超半数作者来自中国。4篇最佳论文中,出自中国团队之手的同样占到50%——分别是北大与DeepSeek合作、梁文锋署名的NSA论文,以及北大杨耀东团队揭示模 ...
JERUSALEM, July 30 (Xinhua) -- Israeli researchers created a low-cost method using ordinary video cameras to monitor plant health in 3D, the Hebrew University of Jerusalem said Wednesday in a ...
ACL 是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 在 NLP 领域的学术影响力都位列第一,它也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 63 届,于 2025 年 7 月 ...
近年来, 大语言模型 (LLM) 在数学、编程等 "有标准答案" 的任务上取得了突破性进展, 这背后离不开 "可验证奖励" (Reinforcement Learning with Verifiable Rewards, RLVR) ...
2 天
科技行者 on MSN首尔大学"智能分区"技术提速AI绘图7倍这项由首尔大学电子与计算机工程系的郑元基、李庆烈、徐浩基和全世英教授团队领导的研究于2025年1月发表,论文题为《Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers》。感兴趣的读者可以通过arXiv:2507.08422v1访问完整论文。
3 天
小黑盒游戏 on MSN无损缩放——拯救低帧率视频游戏和低性能显卡【本文由小黑盒作者@一个观彩板于07月27日发布,未经许可不得转载!】 最近有不少新游戏发布,相信不少盒友会在此期间购入自己想要的游戏,但部分盒友可能会对自己的硬件能不能跟上现如今日益增长的“最低要求”表示担忧,现如今的厂商做优化更是越来越随意了。
随着Kimi K2、Qwen Coder的开源,越来越多的超大型模型进入大家的视野。这些模型具有强劲的性能,但受制于模型尺寸导致推理效率较低。对于超大尺寸的模型,除了进一步优化算子之外。还有像投机采样这样的技术能加速它们的推理。
Nowadays, the beer festival has grown into an internationally renowned celebration. The host city Qingdao is home to the Tsingtao Brewery, a time-honored beer brand in China.
一些您可能无法访问的结果已被隐去。
显示无法访问的结果