资讯

长文本处理能力的测试结果更是亮眼。在64k上下文的”大海捞针”测试中,NSA在所有位置都实现了完美的检索准确率。在LongBench基准测试上,NSA取得了0.469的平均分,不仅超越了全注意力基线(+0.032),更是大幅领先其他稀疏注意力方法。
【新智元导读】2025年ACL盛会于维也纳落下帷幕!今年会议规模空前,投稿量超过8000篇,其中超半数作者来自中国。4篇最佳论文中,出自中国团队之手的同样占到50%——分别是北大与DeepSeek合作、梁文锋署名的NSA论文,以及北大杨耀东团队揭示模 ...
JERUSALEM, July 30 (Xinhua) -- Israeli researchers created a low-cost method using ordinary video cameras to monitor plant health in 3D, the Hebrew University of Jerusalem said Wednesday in a ...
ACL 是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 在 NLP 领域的学术影响力都位列第一,它也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 63 届,于 2025 年 7 月 ...
近年来, 大语言模型 (LLM) 在数学、编程等 "有标准答案" 的任务上取得了突破性进展, 这背后离不开 "可验证奖励" (Reinforcement Learning with Verifiable Rewards, RLVR) ...
在通用基准测试中,采用NSA预训练的27B参数模型在9个评测指标中有7个超越了全注意力基线。特别是在推理相关的基准测试上,DROP提升了0.042,GSM8K提升了0.034,显示出稀疏注意力在强制模型聚焦关键信息方面的独特优势。
这项由首尔大学电子与计算机工程系的郑元基、李庆烈、徐浩基和全世英教授团队领导的研究于2025年1月发表,论文题为《Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers》。感兴趣的读者可以通过arXiv:2507.08422v1访问完整论文。
本研究聚焦订阅制医疗服务的消费者认知,来自印度的研究人员通过横断面因果分析法,对孟买和浦那254名受访者展开调研。结果显示:24.2%的订阅服务用户正在使用健身健康类服务,消费者因其便捷性 (personalized features)和个性化服务将其视为创新解决方案。当感知质量 (perceived quality)介入时,会显著增强使用意愿。但研究同时发现,当感知易用性 (perceived ...
【本文由小黑盒作者@一个观彩板于07月27日发布,未经许可不得转载!】 最近有不少新游戏发布,相信不少盒友会在此期间购入自己想要的游戏,但部分盒友可能会对自己的硬件能不能跟上现如今日益增长的“最低要求”表示担忧,现如今的厂商做优化更是越来越随意了。
随着Kimi K2、Qwen Coder的开源,越来越多的超大型模型进入大家的视野。这些模型具有强劲的性能,但受制于模型尺寸导致推理效率较低。对于超大尺寸的模型,除了进一步优化算子之外。还有像投机采样这样的技术能加速它们的推理。
JERUSALEM, July 21 (Xinhua) -- Israeli researchers have discovered that the human brain does not pay attention in one smooth stream, but in quick bursts, the Hebrew University of Jerusalem said in a ...