资讯

还记得安德烈·卡帕西(Andrej Karpathy)在上个月带火的上下文工程吗?他曾盛赞上下文工程“是一门精心设计、科学填充上下文窗口的精密艺术。”图 | 安德烈·卡帕西(Andrej Karpathy)在 2025 年 6 月发表的 X ...
在 64k 上下文的“大海捞针”测试中,NSA 在所有位置都实现了完美的检索准确率。此外,与全注意力相比,NSA 在解码、前向传播和反向传播方面都实现了显著的速度提升,且序列越长,提速比例越大。
Sub Agents的出现解决了当前AI编程的一个最重要的问题:通过“角色化”和“隔离化”,解决了“单体通用型AI”在复杂、多阶段开发任务中的“上下文失控”和“目标不确定性”问题。这对于用AI开发大型项目的用户,具有重大意义。
近日,华为技术有限公司申请了一项名为“一种大模型预存上下文信息的推理方法及装置”的专利,该专利旨在解决 大模型 在处理长上下文信息时面临的挑战。该专利的公开,预示着华为在大模型技术领域的持续投入,以及对提升 AI 应用效率的积极探索。
多编程任务超越顶级开源模型,仅略逊于闭源的Claude Sonnet-4、GPT-4.1等。 采用MoE架构,30亿参数总量,激活参数3.3亿。 有博主在M2 Macbook Pro上用量化版Qwen3-Coder-Flash( 24.82GB 6bit MLX版)做的游戏,运行效果很不错。
在快速发展的AI领域,新的概念层出不穷,最近备受关注的便是“上下文工程”(Context Engineering)。这一概念的提出,恰逢去年“提示工程”(Prompt Engineering)引发的热潮之后,似乎为我们开启了新的思维视角。
长文本处理能力的测试结果更是亮眼。在64k上下文的”大海捞针”测试中,NSA在所有位置都实现了完美的检索准确率。在LongBench基准测试上,NSA取得了0.469的平均分,不仅超越了全注意力基线(+0.032),更是大幅领先其他稀疏注意力方法。
在今年的国际计算语言学年会(ACL)上,传来了一则令人瞩目的消息:2025年度的获奖论文中,中国作者的比例首次超过了51%,占据了半壁江山,而紧随其后的美国作者比例仅为14%。这一数据不仅彰显了中国在计算语言学领域的强大实力,也预示着该领域未来可能的发展趋势。
Augment 正式宣布推出其全新命令行界面(CLI)工具 Auggie,标志着其在 AI 驱动的软件开发领域迈出了重要一步。这一工具不仅增强了 Augment 在终端环境中的可用性,还进一步巩固了其作为企业级 AI 编码平台的地位。
我自己试了试,发现确实如此。给Claude Code一个简单的修复任务,它居然先读取了整个项目的所有文件,包括node_modules、日志文件、甚至是二进制文件。结果就是,99%的处理能力都浪费在了无关内容上。
继提示工程之后,「上下文工程」又红了!这一概念深得Karpathy等硅谷大佬的喜欢,堪称「全新的氛围编程」。而智能体成败的关键,不在于精湛的 ...
在语言模型中,上下文窗口对于理解和生成与特定上下文相关的文本至关重要。 一般而言较大的上下文窗口可以提供更丰富的语义信息、消除歧义 ...