上下文 - 搜索 News

资讯

上下文工程崛起：中美澳15位科学家定义AI新时代核心学科，揭示大 ...

还记得安德烈·卡帕西（Andrej Karpathy）在上个月带火的上下文工程吗？他曾盛赞上下文工程“是一门精心设计、科学填充上下文窗口的精密艺术。”图 | 安德烈·卡帕西（Andrej Karpathy）在 2025 年 6 月发表的 X ...

2 天

DeepSeek V4 借实习生获奖论文“起飞”？梁文峰剑指上下文：处理速度 ...

在 64k 上下文的“大海捞针”测试中，NSA 在所有位置都实现了完美的检索准确率。此外，与全注意力相比，NSA 在解码、前向传播和反向传播方面都实现了显著的速度提升，且序列越长，提速比例越大。

腾讯网4 天

上下文灾难有救了，Claude Sub-Agent的隐藏功能，99%的开发者还没发现

Sub Agents的出现解决了当前AI编程的一个最重要的问题：通过“角色化”和“隔离化”，解决了“单体通用型AI”在复杂、多阶段开发任务中的“上下文失控”和“目标不确定性”问题。这对于用AI开发大型项目的用户，具有重大意义。

2 天

华为发布大模型推理专利，解决上下文窗口限制，加速AI应用落地

近日，华为技术有限公司申请了一项名为“一种大模型预存上下文信息的推理方法及装置”的专利，该专利旨在解决大模型在处理长上下文信息时面临的挑战。该专利的公开，预示着华为在大模型技术领域的持续投入，以及对提升 AI 应用效率的积极探索。

20 小时

Qwen新模型直逼Claude4！可拓展百万上下文窗口，33GB本地即可运行

多编程任务超越顶级开源模型，仅略逊于闭源的Claude Sonnet-4、GPT-4.1等。采用MoE架构，30亿参数总量，激活参数3.3亿。有博主在M2 Macbook Pro上用量化版Qwen3-Coder-Flash（ 24.82GB 6bit MLX版）做的游戏，运行效果很不错。

2 天

上下文工程：AI应用的新转折点与未来展望

在快速发展的AI领域，新的概念层出不穷，最近备受关注的便是“上下文工程”（Context Engineering）。这一概念的提出，恰逢去年“提示工程”（Prompt Engineering）引发的热潮之后，似乎为我们开启了新的思维视角。

1 天

DeepSeek下一代技术提前曝光，梁文锋署名论文获ACL2025最佳论文奖

长文本处理能力的测试结果更是亮眼。在64k上下文的”大海捞针”测试中，NSA在所有位置都实现了完美的检索准确率。在LongBench基准测试上，NSA取得了0.469的平均分，不仅超越了全注意力基线（+0.032），更是大幅领先其他稀疏注意力方法。

1 天on MSN

DeepSeek实习生论文获奖，NSA技术助力V4模型长上下文处理能力升级

在今年的国际计算语言学年会（ACL）上，传来了一则令人瞩目的消息：2025年度的获奖论文中，中国作者的比例首次超过了51%，占据了半壁江山，而紧随其后的美国作者比例仅为14%。这一数据不仅彰显了中国在计算语言学领域的强大实力，也预示着该领域未来可能的发展趋势。

17 小时

Augment 推出全新 CLI 工具 Auggie，革新开发者工作流

Augment 正式宣布推出其全新命令行界面（CLI）工具 Auggie，标志着其在 AI 驱动的软件开发领域迈出了重要一步。这一工具不仅增强了 Augment 在终端环境中的可用性，还进一步巩固了其作为企业级 AI 编码平台的地位。

1 天

Claude Code烧钱黑洞曝光：99%成本都白费了，但我找到了方法

我自己试了试，发现确实如此。给Claude Code一个简单的修复任务，它居然先读取了整个项目的所有文件，包括node_modules、日志文件、甚至是二进制文件。结果就是，99%的处理能力都浪费在了无关内容上。

36氪26 天

「上下文工程」硅谷爆火，Karpathy亲自站台，提示工程 ...

继提示工程之后，「上下文工程」又红了！这一概念深得Karpathy等硅谷大佬的喜欢，堪称「全新的氛围编程」。而智能体成败的关键，不在于精湛的 ...

36氪2 年

斯坦福大学：大模型“卷”错方向了？上下文窗口越 ...

在语言模型中，上下文窗口对于理解和生成与特定上下文相关的文本至关重要。一般而言较大的上下文窗口可以提供更丰富的语义信息、消除歧义 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

资讯