资讯

近日,美国密苏里大学哥伦比亚分校本科校友、美国迈阿密大学硕士校友、加拿大康科迪亚大学博士生郭琳强和所在团队,首次在移动 GUI Agent 框架中引入了有限状态机(FSM,Finite State Machine)作为任务执行的结构化建模手段来构建 ...
markdown 近日,阿里巴巴人工智能实验室团队发布了一项名为《扩散语言模型综述》的研究成果,引发了业界对 AI对话系统 未来发展方向的广泛关注。该研究在arXiv预印本平台发表,论文编号为arXiv:2508.10875v1,标志着 扩散语言模型 ...
近日,一项由美国密苏里大学哥伦比亚分校校友郭琳强及其团队的研究成果引发关注。他们首次在移动 GUI Agent 框架中引入 有限状态机(FSM,Finite State Machine) ,构建了 Agent 的状态感知能力和结构化记忆,为移动端 Agent 的发展带来了新的思路。这项研究成果发布在 arxiv 上,为业界提供了新的技术参考。
研究团队的核心创新在于开发了一种名为"自搜索强化学习"(SSRL)的方法。这种方法的精妙之处在于,它让AI模型学会了一种"内功心法"——不再依赖外部搜索引擎,而是学会从自己的参数中挖掘知识。更令人惊喜的是,通过这种"内功"训练出来的AI模型,在需要时 ...
此前,浙江大学团队及其合作者发表了一篇关于 OS Agents 的综述,近期又在预印本网站 arXiv 上发布。这篇综述文章颇具价值。 对于想紧跟 AI 发展趋势的你来说,是个不错的“入门读物” 。分享给大家。
在PPO和GRPO等常用的策略优化方法中,clip是控制训练稳定性的重要手段,它通过限制策略更新幅度,避免模型一步走得太远而导致崩溃。Klear团队在实践中发现,clip 机制在保护稳定性的同时,也切断了模型获取最有价值学习信号的通道,模型变得保守,不敢尝试新路径,遇到错误也修正迟缓。
我们每天都在用 SiT、REPA、REPA-E 等方法试图打破 DiT,但这需要基于假设、做实验、进行验证,而 不是只在脑子里扮 演式地做科学 …… 否则,你得出的结论不仅仅是错的,而是 根本连错都谈不上 。
即刻起,人人都可使用AutoGLM。我们将快速迭代推出新功能( “ 定时任务 ” 很快上线,AI每天主动替你干活)。应用商店搜索“ AutoGLM ”, 或点击文末“ 阅读原文 ”。