optimization - 搜索 News

资讯

超越GRPO！阿里通义千问提出强化学习算法GSPO，为最新Qwen3模型突破 ...

强化学习（Reinforcement Learning, ...

科技行者 on MSN3 天

浙江大学发布LAPO：让AI学会"适度思考"的智能训练方法

这项由浙江大学吴行宇、颜雨辰、吕尚柯等研究团队完成的突破性研究发表于2025年1月，论文题为《LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy ...

来自MSN5月

中科飞测新注册《Optical Optimization子系统软件V1.0》等5 ...

证券之星消息，近日中科飞测（688361）新注册了5个项目的软件著作权，包括《Optical Optimization子系统软件V1.0》、《Skyverse Review Station软件V2.0 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果