资讯
研究团队的成果不仅仅是技术上的突破,更是一种技术发展理念的体现。XQUANT证明,通过巧妙的算法设计,可以在有限的资源下实现更好的性能。现代GPU的计算能力增长速度远超内存带宽的提升,使得用时间换空间成为更明智的选择。例如,在NVIDIA ...
markdown 随着人工智能(AI)技术的飞速发展,学术界也面临着前所未有的挑战。预印本平台,如arXiv,作为科研成果快速分享的桥梁,却日益成为AI生成论文的“温床”。为了应对这一趋势,arXiv ...
不过这也只是众多AI生成论文中的其中一篇,据arXiv估计,每年都有约 2% 的论文,因为涉及AI和专门批量造假学术论文的论文工厂,而被平台拒之门外。 尤其是在 ChatGPT 推出后,这一比例还出现了大幅度增长的情况,LLM生成了arXiv上 22 ...
由阿里巴巴人工智能实验室的李天一、陈明达、郭博伟和沈志强联合撰写的这项突破性研究,发表于2025年8月的arXiv预印本平台。这篇名为《扩散语言模型综述》的论文为我们揭开了一个可能改变整个AI对话系统格局的新技术。有兴趣深入了解的读者可以通过arXi ...
研究还发现,GFPO特别善于处理不同难度的问题。对于简单问题,令牌效率策略能够产生比原始模型更短的回答,同时保持甚至提高准确性,实现了真正的"言简意赅"。对于困难问题,自适应难度策略通过保留更多学习样本,确保AI模型有足够的学习机会掌握复杂推理,避免 ...
22 小时
科技行者 on MSNUC Berkeley团队突破AI内存瓶颈:让大模型推理快7倍的神奇方法
这项突破性研究来自加州大学伯克利分校、FuriosaAI、国际计算机科学研究所以及劳伦斯伯克利国家实验室的联合团队,由Aditya Tomar、Coleman ...
4 天
科技行者 on MSN当AI遇上编程逻辑:达拉斯大学团队发现大模型在复杂指令执行上的 ...
这项由达拉斯德州大学的张勉教授和Zoom公司研究团队联合开展的研究发表于2025年8月,完整论文可通过arXiv编号2508.09125获取。研究团队发现了一个令人意外的现象:即使是最先进的AI大模型,在执行包含复杂逻辑结构的指令时也会频频出错,这就 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果