资讯

海归学者发起的公益学术平台分享信息,整合资源交流学术,偶尔风月Al-Si合金因其优异的轻质高强、耐腐蚀和高导电性能,广泛应用于汽车、航空航天等领域。然而,高强铝硅合金的设计仍面临两大核心难题:一是成分空间极其庞大,合金元素复杂耦合,强化相多样,导致传 ...
现有的视频理解基准测试(Benchmark)在衡量AI是否达到人类级智慧上存在着一些根本性的缺陷。它们往往无法区分模型是因为“没看清”而犯错(即关键视频帧采样不足),还是因为“没想明白”而出错(即缺乏真正的推理能力)。
现有的视频理解基准测试(Benchmark)在衡量AI是否达到人类级智慧上存在着一些根本性的缺陷。它们往往无法区分模型是因为“没看清”而犯错(即关键视频帧采样不足),还是因为“没想明白”而出错(即缺乏真正的推理能力)。
为了支撑模型在表格推理任务上的性能提升,中国移动九天人工智能研究院首创搭建面向表格数据的全方位多维度深层次数据体系。基于表格能力全覆盖、各能力独立不交叉原则,通过开源表格数据收集、实际网络表格爬取和特定领域复杂表格定制等手段,重新整合吸纳多源数据,进行数据清洗、质量判定、全流程多阶段数据筛查,最终形成了 涵盖表格推理 6 大能力和 34 项子任务的千万级数据体系 。
ROME方法的成功,不仅为数据集蒸馏领域提供了一条新的技术路径,也为各类应用场景的模型鲁棒性提升指明了方向。在安全关键任务日益增多的今天,如何平衡模型的性能与鲁棒性,将成为未来AI研究的重要课题。随着ROME方法的开源,更多的研究者和开发者能够基于这 ...
【新智元导读】2025年ACL盛会于维也纳落下帷幕!今年会议规模空前,投稿量超过8000篇,其中超半数作者来自中国。4篇最佳论文中,出自中国团队之手的同样占到50%——分别是北大与DeepSeek合作、梁文锋署名的NSA论文,以及北大杨耀东团队揭示模 ...
7月28日晚,智谱悄无声息的开源了新一代旗舰模型 GLM-4.5,发布仅10小时,便引发全球媒体高度聚焦。 CNBC、路透社、Bloomberg等海外重量级媒体第一时间跟进报道。CNBC在报道中指出:“中国企业正在研发的人工智能模型不仅智能化水平提升 ...
阿里云通义实验室近日宣布正式开源其自主搜索AI智能体项目 WebAgent ,其中旗舰组件 WebShaper 和 WebSailor 在网络智能体领域引发广泛关注。作为一款突破性的AI工具,WebAgent以其端到端的自主信息检索与多步推理能力,展现出接近甚至超越人类专家的网络交互水平。
"Models like DeepSeek, Alibaba, Tencent, MiniMax and Baidu Ernie bot are world-class, developed here and shared openly (and) have spurred AI developments worldwide," said Jensen Huang, Nvidia's ...
As of Thursday, the open-source model leaderboard on Hugging Face is topped by GLM-4.5, with Qwen and Tencent in hot pursuit. K2 sits at No. 9, while eight of the top ten models hail from China.
这项由阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)的Fan Zhou、Zengzhi Wang等研究团队完成的突破性研究发表于2025年4月,论文标题为"MegaMath: Pushing the Limits of Open Math ...
麦肯锡的一份报告显示,尽管建筑业每年的资金流动量达10万亿美元,然而在过去20年里,其平均生产率增长率仅为1%,而制造业为3.6%,全球经济总量为2.8%。在一项针对600名美国劳动者的调查中,建筑业在创新认知层面排名垫底,被认为是“技术能力最为薄弱 ...