complexity - 搜索 News

腾讯网2 小时

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工新基准

现有的视频理解基准测试（Benchmark）在衡量AI是否达到人类级智慧上存在着一些根本性的缺陷。它们往往无法区分模型是因为“没看清”而犯错（即关键视频帧采样不足），还是因为“没想明白”而出错（即缺乏真正的推理能力）。

5 小时

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新 ...

现有的视频理解基准测试（Benchmark）在衡量AI是否达到人类级智慧上存在着一些根本性的缺陷。它们往往无法区分模型是因为“没看清”而犯错（即关键视频帧采样不足），还是因为“没想明白”而出错（即缺乏真正的推理能力）。

腾讯网9 小时

因美纳升级旗舰检测产品，加速全面肿瘤基因组分析可及

2025年7月30日，全球DNA测序和芯片技术的领导者因美纳公司（纳斯达克股票代码：ILMN）宣布，正式推出其旗舰款癌症研究检测方案 TruSight™ Oncology 500 ...

科技行者 on MSN23 小时

上海AI实验室推出φ-Decoding：让AI在推理时学会“深思熟虑”的新方法

这项由上海AI实验室的徐方志、西安交通大学的严航以及香港大学、北京大学、新加坡国立大学等多所知名高校研究团队合作完成的研究，发表于2025年3月17日的arXiv预印本平台。有兴趣深入了解的读者可以通过论文编号arXiv:2503.13288v1访问完整论文。当我们面对一道复杂的数学题时，通常不会马上给出答案，而是会在心里盘算一番，考虑不同的解题方法，甚至会在脑海中模拟几种可能的解题路径，然后选 ...

资讯

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工新基准

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新 ...

因美纳升级旗舰检测产品，加速全面肿瘤基因组分析可及

上海AI实验室推出φ-Decoding：让AI在推理时学会“深思熟虑”的新方法