Datasets - 搜索 News

资讯

1 天

「红队测试」（Red-Teaming）是一种通过主动、系统性地模拟攻击来暴露系统漏洞的安全测试方法。DAS 框架创新性地将这一理念引入医疗 LLMs 的评估中，将静态的「考卷」转变为一场动态的、持续的「攻防演练」。

2 天

近日，在加拿大蒙特利尔举行的国际人工智能联合会议（IJCAI）上，蚂蚁数科宣布开源180万深度伪造定位数据集，旨在推动 AI安全技术发展。此举为深度伪造检测领域的研究提供了关键的基础数据资源，也预示着 AI算法可解释性的重要性日益凸显。

这项由上海人工智能实验室叶俊彦、中山大学江东志等研究者组成的跨机构团队完成的研究，发表于2025年8月的arXiv预印本平台。有兴趣深入了解的读者可以通过论文链接https://github.com/yejy53/Echo-4o或数据集链接https ...

只要数据够好、模型够大，幻觉就不叫事，甚至有一天能被彻底根除，之前有相当一部分人这么认为，但研究者们给出了一个相当有冲击力的结论：对于任何基于现有计算范式的LLM，幻觉都是理论上不可避免的。为了让这个结论站得住脚，他们首先给“幻觉”下了一个非常严谨的 ...

一些您可能无法访问的结果已被隐去。