资讯
「红队测试」(Red-Teaming)是一种通过主动、系统性地模拟攻击来暴露系统漏洞的安全测试方法。DAS 框架创新性地将这一理念引入医疗 LLMs 的评估中,将静态的「考卷」转变为一场动态的、持续的「攻防演练」。
近日,在加拿大蒙特利尔举行的国际人工智能联合会议(IJCAI)上,蚂蚁数科宣布开源180万深度伪造定位数据集,旨在推动 AI安全 技术发展。此举为 深度伪造检测 领域的研究提供了关键的基础数据资源,也预示着 AI算法可解释性 的重要性日益凸显。
这项由上海人工智能实验室叶俊彦、中山大学江东志等研究者组成的跨机构团队完成的研究,发表于2025年8月的arXiv预印本平台。有兴趣深入了解的读者可以通过论文链接https://github.com/yejy53/Echo-4o或数据集链接https ...
只要数据够好、模型够大,幻觉就不叫事,甚至有一天能被彻底根除,之前有相当一部分人这么认为,但研究者们给出了一个相当有冲击力的结论:对于任何基于现有计算范式的LLM,幻觉都是理论上不可避免的。为了让这个结论站得住脚,他们首先给“幻觉”下了一个非常严谨的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果