资讯

研究批评CDC等机构在报告社交媒体与自杀风险关联时,忽视效应量差异——家庭不良经历解释25%变异(variance),而社交媒体解释力近乎为零。这种将统计学显著性(P值)等同于临床显著性的做法,导致大量假阳性结论(false-positive results)被采信。
大数据文摘出品想象一下,你向一个AI提问一道数学题:“阿里有21美元,莱拉把她100美元的一半给了他,现在阿里有多少钱?”接着,你让一个“AI裁判”去评估两个答案,一个答案是一串错误的计算公式,另一个答案只有一个单词:“Solution”(解)。你认为AI裁判会判定哪个答案正确?一个惊人的事实是,它很有可能会给那个只 ...
这种现象导致了极高的误报率(False Positive Rate),在某些测试中甚至高达90%,揭示了AI裁判存在着系统性的判断缺陷。