资讯

PaLI-3 在绝大多数字幕和 VQA 基准上,无论是否有外部 OCR 输入,都取得了最先进的性能。 唯一的例外是 AI2D 和 ChartQA,它们不仅需要理解,还需要对 ...