资讯
更令人惊讶的是,研究团队发现这些通用的大语言模型在没有专门训练的情况下,竟然展现出了复杂的策略行为。它们会制定承诺、进行欺骗、背叛盟友,甚至在面对不同实力的对手时表现出截然不同的行为模式。这就好比发现一个从未学过外交的人,仅凭常识和语言能力就能在国际 ...
为解决上述挑战,NVIDIA于SIGGRAPH上宣布扩展两类面向推理任务的模型体系——NVIDIA Nemotron 与 NVIDIA ...
不必过分追求奖励模型的高准确率。 最近的一篇论文中,来自人大和腾讯的研究者们的研究表明,语言模型对强化学习中的奖励噪音具有鲁棒性 ...
交叉学科Interdisciplinary随着人工智能(AI)新方法的不断涌现以及AI应用领域的不断拓展,整合多种模态(文本、图像、音频、视频等)数据对于开发智能系统,实现关键应用显得愈发重要。多模态人工智能模型能够整合不同类型的数据,取长补短,为从医疗保健到自动化实验室等诸多领域中复杂任务 ...
大模型行业分析报告:大型语言模型 (LLM)是基于大量数据进行预训练的超大型深度学习模型。当前,我国大语言模型在全球处于发展前列,但与美国仍然存在一定差距,仍有距离需要追赶。本文将从大语言模型中外发展状况角度对全球行业发展进度进行对比,同时,客观认识我国大语言模型发展进程 ...
MoE Transformer 模块 Time-MoE 基于 decoder-only Transformer,并结合了大规模语言模型中的最新技术。Transformer 模块里,RMSNorm 对每个子层输入进行了归一化 ...
促进我国人工智能大模型技术创新成果向全球治理贡献转化,以人工智能大模型关键核心技术为抓手开拓国际科技合作新局面,在尊重主权、平等互信基础上为全球南方国家建立安全可控的本土大模型提供中国方案,让人工智能大模型技术真正助力全球发展事业,赋能人类美好生活。
36氪独家获悉,大模型初创公司「百川智能」已于近期完成A轮融资,总融资金额达50亿元人民币。 此前,百川智能已经在2023年10月官宣了A1轮融资 ...
Wan2.2 同步开源了一款 50 亿参数模型,采用自研的 Wan2.2-VAE 编码器,压缩率达到 16×16×4。该模型支持文本生成视频和图像生成视频两种模式,生成分辨率高达 720P、24fps,并可在消费级显卡(如 4090)上流畅运行。
多模态大模型的发展对AI芯片和AI服务器提出了更高的要求。AI芯片方面,由于多模态大模型需要处理多种类型的数据,进行复杂的计算任务,如数据解码、特征提取、模态融合等,因此需要具备强大的并行计算能力和高显存容量。AI服务器方面,通常需要配备多个高性能的AI芯片,以及多核、高主频 ...
此次发布比原定时间推迟了约一小时,马斯克略显憔悴。 7月10日中午12点,经历了前一代模型的延期和此次直播推迟,埃隆·马斯克终于现身Grok 4 ...
OpenCompass团队对7个AI大模型进行了高考9个科目的全科目测试,表现最优的三个大模型文科成绩过一本,理科成绩超二本。 此前6月,上海人工智能 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果