资讯

微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。 140亿参数,40%合成数据,年度SLM之王诞生 ...
业界判断,随着7B、14B这样的小参数大模型陆续开源,大模型的私有部署还将进一步普及,中小企业和个人用户只用极小成本,就可以轻松拥有一个 ...
Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。 阿里云此前开源了70亿参数模型Qwen-7B等,一个多月下载量破100万,成为开源 ...
Light-R1-14B-DS在科学常识评测GPQA上涨,打破了模型“灾难性遗忘”的魔咒, 具有较好的泛化性,开辟模型优化新路径。 最强14B端侧推理模型,撕开了DeepSeek 70B的性能封锁线,端侧AI迎来了规模化普及的拐点。 不过,在AI与大众之间,还差一个开源。
从测试结果上来看,Intel酷睿Ultra 9 285H在针对Intel优化过的Ollama上的每秒token输出更高一些, 在14B和7B规模模型中,对比AMD锐龙AI 9 HX370都有40%左右的 ...
新智元报道编辑:编辑部 NJY【新智元导读】AIMO2最终结果出炉了!英伟达团队NemoSkills拔得头筹,凭借14B小模型破解了34道奥数题,完胜DeepSeek R1。第 ...
Intel酷睿Ultra 285H AI体验:DeepSeek 14B模型每秒近10 Tokens OpenVINO成制胜关键 2025-03-31 19:05:06 出处:快科技 作者: 万俟雨休 编辑:万俟雨休 人气: 14363 ...
阿里云表示,Qwen-14B进一步提高了小尺寸模型的性能上限。 9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用 ...
AIMO2最终结果出炉了!英伟达团队NemoSkills拔得头筹,凭借14B小模型破解了34道奥数题,完胜DeepSeek R1。 第二届人工智能数学奥林匹克竞赛(AIMO2)开奖 ...
ChatTS-14B 是一个专注于时间序列理解与推理的语言模型,旨在通过合成数据提高对时间序列数据的处理能力。该模型可以广泛应用于数据分析、金融预测等领域,为用户提供更深层次的时间序列洞察,具有良好的推理能力和准确性。
DeepSeek R1-Distill-14B 14B 较小的蒸馏版,进一步优化了计算资源的使用。 性能较 32B 版本略低,但仍具备良好的推理能力。