maht - 搜索 News

3 天

早在2023年8月，阿里云就开源通义千问70亿参数模型至免费可商用，再到今年的Qwen1.5、Qwen2、Qwen2.5接连发布，让开发者快速用上最先进模型的同时，获得更大控制权和调优空间，从而成为更多企业的首选。

2 天

OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o ...

3 天

通义千问Qwen2.5震撼推出：超越Llama的开源大模型新时代

在2024年9月19日的云栖大会上，阿里云CTO周靖人正式发布了通义千问的新一代开源大语言模型——Qwen2.5。这一型号以旗舰产品Qwen2.5-72B为首，声势浩大地宣告其性能超越Llama系列，稳居全球开源大模型的王座。此次发布的Qwen2.5 ...

2 天

云栖Day1重磅合集！ Qwen2.5-72B成为全球最强开源模型

机器人将是下一个迎来巨变的行业。未来，所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。

红板报 on MSN22 小时

北大AI奥数评测，o1-mini比o1-preview分数还高

Omni-MATH团队投稿量子位 | 公众号 QbitAI OpenAI的o1系列一发布，传统数学评测基准都显得不够用了。 MATH-500，满血版o1模型直接拿下94.8分。更难的奥数邀请赛AIME 2024，o1也获得83.3%的准确率。

3 天

阿里云大动作！Qwen2.5开源，百款模型上新，AI界又迎巨变？

【ITBEAR】9月19日消息，在2024年的云栖大会上，阿里云CTO周靖人揭晓了通义千问的新一代开源模型——Qwen2.5。这一全新模型系列覆盖了多种尺寸的大语言模型、多模态模型、数学模型以及代码模型，且每一尺寸模型都提供了基础版、指令跟随版及量化版，累计发布了超过100个模型。值得一提的是，旗舰版模型Qwen2.5-72B在性能上已超越了拥有4050亿参数的Llama 405B，展现了卓越的 ...

2 天

通义千问重磅开源Qwen2.5，性能超越Llama

自从2023年8月开源以来，通义在全球开源大模型领域后来居上，成为开发者尤其是中国开发者的首选模型。性能上，通义大模型日拱一卒，逐步赶超美国最强开源模型Llama，多次登顶Hugging ...

3 天

技术最牛逼的阿里，又回来了！

9月19日，一年一度的阿里云栖大会拉开帷幕，阿里现任掌舵者吴咏铭、CTO周靖人携手大模型领域当红炸子鸡月之暗面CEO杨植麟、小鹏汽车CEO何小鹏等一众明星企业创始人给业界带来了一场久违的国产自豪感。

3 天

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

Qwen2.5系列模型的开源，不仅采用了Apache2.0许可证，还提供了多种不同规模的版本，以适应不同的应用需求。此外，通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。

2 天

美国智库调研报告：中国的创新体系比人们之前了解的要“强大得多”

据悉，美国信息技术和创新基金会（The Information Technology and Innovation ...

36氪3 天

Qwen2.5登上全球开源王座，72B模型击败LIama3 405B，轻松胜过GPT-4o-mini

除3B和72B模型外，此次所有开源模型均采用Apache 2.0许可。 Qwen2.5：0.5B、1.5B、3B、7B、14B、32B和72B Qwen2.5-Coder：1.5B、7B和32B（on the way） Qwen2.5-Math：1.5B、7B和72B。直接一整个眼花缭乱，已经有网友开始用上了。相比于Qwen2系列，Qwen2.5系列主要有这么几个方面升级。

和讯网3 天

阿里云宣布开源Qwen2.5，上架超100个模型

Qwen2.5-72B模型在MMLU-rudex基准（考察通用知识）、MBPP 基准（考察代码能力）和MATH基准（考察数学能力）的得分高达86.8、88.2、83.1。Qwen2.5支持128K的上下文长度，可生成最多8K内容，支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 种以上语言。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果