推荐7*24快讯

阿里云确认李飞飞团队的s1模型是基于Qwen训练

游客 / 02-06 / 0 评论 / 6 阅读 /0 赞

区小号 2月6日消息，据新浪科技，李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型，该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似，引发广泛关注。不过很快，该s1模型被指“并非从零开始训练”，其基座模型为“阿里通义千问(Qwen)模型”。对此，记者向阿里云方面求证，阿里云方面确认了这一消息，并回应称：“他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，在16块H100GPU上监督微调26分钟，训练出新模型s1-32B，取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比o1-preview高出27%。”

本文来自投稿，不代表本站立场，如若转载，请注明出处：https://quxiaohao.com/7_24kuaixun/131897.html

某交易者通过交易TST获利达120万美元

« 上一篇 02-06

AXIOS：美国白宫呼吁社会对人工智能政策提供意见

下一篇 » 02-06

发表评论

成为第一个评论的人

阿里云确认李飞飞团队的s1模型是基于Qwen训练

相关推荐

CryptoQuant CEO：PoliFi或将成为加密行业杀手级应用

7*24快讯 1阅读

IntoTheBlock：昨日27.2亿枚USDT流入交易平台，创2022年6月以来最大净流入

7*24快讯 1阅读

Binance平台BERA资金费率达下限-2%

7*24快讯 4阅读

Tornado Cash开发者Alexey Pertsev获暂时释放

7*24快讯 3阅读

发表评论

作者信息

置顶文章

标签TAG

# Bitcoin

# Instagram

# Facebook

# Meta

# OpenAI

# DeFi

# 莱特币

# Uniswap

# Doge

# Solana

# 比特币

# 数字货币

# 以太坊

# DOGE

# 加密货币

热点文章

您还未登录

登录体验更多功能

相关推荐

CryptoQuant CEO：PoliFi或将成为加密行业杀手级应用

7*24快讯 1阅读

IntoTheBlock：昨日27.2亿枚USDT流入交易平台，创2022年6月以来最大净流入

7*24快讯 1阅读

Binance平台BERA资金费率达下限-2%

7*24快讯 4阅读

Tornado Cash开发者Alexey Pertsev获暂时释放

7*24快讯 3阅读

发表评论

作者信息

置顶文章

标签TAG

# Bitcoin

# Instagram

# Facebook

# Meta

# OpenAI

# DeFi

# 莱特币

# Uniswap

# Doge

# Solana

# 比特币

# 数字货币

# 以太坊

# DOGE

# 加密货币

热点文章