微软、英伟达、阿里、百度“开抢”,DeepSeek成为主流标配
DeepSeek热度持续席卷全球,短短一周内,微软Azure、英伟达等海外科技巨头,以及国内阿里云、华为云、腾讯云、百度云等云厂商均宣布上线DeepSeek大模型,并以“零代码”“超低价”等优惠吸引更多用户。
2025年以来,DeepSeek陆续开源大语言模型V3、推理模型R1和多模态模型Janus Pro,因其高性能、低成本等优势,率先受到海外市场关注。作为OpenAI的“金主”之一,微软CEO纳德拉在1月29日大赞DeepSeek的创新之处,同时也为微软自身拉了一波广告:DeepSeek-R1模型可通过微软的AI平台Azure AI Foundry和GitHub获取,并承诺未来将在搭载Copilot+的电脑上运行。
1月30日,英伟达也紧随其后,宣布英伟达的开发者网站已将DeepSeek-R1模型纳入“最受欢迎的模型”栏目,可在NVIDIA NIM微服务预览版上使用。NVIDIA NIM是NVIDIA AI企业版服务的一部分,为跨云、数据中心和工作站的自托管GPU加速推理微服务提供容器,用于预训练和自定义AI 模型。
很快,国内各大互联网云服务商开始争相接入DeepSeek系列模型,并拿出“真金白银”相互竞争。
2月3日,阿里云宣布,阿里云PAI Model Gallery支持云上一键部署DeepSeek-V3和R1模型。在该平台上,用户可以零代码实现从训练到部署再到推理的全过程,简化模型开发流程,为开发者和企业用户带来了更快、更高效、更便捷的AI开发和应用体验。
同一天内,百度智能云千帆平台也正式上架DeepSeek-R1和V3模型,推出了超低价格方案,还可享受限时免费服务,登录百度智能云千帆ModelBuilder即可快速体验。同时,百度还融入自身大模型技术,比如将DeepSeek模型融合千帆推理链路,集成百度独家内容安全算子,实现模型安全增强保障。
记者了解到,包括华为云、腾讯云、360数字安全、云轴科技ZStack等多家国内AI公司已接入DeepSeek模型,相当于DeepSeek模型几乎成了主流AI云平台服务的标配。
DeepSeek一路“狂飙”的同时,AI大模型业内逐渐进入“拉力赛”。
1月29日,阿里通义千问上线旗舰级模型Qwen2.5-Max,采用超大规模MoE(混合专家)架构,基于超过20万亿token(词元)的预训练数据。阿里团队表示,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至领先的性能。随着后训练技术的不断进步,下一个版本将有望达到更高水平。
2月1日,OpenAI上线o3-mini,这是OpenAI首款支持开发者需求功能的小型推理模型,具备低成本、低延迟优势,并支持函数调用、流式传输、结构化输出等功能,还支持与搜索功能结合,能够提供最新答案并链接至相关网络资源。经过部分开发者的测试后发现,OpenAI o3-mini性能与DeepSeek R1相比没有明显优势,部分环节仍被R1反超。
(文章来源:上观新闻)
来源:东方财富网
作者:上观新闻