阿里巴巴旗下的阿里云介绍了“通义千问”大语言模型的最新版本Qwen2.5 Max,称其在各项基准测试中均超越了OpenAI的GPT-4o、DeepSeek-V3和Meta的Llama-3.1-405B模型。
据《华尔街日报》报道,中国电商巨头阿里巴巴(Alibaba)发布了该公司人工智能(AI)模型的一个新版本,声称该模型在各项基准测试中均优于DeepSeek的AI模型。
阿里巴巴旗下的阿里云在一份声明中介绍了其“通义千问”(Qwen)大语言模型的这一最新版本,名为Qwen2.5 Max。
阿里云表示,根据其进行的基准测试,Qwen2.5 Max与OpenAI的GPT-4o、DeepSeek-V3和Meta的Llama-3.1-405B领先模型进行了对比,Qwen2.5-Max全部超越了对比模型。
阿里巴巴还宣布,开发者可在其聊天机器人式网络界面Qwen Chat平台免费体验Qwen2.5-Max,用户可以在该界面直接与该模型互动。
此前,中国人工智能初创公司DeepSeek引发了一场市场狂热,导致市场对最先进芯片和数据中心的需求感到担忧。
就在一周多前,DeepSeek推出了其最新的开源AI模型DeepSeek-R1。
该公司声称,DeepSeek-R1擅长解决问题,其性能与OpenAI的GPT-4o推理模型相当,但每次的使用成本却低得多。
此外,DeepSeek的AI助手应用最近在美国iPhone下载排行榜上占据首位,该应用由DeepSeek-V3提供支持。
这些情况引发了业内的安全担忧。
周二,DeepSeek表示,其服务遭到了“大规模恶意攻击”,并表示将暂时限制新用户注册。不过,现有用户可以继续像往常一样登录。
与此同时,白宫新闻秘书Karoline Leavitt在周二的一次新闻发布会上表示,美国国家安全委员会(National Security Council)将审查与DeepSeek发布的产品相关的任何潜在国家安全影响。
OpenAI的一位发言人在一份声明中承认,中国公司和其他公司“一直在试图蒸馏美国领先AI公司的模型”。
这位发言人补充说:“展望未来……至关重要的是,我们要与美国政府密切合作,最好地保护最强大的模型,使其免遭敌对方和竞争对手窃取美国技术的企图影响。”
《华尔街日报》(The Wall Street Journal)和道琼斯通讯社(Dow Jones Newswires)的母公司新闻集团(News Corp)与OpenAI之间有一项内容授权合作协议。