软件行业资讯

中国初创公司AI模型赶超美国，DeepSeek与Moonshot AI展现强劲研发速度

 作者：软荐小编  2024-12-25 14:05:18  540

【文/观察者网赖佳琪】“中国初创企业已经显示出追赶美国人工智能（AI）模式的迹象，而且追赶的速度超出了许多业内人士的预期。”美国《华尔街日报》12月24日报道，通过比较中美两国AI公司推理模型的性能和研发速度，得出上述结论。

11月，中国私募巨头魔方量化投资的AI公司DeepSeek发布了其推理模型DeepSeek-R1的预览版。据DeepSeek介绍，该模型的能力已经接近甚至超越OpenAI今年9月发布的推理模型o1预览版。

除了DeepSeek之外，由中国互联网巨头阿里巴巴和腾讯投资的初创公司Moonshot AI（月球之暗面）表示，他们已经开发了一种专门针对数学的模型，其能力接近o1。阿里巴巴还表示，自己的一个实验模型在解决数学问题方面比美国模型的预览版表现更好。

《华尔街日报》表示，目前很难验证这些中国公司的说法，因为这些公司尚未发表描述其模型的论文，目前也没有商定的单一测试来评估人工智能模型的能力。尽管如此，一些美国专家表示，他们“印象深刻”。

“中国正在更快地追赶。”前 OpenAI 研究员、现 AI 企业家 Andrew Carr 表示，DeepSeek 研究人员“在几个月内就弄清楚了 OpenAI 推理模型，坦白说，我的许多同事对此感到惊讶。”

《华尔街日报》使用今年美国数学竞赛AIME中的15道题进行了测试。他们发现OpenAI的推理模型仍然比几家中国公司的推理模型更快地找到答案。测试结果显示，OpenAI模型在10秒内给出答案，而DeepSeek则需要2分钟多。

不过，该报仍然赞扬了 DeepSeek 的表现，称在目前许多 AI 模型都被简单的数学问题难住的情况下，DeepSeek 能够第一时间得到正确答案是“一项壮举”。

中国AI几个月就赶上了，“我们很惊讶”__中国AI几个月就赶上了，“我们很惊讶”

深思官方网站

中国AI企业能够在短时间内取得“壮举”，原因是多方面的。

与许多美国公司不同，大多数中国公司更喜欢与其他企业和软件开发商共享底层代码。这种共享代码的行为在AI领域被称为“开源”。《纽约时报》表示，开源一直是计算机软件、互联网以及当前人工智能发展的基石，因为开源的支持者认为，当代码免费供任何人检查、使用和改进时，技术会进步得更快。

“开源技术是中国的战略优势。”美国《科技时报》12月17日称，中国企业允许任何人访问模型源代码，这可以触发创新并在全球范围内建立开发者社区。这不仅促进了技术的进步，也让中国的模式出现在全球AI版图上。

《纽约时报》也指出了开源模式给中国带来的优势。该报称，2023年底，发现李开复创办的AI公司01.AI（零一千物）使用美国公司meta的开源模型构建其AI系统。但转折点出现在六个月后。当时01.AI发布了新一代模型，美国斯坦福大学团队也在同期推出了Llama 3-V开源模型。但随后很快就被爆出Llama 3-V与中国大型模型公司Wallface Intelligence开源成果MiniCPM-Llama3-V 2.5几乎相同的模型架构和代码，引发“抄袭”嫌疑。

该报指出，这与01.AI去年面临的争议相反：中国开发者不再基于美国技术构建，而是美国开发者正在基于中国技术构建。

总部位于纽约的AI公司Hugging Face首席执行官Clément Delangue表示，随着美国监管机构限制美国的开源项目，中国的开源模式已成为黄金标准。事情可能会成为常态，“如果这种趋势持续下去，美国将面临越来越多的挑战”。

为了遏制中国发展人工智能的能力，美国政府从2022年开始限制中国获得全球最先进的人工智能芯片。今年12月，即将卸任的拜登政府再次收紧对华人工智能芯片出口。

不过，《华尔街日报》称，中国开发商已经找到了解决办法。 Moonshot AI创始人杨志林表示，公司专注于强化学习（Reinforcement Learning，一种机器学习方法），模仿人类试错。据介绍，这种方法可以在提高性能的同时降低计算能力的使用强度。

据《华尔街日报》报道，自去年年底以来，人工智能开发人员越来越多地使用一种称为“混合专家模型”（MoE）的技术。该技术将问题引导给专门的子模型或“专家”来解决，就像厨师向厨房里的意大利厨师点意大利面一样。这一工艺也降低了对芯片的要求。

腾讯的混合专家模型于今年11月发布。据称该型号的性能可与 meta 今年 7 月推出的 Llama 3.1 型号相媲美。审阅两家公司论文的研究人员表示，腾讯的模型可能仅使用 meta 约 1/10 的计算能力进行训练。

DeepSeek 在 2021 年使用 10,000 个 NVIDIA A100 芯片构建了用于 AI 训练的 Fire-Flyer 2 集群。今年8月，DeepSeek在一篇论文中表示，Fire-Flyer 2的性能接近Nvidia包含类似芯片的系统，但DeepSeek的系统成本更低，消耗的能源也更少。

美国人工智能初创公司 Anthropic 联合创始人杰克·克拉克 (Jack Clark) 在博客中写道：“中国规避出口管制的一种方法是利用其拥有的硬件构建非常好的软件和硬件训练堆栈。 ”、“就像电动汽车、无人机等技术一样，中国制造将在AI模式中占有一席之地。”

《华尔街日报》指出，尖端芯片的缺乏和融资困难仍然是中国AI企业面临的重大挑战。但接受该报采访的一位中国人工智能公司高管将其比作戴着镣铐跳舞，并表示“专注于我们擅长的领域是生存并可能获胜的唯一机会。”

《科技时报》表示，美国和中国在AI生态系统中的竞争类似于过去Windows和iOS操作系统之间的竞争。获胜者可能会主导数字行业，并在未来几年影响全球市场和用户行为。尽管美国的制裁难以打破，但中国更注重开源模式和国内创新，使其成为全球最大的人工智能强国之一。 “全世界都在等着看中国能否超越西方竞争对手。”

下一篇： 马斯克xAI完成60亿新融资，英伟达与AMD领投，总融资额达120亿美元
上一篇： 极目银河公司暴雷事件揭秘：CEO自白信曝光，员工被拖欠巨额薪资

软件行业资讯

中国初创公司AI模型赶超美国，DeepSeek与Moonshot AI展现强劲研发速度

相关内容查看全部 

OpenAI最新o3和o4

韩国科学家研发新

特斯拉Cybercab自

妙鸭相机AI写真火

2025年大模型应用

360织语升级为360

松应科技融资历程

快手2024年财报：

AI终端智能觉醒：

OpenAI O3和o4-mi

中国初创公司AI模型赶超美国，DeepSeek与Moonshot AI展现强劲研发速度

相关内容 查看全部 

相关内容查看全部 