在春节期间,AI圈子中引发了有关DeepSeek的风暴。
根据彭博社的最新报告,Microsoft安全研究人员于去年秋天发现,一些与DeepSeek有关的人通过Openai API提取了数据。
熟悉此事的人们表明,作为技术合作伙伴和Openai最大的黄金大师,Microsoft在发现这种情况后立即告知Openai。
据报道,这种行为可能违反了Openai的服务条款。因为OpenAI的服务条款清楚地规定,用户必须使用自动化或程序化方法从其服务中提取数据。
即使DeepSeek获得了某种形式的API访问权限,但使用方法超出了OpenAI的范围,例如非法或未经授权的商业目的,它也可以被视为违反服务条款。
此外,根据《外国媒体金融时报》的报道,OpenAI声称有证据表明,中国AI AI DeepSeek使用OpenAI模型开发了自己的开源AI产品,这可能违反OpenAI的服务条款。
Openai认为,DeepSeek的行为超出了可接受的范围,因为他们使用OpenAI的技术来创建竞争性产品。
关于相关的评论请求,Openai没有回应,微软拒绝发表评论,而DeepSeek Fang没有回应。
值得一提的是,在许多外部人士之前,通过模型蒸馏技术,DeepSeek可以在培训过程中使用诸如Chatgpt之类的模型的输出数据作为培训材料,并且这些数据中的“知识”迁移到DeepSeek自己的模型本质
实际上,这种方法在AI领域并不少见。
但是,发问者注意DeepSeek是否使用OpenAI模型的输出数据而没有足够的披露。这似乎反映在DeepSeek-V3的自我意识中。
早些时候,用户发现在询问模型的身份时,它将自己误认为是GPT-4。
在最新Model R1的技术报告中,DeepSeek团队清楚地指出,未使用OpenAI模型的输出数据,据说高性能是通过加强学习和独特的培训策略来实现的。
例如,采用了多阶段训练方法,包括基本的模型培训,加强学习(RL)培训,罚款等。这种多阶段循环训练方法有助于模型在不同阶段吸收不同的知识和能力。
彭博社报道说,美国AI事务总监戴维·萨克斯(David Sacks)最近在接受福克斯新闻(Fox News)采访时说,有“确切的证据”表明,DeepSeek使用OpenAI模型的输出数据来开发自己的技术。
但是,麻袋没有提供具体的证据。最近,许多美国官员还说,DeepSeek被怀疑“盗窃”,并正在对其影响力进行国家安全调查。
对于戴维·萨克斯(David Sacks)的讲话而言,Openai的回应更加保守。他的发言人说:“我们知道,来自中国和其他公司的公司一直在试图“延伸”美国领导人工智能公司的模式。”
发言人强调,作为AI领域的领导者,Openai采用了相应的对策来保护其知识产权,包括严格筛选切割 - 边缘能力,确定可以公开发布哪些功能。他们认为,与美国政府的密切合作对于保护最先进的AI模型至关重要。
就像有争议的风暴继续发酵时,外国媒体的眼睛开始转向DeepSeek早些时候发布的开源V3模型,而后者则通过技术报告揭示了相关的Deep -Bottom优化细节。
根据外国媒体的报道,V3模型的开发甚至绕过了CUDA并优化了NVIDIA GPU低级别的组装语言PTX,从而实现了最高的性能。
PTX是NVIDIA GPU的中间指令集体系结构,它可以实现细化的优化,例如寄存器分布,螺纹/线束电平调节。如果CUDA是一种与NVIDIA GPU进行交谈的“高级语言”,那么PTX就像“机器的底语”。
想象一下您正在玩游戏机。通常,我们只需要玩手柄(就像Cuda一样)。这很方便,但它可能无法发挥游戏机的全部力量。
PTX就像打开游戏机的后盖,直接调整内部各种配件和线条。尽管这很复杂,您需要了解很多专业知识,但您可以使游戏机器运行更快并具有更好的性能。
一个更流行的解释是,PTX是一种工具,它允许开发人员“打开GPU”并直接调整其内部操作方法。这就像一辆改装的汽车,不是简单地踩在加速器上,而是直接调整发动机的每个部分以挤压最高性能。
在训练V3模型时,DeepSeek重新配置了H800 GPU,包括将20个SM分配用于间服务器的通信,并实现了组装线算法,并且优化能力远远超过了常规CUDA开发的水平。如果这项技术是正确的,它可能会震动长期建造的护城河。
照片屏幕截图来自DeepSeek V3技术报告
但是,尽管PTX可以极大地优化性能,但它也为开发团队提出了更高的要求。相比之下,NVIDIA的Hugu River Cuda仍然是大多数开发人员的开发方便和快速迭代的首选。
更重要的是,PTX优化通常需要自定义特定模型的硬件。
尽管这种“定量裁缝”优化策略具有重大影响,但它大大增加了开发困难和维护成本。这也解释了为什么CUDA仍将在可预见的未来的主流发展中占主导地位。
但是,在现有规则之外寻求突破通常是颠覆的开始。可能有望在国内外的技术浪潮利用整个AI产业链的现有订单。