发布信息

DeepSeek开源Janus-Pro-7B模型,击败DALL-E 3和Stable Diffusion,引发美国国家安全调查

作者:软荐小编      2025-01-30 10:01:50     128

梁文锋就是AI界的黄峥_梁文锋就是AI界的黄峥_

Liang Wenfeng领导了DeepSeek,并继续激发大型模型行业。

在使用R1模型轰炸场之后,在1月28日凌晨,即除夕的前一天晚上,DeepSeek开设了其多模式模型Janus-Pro-7b,该模型Janus-Pro-7b宣布将在Geneval和DPG-击败DALL-E基准测试测试3(来自OpenAI)和稳定的扩散。

后来,特朗普在会议上提到,DeepSeek的出现对美国公司发出了警报,“我们需要专注于赢得比赛。”根据外国媒体报道,有一天,美国几位官员声称,DeepSeek是“盗窃”,正在进行国家安全调查。

Openai还发表声明说,众所周知,其他公司试图将美国领先公司的型号疏远。现在,他们“采取对策来保护我们的知识产权”,并表示他们将与美国政府密切合作,以保护最先进的模式。

也许Liang Wenfeng自己想不到。意外地走出海的贫民窟刺伤了更多人的神经。

一年前,当DeepSeek V2模型发布时,它开始被加冕为AI Pinduoduo的头衔。

反货物工厂的Liang Wenfeng已经复制了Huang Yan在AI领域的“后来”的故事,并引发了中国的一场大型模型价格战。

当时,在接受36氪的采访时,梁·温芬(Liang Wenfeng)说:“我们不打算成为cat鱼,但我们不小心成为cat鱼。”

如果Liang Wenfeng的cat鱼效应是证明低成本也可以受到高效培训以培训大型AI模型。去年,黄伦Xun(Huang Renxun)创造了另一种cat鱼效应,也就是说,每6个月作为一个周期,更新了较高的性能芯片,以便害怕无法抓住最新的GPU的巨人,抓住了Nvida GPU,Microsoft,Microsoft,Microsoft,Microsoft,微软,微软,微软,微软,微软,微软,微软,微软,微软,Google,meta和Musk被拖到此GPU战斗游戏中。

一年后,DeepSeek在硅谷的眼中成为了“神秘的东方力量”,并由Scale AI创始人Alexandr Wang评估。 “ AI模型发布可能会“改变一切”'

原因是DeepSeek一年前发布了新的开源模型DeepSeek R1。表演不仅赶上了OpenAI O1的完整版本,而且还使用了550万美元的培训费用来实现1亿美元的硅谷效果。

在此之前,大型模型的主流叙事是Nvidia的高端CPU“一个核心困难”。现在,Huang Renxun的销售神话迎来了Liang Wenfeng的积极影响。

由Liang Wenfeng领导的DeepSeek使华尔街重新检查。在这种生存的大型模型中,对NVIDIA芯片和高端计算能力有泡沫需求。这种担忧使NVIDIA在1月27日蒸发了近6000亿美元的市场价值。

在梁文芬(Liang Wenfeng)看来,这一切只有“按照自己的步伐做事”,然后计算成本价格。

Liang Wenfeng并不打算成为cat鱼,而是对Marc Andreessen的评估,这是一位著名的硅谷风险投资家:“作为一个开源项目,这是对世界的遥不可及的礼物。”它们节省了很多成本,并制造了许多高硅谷谷。享受这个行业巨大泡沫的公司席卷了地板。

1月28日,Openai首席执行官Ultraman终于对DeepSeek做出了回应。他称赞DeepSeek使人们令人印象深刻,尤其是在提供模型的成本效益时。随后,这些单词转过身,强调Openai将提供更好的模型并暂停一些版本。早些时候,Ultraman迅速在X上发布了第一个智能车身操作员,并开始出现即将到来的O3米尼。网民开玩笑说:“深看到的迫使Ultraman的新技巧被迫。”

梁文锋就是AI界的黄峥_梁文锋就是AI界的黄峥_

同时,根据外国媒体的突破新闻,DeepSeek的发布引发了meta的紧急加班。工程师疯狂地将代码分解了,员工爆发了其高管的薪水高于培训整个V3模型的成本。

2025年,不想成为fish鱼的梁·温芬(Liang Wenfeng)搅动了一个春天的池塘。

“大多数中国公司都用于遵循而不是创新。” Liang Wenfeng在采访中说,DeepSeek参与了以前的DeepSeek,作为对最后一项底漆的激烈讨论。在领先的技术创新游戏中。

-80年代的AI企业家邮政组织一些顶级大学的新毕业生,波西,Bo五个未毕业的实习生,一些年轻人只毕业了几年。他对团队成员说:“许多人是正确的。进行研究的愿望远远超出了金钱的照顾。”

Liang Wenfeng将DeepSeek定义为“硬核心创新”,并做最困难的事情似乎是对他领导的DeepSeek的一致理解。

在cat鱼的外观中,DeepSeek在Liang Wenfeng的眼中,内部充满了技术理想主义。

早些时候,Liang Wenfeng断言“中国必须站在技术的最前沿”。这次,DeepSeek首先踏上了海浪,但是无论是Catfish Liang Wenfeng还是“技术理想主义者” Liang Wenfeng,都有很多或许多问题要回答。

这次,DeepSeek的圆圈总是与Openai进行比较。一些网民嘲笑,“ DeepSeek生活在真正的Openai(Open Model)中,Openai居住在近距离的AI(封闭模型)中。”

实际上,Ultraman和Liang Wenfeng是典型的学术企业家。

18岁时,Kokushang Stanford大学计算机系辍学并创办了一家业务。后者毕业于朱安格大学,2015年,他建立了一种幻想。在采访中,Liang Wenfeng提到,在2022年底,当Chatgpt受欢迎时,他们开始招募。 2023年7月,Liang Wenfeng建立了DeepSeek。

_梁文锋就是AI界的黄峥_梁文锋就是AI界的黄峥

标题:出现在新闻网络的Liang Wenfeng

图片来源:字母清单的屏幕截图

Liang Wenfeng并没有否认Openai对他的灵感,甚至在许多地方都表现出与Ultraman的惊人相似之处。

在出售初创公司循环后,Ultraman创立了氢津资本。 2015年,30岁的Ultraman成为了众所周知的孵化器YC的总裁,但在AGI中(通用人工智能)并不乐观。在2015年,融资艰难的是,Ultraman发现深度学习前景是由特斯拉创立的Man Musk Co Inted Openai创立的。

Liang Wenfeng是Binance的早期成员,并建立了幻想食谱的量化。作为一名企业家,也有投资经验,Liang Wenfeng于2023年进入该局,并探索了大型制造商。许多企业家公司仅放弃了通用模式。通常,Liang Wenfeng坚定着重于基本模型的研究和突破。

同样,在早期,口袋里没有钱的Ultraman会在招聘信息中写“构建Agi”。当时这个可怕而遥远的目标吸引了大量年轻的Agi信徒。

“年轻和潜力”已成为Ultraman和Liang Wenfeng选择的常见标准。

在Liang Wenfeng的观点中,如果短期目标正在追求,那么找到现有经验是正确的。但是,如果您长期看,经验并不那么重要,基本的能力,创造力和爱情更为重要。出于这个原因,这个纯粹的本地企业家团队没有著名的技术,但没有分享企业家的看法已成为赶上Openai的最快的团队。

即使在一开始,就非营利组织而言,商业化也没有写给DeepSeek的待办事项清单。

在这方面,Ultraman和Liang Wenfeng也有相同的想法。

“当Openai的早期投资者投资于货币时,我认为不得收回多少回报,而是真正想这样做。”在采访中,Liang Wenfeng说,他必须找到一个巨大的模特来赚钱。商业原因(一家商业公司进行无限投资的研究探索)可能找不到,因为找不到它。从业务角度来看,基础研究输入的回报率非常低。

但是“一件令人兴奋的事情可能不会简单地用钱来衡量。就像在家购买钢琴一样,它可以负担得起,因为有一群人急于在上面播放音乐。”

今天,梁·温芬(Liang Wenfeng)的阿吉(Agi Dream)震惊了整个硅谷。

但是,Openai曾经是非营利组织的目的,希望与大型公司的AI霸权作斗争,Ultraman随后推出了微软的巨额投资。在Ultraman的领导下,Openai将成为一家真正的利润公司。后来的政党的Liang Wenfeng始终遵守该模型的开源,并希望有更多的人以低成本使用大型模型,即使小型应用只能由某些人掌握。

对于具有AGI包容性的Mission的Openai来说,Ultraman曾经发射过子弹。现在十年,他有了自己的眉毛。

从这个角度来看,与制作cat鱼相比,技术理想主义者的标签似乎更适合Liang Wenfeng。

但是,不想成为cat鱼的理想主义者Liang Wenfeng意外地“卷起”了所有人两次。

DeepSeek首次成为中国大型模式的价格战的根源。

2024年5月,AI不断轰炸,DeepSeek闻名。原因是他们发布了一个名为DeepSeek V2的开源模型,该模型可以称为价格屠夫:推理成本降低至每百万个令牌1元,约占Llama3 70B的七分之一,而七个则约为七个代币。 GPT-4涡轮增压七分之一。

由于成本效益,DeepSeek已成为“人工智能行业中的很多战斗”。中国的价格战是由此。

首先,明智的频谱AI遵循-up -up,入口级别的产品将价格降低,然后将旗舰模型降低到与DeepSeek相同的价格,然后Ali和Tencent随后。

虽然,除了DeepSeek的创始人Xu Jin外,还毕业于Zhu Kezhen学院,是Huang Yan的同学。 DeepSeek和Pinduoduo没有更多的交叉点。

Liang Wenfeng正在考虑“将AI成为每个人都可以使用的东西”,甚至对大型工厂的后续动作感到惊讶。这样做”

DeepSeek第二次触发了硅谷地震。

在Liang Wenfeng的领导下,Openai成熟模型的成本较低和效率再次解决了“ AI Fighting Duo”的宝座,并成功地出海了。

目前,DeepSeek尚未宣布培训推理模型R1的全部成本,但正式宣布其API定价。 R1输入为1元到1百万元,百万元,百万产量为16元。相比之下,OpenAI O1的运营成本约为前者的30倍。

梁文锋就是AI界的黄峥_梁文锋就是AI界的黄峥_

换句话说,Liang Wenfeng制作了一个大型型号,硅谷需要数亿个投资才能燃烧,不到成本的十分之一。

硅谷的振动几乎是不可避免的。除了被用来完全瞄准OpenAi外,meta还是第一个。随着“大型模型开源国之王”的元,内部员工发布了匿名新闻,即meta Generation AI部门感到恐慌,因为DeepSeek陷入了恐慌,甚至是新一代开源的开源模型Llama 4(尚未发布,正在基准测试中。已经落后于DeepSeek。

A16Z合作伙伴的成员,AI模型Mistral的成员Anjney Midha说,从斯坦福大学到麻省理工学院,DeepSeek R1成为美国顶级大学研究人员的首选模型。

同时,由Liang Wenfeng领导的Deepseek正在pming of街。

Enterprise AI Agent Developer Superpocus的联合创始人表示,与OpenAI旗舰型GPT-4相比,DeepSeek不仅提供相似的,甚至提供更好的。 “超级焦点可能会在接下来的几周内转向DeepSeek,因为可以在自己的服务器上免费下载DeepSeek,并将增加销售产品的利润率。”从海里出来。

同时,纯本地团队的底线被解雇了。 Liang Wenfeng领导了年轻的中国队。没有海外背景的硅谷巨人的叙述成为交通密码。

在大火中,Liang Wenfeng还需要回答更多新问题。

尝试让DeepSeek作为一名记者,并请Liang Wenfeng问Liang Wenfeng。这是DeepSeek的答案:

“ DeepSeek声称其模型培训成本仅是该行业的1/10,但是一些开发人员指出,这可以通过急剧降低模型参数的廉价计算能力或依靠幻想的早期ho积来实现。政党,不是一个真正的技术突破,您是否认识到“成本优势”,而不是算法创新?

令人惊讶的是,DeepSeek问的这个问题几乎可以总结DeepSeek周围的大多数争端。

就在Chatgpt出生时,Openai成为了保留良好的AI标题。 NVIDIA的GPU成为具有高性能计算能力的基础,因此Huang Renxun享有亮点。现在,DeepSeek的R1模型只能证明Liang Wenfeng有能力制作一个,Harmony Openai的最新模型几乎是同一型号。

在采访中,Liang Wenfeng不止一次地提到,他希望打破硅谷的技术垄断,并希望站在“技术的最前沿”,但制作几乎是OpenAI最新模型的模型,它远非如此真正的超越。模仿并关注Openai。

在DeepSeek的领导下,冲浪者Musk从未发表评论,但最近喜欢一条推文。

其中,该推文提到DeepSeek依靠模型蒸馏技术,您需要使用Chatgpt-4O和O1来完成培训。

尽管模型蒸馏是一种常见的技术手段,可以快速完善OpenAI中的关键点并迅速理解和应用,但此模式只能使DeepSeek接近Openai,并且很难真正超越OpenAi。

更不用说,尽管宣讲他是技术理想主义,但Liang Wenfeng背后是定量的私募股权巨头幻想,这是唯一可以保留10,000 A100 A100芯片的公司。根据十一项财务,在2023年,中国不超过5家拥有10个GPU的公司,包括幻想处方。

这恰恰是成本成本的十分之一。它也是基于Liang Wenfeng的实验室的实验室,该实验室已经投资了数亿美元进行初步研究,并拥有大型芯片。如果您想成为AI行业的大量战斗,那么对于Liang Wenfeng的道路,普通的AI企业家团队几乎很难。

梁文锋就是AI界的黄峥__梁文锋就是AI界的黄峥

标题:关于X上DeepSeek的模因图

图片来源:X平台

可以肯定的是,站在Openai巨人的肩膀上,Liang Wenfeng带领DeepSeek实现了令人惊叹的突破,但是当他能够在Openai面前推出未来一代模型,例如GPT-5,然后是Liang Wenfeng是Liang Wenfeng。技术理想aha时刻。

当时,没有坐标的Openai。 Liang Wenfeng是否可以继续依靠低成本的策略来创造出强大的绩效模型?

Liang Wenfeng介绍了自己。他在广东的第五层城市长大,父亲是一位小学老师。 “在1990年代,有很多机会在广东赚钱。当时,许多父母来到我家。父母觉得阅读是毫无用处的。但是现在我回去阅读,概念发生了变化。因为这些概念发生了变化。这笔钱不容易赚钱,即使是开车的机会也可能消失。

Liang Wenfeng充满信心。他认为,将来会有越来越多的核心创新。 “我们只需要一堆事实和一个过程。”

如今,外界期望梁·温芬(Liang Wenfeng)和迪普(Deepseek)成为其中之一。

参考材料:

“揭示深索克:一个更极端的中国技术理想主义者”秘密冲浪

“疯狂的幻想:通往隐形AI巨人的大型型号的道路”

“深山要推翻两个大山”的信件清单

相关内容 查看全部