Observer.com注意到,截至1月26日下午22点,北京时间 - 不到半天,国内AI DeepSeek(在 - 深度搜索中)在美国的Apple App Store免费名单中排名第六飙升至第三名,仅次于Chatgpt和meta的社交媒体平台,超过了Google Gemini和Microsoft Copilot等美国技术公司。
在北京时间26日的晚上10点左右,国内AI DeepSeek已升至美国的第三个Apple申请列表
1月26日,DeepSeek短期爆发了。许多网民报告说,他们在使用过程中遇到了“繁忙服务器”的提示。
作为回应,DeepSeek回答说,当地的服务波动确实在下午发生,但问题在几分钟之内就解决了。该事件可能是由于新模型发布后用户访问的激增造成的,并且服务器无法满足大量用户的并发需求。但是,官方状态页没有将事件标记为事故。
最近,DeepSeek在中国和美国的技术圈中受到了广泛的关注,甚至被认为是大型模型行业中最大的“黑马”。在外部网络上,许多人被称为“神秘的东方力量”。
DeepSeek,全名Hangzhou Deep搜索人工智能基本技术研究有限公司,于2023年7月17日成立。该公司是由一个众所周知的定量资产管理巨型幻想建立的,专注于高级大型语言的发展模型(LLM)和相关技术。
据报道,在美国榜单上的DeepSeek排名之前,它的表现并不特别出色,并且稳定上升,但并未进入前十名。这段时间的突然上升与其最近的一系列出色表现直接相关。
DeepSeek(数据图)金融时报
去年年底,DeepSeek推出了开源模型DeepSeek-V3。当时,聊天机器人竞技场数据显示,DeepSeek-V3在所有模型中排名第七,在开源模型中排名第一。它是世界上最高的成本效益模型。
DeepSeek-V3模型的核心技术创新是其快速上升的关键。该模型融合了三种技术:多头潜在注意力(MLA),混合专家体系结构(MOE)和FP8低精度培训,可显着提高性能和效率。
在本月20日,DeepSeek正式开设了R1推理模型。 1月24日,DeepSeek-R1在聊天机器人竞技场综合列表中排名第三,并与Openai的最佳推理Model O1并列。在高度难度提醒单词,代码和数学等高科技领域中,DeepSeek-R1被吸引了;在测试样式控制和难度提醒和样式控制的测试中,DeepSeek-R1与O1并列。
此外,人工分析的最初测试结果表明,DeepSeek-R1在AI分析质量指数中得分第二高,但价格约为O1的三分之一。
DeepSeek-R1 API价格图来源:迅速新闻
DeepSeek基于“低成本培训”和“成本效益”作为核心卖点。 API输入价格仅为每百万个代币0.1元,远低于Claude 3.5十四行诗(3/百万美元的代币),后者吸引了许多中小型中小型中小型开发商和企业。这种低成本的培训策略还为公司赋予了“ AI Battle”的标题,该策略甚至引发了对Nvidia等硬件制造商的讨论。
NVIDIA高级研究科学家Jim Fan公开发表了他的个人社交平台上的一条推文:“我们正处于如此历史的时刻:一家非美国公司正在继续开放的最初任务 - 通过真正的开放性切割 - 埃奇研究。不合理的,但最有趣的结局通常是最有可能的。
此外,1月24日,在匿名平台Teamblind上发表的一篇文章被疯狂地分发。一位元员工说,由于DeepSeek模型,内部meta进入了恐慌模式。
这个元员工写道:
“一切都来自DeepSeek-V3的出现。它使Llama 4在基准测试中矮小。更令人尴尬的是这样做了。
工程师正在尝试分析DeepSeek,以反对时间,并试图复制其中的所有可能的技术。这并不夸张。
管理层担心Genai R&D部门的巨额投资。该部门的高级管理人员的薪水超过了整个DeepSeek V3的培训成本,并且有数十个高管。他们如何向高级管理层解释?
DeepSeek-R1的出现使情况变得更加严重。具体的细节是机密的,不方便地披露,但很快就会进行。 “