除夕前DeepSeek再推新品！开源多模态大模型Janus - Pro超DALL - E 3，可本地运行

 作者：软荐小编  2025-01-28 09:06:49  108

在周一华尔街的时候，对“ DeepSeek Storm”进行了深入评估，这家中国公司再次抛出了新产品：“ Wensheng Tu”模型DALL-E 3的Multi-Ee 3模型图像生成Janus-Pro的测试，也是开源的。

DeepSeek深夜发布多模态大模型图像性能跑分力压OpenAI竞品_DeepSeek深夜发布多模态大模型图像性能跑分力压OpenAI竞品_

在新年前夕的钟声响起前不久，DeepSeek工程师将Janus Pro 7b和1.5b型号上传到了“拥抱的面孔”平台上。这两种型号已升级到去年10月发布的Janus模型。

_DeepSeek深夜发布多模态大模型图像性能跑分力压OpenAI竞品_DeepSeek深夜发布多模态大模型图像性能跑分力压OpenAI竞品

15亿和70亿个参数的数量意味着这两个模型有可能在消费者级计算机上本地运行。像R1一样，Janus Pro使用MIT许可证，并且对商业用途没有任何限制。

根据DeepSeek的说法，Janus-Pro是一个新型的自我回归框架，它统一地理解并产生了多模式的理解。通过将视觉编码分为“理解”和“生成”的两个路径，它仍然使用单个变压器体系结构来处理它来求解先前方法的局限性。这种分离不仅减轻了视觉编码器在理解和产生时的性格冲突，还可以提高框架的灵活性。

_DeepSeek深夜发布多模态大模型图像性能跑分力压OpenAI竞品_DeepSeek深夜发布多模态大模型图像性能跑分力压OpenAI竞品

从报告给出的“运行点”数据来看，在一些Wensheng Tuji标准测试中，Janus-Pro 70亿参数模型优于DALL-E 3，稳定性AI的稳定扩散3-稳定性AI的稳定性扩散3-稳定性AI。

（来源：技术报告）

OpenAI最新o3和o4