IT Home在2月15日报道说,IT Home从英特尔开发人员区获悉,2025年(2025.0)的第一个OpenVino版本于14日正式发布。此更新重点是改进性能和对更多生成AI模型的支持。并为英特尔神经加工单元(NPU)启动关键优化。
正式说明:OpenVino 2025.0版本正式支持Flux.1图像生成模型(包括Dev和Schnell变体),并且可以通过Genai Pipeline在Intel CPU/GPU上运行。开发人员现在可以通过最智能导出通量模型,并与Text2ImagePipeline结合生成图像。鉴于通量模型对准确性变化非常敏感,我们进行了深入的优化,以确保图像生成性能和准确性。
例如,应用纱线样式之前和之后的int8定量版本。1-dev模型如下(提示词:“阿尔伯特·爱因斯坦,纱线艺术风格”,初始种子= 420,迭代量,迭代量= 20):
这次,还添加了对Image2Image和Inpainting的支持。
该新版本在LLMPipeline API中引入了对提示单词搜索解码的预览支持,这是投机解码的简化,该解码用输入提示单词本身中的直接查找机制代替了传统的草稿模型。在高度相似性的请求中,这有助于大大减少发电潜伏期。例如,可以通过问题和回答一组文档来观察性能优势,因为将从文档中生成答案,这将是迅速单词本身的一部分。
英特尔表示,目前正在努力支持和验证最新型号,包括Mistral-7b-Instruct-V0.2和Qwen2.5。 “当然,我们还支持基于骆驼和Qwen体系结构的DeepSeek蒸馏模型。”
此外,2025.0版本首次实现了NPU加速度支持,开发人员可以通过pytorch的torch.com接口调用Intel NPU计算功率。 OpenVino已经在CPU和GPU上得到了支持,并且非常接近本地OpenVino在性能方面的推断。以下是启用方法: