解锁 LLM 新高度,拓宽模型新边界 —— OpenVINO™ 2024.1 赋能生成式 AI 高效运行...

news2024/11/20 7:12:10

点击蓝字

关注我们,让开发变得更有趣

作者 | 武卓博士 英特尔 OpenVINO™ 布道师

排版 | 李擎

f11ee4c9a60d89f25015dbae702608e5.png

Hello, OpenVINO™ 2024.1

欢迎来到 OpenVINO™ 2024.1!  

OpenVINO™ 工具套件的每一次升级,都意味着我们在 AI 推理与部署的前沿领域迈出了新的步伐,不仅释放了更多创新潜力,也巩固了其市场地位。如今,我们满怀欣喜地向您呈现 OpenVINO™ 2024.1 版本的全新特性,并继续履行我们的承诺:为全球开发者打造更强劲、更灵活、更易用的开发工具。

OpenVINO™ 2024.1 版本的推出,深深植根于广大开发者社区的坚实反馈与我们对于未来发展的明晰构想。这一版本旨在进一步赋能开发者,通过优化大语言模型(LLM)的性能、拓宽模型的支持范围,以及简化跨越各类平台(无论云端还是本地环境)的部署流程,从而全方位提升开发体验与效率。接下来,我们将逐一对本次推出的关键更新进行详述:

OpenVINO™

大语言模型推理的改进

19176648d824d18584f732ccf4e761e4.gif

LLM 的发展仍保持着惊人的速度。尽管现有的 LLM 已经具备强大的功能,但通过 OpenVINO™ 的优化和推理加速,可以对这些复杂模型的执行进行精炼,实现更快、更高效的处理,减少计算开销并最大限度发挥硬件潜力,这将直接导致 LLM 实现更高的吞吐量和更低的延迟。

通过采用压缩嵌入实现额外优化,有效地缩减了 LLM 的编译耗时与内存占用。与此同时,基于英特尔®锐炫™GPU,以及英特尔®高级矩阵扩展(Intel® AMX)的第4代和第5代英特尔®至强®平台之上,LLM 的第一个 token 处理性能得到了显著提升。

通过 oneDNN 可实现更好的 LLM 压缩与性能提升。如今,经过量化或压缩后的 INT4 和 INT8 精度的 LLM 可在英特尔®锐炫™GPU 上得到支持。在搭载集成 GPU 的英特尔®酷睿™Ultra 处理器上,针对部分小型 GenAI 模型显著减少了内存消耗。

此外,现在可以在 PyTorch 模型进行训练后量化之后,对其进行微调,以提高模型精度并简化从训练后量化过渡到训练感知量化的过程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

OpenVINO™

更多生成式 AI 覆盖范围和框架集成

864005439c54ba113a36ae980f255a33.gif

进一步深入了解搭载 OpenVINO™ 的生成式 AI,该新版本拓宽了生成式AI的边界,使其能够覆盖更广泛的神经网络架构与应用场景。

针对最新发布的最先进的 Llama 3 和 Phi3 模型, OpenVINO™ 对其实现了支持和优化。

具备混合专家(MoE)架构的 LLM 模型 Mixtral 以及 URLNet 模型,均针对英特尔®至强®处理器进行了性能提升优化。

文生图模型 Stable Diffusion 1.5以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,则专为搭载了集成 GPU 的英特尔®酷睿™Ultra 处理器进行了推理速度的改进和优化。

现在,OpenVINO™ 已支持 Falcon-7B-Instruct,这是一款即用型、具备优秀性能指标的生成式AI大语言模型,适用于聊天与指令场景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及带有 OpenVINO 和 LangChain 的 RAG 系统。

我们还在 OpenVINO Notebooks 存储库中提供了 Jupyter Notebook 示例。

OpenVINO™

新平台的更改和现有平台的增强

062ec65d15f0dee229401c536b21b4d3.gif

除了 PyPI 上的主 OpenVINO™ 软件包外,英特尔®酷睿™Ultra 处理器的预览 NPU 插件现在在  OpenVINO™ 开源 GitHub 存储库中可用。

现在,可以通过 npm 存储库更轻松地访问  JavaScript API,使 JavaScript 开发人员能够无缝访问 OpenVINO™ API。我们扩展了文档,可帮助开发人员将他们的 JavaScript 应用程序与  OpenVINO™ 集成。

现在,默认情况下已在 ARM 处理器上为卷积神经网络(CNN)启用 FP16 推理。在多种 ARM 设备上,已显著提升了众多模型的性能。已实现与 CPU 架构无关的构建,旨在为不同 ARM 设备提供统一的二进制分发。

OpenVINO™

新增和更新的 Notebook

387b24c5b206ec8a9d7cfa6940e0ff41.gif

OpenVINO™ Notebooks 仍然是非常有价值的资源,用于展示如何利用 OpenVINO™ 在人工智能领域实现重要进展。最近,我们对 OpenVINO™ notebooks 存储库做了一些改动,包括将默认分支从 'main' 更改为 'latest',以及对 "notebooks" 文件夹内 notebook 的命名结构进行了改进

OpenVINO™ Notebooks:

https://github.com/openvinotoolkit/openvino_notebooks/tree/recipes/recipes/automated_self_checkout

使用 GitHub Pages 上的本地 README.md 文件和  OpenVINO™ Notebook 浏览内容。

GitHub Pages:

https://openvinotoolkit.github.io/openvino_notebooks/

新近添加并更新了以下Notebook

  • Grounded Segment Anything

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/grounded-segment-anything/grounded-segment-anything.ipy

  • Visual Content Search with MobileCLIP 

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/mobileclip-video-search/mobileclip-video-search.ipynb

  • yolov9-optimization

    https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/yolov9-optimization

  • Yolo V8 Oriented Bounding Box Detection Optimization 

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/yolov8-optimization/yolov8-obb.ipynb

  • Magika: AI powered fast and efficient file type identification 

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/magika-content-type-recognition/magika-content-type-recognition.ipynb

  • Keras Stable Diffusion 

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/stable-diffusion-keras-cv/stable-diffusion-keras-cv.ipynb

  • RMBG background removal 

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/rmbg-background-removal/rmbg-background-removal.ipynb

  • AnimateAnyone: pose guided image to video generation 

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/animate-anyone/animate-anyone.ipynb

  • LLaVA-Next visual-language assistant

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/llava-next-multimodal-chatbot/llava-next-multimodal-chatbot.ipynb

  • TripoSR: single image 3d reconstruction

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/triposr-3d-reconstruction/triposr-3d-reconstruction.ipynb

  • RAG system with OpenVINO and LangChain

    https://github.com/openvinotoolkit/openvino_notebooks/blob/latest/notebooks/llm-rag-langchain/llm-rag-langchain.ipynb

  • Hello, NPU! 

    https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/hello-npu

OpenVINO™

30cb76118e897c2043679d86eb53df54.png

感谢您,我们的开发者和贡献者!       

26116e397455849f24ac71c7659023aa.png

在我们欢庆 OpenVINO™ 取得的最新成就之际,真正应被受到关注的是所有贡献者的集体努力! 你们宝贵的贡献不仅丰富了 OpenVINO™ 工具套件,更推动了整个社区的发展,营造出一个充满创新与协作氛围的环境。我们对所有作出贡献的个人深表谢意,无论他们是以直接提交代码的方式,还是通过在我们社区中开展活跃的思想交流。

展望未来,我们比以往任何时候都更加兴奋能与您一起继续这一旅程!

我们鼓励经验丰富的开发人员和新开发人员继续做出贡献,您独特的视角和创新理念将把 OpenVINO™ 塑造成一个伟大的工具,使开发人员能够将他们的 AI 愿景变为现实。

OpenVINO™

通知和免责声明 

英特尔技术可能需要启用的硬件、软件或服务激活。 

没有任何产品或组件可以绝对安全。 

您的成本和结果可能会有所不同。 

© 英特尔公司。英特尔、英特尔徽标和其他英特尔标志是英特尔公司或其子公司的商标。其他名称和品牌可能是其他公司的财产。

OpenVINO™

--END--

点击下方图片,让我们一起成为“Issues 猎手”,共创百万用户开源生态!
你也许想了解(点击蓝字查看)⬇️➡️ 隆重介绍 OpenVINO™ 2024.0: 为开发者提供更强性能和扩展支持➡️ 隆重推出 OpenVINO 2023.3 ™ 最新长期支持版本➡️ OpenVINO™ 2023.2 发布:让生成式 AI 在实际场景中更易用➡️ 开发者实战 | 介绍OpenVINO™ 2023.1:在边缘端赋能生成式AI➡️ 基于 ChatGLM2 和 OpenVINO™ 打造中文聊天助手➡️ 基于 Llama2 和 OpenVINO™ 打造聊天机器人➡️ OpenVINO™ DevCon 2023重磅回归!英特尔以创新产品激发开发者无限潜能➡️ 5周年更新 | OpenVINO™  2023.0,让AI部署和加速更容易➡️ OpenVINO™5周年重头戏!2023.0版本持续升级AI部署和加速性能➡️ 开发者实战系列资源包来啦!➡️ 以AI作画,祝她节日快乐;简单三步,OpenVINO™ 助你轻松体验AIGC
扫描下方二维码立即体验 
OpenVINO™ 工具套件 2024.1

点击 阅读原文 立即体验OpenVINO™ 2024.1,评论区已开放,欢迎大家留言评论!

文章这么精彩,你有没有“在看”?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1636608.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【算法刷题 | 动态规划01】5.01(动态规划理论基础、斐波那契数、爬楼梯、使用最小花费爬楼梯)

文章目录 1.动态规划理论基础1.1题目分类大纲1.2什么是动态规划?1.3背包问题1.4解题步骤1.5动态规划应该如何debug? 2.斐波那契数2.1题目2.2解法:动态规划2.2.1动态规划思路(1)确定dp数组以及下标的含义(2&…

SQL如何利用Bitmap思想优化array_contains()函数

目录 0 问题描述 1 位图思想 2 案例实战 3 小结 0 问题描述 在工作中,我们往往使用array_contains()函数来进行存在性问题分析,如判断某个数是否在某个数组中,但是当表数据量过多,存在大量array_contains()函数时,…

PHP定时任务框架taskPHP3.0学习记录7宝塔面板手动可以执行自动无法执行问题排查及解决方案(sh脚本、删除超过特定天数的日志文件、kill -9)

PHP定时任务框架taskPHP3.0学习记录 PHP定时任务框架taskPHP3.0学习记录1(TaskPHP、执行任务类的实操代码实例)PHP定时任务框架taskPHP3.0学习记录2(环境要求、配置Redis、crontab执行时间语法、命令操作以及Screen全屏窗口管理器&#xff0…

无缝对接配电自动化:IEC104转OPC UA网关解决方案

随着水电厂自动化发展的要求,具有一定规模的梯级水电站越来越多,为了实现水电站的无人值班(少人值守),并考虑到节能控制,电厂采用了集中监控。集中监控关注的是整个电网的安全稳定运行及电压、频率和整个电网的电力需求&#xff0…

中科院突破:TalkingGaussian技术实现3D人脸动态无失真,高效同步嘴唇运动!

DeepVisionary 每日深度学习前沿科技推送&顶会论文分享,与你一起了解前沿深度学习信息! 引言:探索高质量3D对话头像的新方法 在数字媒体和虚拟互动领域,高质量的3D对话头像技术正变得日益重要。这种技术能够在虚拟现实、电影…

好看流光风格个人主页源码下载

这是一款美观流光作风个人主页HTML源码,觉得挺喜欢的,需求的自行下载! 源码下载:https://download.csdn.net/download/m0_66047725/89105857 更多资源下载:关注我。

JAVA前端快速入门基础_javascript入门(02)

写在前面:本文用于快速学会简易的JS,仅做扫盲和参考作用 1.JavaScript函数 什么是函数:执行特定任务的代码块 1.1定义: 使用function来进行定义(类似于python里面的def 或者java和c里面的void,int这些返回类型开头)。定义规则如下: func…

开源、轻量、易用的服务器实时监控工具:哪吒探针

本文首发于只抄博客,欢迎点击原文链接了解更多内容。 前言 哪吒探针是一个开源、轻量、易用的服务器监控、运维工具,它有以下几个特点: 一键安装:可以一键安装面板与 Agent,并且支持 Linux、Windows、MacOS、OpenWRT…

【HMGD】使用CubeMx配置GD32F303系列单片机进行DMA ADC

原理图查看 查原理图可以看到GD32F103C8T6的官方开发板GD32303C-START-V1.0的PA1没有接任何东西 使用PA1作为ADC端口 CubeMX配置ADC和时钟 配置ADC通道 启用循环模式 配置此通道ADC分频 配置ADC DMA为循环模式 配置时钟 可根据手册配置最大HZ GD32F303最高频率设定 生成…

使用SDRPI运行openwifi和设置网口

目录 一 制作启动盘 二 使用串口的方式启动openwifi 三 无线连接 四 网口设置,有线连接 五 使用SSH登录 一 制作启动盘 在github上下载img文件,由于github上下载速度比较慢,我会上传网盘链接 githun下载img文件地址: https://git…

【Schrödinger薛定谔软件使用实战】- 4lyw蛋白实战

文章目录 软件选择1 pretein preparation1.1 import and process注意1.1.1 preprocess可能遇到的问题 1.2 review and modify1.3 refine1.3.1 optimize优化氢键网络1.3.2 minimize 氢原子会进行能量最小化 2 ligand prepare3 生成对接盒子-receptor grid generation3.1 recepto…

假设检验随想

⭐️ 前言 你会吵架吗?你会用数学吵架吗,不会的话就过来看看吧,哈哈 西方人发明了现代意义上的概率论,于是就想把它推广到生产和生活中。借助一大堆的概率论中的概念,他们发明了假设检验,想利用有限的数据…

Unity 实现新手引导遮罩

Unity 复写OnPopulateMesh 实现新手引导遮罩、包含点击事件触发区域判断 https://download.csdn.net/download/shenliang34/89247117

在线听歌播放器 梨花带雨网页音乐播放器 网页音乐在线听 源码

最新梨花带雨网页音乐播放器二开优化修复美化版全开源版本源码下载 下 载 地 址 : runruncode.com/php/19749.html 梨花带雨播放器基于thinkphp6开发的XPlayerHTML5网页播放器前台控制面板,支持多音乐平台音乐解析。二开内容:修复播放器接口问题&am…

开启HIVE JDBC连接

开启HIVE JDBC连接 没有人能替你承受痛苦 也没有人能抢走你的坚强 目录 开启HIVE JDBC连接 1.开启命令 2.连接命令 3.hive连接jdbc报错 4.查看服务是否启动 》》》》》》开启HIVE JDBC连接《《《《《《 1.开启命令 hive --service hiveserver2 2.连接命令 beeline -u j…

动静态库(完结版)

文章目录 接上篇完成blog第三方库安装演示动态库加载原理一二三四 接上篇完成blog 上篇链接 第三方库安装演示 sudo yum install -y ncurses-devel下载完成之后 在系统目录下面一定能找到对应的头文件和库文件 此时使用第三方库: 编译之后按错误提示是对应的函数找不到,所以链…

Gitlab安装部署

Gitlab安装部署 一、下载对应的安装包 查看Linux系统的版本信息 cat /proc/version查看Linux系统发行版信息 cat /etc/redhat-release然后下载匹配版本的 gitlab,因为 gitlab 官网下载比较缓慢,所以这里附带了清华的镜像 Index of /gitlab-ce/yum/e…

Django后台项目开发实战一

开发环境使用 Anaconda, IDE 使用 pycharm 第一阶段 创建 Django 项目 在 Anaconda Prompt 中逐步输入下面的命令(之后的所有命令都在这个) 首先创建一个虚拟环境,名称自拟,python 版本我这里使用 3.9.18 关于 python 版本和…

【补充】图神经网络前传——图论

本文作为对图神经网络的补充。主要内容是看书。 仅包含Introduction to Graph Theory前五章以及其他相关书籍的相关内容(如果后续在实践中发现前五章不够,会补上剩余内容) 引入 什么是图? 如上图所示的路线图和电路图都可以使用…

Spring Security介绍(二) 主要组件(1) SecurityConfigurer

一、介绍 1、介绍 SecurityConfigurer 在 Spring Security 中是一个非常重要的角色。在前面的内容中曾经多次提到过,Spring Security 过滤器链中的每一个过滤器,都是通过 xxxConfigurer 来进行配置的,而这些 xxxConfigurer 实际上都是 Secu…