IPRally巧用Google Kubernetes Engine和Ray改善AI

news2024/11/15 21:37:51

专利检索平台提供商 IPRally 正在快速发展,为全球企业、知识产权律师事务所以及多个国家专利和商标局提供服务。随着公司的发展,其技术需求也在不断增长。它继续训练模型以提高准确性,每周添加 200,000 条可供客户访问的可搜索记录,并映射新专利。

随着每年发布数百万份专利文件,并且这些文件的技术复杂性不断增加,即使是经验最丰富的专利专业人士也可能需要花费几个小时的研究才能使用传统专利检索工具解决案件。 2018 年,芬兰公司 IPRally 开始采用基于图的方法来解决这个问题。

IPRally如何通过Google Kubernetes Engine 和 Ray利用AI?

“专利搜索引擎大多是复杂的布尔型搜索引擎,您需要花费数小时构建复杂的查询,”这家拥有 50 名员工的公司的首席技术官兼联合创始人 Juho Kallio 说道。 “我想打造一些重要且具有挑战性的东西。”

该公司利用机器学习 (ML) 和自然语言处理 (NLP),将超过 1.2 亿份全球专利文档的文本转换为嵌入可搜索向量空间的文档级知识图。现在,专利研究人员可以在几秒钟内收到相关结果,其中包括人工智能选择的关键信息亮点和可解释的结果。

为了满足这些需求,IPRally 使用Google Kubernetes Engine (GKE) 和开源 ML 框架Ray构建了一个定制的 ML 平台,平衡了效率、性能并简化了机器学习操作 (MLOps)。该公司使用开源KubeRay在 GKE 上部署和管理 Ray,这使他们能够利用经济高效的 NVIDIA GPU Spot 实例进行探索性 ML 研究和开发。它还使用 Google Cloud 数据构建块,包括Cloud Storage和Compute Engine永久性磁盘。接下来将扩展到 Ray Data 和BigQuery的大数据解决方案。

“Ray on GKE 有能力在未来支持我们任何规模和任何类型的分布式复杂深度学习,”Kallio 说。

专为提高性能和效率而构建的定制机器学习平台

IPRally 工程团队的主要关注点是研发以及如何继续改进其 Graph AI,以使技术知识更容易获取。只需两名 DevOps 工程师和一名 MLOps 工程师,IPRally 就能够以 GKE 和 Ray 作为关键组件构建自己的定制 ML 平台。

作为开源的大力支持者,IPRally 在计算需求增长时将所有内容都转移到了 Kubernetes。然而,他们不想自己管理 Kubernetes。这促使他们选择了 GKE,因为它具有可扩展性、灵活性、开放生态系统以及对各种加速器的支持。总而言之,这为 IPRally 提供了性能和成本之间的适当平衡,以及计算资源的轻松管理以及在不需要时有效缩减容量的能力。

“GKE 提供了我们满足这些复杂的培训和服务需求所需的可扩展性和性能,并且我们获得了对数据和计算的正确控制粒度,”Kallio 说。

Kallio 强调的一项特殊的 GKE 功能是容器镜像流,它显着加快了启动时间。

“我们已经看到 GKE 中的容器镜像流对于加快我们的应用程序启动时间具有重大影响。图像流帮助我们将提交后训练作业的启动时间缩短了 20%,”他分享道。 “而且,当我们能够重复使用现有的 Pod 时,我们可以在几秒钟而不是几分钟内启动。”

下一层是 Ray,该公司使用它来扩展用于机器学习的分布式并行 Python 和 Clojure 应用程序。为了更轻松地管理 Ray,IPRally 使用 KubeRay,这是一种可以简化 Kubernetes 上的 Ray 集群管理的专用工具。 IPRally 使用 Ray 执行最高级的任务,例如大规模数据预处理和研发中的探索性深度学习。

“Ray 和 GKE 自动缩放之间的互操作性平稳且强大。我们可以不受任何限制地组合计算资源。”Kallio 说道。

最重的 ML 负载主要部署在配备 8 个 NVIDIA L4 GPU 的G2 虚拟机上,配备多达 8 个NVIDIA L4 Tensor Core GPU,为 AI 推理工作负载提供尖端的性价比。通过在 GKE 中利用它们,IPRally 有助于按需创建节点,根据需要扩展 GPU 资源,从而优化其运营成本。每个区域都有一个由 Terraform 提供的 Kubernetes 集群,用于 IPRally 搜索廉价的现货实例。然后,GKE 和 Ray 介入进行计算编排和自动扩展。

为了进一步简化 MLOps,IPRally 在 KubeRay 和 Ray 之上构建了自己的精简编排层 IPRay。该层为数据科学家提供了一个命令行工具,可以轻松配置模板化的 Ray 集群,该集群可以有效地向上和向下扩展,并且可以在 Ray 中运行作业,而无需了解 Terraform。这个自助服务层减少了摩擦,让工程师和数据科学家能够专注于他们更高价值的工作。

技术为强劲增长铺平道路

通过选择 Google Cloud 和开源框架,IPRally 表明初创公司无需花费数百万美元即可构建企业级 ML 平台。从一开始就专注于提供强大的 MLOps 和自动化基础,这在效率和团队专注于研发的能力方面带来了回报。

IPRally 的 ML 工程师 Jari Rosti 表示:“用最好的部件打造灵活的 ML 基础设施是非常值得的。” “现在,随着我们调整基础设施以适应不断发展的现代机器学习理念,我们看到这项投资的好处成倍增加。其他年轻公司也可以通过利用 Google Cloud 和 Ray 来实现这一目标。”

此外,该公司通过使用Spot 实例节省了 70% 的 ML 研发成本。这些经济实惠的实例提供与按需实例相同质量的虚拟机,但可能会出现中断。但由于 IPRally 的研发工作负载具有容错能力,因此非常适合 Spot 实例。

IPRally去年完成了 1000 万欧元的 A 轮投资,目前正在不断吸收和处理来自全球的知识产权文档,重点是改进其图神经网络模型并构建用于专利检索的最佳人工智能平台。到2022 年,专利申请量将达到 340 万件(连续第三年增长),数据将持续流动,IPRally 可以继续帮助知识产权专业人士找到每一条相关信息。

“通过 GKE 上的 Ray,我们建立了 ML 基础,这证明了 Google Cloud 在 AI 方面的强大功能,” Kallio 说道。 “现在,我们准备探索更先进的深度学习并不断发展。”

完整原文传送门:IPRally如何通过Google Kubernetes Engine和Ray利用AI?-国外VPS网站icon-default.png?t=N7T8https://www.vps911.com/gwvpstj/1506.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1616896.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI大模型探索之路-资料篇:大模型开发相关地址信息收藏

文章目录 前言一、OpenAI大模型二、LangChain开发框架三、RAGA评估框架四、GLM大模型五、搜索服务1. Tavily Search API 六、文本LLM大模型七、多模态LLM模型八、模型排行榜1.大模型评测体系(司南OpenCompass)2.大模型排行榜(DataLearner AI&…

基于SSM的在线家教管理系统(含源码+sql+视频导入教程)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于SSM的在线家教管理系统1拥有三种角色 管理员:学生管理、老师管理、发布管理、留言管理、回复管理、订单管理等教师:我的订单、我的关注、查看回复留言、登录注…

如何加盟共享wifi项目?了解套路有哪些?

自共享wifi项目推出在市场火爆后,各路资本都看到了该项目的广阔前景,纷纷开始研发程序,想要趁机分一杯羹。但对于普通人而言,独立研发程序显然不大现实,于是,共享wifi项目如何加盟便成为了绝大多数人最为关…

Sql Server 数据库:查询表结构脚本

查询脚本: SELECT CASE WHEN col.colorder 1 THEN obj.name ELSE END AS 表名, col.colorder AS 序号 , col.name AS 列名 , ISNULL(ep.[value], ) AS 列说明 , t.name AS 数据类型 , col.length AS 长度 , ISNULL(COLUMNPROPERTY(col.id, col.name, Scale), 0) AS 小数位数…

Python与数据库连接

新建表boss create table 创建表 Code import pymysqlcon pymysql.connect(hostlocalhost,\userroot,\password,\port3306,\dbbusiness) cursorcon.cursor() cursor.execute(create table if not exists boss(id int auto_increment primary key,name varchar(20)not null…

可持续发展:制造铝制饮料罐要消耗多少资源?

铝制饮料罐是人们经常使用的日常用品,无论是在购物、午休还是在自动售货机前选择喝什么的时候,很少有人会想知道装他们喝的饮料的罐子到底是如何制成的,或者这些铝罐的原材料是如何进出的。 虽然有化学品和一些合金进入铝饮料罐制造过程或成为…

成都直播产业园「天府锋巢」电商流量深度变现,助力企业降本增效

天府锋巢园区环境 天府锋巢直播基地 其他重点特色产业服务 等您来解锁! 「锋巢资讯 聚焦天府 诚邀企业 敬请关注」

Java中的BIO、NIO与AIO

1.概述 I/O 模型简单的理解:就是用什么样的通道进行数据的发送和接收,很大程度上决定了程序通信的性能。Java 共支持 3 种网络编程模型 I/O 模式:BIO、NIO、AIO。 2.Java BIO Java BIO(Blocking I/O):是传统的java io 编程&#…

java Web-Spring AOP

AOP的概念 AOP:面向切面编程,面向方法编程。简单理解就是对特定方法的扩充的思想 例如我们要在特定方法进行方法的执行时间判断,我们假如去使用在每个方法去进行业务逻辑扩充,这样就太繁琐了,而使用AOP就可以简化操作。Spring A…

vue3中web前端JS动画案例(四)侧边栏横幅效果-右下角广告-淘宝案例

myJsAnimation.js, 这里使用了上次封装的动画方法,并进行了改造 /*** 动画的函数* dom 当前对象* JSON 传入元素对象的属性 {"width": 300, "opacity": 50}* * -------------------- 多物体运动,同时运动 ---传入JSON-------------*…

Unity Shader 图形学【笔记一】

游戏图形学 源自:计算机图形学 涵盖:图形、动画的创建渲染展示 目标:性能优化、提高视觉质量,增强用户体验 技术:三维模型、纹理、光照、阴影、特效、动画、物理模拟、碰撞检测等 Unity Shader 是:un…

力扣-1844.将所有数字用字符替换

思路: 1. class Solution::定义了一个名为 Solution 的类,用于包装解决问题的方法。 2. def replaceDigits(self, s: str) -> str::定义了一个名为 replaceDigits 的方法,该方法接受一个字符串 s 作为参数&#x…

gitee / github 配置git, 实现免密码登录

文章目录 怎么配置公钥和私钥验证配置成功问题 怎么配置公钥和私钥 以下内容参考自 github ssh 配置,gitee的配置也是一样的; 粘贴以下文本,将示例中使用的电子邮件替换为 GitHub 电子邮件地址。 ssh-keygen -t ed25519 -C "your_emai…

Kotlin语法快速入门--条件控制和循环语句(2)

Kotlin语法入门–条件控制和循环语句(2) 文章目录 Kotlin语法入门--条件控制和循环语句(2)二、条件控制和循环语句1、if...else2、when2.1、常规用法2.2、特殊用法--并列:2.3、特殊用法--类型判断:2.4、特殊…

OLED透明屏的寿命如何?

OLED透明屏的寿命一般在20年左右,但如果是旧款,其寿命可能会缩短至15年左右。然而,这个数字并不是绝对的,因为不同用户的使用和保养方法会导致OLED透明屏的寿命出现延长或缩短。例如,长时间使用或在强光、高对比度高亮…

力扣刷题学习python(跟随视频学着刷)

使用入门 视频链接 【手把手带你刷Leetcode力扣|各个击破数据结构和算法|大厂面试必备技能【已完结】-哔哩哔哩】 https://b23.tv/vIcRT61 时空复杂度 时间: 空间:主要有O(1)和O(n)两种 数组 特点:适合读多写少 操作…

Leetcode 118 杨辉三角

目录 一、问题描述二、示例及约束三、代码方法一:数学 四、总结 一、问题描述 给定一个非负整数 numRows,生成「杨辉三角」的前 numRows 行。   在「杨辉三角」中,每个数是它左上方和右上方的数的和。 二、示例及约束 示例 1&#xff1a…

SQL的基础语句

1、select语句 select colums from table_name 2、条件语句 #查询出查询出用户id为1和3的用户记录 IN 操作符允许我们在 WHERE 子句中规定多个值。 select * from student where id in (1,3) #查询出所有姓王的同学 模糊查询 like 通配符(% 任意多个字符 _单个字符) #下例…

AR HUD_VSLAM+显示技术

智能座舱的一个重要技术方向是表达与展示。HUD可以将驾驶相关的信息,如车速、导航等投射到驾驶员的视线上方,避免驾驶员的目光离开前方道路。这种显示方式可以提供关键信息的实时展示,减少驾驶员的分心。 HUD的技术原理就是通过光学系统将信息…

突破文化壁垒:海外社交媒体营销的内容创新与个性化策略

随着全球化的加速和互联网的普及,海外社交媒体营销已成为企业拓展国际市场、提升品牌影响力的重要手段。然而,如何在众多品牌中脱颖而出,吸引海外用户的关注,却是一个值得深入探讨的问题。本文Nox聚星将和大家从内容创新和个性化策…