致敬图灵!HashData拥抱数据智能新时代!

news2024/9/29 21:29:32

图片

图1:2023ACM中国图灵大会现场

生于1912年的艾伦·图灵被称为“计算机科学之父”、“人工智能之父”。1966年,国际计算机协会(ACM)为了纪念这位卓越的科学家,设立了以其名字命名的ACM图灵奖,以表彰在计算机领域做出重大贡献的科学家。

时至今日,图灵专注创新、持续探索的精神激励着一代又一代的科学家投身计算机科学的研究,由此带动的IT技术变革也深刻影响了社会和经济的发展。

今天,新一轮人工智能科技革命和产业变革已然到来。自去年年底以来,国内众多科技企业陆续推出大模型产品,并积极推进大模型的行业落地应用。

在AI大模型火热的当下,以“通用智能,人机共生”为主题的2023ACM中国图灵大会于7月28日至30日在武汉召开。酷克数据作为国内云原生数据仓库领军企业,受邀参与本次大会。在会上,酷克数据展示了基于HashData云数仓自主研发的下一代高级分析和数据科学工具HashML,助力 AI 模型生产应用和规模化落地。

三层解耦 降低数据分析成本

AI模型训练需要依托海量的文本、图像和视频数据。如何低成本、高效率地管理与利用数据,是企业在人工智能时代面临的重要挑战。HashData云数仓通过创新的三层解耦架构设计,在保证了数据的一致性的同时,节省了更低的存储和调用资源。

图片

图2:HashData产品架构

HashData的湖仓一体特性帮助企业一站式管理多模态训练数据。产品架构完美适应混合云,最大限度帮助用户实现公域训练数据和私有训练数据的安全、合规、统一管理和调度。云架构带来的充分弹性和并发性,支持几乎无限的横向扩展,满足用户长时间、高密度的数据提取与计算的峰值需求。此外,HashData支持亿级向量存储,为大模型训练提供根本的底层支持。

同时,HashData云数仓能够充分发挥云平台的弹性和扩展能力,并且将数据持久化到底层对象存储,大幅度降低企业进行数据分析的成本。

HashData数据仓库可无缝对接多种公有云和混合云,以统一的平台提供包括数据仓库、数据湖、数据科学、数据工程和数据共享等能力,可以支持千万级的数据库对象、100+PB数据量、数千个并发应用。

此外,通过支持对象存储,HashData能够提供完全兼容多个公有云与混合云的数据管理能力,为企业多云战略的实施提供了灵活易用的解决方案。

两大引擎 高效管理海量数据

在数据智能产业链上,基础设施建设和模型生产应用是AI大模型发展的必由之路,而机器学习是Al成长的重要“抓手”。

传统MPP架构的数据库,在机器学习解决方案存在支持算法种类有限、缺乏数据并行训练、新算法开发难度大等诸多问题,难以满足数据管理和模型开发的需求。

与之相比,HashData拥有两种计算引擎:针对SQL查询分析任务的MPP计算引擎,以及针对机器学习和深度学习任务的ML/DL计算引擎。

基于存算分离的架构,HashData不仅能够通过SQL计算引擎对传统的数仓业务提供很好的支持,还能够借助ML/DL计算引擎实现对机器学习和深度学习的高效支持,其中包括在库内环境对大语言模型进行微调和推理。HashML就是酷克数据利用HashData强大的计算引擎打造的下一代In-Database高级分析和数据科学工具。

 图3:基于HashData双计算引擎架构构建HashML

同时,HashData还实现了对大规模向量数据的高效存储和检索,使得基于知识增强的LLM智能应用搭建变得更加简单。

一步到位 助力大模型规模化应用

AI 模型开发完成后需要在实际生产环境中落地部署,才能最终实现价值。

国际调研机构Gartner的研究表明,只有53%的项目能够从 AI 原型转化为生产。AI生产转化率低的主要原因在于模型全链路生命周期管理存在问题,包括跨团队协作难度大、过程和资产管理欠缺、生产和交付周期长等。

为了解决这些问题,HashML提供了从数据查询处理、高级分析到ML/DL模型的训练、推理和服务部署的全套工具,实现对大语言模型微调和推理的全链路支持。例如,借助HashML,最少用3行代码就可以对LLaMA2模型进行参数高效的微调:

图片

图4:用HashML对LLaMA2模型进行微调

HashML与HashData云数仓共享统一的存储和计算资源,随数仓的部署提供开箱即用、一站式交付的AI能力,大幅降低了系统部署的成本和复杂度,为开发者提供了统一的数据查询、分析、建模环境。

图片

图5:HashML主要功能概览

作为一款算法先进、性能卓越的数据科学工具,HashML能够帮助用户高效、简易地构建、训练和部署模型,极大地降低建模使用门槛,让用户能够在短时间内尝试多种模型架构和参数组合,从而更好地满足多元应用场景的需求。

目前,HashML各项功能正在紧锣密鼓地完善中,预计将于八月发布第一个正式版本。届时,我们将邀请各方合作伙伴共同参与验证测试,推动产品快速迭代升级,加速 AI 落地,让AI惠及各行各业。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/808097.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RH850 1372/1374 程序跑飞异常分析

文章目录 前言现象描述原因分析解决方案总结 前言 最近项目用瑞萨RH850系列的1372/1374开发,官方的MCAL做的不咋地就算了,FAE支持也很少。给的demo问题也很多。本文记录一下开发过程中的问题。 现象描述 MCAL配置完ADC1后,运行ADC1的采样程…

SQL注入原理分析

前言 order by的作用及含义 order by 用于判断显示位,order by 原有的作用是对字段进行一个排序,在sql注入中用order by 来判断排序,order by 1就是对一个字段进行排序,如果一共四个字段,你order by 5 数据库不知道怎么…

51:电机(ULN2003D)

1:介绍 我们51单片机使用的是直流电机 直流电机是一种将电能转换为机械能的装置。一般的直流电机有两个电极,当电极正接时,电机正转,当电极反接时,电机反转 直流电机主要由永磁体(定子)、线圈(转…

【Java|基础篇】File类和IO流

文章目录 1.File类2.流的概念3.InputStream4.OutputStream5.Reader6.Writer7.使用Scanner读文件8.使用PrintWriter写文件9.close()方法10.flush()方法10.总结 1.File类 File类是Java中用于表示文件或目录的类。它提供了一些方法来操作文件和目录的属性和内容,可以进…

对js中的window深入理解

window和 document的区别 window对象是浏览器中的全局对象,代表的是整个浏览器窗口;document只是window对象中的一部分,表示当前窗口或框架中加载的HTML文档,主要用于访问和操作文档的内容,包括DOM元素、样式、事件等&…

华为OD机试真题 Java 实现【AI面板识别】【2023 B卷 100分】,附详细解题思路

目录 专栏导读一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明4、控制台输出 华为OD机试 2023B卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题&#xff08…

【Javalin 】Javalin Kotlin/Java 轻量级 REST API 库

Javalin 旨在为 Kotlin 和 Java 提供一个易用的轻量级 REST API 库。这个 REST API 易于使用,API 也非常的流畅。 Javalin 主要有以下的特点: 易用:不用提前学习任何概念就可以开始使用 一致的 API:所有的处理程序和映射器在 Co…

基于RK3588+AI的边缘计算算法方案:智慧园区、智慧社区、智慧物流

RK3588 AI 边缘计算主板规格书简介 关于本文档 本文档详细介绍了基于Rockchip RK3588芯片的AI边缘计算主板外形、尺寸、技术规格,以及详细的硬件接口设计参考说明,使客户可以快速将RK3588边缘计算主板应用于工业互联网、智慧城市、智慧安防、智慧交通&am…

年轻人的第一套海景房

前段时间新房装修,我把书房设计成工作室的风格,并自己装配了一台电脑,本文是对电脑选购与装配的一则经验贴,仅包含我对计算机硬件的浅薄理解。 配件选购 装机契源 事实上,很多电脑店都提供装配和测试服务&#xff0c…

【二叉树】刷题二(以递归写法为主)

617. 合并二叉树 class Solution:def mergeTrees(self, root1: Optional[TreeNode], root2: Optional[TreeNode]) -> Optional[TreeNode]:root TreeNode()if not root1 and not root2:returnelif root1 and not root2:root root1elif not root1 and root2:root root2elif…

AD21原理图的高级应用(一)端口的应用

(一)端口的应用 1.放置端口2.自动给端口添加页码 说明,博主的AD版本是AD21,所有的工程都基于AD21,虽然AD软件几乎不存在版本兼容性问题,但还是建议大家使用对应版本的软件来学习。 资料仅供学习使用。 1.…

013 怎么查看自己电脑的wifi密码

方法一:查看当前电脑连接的无线密码 步骤1: 打开windows命令行窗口,输入:ncpa.cpl 快速打开“控制面板”中的“网络连接”,如下图: 步骤2: 右键,打开“状态” 步骤3:…

Pearson correlation皮尔逊相关性分析

在参数检验的相关性分析方法主要是皮尔逊相关(Pearson correlation)。既然是参数检验方法,肯定是有一些前提条件。皮尔逊相关的前提是必须满足以下几个条件: 变量是连续变量;比较的两个变量必须来源于同一个总体&…

瓦瑟斯坦距离、收缩映射和现代RL理论

Wasserstein Distance, Contraction Mapping, and Modern RL Theory | by Kowshik chilamkurthy | Medium 一、说明 数学家们在考虑一些应用的情况下探索的概念和关系 - 几十年后成为他们最初从未想象过的问题的意想不到的解决方案。 黎曼的几何学只是出于纯粹的原因才被发现的…

Abaqus 导出单元刚度矩阵和全局刚度矩阵

Abaqus 导出单元刚度矩阵和全局刚度矩阵 首次创建:2023.7.29 最后更新:2023.7.29 如有什么改进的地方,欢迎大家讨论! 详细情况请查阅:Abaqus Analysis User’s Guide 一、Abaqus 导出单元刚度矩阵 1.生成单元刚度矩阵…

Kafka原理剖析

一、简介 Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统,它提供了类似于JMS的特性,但在设计上完全不同,它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性,适用于离线和在线的消息消费,如常规的…

安装Anaconda3和MiniConda3

MiniConda3官方版是一款优秀的Python环境管理软件。MiniConda3最新版只包含conda及其依赖项如果您更愿意拥有conda以及超过720个开源软件包,请安装Anaconda。MiniConda3官方版还是一个开源的软件包管理系统和环境管理系统,能够帮助用户安装多个版本的软件…

Android高德地图定位实现签到打卡功能(全网最详细+收藏)

前言 本章根据高德地图API,实现打卡签到功能。用到了定位SDK 和地图SDK、覆盖物。打卡范围图形可以支持多种形状,如:圆形、长方形、多边形。 核心逻辑: 获取当前定位信息,然后通过Marker绘制小图标进行展示&a…

IO流(1)-字符流与字节流

1. I/O流前置知识 在讲解IO流之前,需要先说明几个小知识点: (1)bit 是最小的二进制单位,是计算机的操作部分,取值0或1。 (2)Byte(字节)是计算机操作数据的…

PayPal:全球金融科技领域当之无愧的巨无霸

来源:猛兽财经 作者:猛兽财经 全球最大的金融科技公司之一PayPal(PYPL)将于2023年8月2日发布其2023年第二季度的财报。多年以来该公司一直在革新数字汇款和收款方式,并提高数百万客户的生活质量。此外,PayPal的各种工具也为企业…