AIGC 大模型纷纷部署,企业如何为 AI 数据降本增效

news2024/11/25 16:50:10

编辑 | 宋慧

出品 | CSDN 云计算

AIGC 从年初开始持续爆火,国内各种大模型纷纷涌现,其中模型参数轻松突破千亿数量级。模型中数据的形态、部署也是多种多样的,庞大数据量背后的管理和成本不容小觑。

混合数据厂商肯睿 Cloudera 今年相继发布了系列的数据产品与方案,就是希望为所有 AI 与大模型的用户降低背后的数据成本。详细来说,Cloudera 建议用户重点去提高对数据的可观测性设计,并优化混合云的部署成本。另外对于 AI 场景的数据需求,用户可以重点关注湖仓一体的混合数据部署方式。

提升数据可观测性,优化混合云成本

经过十多年的 IT 改造和云化升级,采用混合云部署的模式正在逐渐普及和成为企业的重要选择。对于混合云场景,Cloudera 总结了三方面需要数据相关的技术团队去重点关注的工作。首先,在由容器、调度器、服务等复杂系统的混合云场景里,数据平台的可控和稳定性是第一重要的。另外,目前的管理系统对于云消耗情况和效率的可见性仍有限,所以常常会导致浪费和超支,因此技术团队需要重视对于数据底层的资源管理与控制工作。最后,对于数据系统运维来说,故障排除麻烦,提供支持的人员需要频繁地来回奔波,运维人员与平台系统的体验也是运维效率的重要保证。

因此,Cloudera 针对以上的重点技术问题,设计了可以覆盖整个 CDP 平台产品的一站式可观测性应用解决方案 Cloudera Observability。方案从财务视角、管理监控、性能优化、自动化分析等等方面去进行设计。具体功能与设计如下:

1、财务治理

  • 通过成本管理避免超出预算
  • 规划前的能力预测

2、主动系统监控

  • 关于基础设施、服务、工作负载和用户的历史分析报告
  • 当前系统监控和洞察

3、工作负载优化

  • 性能调校建议
  • 调节规则主动失效和刷新

4、服务健康监控

  • 通过连续服务监控确定瓶颈
  • 事件和日志与服务的关联性

5、自助式分析

  • 覆盖所有能力的自动化操作
  • 完整的影响分析和可见性

6、更快的问题解决速度

  • 随时可用的 RCA 和处方更快的支持速度

据介绍,目前 Cloudera Observability 已经支持了 Hive、Impala 和 Spark 等 CDP 的几个主要的数据引擎,并以 Cloudera 托管的 SaaS 形式提供服务,接下来 Cloudera Observability 还将推出可本地部署的版本。根据测算,采用 Cloudera Observability 之后,数据系统的集群利用率可提升 30%以上,SLA 和 SLO 遵守率可提高 43%,RCA 和故障排除速度加快 50 倍,从数据的效果可以看到可观测性技术对于基础设施的投资回报率、收入、运营开支都有非常显著的优化。

企业大模型的数据困境,Cloudera 湖仓一体给出新答案

除了对于数据的可观测技术,对于 AI 与大模型场景下的数据应用,数据系统也面临了与以往数据分析所不同的全新技术挑战,例如企业内部大模型训练所需数据的来源、准确性、安全性等等。

以大语言模型为例,对于 Spark、Hive 等系统下数据结构与性能等不同需求

详细来说:

1、数据背景信息缺失

  • 未在企业自身的数据上训练
  • 企业客户背景信息至关重要

2、数据的关联性与准确性

  • 错误的响应会带来严重的后果

3、数据的可信与安全

  • 针对意图而不是功能的新验证理念

4、数据风险与合规

  • 授权、溯源、治理审计追踪

Cloudera 已经积累了针对数据编织、湖仓一体、数据网格和未来数据生态系统架构要求的混合数据平台,基于混合云与多云部署,提供数据编制编排后,统一提供 AI、BI、机器学习等数据分析与应用产品。

今年 4 月 Cloudera 客户大会上 Cloudera 也重点强调了 Cloudera 混合数据平台 CDP 对数据科学与 AI、机器学习的支持。例如 Cloudera Machine Learning(CML)可以为机器学习生命周期提供端到端的工作流程支持,以及覆盖从数据专家到数据分析师等各类用户的协作式、一体化商业智能与增强功能。

针对企业训练和使用大模型对于数据的需求,Cloudera 也总结和分享了对应的产品与技术路线。目前已经分别从安全可信、混合数据应用、可扩展的三个方面提供技术能力。

具体来说:

1、可信、安全和治理。Cloudera SDX 提供在任何地点的企业数据上创建可信 AI 所需的安全、治理和溯源。

2、混合数据应用,利用企业已有数据打造企业 AI 应用。Cloudera 赋能各个公有云和私有云上的企业数据,通过与企业业务相关的背景信息增强企业 AI 技术能力。

3、增加数据可扩展性,为 ML/AI 应用提供数据基础。Cloudera 在云数据管理和分析领域所管理的数据超过 2500 万 TB,与超大规模云服务商不相上下。

数据的重要性,在 AI 时代将愈加突显。开发者对于数据的存储、管理、分析、应用将是重要的工作。Cloudera 对于数据系统的设计思路与建议,值得开发者重点关注,CSDN 将持续报道数据技术的进展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/765832.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式的概述

目录 分类 创建型模式 结构型模式 行为型模式 类之间的关系 关联关系 聚合关系 组合关系 依赖关系 继承关系 实现关系 设计原则 开闭原则 里氏代换原则 依赖倒转原则 接口隔离原则 合成复用原则 一、分类 创建型模式 用于描述“怎样创建对象”,它…

线程池的学习(一)

转载:Java 线程池 线程池的创建方式 方式一:创建单一线程的线程池 newSingleThreadExecutor 特点: 线程池中只包含 1 个线程,存活时间是无限的按照提交顺序执行任务唯一线程繁忙时,新提交的任务会被加入到阻塞队列…

Java springBoot项目报LDAP health check failed

报错内容如下: 在bootstrap.yml文件里加 management:health:ldap:enabled: false 配置。 或者在application.properties文件里加: management.health.ldap.enabledfalse 参考答案:LDAP health check failed 难道没有人遇到这样的问题吗&…

我造了一个新的词汇:信息湍流

信息湍流 信息湍流的简介起因有出现信息湍流的领域如何做信息湍流的计算 信息湍流的简介 在物流学中,一个物体从一个位置到另外一个位置,我们可以通过精确的公式计算来预测出新位置。 而水和气体则是大量一个一个物体组成的新物体,称为&…

Docker安装以及基础镜像的使用

Docker 安装 Docker 要求 CentOS 系统的内核版本高于 3.10 uname -r使用 root 权限登录 su # 输入密码更新 yum yum -y update卸载旧版本的 docker yum remove ‐y docker*安装需要的软件包 yum -y install yum-utils设置 yum 源,并更新 yum 包的索引 yum-config-ma…

凝心聚力,同为科技(TOWE)2023年中会议暨团建活动圆满举行

01凝心聚力 奋勇冲刺——年中会议现场 年中会议现场 时光冉冉,2023年已过半,7月4日-11日,为回望过往、总结成果、复盘经验,确保顺利完成公司年度目标,增强团队凝聚力、激发员工活力,深化企业文化建设&…

15 - 堆栈 - 大顶堆

前面我们学习了小顶堆,相信大家都已经有点概念了,今天来了解一下大顶堆。 大顶堆示意图 堆数组存放的公式 我们用简单的公式来描述一下堆的定义就是: 大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2] 小顶堆:arr[i] <= arr[2i+1] && a…

两股热潮如何汇聚:当数字孪生遇上元宇宙

引言 随着科技的迅猛发展&#xff0c;数字孪生和元宇宙已成为当今技术界备受关注的两股热潮。这两个概念各自都在不同领域取得了突破性进展&#xff0c;但在最近的发展中&#xff0c;人们开始发现它们之间存在着潜在的契合点。本文将探讨数字孪生和元宇宙的定义、特点&#xf…

【【51单片机蜂鸣器实现起风了】】

哀伤如同风&#xff0c;消失无影踪。 前面的有两个非常关键的点希望兄弟们明白 我一开始也失算了 这里兄弟们注意务必改成int 不然会超出 就会出现播放一半从头开始的情况 下面是两份起风了代码直接附上main.c 因为另外的其实和我之前说的模板都一样复制粘贴就行 为什么是…

M1 Mac如何安装CentOS7虚拟机(图文详细解说)

1、下载相应的文件 2、打开VMware Fusion pro进行安装 3、 输入许可证密钥 4、 将CentOS-7拖入“从光盘或映像中安装”中 5、点击继续 6、选择其他-->其他64位ARM-->继续 7、进行自定设置 8、这里更改名为“Centos7”&#xff08;不要加空格&#xff09;&#xff0c;存…

2023 Testing Expo倒计时-聚焦Softing 9003展位

请点击此处&#xff0c;即可进行在线登记报名并了解更多信息&#xff01;

ES系列--文档处理

一、文档冲突 当我们使用 index API 更新文档 &#xff0c;可以一次性读取原始文档&#xff0c;做我们的修改&#xff0c;然后重 新索引 整个文档 。 最近的索引请求将获胜&#xff1a;无论最后哪一个文档被索引&#xff0c;都将被唯一存 储在 Elasticsearch 中。如果其他人同时…

Java-生成数据库设计文档

目录 场景screw 官网介绍接口编写 场景 在企业开发中&#xff0c;有些公司会要求开发人员编写数据库表结构文档&#xff0c;这项工作没啥技术含量而且很繁琐&#xff0c;每当有表发生更改时就需要维护这个文档&#xff0c;或者是需要交付数据库设计文档和导出数据库设计文档这类…

8月|龙讯旷腾高性能计算与工业材料模拟论坛2023

2023年8月25日 山东青岛 高性能计算与工业材料模拟论坛2023 青岛&#xff0c;别称岛城&#xff0c;国务院批复确定的中国沿海重要中心城市和滨海度假旅游城市&#xff0c;国家历史文化名城、中国帆船之都、世界啤酒之城、联合国电影之都&#xff0c;也是国家海洋科研和教育中…

【产品经理】TO B市场分析

市场分析是一个独立而又宏大的学科领域&#xff0c;并且具体使用中&#xff0c;目标和个体不同&#xff0c;分析的方式方法也不同。TO B产品的市场分析是对市场环境、市场规模、性质、特征、竞品进行分析&#xff0c;从而寻找和研究潜在需求的市场机会&#xff0c;帮助产品经理…

设计模式大白话——工厂模式

文章目录 设计模式大白话——工厂模式1.1、简单工厂:1.2、工厂方法1.3、抽象工厂 设计模式大白话——工厂模式 1.1、简单工厂: 场景与思路 ​ 现在需要开一个 Pizza 店&#xff0c;Pizza 店可以生产各种口味的 Pizza ​ 既然要生产各种各样的 Pizza&#xff0c;那就会很容易想…

管理类联考——英语——趣味篇——不择手段——d开头单词

&#x1f3e0;个人主页&#xff1a;fo安方的博客✨ &#x1f482;个人简历&#xff1a;大家好&#xff0c;我是fo安方&#xff0c;考取过HCIE Cloud Computing、CCIE Security、CISP、RHCE、CCNP RS、PEST 3等证书。&#x1f433; &#x1f495;兴趣爱好&#xff1a;b站天天刷&…

SignalTap II 软件使用步骤

文章目录 前言一、SignalTap II是什么&#xff1f;二、使用步骤三、总结四、参考资料 前言 环境&#xff1a; 1、Quartus18.1 2、板子型号&#xff1a;原子哥开拓者2(EP4CE10F17C8) 要求&#xff1a; 能够使用SignalTap II进行片上调试。 一、SignalTap II是什么&#xff1f; S…

海外媒体发稿:链游媒体发稿写作方法及优缺点解析

链游媒体发稿是一种新的媒体发布机制&#xff0c;它可以把信息准确、及时、有效地传播给大量的人&#xff0c;帮助企业实现信息的最大化传播&#xff0c;因此越来越多的公司也开始使用链游媒体发稿服务&#xff0c;本文就介绍链游媒体发稿写作的方法及小技巧。 一、链游媒体发稿…

Kubernetes Service的过程

文章目录 Kubernetes Service的实现基础内容1. 命令 ip route show table all2. DNAT3. IPVS和iptables4. Service Service的实现简述 Kubernetes Service的实现 基础内容 在了解Service之前,需要先了解一些额外的知识: 命令: ip route show table allDNATIPVS和iptables基础…