正确完成实时 AI

news2024/11/23 21:54:34
发表于

构建真实世界的实时 AI

·

一、说明

        我们知道,当前的AI进展是扎根于历史数据,这就造成一个事实,模型总是赶不上实时进展,模型的洞察力不够尖锐,或者,时间损失等,本篇对这一系列AI的短板展开议论。

二、正确完成实时 AI:及时大规模洞察和行动

        在我之前的博客文章中,我列出了当前人工智能架构的挑战以及它们对数据科学家和开发人员施加的固有限制。这些挑战阻碍了我们利用实时数据增长、满足消费者日益增长的期望、适应日益动态的市场以及提供经过验证的实时业务成果的能力。简而言之,即使人工智能带来了一些巨大的好处,但由于以下原因,它仍然不足:

  • 基于广泛的人口统计数据的定向预测,无法提供改变行为和推动影响所需的洞察力。
  • 批处理和历史分析无法跟上快速发展的消费者需求。
  • 时间、成本和复杂性延迟了我们学习新模式和采取行动以满足不断变化的市场需求的速度。
  • 团队之间缺乏可见性以及各种工具堆栈,这进一步使 AI 从业者在尝试构建提供价值的应用程序时变得复杂和延迟。

        简而言之,这种将数据引入ML / AI系统的过时模型无法以企业和消费者所需的速度提供所需的结果类型。但是,有一种更好的方法可以通过 AI 提供实时影响并推动价值。

        现在,让我们探讨一下组织如何超越这些限制,加入将ML引入数据的企业行列,以提供更智能的应用程序,并在确切的时间进行更准确的AI预测,从而产生最大的业务影响。

三、重新思考数据架构,利用 AI 推动影响力

        借助实时 AI,开发人员现在可以构建 AI 驱动的应用程序,这些应用程序不仅可以预测行为,还可以驱动操作——在它可能产生最大影响的确切时刻。有了实时人工智能,您现在有了各种可能性——从改变个人层面的消费者行为,到洞察用户意图和背景,再到采取预防措施来保护制造正常运行时间和供应链弹性,无所不包。根据对用户的广泛人口统计理解,远离你所说的世界,这是将流失的用户百分比,并转移到一个模型,在这个模型中,你可以了解特定的个人并推动决策,在当下,增加参与度。

        实现这种转变需要改变人工智能系统的构建方式。今天的大多数人工智能都是基于大量的历史数据,每天或有时每周分批收集。其结果是基于广泛的模式和人口统计数据对历史行为的后视镜观察。借助实时 AI,您可以在一系列事件展开时连接到它们,从而可以在它们发生时立即发现关键时刻、信号和结果。其结果是对消费者行为、安全威胁、系统性能等的高度个性化理解,以及干预以改变结果的能力。

        例如,音乐应用程序的目标不仅仅是提供正确的内容,而是提供个性化、引人入胜的内容,让用户停留更长时间,探索新的音乐领域、新的艺术家和新的流派,并让他们如此参与,以至于他们续订了订阅。该应用程序需要的不仅仅是基于用户的历史记录,而是基于用户在积极参与时在应用程序中的意图来提供音乐。

        想想那些整个早上都在听着有助于提高生产力的器乐的听众,但现在是中午,他们要去健身房。他们想要音乐来帮助激励他们。如果应用程序在用户想要锻炼碧昂斯时继续提供贝多芬,那么应用程序就达不到要求,给用户带来了搜索的负担和潜在的挫败感。

        那么,当用户在应用程序中时,应用程序如何检测意图的转变呢?这可以通过实时行为和行动来揭示。可能是用户留下了他们一直在听的歌曲,并根据排名算法滚动选择,但没有进行选择。然后,用户转到应用提供的轮播之一,但同样不会选择任何选项,因为它们都是播客。也许他们会播放他们旧的锻炼播放列表中的一首歌。此外,背景很重要;它可以从诸如星期几或一天中的时间甚至用户的位置等因素中收集。现在,有了意图和上下文,实时 ML 模型可以更准确地预测当前会话中所需的内容。

        部署到应用程序后,实时 AI 依赖于功能新鲜度和低延迟 - 功能更新时间以及应用程序随后可以多快采取行动。正确的基础架构消除了响应滞后,并通过实时计算这些功能来更有效地利用资源,以便仅针对活动用户进行预测。这种体验在听众需要时为他们提供了他们需要的东西,这将推动参与度和订阅续订的最终目标。

四、灵活性和响应能力

        实时 AI 是为速度和规模而构建的;它能够在正确的时间在正确的基础架构上交付正确的数据。这反过来又可以在上下文中捕获机会,根据历史和实时数据训练模型,以做出更准确、更及时的决策。

        在最先进的情况下,实时 AI 可以监控 ML 模型的性能。如果模型的性能下降,则会触发自动重新训练。或者,可以训练“影子”模型,如果它们开始比生产中的模型表现更好,则可以将它们换成性能不佳的模型。

        实时人工智能还可以更轻松地确保所有人口统计数据得到平等对待,从而允许监控和实时调整意外后果的能力。想象一下,生产中的模型开始通过公平性和偏见测试。在实时中,企业可以将模型从生产中翻转出来,并回退到基于规则的系统或代表业务标准和准则的模型。这种方法可提供动态变化的高风险环境中所需的灵活性和响应能力。

五、减少时间、成本和复杂性

        传统人工智能的主要局限性之一是与数据传输和存储相关的大量工作和成本。相比之下,将 ML 功能引入数据本身可以通过消除这些数据传输来节省时间、成本和复杂性,因为通过简化的架构,您可以获得一个环境来处理事件数据、功能和模型,从而即时大规模摄取数据。此外,通过简化复杂性并提高特征和训练数据集沿袭的可理解性,可以提高速度和生产力。换句话说,可以更清晰、更清楚地了解跨多个管道、湖泊、视图和转换所发生的情况。通过访问直接数据源,您可以加快理解速度,尤其是在提升团队或个人能力时。

        由于许多客户并非每天都活跃,因此无需在整个客户群中生成每日预测,从而节省了更多的成本。例如,如果一个组织使用批处理系统,并且每天有 100,000 个活跃用户,而每月有 100 亿个活跃用户,则没有必要每晚重新评分 100 亿个客户。这样做会增加不必要的大量成本。存储这些数据所产生的成本不断增加。

                重新训练模型以合并行为更改需要保留或能够重现每个训练数据集,以实现故障排除和审核。为了减少随时间推移复制和存储的数据量,每次重新训练模型时,都应该能够访问数据的原始、未转换版本,并能够使用训练期间使用的特征版本重现训练数据集。这对于批处理系统来说是非常困难的,因为数据已经经历了跨多个系统和语言的多次转换。在实时系统中,直接从原始事件中表达用于训练和生产的完整功能,可以减少通常需要存储在多个位置的所有数据的重复量。

        将 AI/ML 引入数据源会创建表达转换的单一方法。您现在可以知道您已连接到正确的源,您知道这是转换的确切定义,并且您可以在几行代码中更简洁地表达数据转换中所需的内容 - 而不是管道到管道到管道,这些多次传输涉及混乱。

六、减少摩擦和焦虑

        正如我在之前的博客文章中指出的那样,跨越数据、ML 和应用程序堆栈的团队成员通常无法对 ML 项目进行广泛的可见性或深入理解。这些工具根据团队成员在堆栈中的位置而有很大差异。

        这些孤岛给流程注入了摩擦和混乱,并围绕诸如“这是否准备好生产了吗?“一旦我们真正投入生产,这能奏效吗?”“或者,”尽管投入了数百万美元,但这些模式是否只能产生最小的影响——远远达不到提供价值的承诺或愿景?

        将 AI/ML 引入数据可实现具有一组抽象的统一接口,以支持训练和生产。相同的特征定义可以生成任意数量的训练/测试数据集,并使特征存储与新数据流保持最新。此外,使用声明性框架可以导出功能定义及其所依赖的资源定义,以将内容签入代码存储库或 CI/CD 管道,并在不同区域中使用新数据启动新环境,而无需将数据传出该区域。这使得集成最佳实践变得容易,简化了测试,并缩短了学习曲线。这也本质上降低了摩擦,提供了更高的可见性,并通过更标准化的格式,更清楚地了解特定代码集中正在发生的事情。

七、正确完成实时 AI

        实时 AI 解决方案将大规模实时数据与集成机器学习整合到专为开发人员构建的完整开放数据堆栈中,这是一种新方法。正确的堆栈和正确的抽象,具有令人难以置信的前景,可以创建新一代应用程序,从而推动更准确的业务决策、预测性操作以及更具吸引力、更具吸引力的消费者体验。这有可能以一种除了少数几家企业之外所有人都无法实现的方式释放人工智能的价值和承诺。这将产生对各种形式的大规模数据的即时访问。借助集成智能,实时 AI 将为全球分布式运营、数据和用户提供时效性洞察。

        在即将发布的博客文章中,我将讨论Apache Cassandra®在这个实时AI堆栈中的关键作用,以及您可以从DataStax期待的一些令人兴奋的新事物。

了解 DataStax 如何实现实时 AI。

DataStax

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1057415.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【初识Linux】:常见指令(1)

朋友们、伙计们,我们又见面了,本期来给大家解读一下有关Linux的基础知识点,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成! C 语 言 专 栏:C语言:从入门到精通 数…

WebSocket基础——WebSocket的基本概念 VS Http SpringBoot整合WebSocket vue前端代码和效果展示

前言 WebSocket是一种在Web浏览器和服务器之间进行全双工通信的协议。它允许在单个TCP连接上进行双向通信,而不需要通过多个HTTP请求-响应循环来实现。相比传统的HTTP请求,WebSocket提供了更低的延迟和更高的实时性。 本篇博客介绍WebSocket的基本概念…

计算机网络(四):网络层

参考引用 计算机网络微课堂-湖科大教书匠计算机网络(第7版)-谢希仁 1. 网络层概述 网络层的主要任务是实现网络互连,进而实现数据包在各网络之间的传输 要实现网络层任务,需要解决以下主要问题 网络层向运输层提供怎样的服务 (“…

基于SpringBoot的养老监护管理平台设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

解决Invalid bound statement (not found)错误~

报错如下所示: 找了好久,刚开始以为是名称哪里写的有问题,但仔细检查了好多遍都不是 最后发现了问题如下所示: UserMapper里面的内容被我修改了,但classes中的内容还是原来的内容,所以才导致了编译器报错n…

Vue2详解

Vue2 一、Vue快速上手 1.1什么是Vue 概念:Vue是一套构建用户界面的渐进式 框架 构建用户界面:基于数据渲染出用户可以看到的界面 渐进式:所谓渐进式就是循序渐进,不一定非得把Vue中所有的API都学完才能开发Vue,可以…

【数据结构】红黑树(C++实现)

​ ​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:数据结构 🎯长路漫漫浩浩,万事皆有期待 上一篇博客:【数据…

一篇博客学会系列(3) —— 对动态内存管理的深度讲解以及经典笔试题的深度解析

目录 动态内存管理 1、为什么存在动态内存管理 2、动态内存函数的介绍 2.1、malloc和free 2.2、calloc 2.3、realloc 3、常见的动态内存错误 3.1、对NULL指针的解引用操作 3.2、对动态开辟空间的越界访问 3.3、对非动态开辟内存使用free释放 3.4、使用free释放一块动态…

接口测试入门实践

简单接口搭建(表单/REST) 五步教会你写接口 首先要安装flask包: pip install flask 从flask中导入Flask类和request对象: from flask import Flask, request从当前模块实例化出一个Flask实例:appFlask(__name__)编写一个函数来处理请求 从请求对象中获取数据:arequest.values.…

【test】文章测试

自定义文章测试 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个注脚注…

【改进哈里鹰算法(NCHHO)】使用混沌和非线性控制参数来提高哈里鹰算法的优化性能,解决车联网相关的路由问题(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

嵌入式学习笔记(42)SD卡的编程接口

8.3.1 SD卡的物理接口 SD卡由9个针脚与外界进行物理连接,这9个脚中有2个地,1个电源,6个信号线。 8.3.2 SD协议与SPI协议 (1)SD卡与SRAM/DDR/SROM之类的东西的不同:SRAM/DDR/SROM之类的存储芯片是总线式的,只要连接上…

Docker部署Nginx-常用命令

1.拉取 docker pull nginx 2. 查看镜像 docker images 3.保存镜像 docker save -o nginx.tar nginx:latest 4.删除镜像 docker rmi nginx:latest 5. 加载镜像 docker load -i nginx.tar 6. 运行Nginx docker run -d --name nginx -p 80:80 nginx 7.停掉Nginx容器 docker stop n…

Android 活动Activity

目录 一、启停活动页面1.1 Activity的启动和结束1.2 Activity的生命周期1.3 Activity的启动模式 二、在活动之间传递消息2.1 显式Intent和隐式Intent2.2 向下一个Activity发送数据2.3 向上一个Activity返回数据 三、补充附加信息3.1 利用资源文件配置字符串3.2 利用元数据传递配…

操作系统--分页存储管理

一、概念介绍 分页存储:一是分内存地址,二是分逻辑地址。 1.分内存地址 将内存空间分为一个个大小相等的分区。比如,每个分区4KB。 每个分区就是一个“页框”,每个页框有个编号,即“页框号”,“页框号”…

Linux【网络】数据链路层

Linux【网络】数据链路层 数据链路层以太网帧格式对比理解MAC地址和IP地址ARP协议--地址解析协议ARP工作流程ARP请求ARP应答 其他协议DNS-域名解析协议ICMP--网络层协议NAT技术NAPT 正向代理与反向代理 数据链路层 数据链路层用于两个设备,同一数据链路节点之间的信…

DPDK程序结合网络助手接收数据

网络调试工具&#xff1a;https://download.csdn.net/download/hdsHDS6/88390999?spm1001.2014.3001.5503 DPDK代码&#xff1a; #include <stdio.h> #include <string.h> #include <rte_eal.h> #include <rte_ethdev.h> #include <rte_ip.h> …

[管理与领导-112]:IT人看清职场中的隐性规则 - 9 - 付出与回报的关系:先付出,后回报,不行就止损,这才是职场价值交换的本质

目录 一、职场中付出与回报的先后关系 二、付出与回报四象限模型 三、职场专业性的本质 一、职场中付出与回报的先后关系 在职场中&#xff0c;个人的付出和回报之间存在着先后关系。以下是按照先后关系划分的四种类型&#xff1a; 先付出后回报型&#xff0c;不回报&#…

对进程的初步认识以及fork()函数的理解

什么是进程 进程是什么呢&#xff1f;其实解释的通俗浅显一点就是我们运行到内存的程序。我们知道运行一个磁盘里的程序时&#xff0c;会将该程序先加载&#xff08;将磁盘的数据拷贝&#xff09;到内存当中&#xff0c;因此该程序就可以称为一个进程。首先我们以Windows操作…

特斯拉被称为自动驾驶领域的苹果

特斯拉的自动驾驶技术无疑是居于世界上领先地位的,有人形容特斯拉是自动驾驶汽车领域的苹果。特斯拉发布的Tesla Vision系统只配备了摄像头,不依靠雷达。 这并不是特斯拉唯一和其它对手不同的地方,他们的整个战略都是基于车队和销售产品,而其大多数竞争对手则销售自…