对话掌阅科技CTO孙凯:如何用生成式AI重新定义阅读体验

news2024/12/28 18:44:54

导读:生成式AI能对阅读做本质的改造吗?

读一本好书,犹如和一位智者对话。

对于很多热爱读书的人,这是一种令人憧憬的阅读体验。以往,这种对话只能在读者的头脑和思维中进行。

有没有可能,读者可以随时随地和书籍本身、作者以及书中的人物进行对话?如何让阅读不再是孤独的苦旅,变成更有趣味性、更具沉浸感的体验?

生成式AI技术正在将这些愿景变成现实。目前,全球领先的数字阅读平台掌阅科技正在借助亚马逊云科技的生成式AI技术能力,打造沉浸式、高互动性的阅读体验。

生成式AI技术将对阅读体验将带来哪些变革?近日,掌阅科技CTO孙凯向国内媒体分享了相关洞察。

图片来自摄图网

生成式AI,有望对阅读进行本质化改造

2008年成立的掌阅科技专注在数字阅读赛道,业务遍布全球150多个国家和地区。掌阅科技飞速发展的历程,也见证了过去十余年间数字阅读领域两次重大的技术变迁。

第一次是2010年左右,电子书的加速普及带来书籍介质的变革。从此,越来越多消费者的阅读习惯从纸质书阅读跃迁到电子书阅读。

第二次是2015年左右,数字阅读完成了从PC互联网向移动互联网的跨越。

根据2024年4月发布的第二十一次全国国民阅读调查报告,2023年有78.3%的成年国民进行过手机阅读。数字化阅读、移动化阅读已经深入人们的日常生活。

“过往的技术变革,其实还没有对阅读内容的可读性、体验以及可理解性,做比较触达本质的改造。即如何真正激发用户的阅读兴趣。”

孙凯认为,尽管介质的变迁让阅读变得随时随地触手可及,但在数字阅读时代,读者还是普遍面临几大痛点。简单地说,可以概括为“读前、读中、读后”三个场景:

在“读前”场景,很多读者不知道自己该读什么书。只是觉得应该读书,但面对茫茫书海不知如何选择,导致后面更难坚持下去。

在“读中”场景,很多读者即使有明确的读书目标,也往往坚持不下去。正如很多人都认可健身的价值,但真正能养成健身习惯的人却很少。

在“读后”场景,即使读者能够努力读完一本书,但很多时候收获甚微。当要用的时候,往往发现对书籍的核心观点只记得一个模糊的概念,真正留存和运用的价值很少,容易对阅读产生挫败感。

“在生成式AI浪潮下,掌阅科技希望以人为中心,以用户的存储与时间为半径,致力于回归阅读内容与阅读兴趣的本质,打造创新解决方案,与用户进行深层次互动。”孙凯表示。

携手亚马逊云科技,加速AI+阅读场景创新

孙凯认为,如果将人们阅读的目标划分为两大类型:学习知识与休闲娱乐,那么生成式AI在每一类型的应用场景都非常广泛。

针对知识学习型阅读,生成式AI可以通过自然语言互动、启发式提问等方式,提升读者获取知识的效率。比如能否用3个小时获得 10个小时阅读时间一样的知识密度。

针对休闲娱乐型阅读,文生图、图生图等多媒体内容生成可以大幅提升阅读兴趣,提供更沉浸式的阅读体验。

2023年上线的“阅爱聊”小程序是掌阅科技应用生成式AI技术的首次尝试。“阅爱聊”让用户可以与书籍或人物直接进行对话,提升用户对于经典好书或角色的理解,增加趣味性的体验。

目前,可以对话的书籍包括《红楼梦》、《傲慢与偏见》等中外名著,以及《三体》畅销经典。对话人物则涵盖孔子、李白等历史名人,也包括哈利波特、叶文洁等文学创作人物。

其中,书籍和人物的回应全部由AI自动生成。在互动性强、趣味性强的对话中,读者可以对经典名作获得新的思考与启发。

此外,掌阅科技核心产品掌阅APP也在尝试借助生成式AI技术,进行阅读体验提升的探索,比如:

针对“读前”场景,生成式AI技术可以基于书籍内容本身的理解,并结合用户画像,以更懂用户的方式,提供量身定制的书籍推荐。

针对“读中”场景,生成式AI技术可以显著提升阅读效率和体验。通过精读模式和多媒体化手段,满足不同用户需求,提升阅读的知识密度和娱乐性。

针对“读后”场景,提供系统化知识管理服务,通过构建以书为原点的知识图谱,帮助用户回溯和管理阅读内容。

除此之外,掌阅科技选择亚马逊云科技为重要云服务供应商,应用生成式AI技术为掌阅AI阅读项目提供助力,为用户打造数字化与沉浸式创新阅读体验。

基于亚马逊云科技机器学习平台Amazon SageMaker,以及开箱即用的关于Stable Diffusion的亚马逊云科技插件解决方案,掌阅科技在文生图解决方案的开发效率上获得很大提升。

“要做一个文生图的项目并运用在企业业务中,对于 Stable Diffusion的不管是资源管理、插件管理、伸缩性、稳定性、性能调优还是部署,需要技术深度和广度还是不低的。掌阅科技的优势在于对场景和用户痛点的洞察,以及阅读体验创新,所以选择专业的技术伙伴是性价比更高的方式。”孙凯表示。

亚马逊云科技全面的云服务与生成式AI技术的紧密结合,也是掌阅科技选择其作为重要云服务提供商的关键。

比如,针对个性化场景推荐场景,全托管的无服务器非关系数据库Amazon DynamoDB不仅能够存储和分析用户个性化推荐模型所需的数据,还支持复杂的数据查询和分析,能够为掌阅科技的用户提供更精准的推荐结果。

据悉,掌阅科技与亚马逊云科技的合作可以追溯到2015年。目前,掌阅科技海外业务大部分部署在亚马逊云科技之上,为全球各地读者提供海量的图书内容和优质的在线阅读体验。

“我们非常感谢亚马逊云科技为掌阅科技提供了坚实的底层技术保障,包括存储、计算、数据库、内容分发网络等等。未来,我们还将继续与亚马逊云科技携手,为全球各地读者提供海量的图书内容和优质的在线阅读体验。”孙凯表示。

生成式AI技术对数字阅读带来的改变刚刚开始。如何触达阅读的本质,让更多人爱上阅读,生成式AI将带给行业巨大的想象空间。

END

本文为「智能进化论」原创作品。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1697033.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使OpenCV可以读取中文路径图片的方法

一.问题复现 1.代码 #! /usr/bin/env python # -*- coding: utf-8 -*-# File: show_img.pyimport cv2# 读取图片 img cv2.imread("车牌素材/冀A.png")# 显示图片 cv2.imshow("img", img) cv2.waitKey(0)2.报错截图 3.报错内容 [ WARN:00.05…

[JAVASE] 类和对象综合应用 -- 图书管理系统

目录 零. 概览 一. 抽象出图书管理系统所涉及的对象 1.1 Book 1.2 User 1.3 Operation 二. 实现 User 包中的对象 2.1 User父类 2.2 NormalUser 对象 2.3 AdminUser 对象 2.4 小总结(1) 三. 实现Book包中的对象 3.1 Book 对象 3.2 BookList 对象 四. 实现 Operation…

大数据工具之HIVE-参数调优,调度乱码(二)

一、调度乱码 在利用HUE工具,搭建WORKFLOW流程的过程中,如果直接执行hivesql数据正常,不会出现乱码现象,如果利用WORKFLOW搭建的流程,进行数据的拉取,会出现数据中文乱码现象,这些乱码主要是由于select 中的硬编码中文导致出现的现象 具体现象如下: select case when …

【WEB前端2024】开源智体世界:乔布斯3D纪念馆-第26节-内嵌blender展厅

【WEB前端2024】开源智体世界:乔布斯3D纪念馆-第26节-内嵌blender展厅 使用dtns.network德塔世界(开源的智体世界引擎),策划和设计《乔布斯超大型的开源3D纪念馆》的系列教程。dtns.network是一款主要由JavaScript编写的智体世界…

人工智能万卡 GPU 集群的硬件和网络架构

万卡 GPU 集群互联:硬件配置和网络设计 一、背景 自从 OpenAI 推出 ChatGPT 以来,LLM 迅速成为焦点关注的对象,并取得快速发展。众多企业纷纷投入 LLM 预训练,希望跟上这一波浪潮。然而,要训练一个 100B 规模的 LLM&a…

OpenWrt U盘安装使用 详细教程 x86/64平台 软路由实测 系列一

1 官方稳定 版:OpenWrt 23.05 OpenWrt Downloads #根据实际情况选择 PC支持uefi,选择版本:https://downloads.openwrt.org/releases/23.05.3/targets/x86/64/openwrt-23.05.3-x86-64-generic-ext4-combined-efi.img.gz 2 rufus 制作U盘启动 3 制作好的U盘,接入主…

经典链表题-链表回文结构

🎉🎉🎉欢迎莅临我的博客空间,我是池央,一个对C和数据结构怀有无限热忱的探索者。🙌 🌸🌸🌸这里是我分享C/C编程、数据结构应用的乐园✨ 🎈🎈&…

传输层——UDP

在学习计算机网络的过程中,我们知道OSI七层协议模型,但是在实际开发应 用中我们发现OSI七层协议模型并不适合实施,因为OSI上三层通常都是由开 发人员统一完成的,这三层之间在实现过程中没有一个明确的界限,所以我 们更…

Windows平台C#版RTSP转RTMP直播推送定制版

技术背景 前几年我们发布了C版的多路RTMP/RTSP转RTMP转发官方定制版。在秉承低延迟、灵活稳定、低资源占用的前提下,客户无需关注开发细节,只需图形化配置转发等各类参数,实现产品快速上线目的。 如监控类摄像机、NVR等,通过厂商…

关于堆排序

今天我们不刷力扣了,我们来复习(手撕)一下数据结构中的八大排序算法之一,堆排序 基本概念: 堆是一种特殊的树形数据结构,即完全二叉树。 堆分为大顶堆和小顶堆: 大顶堆:每个节点的值…

手机上制作证件照

最近由于需要给老姐弄一组证件照,找了一通手机上的软件,找到一款性价比较高的,详细流程记录下来。vx小程序上搜索"泰世茂证件照",打开首页如下图所示∶ 单击"开始制作" ,选择一个证件照类别&#…

Python中Web开发-FastAPI框架

大家好,在当今Web开发领域,高性能、易用性和可扩展性是开发者们追求的目标。Python作为一种流行的编程语言,在Web开发领域也有着强大的影响力。而在众多的Python Web框架中,FastAPI凭借其快速、现代和易用的特性,成为了…

语雀——云知识库/笔记

对于日常进行学习/创作或是记录学习、工作内容与心得的群体来说,能够及时同步的云笔记应用有着广泛的应用场景。近期,我也探索了许多款不同的软件应用,今天来分享一款很有特点的应用——语雀。 语雀,为每一个人提供优秀的文档和知…

docker-file 网络

docker挂载 1.绑定挂载(Bind Mounts):绑定挂载是将主机上的文件或目录挂载到容器中。 docker run -v /host/path:/container/path image_name 2.卷挂载(Volume Mounts):卷挂载将 Docker 数据卷挂载到容器中…

[数据结构1.0]计数排序

读者老爷好,本鼠鼠最近学了计数排序,浅浅介绍一下! 目录 1.统计相同元素出现次数 2.根据统计的结果将序列回填到原来的序列中 3.相对映射计数排序 计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用,是非比较排…

AI语音及其应用

文章目录 一、基本认识二、AI语音应用场景三、真人录音与AI配音的区别四、AI语音创作基本步骤 本文将简单了解下AI语音、应用场景及其优势和创作核心步骤。 一、基本认识 AI语音是指基于人工智能技术开发的语音识别和语音合成系统。语音识别是指计算机识别和理解人类语音的能力…

决定了,将ChatGPTer开源!主打一个大模型人人可用。

一个快速上手且极易部署的类ChatGPT开源应用,可接入 OPENAI API 或 通义千问API 开源地址: https://github.com/isnl/EsChat 大声(偷偷)告诉你:通义千问有免费API额度可白嫖!!! 版本特性 OPENAI 和 通义千…

北航提出part2whole:可控⼈体图像⽣成的统⼀参考框架,可从任何数量和不同来源的参考人体部位图像中生成逼真的、高质量的各种姿势的人体人物图。

Parts2Whole,它可以从任何数量和不同来源的参考人体部位图像中生成逼真的、高质量的各种姿势的人体人物。我们的方法保持了与相应条件语义区域的高度一致性,同时保证了整体之间的多样性和协调性。 (a)以不同人的参考图像为条件生成人的图像。每对包括4个…

6.Redis之String命令

1.String类型基本介绍 redis 所有的 key 都是字符串, value 的类型是存在差异的~~ 一般来说,redis 遇到乱码问题的概率更小~~ Redis 中的字符串,直接就是按照二进制数据的方式存储的. (不会做任何的编码转换【讲 mysql 的时候,知道 mysql 默认的字符集, 是拉丁文,插入中文…

ChatGLM2-6B 模型基于 [P-Tuning v2]的微调

ChatGLM2-6B-PT 一、介绍 1、本文实现对于 ChatGLM2-6B 模型基于 [P-Tuning v2](https://github.com/THUDM/P-tuning-v2) 的微调 2、运行至少需要 7GB 显存 3、以 [ADGEN](https://aclanthology.org/D19-1321.pdf) (广告生成) 数据集为例介绍代码的使用方法。 模型部署参考…