再论大模型做内容消费

news2024/9/20 22:31:50

前言

今天咱们再体验几个有关大模型聚集内容创作的工作。

之前也专门介绍过一些大模型在该方面的工作,感兴趣的小伙伴可以穿梭:《提升大模型内容创作能力》:https://zhuanlan.zhihu.com/p/716240950

废话不多说,一起来看看吧!

MidReal

体验网址:https://midreal.ai/

其是一个AI互动小说,用户可以实时选择剧情走向创作,而且MidReal支持长篇剧情,保持连贯性。还支持多种语言、多模态等等。

废话不多说,我们直接体验一下试试,你只要输入一个简单的剧情大纲,其便可以开始进行创作,笔者一共试了两个:

以第一个为例,输入的是“用户看到哈士奇在疯狂拆家,进行教育,但是二哈各种不听话,还是各种拆家”,那么它就开始进行了创作,会给出主人公,过程中还会对应的生成一些插图,下面是笔者随便截的几张效果图

它不是一下创作完整个剧情,而是在生成一部分后停止,进而给出一些不同的剧情走向供你选择,或者自定义剧情如下

除了生成剧情外,还可以实时选择和剧情中的人物进行聊天

整体体验下来就是这种新的互动模式很好玩,不论是剧情还是聊天都可实时参与,但是目前的效果(笔者只试了中文)感觉还是很英文感,汉化的不够好,相信后面慢慢优化,这种互动式的内容创作还是很好玩的。

IBSEN

论文链接:https://arxiv.org/html/2407.01093v1

github: https://github.com/OpenDFM/ibsen

该篇论文提出了一个<导演-演员>协同框架

这篇文章提出了IBSEN,其模拟现实生活中拍电影的流程即导演-演员模式。导演负责决定演员出场的顺序和对话脚本,而演员则需要根据导演的指示进行实际表演。

同时用户作为玩家,可以随时参与进来,打断某一剧情,这个时候导演需要临场发挥,随机应变即根据用户的互动实时调整剧本,进而指示演员进行配合,其最终目的就是既要配合好用户又要让剧情朝着预设的方向发展,不偏离主线。

可以看到其实整个过程就是一个控制框架,而各个节点的控制其实就是通过prompt来完成的,作者在附录都也给出来了。

为了便于理解,笔者跑了一下官方的demo,下面我们一起看下。

官方一共给了两种体验方式mzgame_frontend.py和terminal_frontend.py,前者是一个游戏脚本,其做了一些前端交互等等,使得其体验更有趣如下,感兴趣的小伙伴可以自己跑着玩一下。

笔者直接尝试跑了一下terminal_frontend.py即纯终端的交互。其大概的剧本是Hedda Gai正要举办一场发布会内容是关于Eilert的死讯,而给用户的设定是一名叫做Edward Helson的记者。游戏一开始是你可以输入不同的数字进入不同的剧情比如1代表酒店走廊、2代表酒店大堂、3代表新闻发布厅、你还可以输入-1进行随机采访某个人如下:

这里笔者是选择输入个1,那便可以得到一段剧情发展(绿色框),可以看到陆续有四个演员登场,其中Hedda Gai和George Dai进行一波寒暄,John和Peter则是讨论了下这场发布会的内容。

紧接着红色框又是给用户进行新的选择。

这次笔者选择-1进行主动采访(如下图),然后它让我选择具体想采访的人,笔者选了1也即Hedda Gai。然后让输入想采访的问题,笔者输入了“你看起来心情不错啊”,Hedda Gai回答的大概意思就是为了面子总得装装。笔者觉得不应该这样,Hedda Gai回答这就是我们的不同点。最后笔者不想采访了直接选择0进行退出,它会让接着选择是否想采访其他人,笔者也不想采访了,直接选择0进行退出。

退出后,它又让开始选择剧情,笔者这会选择3即新闻发布厅,它接着就会出现新的演员进行剧情推动。

接下来就又是同样的选择进行互动了,笔者就不再过多演示了。相信大家通过上面的例子已经大概了解到游戏是什么样子了,感兴趣的小伙伴可以去尝试一下。

  • 跑demo提示

想跑通demo的小伙伴可能会遇到一些坑,笔者这里也记录一些debug遇到的,希望能帮的上。

(1)首先代码中用到了guidance这个包,其因为一些版本的问题可能和openai的调用会出现一些diff。首先就是改guidance/llms/_openai.py的652行的将stop这里改成列表即[stop]

(2)其次就是guidance/llms/_openai.py的157行改为chat_mode = True,因为chat_model_pattern这里还没有gpt-40-mini,其会检查是不是chat模型,其实这里不需要检查,直接用就行,所以都改成TRUE

(3) 其次就是issiue区提到的一个问题,大家直接按着修复就行:https://github.com/OpenDFM/ibsen/issues/1

(4)还有就是ibsen本身的代码director.py的150行next_instruction = ""单独设置为空,上面已经返回值,这个为空导致query为空报错,可以注释掉这一行试试,https://github.com/OpenDFM/ibsen/blob/main/server/director.py#L150

总结

(1)IBSEN的好处是控制了内容中的人物,但是缺点是需要预先设置好基本的剧情甚至细节。这部分还是需要人力的。而MidReal则是给一个基本大纲便可自动持续的创作剧情以及可以实时调控剧情走向,但是聊天的不够好,如果能把二者工作结合起来进行内容创作是不是更好呢?

(2)目前demo的中文效果都不怎么好,如果能针对中文场景进行一番优化,说不定是一个不错的大模型落地。

关注笔者

知乎,csdn,github,微信公众号

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2114207.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【技术调研】三维(0)-webGL、三维基础知识、前置知识、数学知识以及简单示例

前言 ​ 因业务需要了解网页端三维相关技术,故对webGL相关技术学习并记录。旨在了解网页端三维的基本原理。 什么是webGL? ​ WebGL全称叫做Web Graphics Library,它是JavaScript API。用于在任何兼容的Web浏览器中渲染交互式的3D图形,并且无需使用插件。它基于 OpenGL …

参会邀请 | 第二届机器视觉、图像处理与影像技术国际会议(MVIPIT 2024)

第二届机器视觉、图像处理与影像技术国际会议&#xff08;MVIPIT 2024&#xff09;将于2024年9月13日-15日在中国张家口召开。 MVIPIT 2024聚焦机器视觉、图像处理与影像技术&#xff0c;旨在为专家、学者和研究人员提供一个国际平台&#xff0c;分享研究成果&#xff0c;讨论…

上海大学《2022年836+915自动控制原理真题及答案》 (完整版)

Part1&#xff1a;2022年上海大学真题题目 学硕836 专硕915 Part2&#xff1a;2022年上海大学真题答案 学硕836 专硕915

Linux学习之路 -- 线程概念

本文主要介绍线程的相关概念与基础控制 什么是线程&&线程的相关知识 按照书本上的定义&#xff0c;线程就是进程内部的一个执行分支&#xff0c;而线程是cpu调度的基本单位。 如果直接按照书本上的定义理解&#xff0c;线程这个概念是比较模糊的&#xff0c;而且我们…

013.Python爬虫系列_re正则解析

我 的 个 人 主 页:👉👉 失心疯的个人主页 👈👈 入 门 教 程 推 荐 :👉👉 Python零基础入门教程合集 👈👈 虚 拟 环 境 搭 建 :👉👉 Python项目虚拟环境(超详细讲解) 👈👈 PyQt5 系 列 教 程:👉👉 Python GUI(PyQt5)文章合集 👈👈 Oracle数…

SAP学习笔记 - 开发01 - BAPI是什么?通过界面和ABAP代码来调用BAPI

BAPI作为SAP中的重要概念&#xff0c;在SAP系统的开发中几乎是必须的。 本章来学习一下BAPI 的直观印象&#xff0c;以及在ABAP代码中的调用。 目录 1&#xff0c; BAPI概述 1&#xff0c;从画面角度来直观体验一下BAPI 1-1&#xff0c;MM&#xff1a;購買依頼変更BAPI - …

日志服务管理

系统日志管理 sysklogd 系统日志服务 在 CentOS5 以及之前的发行版中&#xff0c;其采用的 sysklogd 服务来记录和管理系统日志的。 sysklogd 服务有两个模块&#xff1a; klogd&#xff1a; 用于记录 linux kernel 相关的日志 syslogd&#xff1a;用于记录用户空间应用日志…

OCC开发_箱梁梁体建模

概述 OCC(全称OpenCascade)是一个近年来比较受欢迎的开源三维CAD建模平台&#xff0c;曲线、曲面、实体、渲染等方面功能强大&#xff0c;并且在机械、航空、船舶等许多领域应用广泛。基于OCC的强大功能考虑&#xff0c;本人尝试将其引入桥梁领域。桥梁设计中&#xff0c;比较常…

Nginx核心配置文件结构

一、简单介绍 源码安装的Nginx的核心配置文件默认是放在/usr/local/nginx/conf/nginx.conf yum安装的Nginx的核心配置文件默认是放在/etc/nginx/nginx.conf 使用命令&#xff1a;nginx -t&#xff0c;可以检查测试nginx的配置文件&#xff08;nginx.conf&#xff09;语法是否…

6.1排序——插入排序与希尔排序

本篇博客来梳理两种常见排序算法&#xff1a;插入排序与希尔排序 常见的排序算法如图 写排序算法的原则&#xff1a;先写单趟&#xff0c;再写整体 一、直接插入排序 1&#xff0e;算法思想 先假定第一个数据有序&#xff0c;把第二个数据插入&#xff1b;再假设前两个数据…

iOS剪贴板同步到Windows剪贴板(无需安装软件的方案)

摘要 剪贴板同步能够提高很多的效率&#xff0c;免去复制、发送、复制、粘贴的步骤&#xff0c;只需要在手机上复制&#xff0c;就可以直接在电脑上 ctrlv 粘贴&#xff0c;这方面在 Apple 设备中是做的非常好的&#xff0c;Apple 设备之间的剪贴板同步功能&#xff08;Univer…

2024整理 iptables防火墙学习笔记大全_modepro iptables

Iptables名词和术语 2iptables表&#xff08;tables&#xff09;和链&#xff08;chains&#xff09; 2表及其链的功能 2  Filter表 2  NAT表 2  MANGLE表 2iptables的工作流程 3iptables表和链的工作流程图 3 二、 iptables实战应用 4iptables命令参数详解 4  iptable…

Python基础part1

Python基础 语法 字面量 数字 整数浮点复数布尔 字符串列表 list元组 Tuple集合 Set字典 Dictionary 注释 单行# 单行注释的内容多行“”“ 多行注释的内容 ”“” 单行注释#后要加一个空格再写注释 变量 变量无类型&#xff0c;但数据有类型 语法&#xff1a; 变量名 …

java黑马微项目

1 飞机票 代码实现&#xff1a; import java.util.Scanner; public class F1 {public static void main(String[] args) {Scanner input new Scanner(System.in);System.out.print("请输入票价&#xff1a; ");double jia input.nextDouble();System.out.print(&…

培训第九周(部署k8s基础环境)

一、前期系统环境准备 1、关闭防火墙与selinux [rootk8s-master ~]# systemctl stop firewalld[rootk8s-master ~]# systemctl disable firewalldRemoved symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.Removed symlink /etc/systemd/system/dbus-o…

快速格式化和格式化的区别有哪些?

磁盘通常需要格式化才能正常使用&#xff0c;通过格式化&#xff0c;磁盘结构才能被操作系统正确识别。磁盘格式化分为快速格式化和格式化&#xff08;完全格式化&#xff09;&#xff0c;它们都是格式化的方法&#xff0c;下面是它们的详细区别。 磁盘快速格式化和格式化的区别…

2024 年高教社杯全国大学生数学建模竞赛B题第三问详细解题思路(终版)

示例代码&#xff1a; import numpy as np import pandas as pd# 参数设定 params {m: 8, # 零配件数量n: 2, # 半成品数量p: [0.10, 0.10, 0.10, 0.10, 0.10, 0.10, 0.10, 0.10], # 零配件次品率c: [2, 8, 12, 2, 8, 12, 8, 12], # 购买单价d: [1, 1, 2, 1, 1, 2, 1, 2]…

个性化阅读体验:Spring Boot驱动的图书推荐系统

1 绪论 1.1研究背景 随着网络不断的普及发展&#xff0c;图书个性化推荐系统依靠网络技术的支持得到了快速的发展&#xff0c;首先要从学生的实际需求出发&#xff0c;通过了解学生的需求开发出具有针对性的首页、图书信息、好书推荐、留言反馈、个人中心、后台管理功能&#x…

文本分类场景下微调BERT

How to Fine-Tune BERT for Text Classification 论文《How to Fine-Tune BERT for Text Classification?》是2019年发表的一篇论文。这篇文章做了一些实验来分析了如何在文本分类场景下微调BERT&#xff0c;是后面网上讨论如何微调BERT时经常提到的论文。 结论与思路 先来看…

19:HAL—-DAC

一&#xff1a;介绍 1&#xff1a;简历 2&#xff1a;简图 F1,F4,F7的DAC框架图都一样。 触发源&#xff1a; 宏定义补全及解释 #define DAC_TRIGGER_NONE 0x00000000UL /*!< 转换是自动的&#xff0c;一旦DAC1_DHRxxxx寄存器被加载&#xff0c;不由外部触发 */ #define …