GPT-4o在加密货币情绪动态和行为模式应用

news2024/11/14 17:45:40

      本文研究了加密货币相关讨论中的预测性陈述、希望言论和后悔检测行为,旨在通过少量学习和大语言模型(如GPT-4o)分析投资者的情绪动态和预测行为。该问题的研究难点包括:数据量有限、资源可用性不足、需要准确分类预测性陈述、希望和后悔情绪的表达和分析。

1 概述

1.1 预测性陈述 (Predictive Statement)

预测性陈述是指对投资或市场未来表现或趋势的预测。根据预测内容,可以将预测性陈述分为以下四类:

  • 增量预测 (Incremental): 预测未来事件或结果将有所改善或增长,例如“市场占有率将在下一季度稳步增长”。
  • 减量预测 (Decremental): 预测未来事件或结果将有所下降或恶化,例如“预计下个财季销售额将下降”。
  • 中性预测 (Neutral): 预测未来事件或结果将保持稳定,没有显著变化,例如“公司预计未来一个季度的收入将保持稳定”。
  • 非预测性文本 (Non-Predictive): 不包含对未来事件或结果进行预测的内容,例如“区块链技术正在改变全球各个行业”。

1.2 希望检测 (Hope Detection)

希望检测旨在识别文本中表达希望情感的内容。根据希望的性质,可以将希望分为以下四类:

  • 广义希望 (Generalized Hope): 对加密货币领域整体持有积极乐观的态度,例如“对加密货币的未来充满期待!”
  • 非希望 (Not Hope): 不表达任何希望或期待的情感,例如“我不认为这种加密货币会增值”。
  • 现实希望 (Realistic Hope): 对未来事件或结果持有合理的期望,例如“随着区块链技术的发展,这种加密货币有望实现增长”。
  • 非现实希望 (Unrealistic Hope): 对未来事件或结果持有不切实际的期望,例如“我坚信这种加密货币会让我一夜之间成为百万富翁”。

1.3 遗憾检测 (Regret Detection)

遗憾检测旨在识别文本中表达遗憾情感的内容。根据遗憾的原因,可以将遗憾分为以下三类:

  • 行动遗憾 (Regret by Action): 由于采取了某种行动而感到后悔,例如“我后悔购买了这种加密货币,它已经贬值了很多”。
  • 不行动遗憾 (Regret by Inaction): 由于没有采取某种行动而感到后悔,例如“我应该早点购买这种加密货币,现在价格已经涨得很高了”。
  • 无遗憾 (No Regret): 不表达任何遗憾的情感,例如“我很高兴我没有投资这种加密货币,它正在崩盘”。

2 方法

2.1 数据收集

从两个研究论文中收集了来自 X 平台的数据,时间跨度为 2021 年 9 月至 2023 年 3 月。从 115,899 条推文中随机选择了 5,000 条评论,并从中选择了每种加密货币 1,000 条推文。

2.2 数据评估

使用 Cohen’s Kappa 系数评估 GPT-4o 模型与人工标注之间的可靠性。对 1,000 条评论进行人工标注,并与 GPT-4o 模型的结果进行比较,结果显示 Kappa 系数分别为:希望检测 0.4393%,遗憾检测 0.5796%,预测性陈述检测 0.7173%。

2.3 数据预处理

  • URL 移除: 使用正则表达式删除数据集中的 URL。
  • 文本清洗: 删除特殊字符和长度小于等于 2 的单词。
  • 其他处理: 包括去除多余字符、分词和文本规范化。

2.4 模型训练和执行

  • 使用 GPT-4o 模型进行少样本学习,使用标注的示例进行训练。
  • 对于每条评论,将包含评论和示例标签的结构化提示输入模型。
  • 模型根据其理解对评论的情感和预测性质进行分类,并将分类标签存储在数据集中。

2.5 分类任务

  • 预测性陈述: 将评论分类为增量预测、减量预测、中性预测或非预测性。
  • 希望话语检测: 将评论分类为广义希望、非希望、现实希望或非现实希望。
  • 遗憾检测: 将评论分类为行动遗憾、不行动遗憾或无遗憾。

2.6 方法的优势

  • 少样本学习: GPT-4o 模型的少样本学习能力可以有效地进行文本分类,无需大量标注数据。
  • 多任务学习: 同时进行预测性陈述、希望话语检测和遗憾检测,可以更全面地了解加密货币投资者 sentiment。
  • 高可靠性: 与人工标注结果相比,GPT-4o 模型的分类结果具有较高的可靠性。

2.7 方法的局限性

  • 数据量有限: 数据集规模较小,可能限制了模型的泛化能力。
  • 模型复杂度: GPT-4o 模型计算资源消耗较大,成本较高。

3 结果

3.1 预测性陈述

每种加密货币的评论中都存在大量的预测性陈述,但增量预测和减量预测的比例有所不同。

  • Matic 的增量预测比例最高,表明用户对其未来表现持更乐观的态度。
  • Cardano 的预测比例最低,表明用户对其投资热情相对较低。
  • Binance 的减量预测比例最高,表明用户对其未来表现持更悲观的态度。

3.2 希望检测

用户对不同加密货币的希望表达存在差异。

  • Fantom 的“非希望”评论比例最高,表明用户对其持怀疑或消极的态度。
  • Matic 的“非现实希望”评论比例最高,表明用户对其持有过度乐观或不切实际的期望。
  • Cardano 的“广义希望”评论比例最高,表明用户对其未来投资前景持更乐观的态度。

3.3 遗憾检测

不同加密货币的遗憾表达也存在差异。

  • Fantom 和 Binance 的“行动遗憾”和“不行动遗憾”评论比例最低,表明用户对其持更满意或自信的态度。
  • Ripple 的“行动遗憾”评论比例最高,表明用户对其过去投资决策持有更多的遗憾。
  • Matic 的“不行动遗憾”评论比例相对较高,表明用户对其错过投资机会持有更多的遗憾。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2107182.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java基于微信小程序的家庭财务管理系统,附源码

博主介绍:✌Java徐师兄、7年大厂程序员经历。全网粉丝13w、csdn博客专家、掘金/华为云等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇🏻 不…

微深节能 环冷机卸灰小车定位远程控制系统 格雷母线

微深节能环冷机卸灰小车定位远程控制系统中的格雷母线是一种高精度位移测量系统,该系统在环冷机卸灰小车的定位与控制中发挥着关键作用。 一、系统组成 格雷母线系统主要由以下几个核心部分组成: 格雷母线:一种特殊的编码线缆,通常…

RAG挑战来袭:长上下文的LLMs会取代RAG系统吗?

2023年,上下文LLMs窗口一般在4K-8K左右。但是,截至 2024 年 7 月,LLMs上下文窗口超过 128K 的情况很常见。 例如,Claude 2 有一个 100K 的上下文窗口。Gemini 1.5 声称有 2M 的上下文,后来的 LongRoPE 声称将LLM上下文窗口扩展到 200 万个令牌之外。此外,Llama-3–8B-I…

天气预报爬虫

一、获取天气接口 主要通过nowapi注册用户之后,进入相应的接口,进行抓取报文。 二、wireshark抓取报文,解析cjson格式 Http的交互过程 1.建立TCP连接 2.发送HTTP请求报文 3.回复HTTP响应报文 4.断开TCP连接 CJSON的使用办法 1. JSON…

关键字驱动的测试模式和代码实例分享

什么是关键字驱动测试? 关键字驱动测试 (KDT) 是一种软件测试方法,使用业务术语(关键字)来描述测试用例,而不是使用编程语言。它通过将测试逻辑与测试数据分离,简化了测试流程,并允许非技术人员…

Java运算符(详解)

前言: Java中运算符有哪些? 大致分为: 算术运算符、关系运算符、逻辑运算符、位运算符、移位运算符、条件运算符 接下来,一一分析。 算术运算符: 基本运算符: 加减乘除,是最基本的运算符。 例…

手搓 Java hashmap

1. 前言 都知道 hashmap 是哈希表,字典,这里全萌新向,至于为什么萌新向,因为我也不会,算是拷打自己对于一些流程的实现。 我们先把最基础的功能实现了,后面再考虑扰动,红黑冲突树,…

无线麦克风推荐哪些品牌,无线麦克风哪个品牌好,好的麦克风推荐

在声音创作与直播的领域里,无线领夹麦克风作为捕捉清晰声音的第一道防线,其重要性不言而喻。传统的有线麦克风及部分无线产品,难以在移动场景下提供稳定、清晰的录音效果;劣质无线领夹麦克风往往音质不稳定,甚至可能在…

爬虫 可视化 管理:scrapyd、Gerapy、Scrapydweb、spider-admin-pro、crawllab、feaplat、XXL-JOB

1、scrapyd 大多数现有的平台都依赖于 Scrapyd,这将选择限制在 python 和 scrapy 之间。当然 scrapy 是一个很棒的网络抓取框架,但是它不能做所有的事情。 对于重度 scrapy 爬虫依赖的、又不想折腾的开发者,可以考虑 Scrapydweb;…

Java IO异常处理:在Web爬虫开发中的实践

在当今的互联网时代,Web爬虫技术已经成为数据采集的重要手段之一。它们能够自动地从网页中提取信息,为数据分析、搜索引擎优化、内容聚合等提供了强大的支持。然而,Web爬虫在执行过程中可能会遇到各种输入/输出(IO)异常…

iomuxc、pinctrl子系统、gpio子系统(学习总结)

iomuxc、pinctrl子系统、gpio子系统三者的关系 相互依赖:IOMUXC、pinctrl子系统和gpio子系统在功能上相互依赖。IOMUXC提供了引脚复用和电气属性的配置能力,pinctrl子系统负责从设备树中获取这些配置信息并完成初始化,而gpio子系统则在引脚被…

华三防火墙第-安全策略02

一 安全策略的图解 安全策略是一种根据报文的属性信息对报文进行精细化转发控制的智能安全防护措施。它 融合了多维度精确报文识别、深度报文检测、安全动作执行、智能策略分析、应用风险调 优等多种安全防护功能,为网络的安全性提供全方位保障。 安全策略运行原理 安全策略对…

【代码解读】LLGC

对象创建: model LLGC(description.size(1), label.max().item()1, args.drop_out, args.use_bias).to(device)模型使用: output model(train_features)LLGC: # Lorentzian MODEL class LLGC(nn.Module):def __init__(self, nfeat, ncla…

家政保洁|基于SSM+vue的智能家政保洁预约系统(源码+数据库+文档)

智能家政保洁预约系统 基于SSMvue的智能家政保洁预约系统 一、前言 二、系统设计 三、系统功能设计 系统功能实现 后台模块实现 管理员功能实现 家政人员功能实现 用户功能实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获…

多维动态规划-面试高频!-最长公共子序列和最长公共子串、回文串-c++实现和详解

1143. 最长公共子序列 中等 给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0 。 一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删…

UE驻网失败问题(三)

这个问题是lab问题,现象如下: 期望UE注册在SA网络下,咋一看没有5G MIB/SIB1打印,好像是没搜到5G小区,而实际上并不是这样。 在查看搜网过程时会发现如下log打印: [I nr5g_rrc_acq.c 3544] RRC ACQ: Band 41…

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

01 引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶&#xff0c…

ElasticSearch-Ingest Pipeline Painless Script

Ingest Node & Pipeline & Processor Ingest NodePipeline & Processor内置的 Processors创建 pipeline使用 pipeline 更新数据借助 update_by_query 更新已存在的文档Ingest Node VS Logstash Painless Ingest Node & Pipeline & Processor 应用场景&…

坚持与等待的区别!看了当年高考状元如今的现状,我才明白所谓名校的真相——早读(逆天打工人爬取热门微信文章解读)

快 机会来了 引言Python 代码第一篇 洞见 看了当年高考状元如今的现状,我才明白所谓名校的真相第二篇 股市 之 空窗期结尾 (不是 你改名 怎么改群名字! 这下每个人都知道王妈妈单身了) 引言 昨天忘记写了 真的很抱歉 说下借口哈…

Invicti-Professional-V24.8.1

前言 Invicti 专业 Web 应用程序安全扫描器 自动、极其准确且易于使用的 Web 应用程序安全扫描程序,可自动查找网站、Web 应用程序和 Web 服务中的安全漏洞。 Invicti Professional Edition 是一款商业 Web 应用程序安全扫描器。它旨在自动查找和修复 Web 应用程…