SPSSAU【文本分析】|我的项目

news2024/10/5 18:32:32

文本分析之我的项目

SPSSAU提供文本分析模块,其单独针对文本数据进行研究和分析使用,其包括词云分析、文本情感分析、文本聚类分析、社会网络关系分析、LDA主题分析、新词发现和我的词库等功能。使用SPSSAU进行文本分析时,涉及下述内容。分别是进入文本分析模块路径,文本数据上传管理等,以及如何进行分析和研究使用。接下来逐一进行说明。

第1、进入文本分析模块路径

进入文本分析模块的路径有以下3种。分别是通过搜索框进入、仪表盘点击进入或者输入网址进入。

1SPSSAU搜索框进入

在SPSSAU主系统左上角处进行搜索,比如搜索‘文本’二字时,下拉中会提示文本分析模块,当然搜索其它的潜在关键词,比如情感分析、LDA、文本聚类等均可。

2 SPSSAU界面仪表盘进入

通过SPSSAU主系统左侧仪表盘点击‘文本分析模块’进入。

3输入网址

与此同时,可输入文本分析模块的网址链接:https://spssau.com/textanalysis.html进入,当然如果此时没有登录SPSSAU,系统会提示首先登录账号。

第2、文本数据上传管理等

进入SPSSAU文本分析模块之后,首先需要上传文本数据。上传数据涉及以下内容:

  • 支持直接粘贴文本进行上传数据
  • 支持上传txt或excel格式数据
  • 上传文件最高限制为5M

用户可‘点击上传’自己的文本数据,在弹出对话框中,可实现真实粘贴文本进行上传或者上传txt/excel文件等。如下图所示:

如果是第1次使用,可直接点击‘体验DEMO数据’体验文本分析模块功能。

需要注意的是:如果是通过excel格式(包括csv/xls/xlsx格式)时,只需要1列数据,该列数据中包括文本信息,类似如下图所示:

将文本全部放置于A列中,A列不需要有标题信息。每行(即每个单元格)存在1个分析文本。如果是txt文档或者粘贴文本进行上传,那么系统会自动过滤掉空行数据,并且以回车键作为每行(即每个分析文本)标志。

每份数据是1个项目,最高支持10个项目(即10个数据),如果是粘贴数据上传,那么系统会自动对其命名,格式为时间+粘贴上传,名称类似为“20240112 15:06:31 粘贴上传”,当然用户可对该名称进行修改。上传完成后展示信息类似如下:

其展示项目的名称,上传时间,文件大小,总行数,分析时间和总共切词次数等。当前文件上传后还未进行分析,因而没有分析时间和总词数这两个信息。在项目分析之后则会展示该两项信息。

提示:

当前SPSSAU限制周会员及以上用户使用,仅购买1天的会员或者非会员无法使用文本分析模块功能,也无法上传文本数据。如果是购买SPSSAU权益号,那么其分配出来的账号或者会员均享受周会员权益,即可使用文本分析模块功能。

第3、进行分析

上传文本数据后,接着则需要对该数据(项目)进行分析。点击‘开始分析’按钮,项目则开始进行分析。如下图所示:

提示:

文本分析计量量大,其较为耗资源和耗时间,当文本文件较大(比如大于2M)时,可能需要等待较长时间才能完成(通常会在5分钟内完成),请耐心等待其完成。

此时点击‘开始分析’也会有‘项目正在分析,请等待’的提示。并且此时左侧仪表盘均为灰色无法点击。

如果对我的词库有过变动,比如加入或移出新词,加入或移出停用词,加入或移出情感词等,在这些操作全部完成后,可重新进行分析,点击重新分析按钮即可。强烈建议一次性处理完成新词、停用词或者情感词后,再点击重新分析,否则可能出现较长时间等待。

如果完成分析后,‘开始分析’按钮会展示为‘进入项目’,也会展示‘重新分析’按钮,此时点击‘进入项目’即可查看对应的分析,比如词云分析情况等。类似如下图所示:

最后,针对上传的文件数据,可对其进行相关管理,包括查看数据,下载数据,下载分析和重命名,也或者删除该项目等,如下图所示。需要提示的是:删除文件后无法恢复(如果不删除会存储在云端),以及下载分析可能会因为进行其它分析而改变,比如默认没有情感分析的分析结果,但在完成按行文本聚类分析之后在点击下载分析,此时下载出的分析结果中包括聚类分析的结果。

我的项目界面展示信息类似如下:

SPSSAU

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1456839.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【刷刷刷,爽!】leetcode198. 打家劫舍

题目如上! 这是一道非常非常标准的初级动规题。属于走楼梯的进阶版。所以我们尝试把他变成走楼梯。 怎么变?或者说是怎么看成走楼梯。 答案是!!!! 看最后一个数。 往往会最有灵感。 比如示例1中[1,2,3,4]&a…

docker 服务的启动命令

Docker 服务的启动命令主要涉及 Docker Daemon 的启动和管理。Docker Daemon 是在后台运行的服务进程,负责管理 Docker 容器的创建、运行、停止等操作。根据你使用的操作系统,启动 Docker 服务的命令可能有所不同。 对于 Linux 系统 使用 systemctl (适…

【二十四】【C++】多态

多态的基本概念 多态是一种允许使用相同的接口来访问不同的底层形式(类型)的对象的能力。C中的多态主要通过以下两种方式实现: 编译时多态(静态多态):通过函数重载和运算符重载实现。 运行时多态&#x…

基于数字双输入的超宽带Doherty功率放大器设计-从理论到ADS版图

基于数字双输入的超宽带Doherty功率放大器设计-从理论到ADS版图 参考论文: 高效连续型射频功率放大器研究 假期就要倒计时啦,估计是寒假假期的最后一个博客,希望各位龙年工作顺利,学业有成。 全部工程下载:基于数字双输入的超宽…

机器人初识 —— 定制AI

一、机器人设计难点 波士顿动力设计的机器人,尤其是其人形机器人Atlas和四足机器人Spot等产品,在技术上面临多重难点: 1. **动态平衡与稳定性**:双足或四足机器人在运动时需要维持极高的动态平衡,特别是在不平坦地面…

KMP算法简介以及相关例题的分析

一.KMP算法简介 KMP 算法是 D.E.Knuth、J,H,Morris 和 V.R.Pratt 三位神人共同提出的,称之为 Knuth-Morria-Pratt 算法,简称 KMP 算法。该算法相对于 Brute-Force(暴力)算法有比较大的改进,主要是消除了主串指针的回溯…

【Java面试】MongoDB

目录 1、mongodb是什么?2、mongodb特点什么是NoSQL数据库?NoSQL和RDBMS有什么区别?在哪些情况下使用和不使用NoSQL数据库?NoSQL数据库有哪些类型?启用备份故障恢复需要多久什么是master或primary什么是secondary或slave系列文章版…

【Vuforia+Unity】01实现单张多张图片识别产生对应数字内容

1.官网注册 Home | Engine Developer Portal 2.下载插件SDK,导入Unity 3.官网创建数据库上传图片,官网处理成数据 下载好导入Unity! 下载好导入Unity! 下载好导入Unity! 下载好导入Unity! 4.在Unity设…

unity C#中的封装、继承和多态简单易懂的经典实例

文章目录 封装 (Encapsulation)继承 (Inheritance)多态 (Polymorphism) C#中的封装、继承和多态是面向对象编程(OOP)的三大核心特性。下面分别对这三个概念进行深入解释,并通过实例来说明它们在实际开发中的应用。 封装 (Encapsulation) 实例…

11. Springboot集成Dubbo3(二)示例demo

目录 1、前言 2、注册中心 3、快速开始 3.1、添加dubbo3依赖 3.2、dubbo3-api ​编辑 3.3、dubbo3-server 3.3.1、添加依赖 3.3.2、实现IUserService 3.3.3、添加配置文件application.properties 3.3.4、修改Application启动类 3.3.5、出错解决 3.4、dubbo3-porta…

世界顶级名校计算机专业,都在用哪些书当教材?

前言 在当今信息化、数字化时代,计算机科学已成为全球最为热门和重要的学科之一。世界顶级名校的计算机专业,更是培养未来行业领袖和创新人才的重要基地。那么,这些名校的计算机专业究竟使用哪些教材呢?这些教材又具有哪些特色和…

智能化机械生产引擎:亿发制造ERP系统助帮助工厂真正把控车间管理

工厂的制造管理过程以车间管理为核心,而车间管理涉及到生产的下达、派工、汇报等复杂流程,几乎包含了生产的全过程。这种繁琐性使得车间管理变得异常困难,因此,引入一款专业的制造ERP软件成为解决难题的有效途径。 在制造业引入E…

文件IO及目录IO——day05

文件IO还剩下一个知识点,今天主要内容是目录IO 文件IO lseek lseekoff_t lseek(int fd, off_t offset, int whence); 功能:重新设定文件描述符的偏移量 参数:fd:文件描述符offset:偏移量whence:SEEK_SET 文件开头SEEK_CUR 文件当前位置SEEK_END 文件末尾…

【PyQt6] 框选截图功能

1 简介 书接上回, 全屏截图实现起来很简单, 来点稍微复杂点的, 框选截图 原理很简单, 弄个控件实现全屏半透视, 在全屏控件上画一个选框或者再弄一个几乎全透的子控件,实现鼠标拖动,缩放,移动, 键盘wasd 微调 用一个控件实现起来会很完美, 但是逻辑全部堆砌在一起,看代码会很…

PWM功能介绍 和配置

泰山派默认提供了3组PWM的GPIO , 为了检测PWM的输出,我们可以配合逻辑分析仪来查看效果,或者搭配STC8的LED灯 PWM 测试 列举所有的PWM设备: # 查找所有有pwm名称的文件 find / -name "pwm" # pwm4: pwmfe6e0000 edp屏幕…

VPX信号处理卡设计原理图:9-基于DSP TMS320C6678+FPGA XC7V690T的6U VPX信号处理卡 信号处理 无线电通信

一、概述 本板卡基于标准6U VPX 架构,为通用高性能信号处理平台,系我公司自主研发。板卡采用一片TI DSP TMS320C6678和一片Xilinx公司Virtex 7系列的FPGA XC7V690T-2FFG1761I作为主处理器,Xilinx 的Aritex XC7A200T作为辅助处理器。XC7A2…

OpenAI视频生成模型Sora的全面解析:从ViViT、扩散Transformer到NaViT、VideoPoet

前言 真没想到,距离视频生成上一轮的集中爆发(详见《视频生成发展史:从Gen2、Emu Video到PixelDance、SVD、Pika 1.0、W.A.L.T》)才过去三个月,没想OpenAI一出手,该领域又直接变天了 自打2.16日OpenAI发布sora以来(其开发团队包…

30分钟快速上手LaTex

文章目录 30 分钟快速上手 LATEX1.什么是LATEX?2.为什么学习LATEX?3.编写第一个LATEX程序4.LATEX文档的序言5.LATEX文档的标题、作者和日期信息6.LATEX文档的注释7.LATEX文档的粗体、斜体和下划线8.LATEX文档中添加图片9.LATEX中对图像进行标注、标签化和引用10.在LATEX中创建…

105.网游逆向分析与插件开发-网络通信封包解析-分析接收到的对话数据包

内容参考于:易道云信息技术研究院VIP课 上一个内容:接收数据的初步逆向分析 通过上一个内容,找到了数据包出现的一个很重要的位置,只要hook之后就能很好的得到这个数据了 然后来到明文数据的位置,把数据包复制出来&…

跨境电商独立站是什么?为什么要做独立站?

独立站在近两年被推上风口,很多人跟风涌入赛道,但并不知道做独立网站的根本原因是什么?为什么跨境电商要做独立站? 今天分享这篇文章,希望能帮助正在建站或想要建站的朋友们建立起对独立站的优劣势、未来发展空间的一…