特征
插件 Reshape.XL 包括 130 个基本可组合功能。使用它们,您可以快速轻松地进行非常复杂的数据转换和处理。它们的架构和基本定义受到 SQL 和 R 语言的强烈启发。
到目前为止,类似的功能只能通过脚本语言供程序员使用。借助 Reshape.XL 插件,您还可以在简单易用的可视化界面中访问这些功能。插件函数分为七个基本组。这些逻辑组形成单独的功能区选项卡。
#重塑
功能区选项卡“重塑”包含用于编辑数据集一般特征的基本功能。例如,分组-取消分组功能用于创建“虚拟子表”。以下功能在这些子表中单独执行。收集和传播函数用作“行到列”和“列到行”转换。使用 Transpose 和 Flip,您可以旋转数据集。打包功能允许您自动删除完全空的行和列。
#变量
功能区选项卡变量包含“基于列”的函数。例如,您可以格式化变量(数据类型)、选择它们、重新排序、排列或重命名。Complete 函数用于补全数据集中缺失的组合(从隐式缺失值到显式缺失值)。接下来,您可以组合或划分变量。最后,所描述的选项卡包括用于处理缺失值的功能。
#子集
子集组中的函数用于从数据集中选择行(记录) - “基于行”函数。您可以通过多种方式过滤这些记录 - 您可以选择唯一记录,可以对数据集进行随机采样,可以选择前 N 个数据集记录或后 N 个数据集记录,最后,您可以使用复杂的 Slice 函数选择数据集记录。
#变异
变异函数用于修改现有变量或创建新变量。您可以逐步或一次编辑/改变多个变量。在这里您还可以找到“条件编辑”功能,这些功能可以根据定义的选择标准修改变量。此外,您还会发现 SQL 语言中众所周知的许多其他功能,例如 Lead、Lag 或 Coalesce 命令或累积(例如 Cumulative Mean)和排名(例如 Row Number 或 Rank)函数。
#总结
另一组则专注于总结。这些函数计算选定的统计值,例如最小值、总和、平均值、中值、百分位数或四分位数范围。这些函数可以应用于整个数据集(所有记录)或数据集组。
#结合
以下一组功能可用于数据集组合。Join 函数的灵感来自于 SQL 语言中的类似函数,通过不同的设置,您可以实现不同类型的连接,例如全连接、左连接、反连接或外连接。此外,您还可以使用其他组合数据集的函数,例如 Intersect、Except、Set_Diff 或 Union。使用 Bind_Cols 函数,可以将列从一个数据集插入到另一个数据集。
#特别的
最后一组包含一组特定功能。它们按指定的数据类型划分。这些函数可用于处理数字、字符串和日期时间格式的变量。例如,您可以在统计分析之前对类别进行匿名化、从特定格式解析时间和日期值,或者使用多个与字符串相关的高级函数。
可以选择组合各个插件功能。通过这种方式,您可以设计和执行非常高级的数据转换和调整类型。另一方面,他们的定义极其快速、简单且高效。