Quilt Catalog 是 Quilt 的第二部分。它提供了一个在您的 S3 存储桶上的界面,将 Quilt 的数据包和搜索等功能带到了 Web 界面上。
请注意,您可以在不使用 Quilt Catalog 的情况下使用 Quilt Python API,但它们是设计为配合使用的。
简要介绍
Quilt Catalog 提供了数据目录的主页,基于您可以选择在存储桶顶部创建的 README.md 文件。
浏览
Catalog 允许您使用“Packages”选项卡浏览注册表中的数据包。
Packages 选项卡
您还可以使用“Bucket”选项卡浏览底层的 S3 对象。
Files 选项卡
搜索
Catalog 还可以让您搜索存储桶中的内容。我们支持无结构的搜索(例如“San Francisco”)和结构化的搜索(例如“metadata_key: metadata_value”)。搜索结果可以在搜索结果中直接预览。
上传数据包
您可以上传一个新的数据包,提供数据包名称、提交消息、文件、元数据和工作流。
名称应以命名空间/数据包
名称的格式命名。
消息需要为此数据包的新版本添加备注。
文件是数据包的内容。
相关的工作流包含验证数据包的规则。
元数据可以使用 JSON 编辑器添加,用于包和数据包内的单个文件条目,以键/值表的形式表示,支持无限嵌套。如果您的工作流包含 JSON 模式,则会基于模式预定义键/值对。
JSON 编辑器
要添加新的键/值字段,请双击空单元格并输入键名,然后按“Enter”或“Tab”键,或单击单元格外部。要更改值,请双击该值。
值可以是字符串、数字、数组或对象。您输入的每个值都将被解析为 JSON。
限制
目前不支持引用和复合类型。
推送到存储桶
您可以将现有的数据包从一个 S3 存储桶推送到另一个存储桶。要使用此功能,请参阅该页面。
摘要
向数据包(或 S3 目录路径)添加 quilt_summarize.json 文件将在首页上启用内容预览功能。
详细信息请参阅该页面。
数据包首页
管理界面
Quilt Catalog 包括一个管理面板,您可以在其中管理用户和存储桶,并自定义 Quilt Catalog 的显示方式。详细信息请参阅该页面。