【电商干货分享】干货速看!电商数据集大全!

news2024/10/5 14:22:43

数据分析——深入探索中小企业数字化转型,专注提供各行业数据分析干货、分析技巧、工具推荐以及各类超实用分析模板,为钻研于数据分析的朋友们加油充电。

公共参数

名称类型必须描述
keyString调用key(必须以GET方式拼接在URL中)
secretString调用密钥
api_nameStringAPI接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cacheString[yes,no]默认yes,将调用缓存的数据,速度比较快
result_typeString[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
langString[cn,en,ru]翻译语言,默认cn简体中文
versionStringAPI版本

请求参数

请求参数:num_iid=10335871600

参数说明:num_iid:JD商品ID

响应参数

Version: Date:

名称类型必须示例值描述

item

item[]0获得JD商品详情

电商数据集通常包含专有信息,因此很难在公共数据库中找到。在互联网上进行搜索以收集可公开获得的电子商务数据的列表,请享用!

1、电商产品数据集

1)Fashion-MNIST:MNIST非常适合产品分类用例,其中包含10个类别的近60,000张时尚产品的训练图像和10,000张测试图像。

https://github.com/zalandoresearch/fashion-mnist

2)来自“维多利亚的秘密”和其他杂志的内衣数据:来自流行零售网站的600,000多种内衣产品数据。它包括产品说明,价格,类别,评级等。

https://www.kaggle.com/PromptCloudHQ/innerwear-data-from-victorias-secret-and-others

3)电子产品和定价数据:此数据集包含7,000多种电子产品的列表以及10个价格信息字段。

https://data.world/datafiniti/electronic-products-and-pricing-data

4)男鞋价格:10,000张男鞋的清单以及各种售价。

https://data.world/datafiniti/mens-shoe-prices

5)女鞋价格:除了以前的数据集之外,它还包含10,000种女鞋的列表以及各种售价。

https://data.world/datafiniti/womens-shoe-prices

6)电子商务商品数据:对于推荐系统很有用,该数据集包含SKU及其来自户外服装品牌产品目录的相关产品描述。

https://www.kaggle.com/cclark/product-item-data/home

7)Amazon.com上的Fashion Products:这是通过从Amazon提取数据而创建的预抓取数据集。它由亚马逊上约22,000种时尚产品组成。

https://data.world/promptcloud/fashion-products-on-amazon-com

8)服装的电子商务标签:此零售数据集包含来自电子商务网站的图像,在衬衫,夹克,太阳镜等周围画有边框。它有907个项目,其中504个项目已手动标记。

https://dataturks.com/projects/devika.mishra/E-commerce%20Tagging%20for%20clothing

2、零售交易数据集

1)在线零售数据集(UCI机器学习存储库):此数据集包含一个总部位于英国的在线零售公司在八个月内(01/12 / 2010-09 / 12/2011)的所有交易。

https://www.kaggle.com/carrie1/ecommerce-data/home

2)巴西电子商务公共数据集:此数据集包含2016年至2018年在多个市场在Olist上做出的100,000多个巴西匿名订单(100k订单)。此外,它包括从订单状态,价格,付款和货运绩效到客户的真实书面评论的多个维度。

https://www.kaggle.com/olistbr/brazilian-ecommerce/home

3)Online Auctions数据集:零售数据集,其中包含Cartier手表,Xbox游戏机,Palm Pilot M515 PDA和Swarovski珠子上的eBay拍卖数据。

https://www.kaggle.com/onlineauctions/online-auctions-dataset/home

4)Retailrocket推荐系统数据集:此数据是在4.5个月的时间内从真实的电子商务网站收集的。此外,它还包含有关访客行为的信息,包括点击,添加到购物车和交易等事件。

https://www.kaggle.com/retailrocket/ecommerce-dataset/home

3、电子商务搜索相关性数据集

1)电子商务搜索相关性:此集合包含图像URL,页面排名,每种产品的描述,导致每种结果的搜索查询以及来自五个主要英语电子商务网站的更多信息。

https://data.world/crowdflower/ecommerce-search-relevance

2)百思买搜索查询NER数据集:零售数据集,包含在bestbuy.com上带有手动标记的搜索查询。搜索查询中的短语被标记为各种重要实体,例如品牌,型号名称,类别名称等。

https://dataturks.com/projects/Mohan/Best%20Buy%20E-commerce%20NER%20dataset

4、客户审查数据集

1)女士电子商务服装评论:另一个电子商务数据的绝佳资源,此Kaggle数据集包含23,000个真实的客户评论和评分。但是,由于其特征是真实的商业数据,因此所有信息都已匿名化。因此,在评论文本和正文中对公司的引用已被替换为“零售商”。

https://www.kaggle.com/nicapotato/womens-ecommerce-clothing-reviews/home

2)Amazon Commerce评论集:此零售数据集用于在线Writeprint中的作者身份识别,Writeprint是模式识别的新研究领域。此外,为了检查分类算法的鲁棒性,我们确定了50个最频繁发布评论的最活跃用户。

https://archive.ics.uci.edu/ml/datasets/Amazon+Commerce+reviews+set

3)多域情感分析数据集:稍旧的零售数据集,其中包含按产品类型和等级划分的产品评论数据。此外,评论包含星级(1到5颗星),可以根据需要将其转换为二进制标签。

http://www.cs.jhu.edu/~mdredze/datasets/sentiment/

4)亚马逊和百思买电子:来自50种电子产品的7,000多个在线评论列表。除了评论本身之外,数据集还包括日期,来源,等级,标题,评论者元数据等。

https://data.world/datafiniti/amazon-and-best-buy-electronics

5)语法和在线产品评论:这是Datafiniti的一个大型数据集的示例。它包含超过70,000条评论的列表,可用于许多机器学习用例。例如,您可以评估写作质量如何影响正面和负面的在线产品评论。

https://data.world/datafiniti/grammar-and-online-product-reviews

5、电子商务数据集

1)年度零售贸易调查(ARTS):此数据集提供了在美国境外持有的年度总销售,运营费用和库存的国家估计。

https://catalog.data.gov/dataset/annual-retail-trade-survey

2)经济普查:经济普查每五年对国家和地方一级的行业和社区的商业活动进行详细描述。

https://catalog.data.gov/dataset/economic-census

3)E-Stats:美国政府的该数据集报告了无论通过开放式网络(例如Internet)在线销售的商品和服务的价值。

https://catalog.data.gov/dataset/e-stats

4)欧盟对外贸易数据集:另一个政府数据集,欧盟对外贸易数据集提供有关按商品,按原产国或目的地分类的进出口,贸易顺差值的信息。

https://ec.europa.eu/eurostat/web/international-trade-in-goods/data

5)1999-2015年按商品类别划分的电子商务销售额:此数据集包含真实的普查数据,该数据显示了按商品类别划分的电子商务总销售额以及1999-2015年的复合年增长率。

https://www.census.gov/data/tables/2015/econ/e-stats/2015-e-stats.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1900765.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LRU缓存算法设计

LRU 缓存算法的核⼼数据结构就是哈希链表,双向链表和哈希表的结合体。这个数据结构⻓这样: 创建的需要有两个方法,一个是get方法,一个是put方法。 一些问题:为什么需要使用双向链表呢?因为删除链表的本身&…

Python统计实战:时间序列分析之一元线性回归预测和指数曲线预测

为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能,从而更快地掌握解决问题所需的能力。 (以下练习题来源于《统计学—基于Python》。请在Q群455547227下载原始数据。) 练习题 下表是某只股票…

Unity入门之重要组件和API(3) : Transform

前言 Transform类主要处理游戏对象(GameObject)的位移、旋转、缩放、父子关系和坐标转换。 1.位置和位移 1.1必备知识点:Vector3 Vector3 主要用来表示三维坐标系中的一个点或者一个向量。 【声明】 Vector3 v1 new Vector3(); Vector3 v2 new Vector3(10, 10…

Redis---9---集群(cluster)

将新增的6387节点(空槽号)作为master节点加入原集群 Redis—9—集群(cluster) 是什么 定义 ​ 由于数据量过大,单个Master复制集难以承担,因此需要对多个复制集进行集群,形成水平扩展每个复…

uniapp 在手机上导出excel

1.创建excelDev.js文件 export default {exportExcel(fileData, documentName excel) {plus.io.requestFileSystem(plus.io.PUBLIC_DOCUMENTS, function(fs) {let rootObj fs.rootlet fullPath rootObj.fullPathconsole.log("开始导出数据")// 创建文件夹rootObj…

基于海思Hi3403V100方案开发双目1600万拼接相机测试截图

海思Hi3403V100平台SOC内置四核A55,提供高效且丰富和灵活的CPU资源,以满足客户计算和控制需求,并且集成单核MCU,已满足一些低延时要求较高场景。 多目相机PE108CB板是针对该芯片设计的一款多目凭借相机PCBA,硬件接口支…

微米级触觉感知的紧凑视触觉机器人皮肤

视触觉皮肤(VTS)分为涂层型、标记型和热致变色型。涂层的耐磨性和空间分辨率是涂层型VTS的核心问题。近期,北京邮电大学方斌教授联合中国地质大学(北京)杨义勇教授,在传感器领域Q1期刊IEEE Sensors Journal…

【Java学习笔记】方法的使用

【Java学习笔记】方法的使用 一、一个例子二、方法的概念及使用(一)什么是方法(二)方法的定义(三)方法调用的执行过程(四)实参和形参的关系(重要)&#xff08…

Python排序,你用对了吗?一文教你sorted和sort的正确姿势!

目录 1、sorted基础用法 🍏 1.1 列表排序入门 1.2 自定义排序规则 1.3 排序稳定性和key函数 2、sort内置方法操作 🔍 2.1 直接修改原列表 2.2 sort高级技巧与性能考量 2.3 案例:数据预处理实战 2.4 高级用法:reverse与cmp_to_key 3、应对复杂数据结构 🌐 3.1…

【学习笔记】操作系统--万字长文

计算机操作系统 文章目录 计算机操作系统引言 操作系统基本概念第一章 引论目标和作用操作系统发展历程单道批处理系统多道批处理系统分时系统实时系统 基本特征并发共享虚拟异步性(不确定性) 操作系统主要功能处理机管理内存管理设备管理文件管理 第二章…

平价蓝牙耳机推荐有哪些?四大超值平价蓝牙耳机品牌盘点

市面上的蓝牙耳机品牌繁多,价格差异巨大,对于预算有限但又不想牺牲音质和使用体验的消费者来说,寻找到既平价又性能出色的蓝牙耳机无疑是一项挑战,那么在平价蓝牙耳机推荐有哪些?面对这个疑问,作为真无线蓝…

C # @逐字字符串

逐字字符串 代码 namespace TestAppConsole {class program{static void Main(string[] args){int a 0;int b 9;string c "2ui923i9023";//Console.Write(sizeof(int));string d "\t8282jjksk";string e "\t8282jjksk";Console.WriteLine(…

塔子哥的收藏夹-美团2023笔试(codefun2000)

题目链接 塔子哥的收藏夹-美团2023笔试&#xff08;codefun2000&#xff09; 题目内容 输入描述 输出描述 样例1 输入 4 7 1 0 1 0 1 0 1 1 1 1 3 1 4 1 3 2 3 5 3 100 3 输出 0 2 7 7 提示 操作记录为 0 0 0 0(初始) 询问[1,3]结果为000> 2 0 0 0<1号更改为2> <…

独家揭秘!格行随身WiFi‘骄傲’宣言背后的震撼行业的真相!随身WiFi行业内黑马

近几年以来&#xff0c;随行WiFi产品呈现爆发式增长&#xff0c;随行WiFi的火爆&#xff0c;是技术进步带给消费者的一种“福利”&#xff0c;各大直播间也充斥着品牌各异的随身WiFi。但真正脱颖而出、赢得消费者信赖的优质品牌却凤毛麟角。而其中最受欢迎的格行随身WiFi也因设…

【Python】已解决:FileNotFoundError: [Errno 2] No such file or directory: ‘./1.xml’

文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决&#xff1a;FileNotFoundError: [Errno 2] No such file or directory: ‘./1.xml’ 一、分析问题背景 在Python编程中&#xff0c;FileNotFoundError是一个常见的异常&…

[CP_AUTOSAR]_分层软件架构_内容详解

目录 1、软件分层内容1.1、Microcontroller Abstraction Layer1.2、ECU Abstraction Layer1.2.1、I/O HW Abstraction1.2.2、Communication Hardware Abstraction1.2.3、Memory Hardware Abstraction1.2.4、Onboard Device Abstraction1.2.5、Crypto Hardware Abstraction 1.3、…

基于机器学习(霍特林统计量,高斯混合模型,支持向量机)的工业数据异常检测(MATLAB R2021B)

近年来&#xff0c;隨着集散控制系统、工业物联网、智能仪表等信息技术在现代工业生产系统中的应用&#xff0c;生产过程的运行状态能够以大量数据的形式被感知和记录。基于数据的故障诊断方法以过程数据为基础&#xff0c;采用统计分析、统计学习、信号处理等方法&#xff0c;…

100+大屏模板,基于Vue 国产开源 IoT 物联网 Web 组态可视化 BI 数据分析工具

项目源码&#xff0c;文末联系小编 01 DataEase 可视化大屏 DataEase 是一个国产开源的数据可视化分析工具(BI工具)&#xff0c;旨在帮助用户快速分析数据并洞察业务趋势&#xff0c;以实现业务的改进与优化。它支持丰富的数据源连接&#xff0c;包括OLTP和OLAP数据库、数据仓库…

【Python文件】操作终极指南:高效管理和处理文件系统的必备技能

目录 ​编辑 1. 文件的基础操作 1.1 打开/关闭文件 ​编辑 示例代码 文件对象 使用with语句打开文件 2. 读文件 2.1 使用read方法读取文件 2.2 使用readline方法读取文件 2.3 使用readlines方法读取文件 2.4 使用for循环读取文件 3. 写文件 3.1 使用write方法写文…

蓝桥杯web组国三选手题纲解析和备赛技巧--经验分享

蓝桥杯web组赛题解析和杯赛技巧 **&#x1f389;&#x1f389;&#x1f389;欢迎来到我的博客,我是一名自学了2年半前端的大一学生,熟悉的技术是JavaScript与Vue.目前正在往全栈方向前进, 如果我的博客给您带来了帮助欢迎您关注我,我将会持续不断的更新文章!!!&#x1f64f;&am…