【Kaggle】初学者几个冷门的操作总结

news2025/1/10 18:31:24

文章目录

  • 一、如何看当前的目录?
  • 二、Kaggle如何切换路径?
  • 三、与包安装或设置有关的错误
  • 四、如何把 Kaggle 上的 input 数据转到 output 中?

一、如何看当前的目录?

在 Linux 中,你可以使用 pwd 命令来查看当前所在的目录。“pwd” 代表 “Print Working Directory”,它会显示出当前工作目录的路径。

要查看当前目录,请按照以下步骤操作:

  • 打开终端,以进入命令行界面。
  • 输入 pwd 命令,然后按下回车。
  • 系统将显示当前目录的绝对路径,例如 /home/user/Documents。这表示你当前位于名为 “Documents” 的文件夹下。

请注意,Linux 中的路径可以是相对路径或绝对路径。相对路径是相对于当前目录的路径,而绝对路径是从根目录开始的完整路径。pwd 命令始终显示绝对路径。

在Kaggle中的操作为:

!pwd

输出结果为:

在这里插入图片描述

二、Kaggle如何切换路径?

在 Kaggle 上,你可以通过以下步骤切换到输入数据的路径:

  1. 在 Kaggle 网站上打开你的 Kernel(或者 Notebook)。
  2. 点击右侧的 “Data” 选项卡,它会显示出可用的输入数据集。
  3. 在 “Data” 选项卡下,你会看到一个名为 kaggle 的目录。输入数据集通常会被挂载到此目录下。
  4. 使用以下命令切换到输入数据的路径:
import os

input_path = "/kaggle/input"
os.chdir(input_path)

这将把当前工作目录更改为输入数据的路径 /kaggle/input。现在你可以通过该路径访问输入数据集中的文件。

请注意,如果你使用的是 Kaggle Notebook,则输入数据集会自动挂载到 /kaggle/input 目录下。但是,如果你使用的是 Kaggle Kernel,则需要将输入数据集手动添加到 Notebook 设置中,并且在切换到输入数据路径之前,你需要等待输入数据集加载完成。

在这里插入图片描述

三、与包安装或设置有关的错误

我在安装包的过程中,用到了这样的命令:

!python -m pip install -e regionclip-main

但是代码报错:

Obtaining file:///kaggle/input/regionclip-main
  Preparing metadata (setup.py) ... error
  error: subprocess-exited-with-error
  
  × python setup.py egg_info did not run successfully.
  │ exit code: 1
  ╰─> [21 lines of output]
      Traceback (most recent call last):
        File "/kaggle/input/regionclip-main/setup.py", line 174, in get_model_zoo_configs
          os.symlink(source_configs_dir, destination)
      OSError: [Errno 30] Read-only file system: '/kaggle/input/regionclip-main/configs' -> '/kaggle/input/regionclip-main/detectron2/model_zoo/configs'
      
      During handling of the above exception, another exception occurred:
      
      Traceback (most recent call last):
        File "<string>", line 2, in <module>
        File "<pip-setuptools-caller>", line 34, in <module>
        File "/kaggle/input/regionclip-main/setup.py", line 202, in <module>
          package_data={"detectron2.model_zoo": get_model_zoo_configs()},
        File "/kaggle/input/regionclip-main/setup.py", line 177, in get_model_zoo_configs
          shutil.copytree(source_configs_dir, destination)
        File "/opt/conda/lib/python3.10/shutil.py", line 559, in copytree
          return _copytree(entries=entries, src=src, dst=dst, symlinks=symlinks,
        File "/opt/conda/lib/python3.10/shutil.py", line 457, in _copytree
          os.makedirs(dst, exist_ok=dirs_exist_ok)
        File "/opt/conda/lib/python3.10/os.py", line 225, in makedirs
          mkdir(name, mode)
      OSError: [Errno 30] Read-only file system: '/kaggle/input/regionclip-main/detectron2/model_zoo/configs'
      [end of output]
  
  note: This error originates from a subprocess, and is likely not a problem with pip.
error: metadata-generation-failed

× Encountered error while generating package metadata.
╰─> See above for output.

note: This is an issue with the package mentioned above, not pip.
hint: See above for details.

这似乎是一个与包安装或设置有关的错误,而不是路径切换问题。以下是一些可能的解决方法:

  1. 检查输入数据集和依赖项: 确保你正确添加了输入数据集,并且依赖项和所需的文件都在正确的位置。可能有一些文件或配置缺失或被放置在了不正确的位置。
  2. 检查文件系统权限: 错误信息中提到了 “Read-only file system”,这可能意味着你没有足够的权限在该路径下创建或修改文件。在 Kaggle 上,输入数据集通常是只读的,因此你可能无法修改其中的文件。你可以尝试将文件复制到其他目录中,并在该目录下进行操作。
  3. 联系包的作者或提供者: 错误信息中还提到了 setup.py 文件的错误,这可能是包的安装过程中出现了问题。

四、如何把 Kaggle 上的 input 数据转到 output 中?

在 Kaggle 上,你可以使用以下步骤将输入数据转移到输出目录中:

  1. 在 Kaggle 网站上打开你的 Kernel(或者 Notebook)。
  2. 在 Notebook 中,通过以下代码获取输入数据的路径:
import os
import shutil

input_path = "/kaggle/input"
  1. 然后,使用以下代码创建一个输出目录并将输入数据复制到输出目录中:
output_path = "/kaggle/working/output"
os.makedirs(output_path, exist_ok=True)

# 复制输入数据到输出目录
input_files = os.listdir(input_path)
for file in input_files:
    source = os.path.join(input_path, file)
    destination = os.path.join(output_path, file)
    shutil.copyfile(source, destination)

以上代码会在输出目录 /kaggle/working/output 中创建与输入数据相同的文件,并将输入数据复制到输出目录中。你可以根据需要修改输出目录的路径。

请确保你有足够的磁盘空间来存储复制的文件,并注意一些大型文件可能需要较长的时间进行复制。

完成后,你可以在输出目录中访问并处理这些数据。

发现报错:

IsADirectoryError: [Errno 21] Is a directory: '/kaggle/input/regionclip-main'

完整的报错信息为:

---------------------------------------------------------------------------
IsADirectoryError                         Traceback (most recent call last)
Cell In[8], line 13
     11 source = os.path.join(input_path, file)
     12 destination = os.path.join(output_path, file)
---> 13 shutil.copyfile(source, destination)

File /opt/conda/lib/python3.10/shutil.py:254, in copyfile(src, dst, follow_symlinks)
    252     os.symlink(os.readlink(src), dst)
    253 else:
--> 254     with open(src, 'rb') as fsrc:
    255         try:
    256             with open(dst, 'wb') as fdst:
    257                 # macOS

IsADirectoryError: [Errno 21] Is a directory: '/kaggle/input/regionclip-main'

这个错误表明你正在尝试复制一个目录而不是一个文件。shutil.copyfile() 函数用于复制文件,而不是目录。

如果你想将整个输入目录复制到输出目录中,你可以使用 shutil.copytree() 函数来完成。以下是更新后的代码示例:

import os
import shutil

input_path = "/kaggle/input/regionclip-main"
output_path = "/kaggle/working/output"

shutil.copytree(input_path, output_path)

使用 shutil.copytree() 函数,你可以直接复制整个目录,包括其中的文件和子目录。

再次报错:

---------------------------------------------------------------------------
FileExistsError                           Traceback (most recent call last)
Cell In[9], line 7
      4 input_path = "/kaggle/input/regionclip-main"
      5 output_path = "/kaggle/working/output"
----> 7 shutil.copytree(input_path, output_path)

File /opt/conda/lib/python3.10/shutil.py:559, in copytree(src, dst, symlinks, ignore, copy_function, ignore_dangling_symlinks, dirs_exist_ok)
    557 with os.scandir(src) as itr:
    558     entries = list(itr)
--> 559 return _copytree(entries=entries, src=src, dst=dst, symlinks=symlinks,
    560                  ignore=ignore, copy_function=copy_function,
    561                  ignore_dangling_symlinks=ignore_dangling_symlinks,
    562                  dirs_exist_ok=dirs_exist_ok)

File /opt/conda/lib/python3.10/shutil.py:457, in _copytree(entries, src, dst, symlinks, ignore, copy_function, ignore_dangling_symlinks, dirs_exist_ok)
    454 else:
    455     ignored_names = set()
--> 457 os.makedirs(dst, exist_ok=dirs_exist_ok)
    458 errors = []
    459 use_srcentry = copy_function is copy2 or copy_function is copy

File /opt/conda/lib/python3.10/os.py:225, in makedirs(name, mode, exist_ok)
    223         return
    224 try:
--> 225     mkdir(name, mode)
    226 except OSError:
    227     # Cannot rely on checking for EEXIST, since the operating system
    228     # could give priority to other errors like EACCES or EROFS
    229     if not exist_ok or not path.isdir(name):

FileExistsError: [Errno 17] File exists: '/kaggle/working/output'

输出目录 ‘/kaggle/working/output’ 已经存在,并且你希望覆盖其中的内容,可以使用 shutil.rmtree() 函数删除现有目录,然后再执行复制操作。请注意,这将删除输出目录中的所有内容,请确保你已经备份了重要的数据。

以下是更新后的代码示例:

import os
import shutil

input_path = "/kaggle/input/regionclip-main"
output_path = "/kaggle/working/output"

# 删除现有的输出目录
if os.path.exists(output_path):
    shutil.rmtree(output_path)

# 复制目录
shutil.copytree(input_path, output_path)

通过在复制之前删除现有目录,你可以避免 FileExistsError。请确保仔细评估是否需要删除现有目录,以及确认没有重要的数据将被删除。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/753988.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UML与SYSML的关系

UML与SysML的联系 UML&#xff08;统一建模语言&#xff09;和SysML&#xff08;系统建模语言&#xff09;是两种与建模相关的语言&#xff0c;它们之间存在联系和区别。 SysML的图分类如下图所示。 联系 SysML是基于UML的&#xff0c;它重用了UML 2的子集&#xff0c;并提…

MySQL持久化数据——主从分离 Linux下创建2个MySQL的Docker容器 挂载方式启动 配置主从

目录 引出数据库的事务1.原子性2.一致性3.隔离性4.持久性 MySQL持久化数据0.在宿主机centos创建主的文件夹1.拷贝my.cnf配置文件2.挂载方式启动主mysql3.修改my.cnf文件的权限【bug】mysql: [ERROR] unknown variable server-id200. 3.修改主的my.cof文件4.创建主从账号slave5.…

Mysql索引实战

Mysql索引实战 一&#xff1a;概述1.1 索引如何提高查询效率&#xff1a; 二&#xff1a;结构2.1 主要索引结构2.2 详解BTree2.2.1 二叉树2.2.2 红黑树2.2.3 B-Tree2.2.4 BTree2.2.5 为什么InnoDB存储引擎选择使用Btree索引结构&#xff1f; 三&#xff1a;索引分类3.1 按照作用…

使用fast测试的错误

错误&#xff1a;Connection refused: connect 分析&解决 检查服务的端口号和fast生成请求时的端口号是否一致&#xff0c;不一致会报上面的错误 分析&#xff1a;设置服务配置的方法很多&#xff0c;可以写在配置文件里&#xff0c;也可以写在命令行里&#xff0c;当有多…

windows nodejs 版本切换

一、按健winR弹出窗口&#xff0c;键盘输入cmd,然后敲回车。然后进入命令控制行窗口&#xff0c;并输入where node查看之前本地安装的node的路径。 二、找到上面找到的路径&#xff0c;将node.exe所在的父目录里面的所有东西都删除。 三、从官网下载安装包 https://github.com/…

轻量级性能测试工具 wrk 应该如何使用?

项目设计之初或者是项目快要结束的时候&#xff0c;大佬就会问我们&#xff0c;这个服务性能测试的结果是什么&#xff0c;QPS 可以达到多少&#xff0c;RPS 又能达到多少&#xff1f;接口性能可以满足未来生产环境的实际情况吗&#xff1f;有没有自己测试过自己接口的吞吐量&a…

MongoDB安装配置教程(详细版)

前言&#xff1a;MongoDB是前端开发人员普遍使用的数据库&#xff0c;因为MongoDB不需要图形界面&#xff0c;是一个基于分布式文件存储的开源数据库系统。MongoDB 将数据存储为一个文档&#xff0c;数据结构由键值对(key>value)组成&#xff1b;MongoDB 文档类似于 JSON 对…

Flutter:自定义错误显示

为什么要自定义错误处理 以下面数组越界的错误为例&#xff1a; class _YcHomeBodyState extends State<YcHomeBody> {List<String> list [苹果, 香蕉];overrideWidget build(BuildContext context) {return Center(child: Column(children: [Text(list[0]),Tex…

小区物业管理信息系统设计与实现(论文+源码)

小区物业管理信息系统设计与实现(论文源码) 本篇 论文源码私我 以上内容只是精简版 还有很多原创类型论文 摘 要 随着互联网的发展&#xff0c;网络技术的发展变得极其重要&#xff0c;所以依靠计算机处理业务成为了一种社会普遍的现状。管理方式也自然而然的向着现代化技术方…

python_day8_timeline

带时间线的柱状图 导包 from pyecharts.charts import Bar, Timeline from pyecharts.options import * from pyecharts.globals import *创建柱状图1 bar1 Bar() bar1.add_xaxis([中国, USA, 不列颠]) bar1.add_yaxis(GDP, [30, 20, 10],label_optsLabelOpts(position&quo…

【Linux详解】——文件系统(磁盘结构、软硬链接、动静态库)

&#x1f4d6; 前言&#xff1a;本期介绍文件系统。 目录 &#x1f552; 1. 磁盘结构&#x1f558; 1.1 物理结构&#x1f558; 1.2 存储结构&#x1f558; 1.3 逻辑结构 &#x1f552; 2. 文件系统&#x1f558; 2.1 对 IO 单位的优化&#x1f558; 2.2 磁盘分区与分组&#x…

一套电子病历系统源码(EMR)

EMR电子病历系统源码 电子病历系统面向门诊医生和病房临床医生&#xff0c;实现了医生日常阅读、书写病历和医院管理病历的需求&#xff0c;它包括知识库管理、病历模版制作、医生书写病历、开各种检查检验申请单、查询各种报告单、电子病历浏览、病历质量控制等功能。 它将病…

JMeter基础 — JMeter聚合报告详解

提示&#xff1a;聚合报告组件的使用和察看结果树组件的使用方式相同。本篇文章主要是详细的介绍一下聚合报告组件内容&#xff0c;不做示例演示。 1、聚合报告介绍 在使用JMeter进行性能测试时&#xff0c;聚合报告(Aggregate Report)可以说是必用的监听器。 &#xff08;1&…

【微信小程序创作之路】- 小程序窗口整体配置(导航栏、标题)

【微信小程序创作之路】- 小程序窗口导航栏配置 第五章 微信小程序窗口导航栏配置 文章目录 【微信小程序创作之路】- 小程序窗口导航栏配置前言一、入口文件的配置二、页面配置三、全局默认窗口配置1.navigationBarTitleText&#xff1a;导航栏标题文字2.navigationBarBackgr…

基于ChatGPT上线《你说我猜》小游戏

摘要 AIGC、GPT、休闲小游戏三者可以怎么结合&#xff1f; AIGC、GPT与小游戏的结合为游戏体验带来了新的可能性。AIGC&#xff08;Artificial Intelligence Game Content&#xff09;作为一种人工智能技术&#xff0c;可以自动生成任务、剧情和角色对话等游戏元素&#xff0c…

安卓:Fragment

一、Fragment介绍 Fragment 是 Android 平台上的一种 UI 组件&#xff0c;用于构建灵活且可复用的界面模块。每个 Fragment 都有自己的生命周期&#xff0c;可以嵌入到 Activity 中&#xff0c;并在一个 Activity 内部管理其自己的布局和行为。通过使用 Fragment&#xff0c;可…

1000多道大厂Java真题汇总。刷完这一套高质量题集,这个金九银十妥妥的

又是一年金九银十&#xff01; 纵观今年的技术招聘市场&#xff0c;Java依旧是当仁不让的霸主&#xff01;即便遭受Go等新兴语言不断冲击&#xff0c;依旧岿然不动。究其原因&#xff1a; Java有着极其成熟的生态&#xff0c;这个不用我多说&#xff1b;Java在运维、可观测性…

el-table实现动态表头,自定义斑马纹等功能

需求&#xff1a;1.根据选择的日期时间&#xff0c;实现表头的动态显示功能 2.修改默认表头灰色样式&#xff0c; 3.斑马纹偶数灰色改为奇数为灰色 4.表格某一行加分割线区分 1.效果 2.动态表格实现 1.height&#xff1a;表格的高度设置&#xff0c;内容超出后会显示滚动条&a…

类和对象(二)

目录 一、类的六个默认成员函数 二、构造函数 2.1 概念 2.2 特性 三、析构函数 3.1 概念 3.2 特性 四、拷贝构造函数 4.1 概念 4.2 特性 五、赋值运算符重载 5.1 运算符重载 5.2 赋值运算符重载特性 六、const修饰成员函数 七、取地址及const取地址操作符重载 一…

Html基础知识学习——css精灵(十五)

这里写自定义目录标题 定义示例一示例二 定义 将网页用到的图片放在一张图片上&#xff0c;进行定位展示 优点:防止网页http请求次数过多&#xff0c;从而提高页面性能 缺点&#xff1a;降低开发效率。维护难度加大 示例一 使用图 网页制作图 <!DOCTYPE html> <…