【数据分析专栏之Python篇】二、Jupyer Notebook安装配置及基本使用

news2024/10/10 20:13:52

文章目录

  • 前言
    • 一、Jupter Notebook是什么
      • 1.1 简介
      • 1.2 组成部分
      • 1.3 Jupyter Notebook的主要特点
    • 二、为什么使用Jupyter Notebook?
    • 三、安装
    • 四、Jupyter Notebok配置
      • 4.1 基本配置
      • 4.2 配置开机自启与后台运行
      • 4.3 开启代码自动补全
    • 五、两种键盘输入模式
      • 5.1 编辑模式
      • 5.2 命令模式
      • 5.3 其他常用快捷键
    • 六、魔法命令
      • 6.1 查看帮助文档
      • 6.2 其他魔法命令
    • 七、结语
    • 参考

前言

在上一篇中我们已经安装好了Anaconda,Anaconda本身自带Jupter Notebook。本期我们来学习使用 Jupyter Notebook。

一、Jupter Notebook是什么

1.1 简介

Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍

Jupyter Notebook是一个开源 Web 应用程序,允许您创建和共享包含实时代码、方程式、可视化和叙述文本的文档。用途包括:数据清理和转换,数值模拟,统计建模,数据可视化,机器学习等等。支持python、C、java、Go等多种编程语言。同时支持markdown编辑器。

简而言之,Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码运行代码,代码的运行结果也会直接在代码块下显示的程序。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。

image-20230725133039505

Jupyter Notebook 已迅速成为数据分析,机器学习的必备工具。因为它可以让数据分析师集中精力向用户解释整个分析过程。

1.2 组成部分

① 网页应用

网页应用即基于网页形式的、结合了编写说明文档、数学公式、交互计算和其他富媒体形式的工具。简言之,网页应用是可以实现各种功能的工具。

② 文档

即Jupyter Notebook中所有交互计算、编写说明文档、数学公式、图片以及其他富媒体形式的输入和输出,都是以文档的形式体现的。

这些文档是保存为后缀名为.ipynbJSON格式文件,不仅便于版本控制,也方便与他人共享。

此外,文档还可以导出为:HTML、LaTeX、PDF等格式。

1.3 Jupyter Notebook的主要特点

① 编程时具有语法高亮缩进tab补全的功能。

② 可直接通过浏览器运行代码,同时在代码块下方展示运行结果。

③ 以富媒体格式展示计算结果。富媒体格式包括:HTML,LaTeX,PNG,SVG等。

④ 对代码编写说明文档或语句时,支持Markdown语法。

⑤ 支持使用LaTeX编写数学性说明。

二、为什么使用Jupyter Notebook?

  • 传统软件开发:工程/目标明确

    需求分析,设计架构,开发模块,测试

  • 数据挖掘:艺术/目标不明确

    目的是具体的洞察目标,而不是机械的完成任务

    通过执行代码来理解问题

    迭代式地改进代码来改进解决方法

    实时运行的代码、叙事性的文本和可视化被整合在一起,方便使用代码和数据来讲述故事

    对比Jupyter Notebook和Pycharm

  • 画图和数据展示便捷,可以实时查看结果

总结:Jupyter Notebook 相比 Pycharm 在画图和数据展示方面更有优势。

三、安装

在上一篇中我们已经安装好了Anaconda,Anaconda本身自带Jupter Notebook。具体安装参考上篇。

四、Jupyter Notebok配置

4.1 基本配置

1、设置登录密码,获取sha1密码

# 首先进入python命令行
python
# 在命令行下输入
from notebook.auth import passwd;passwd()
# 按照提示输入密码,这是jupyter的登陆密码

记住设置的密码, 非常重要, 比如设置了密码为:123456。

记住sha1, 非常重要, 'sha1:XXXX:XXXX’全部复制下来, 包括引号。

2、修改jupyter配置文件

生成配置文件 jupyter_notebook_config.py,windows在 C:\Users\username\.jupyter下,username为你电脑用户名。如果没有这个文件,可以使用下面命令生成。

jupyter notebook --generate-config

编辑 jupyter_notebook_config.py,在开头加入以下代码

#设置可访问的ip为任意。
c.NotebookApp.ip = '*'  #某些版本为c.NotebookApp.ip = '0.0.0.0',都表示任意ip

#不打开浏览器。推荐谷歌,火狐等访问登录jupyter
c.NotebookApp.open_browser = False

#这里填上面设置密码时生成的hash密码
c.NotebookApp.password = 'sha1:XXXX:XXXX'

#允许使用root用户开启jupyter,windows忽略这条
#c.NotebookApp.allow_remote_access = True

#设置登陆端口,一般为8888
c.NotebookApp.port = 8888

#设置jupyter-notebook的工作空间,注意linux与windows的路径表示方式
c.NotebookApp.notebook_dir = 'E:\workspace\pycharm\jupyter'

## 其他配置项根据自己需要修改

3、启动

① 点击Jupyter Notebook打开

image-20230725125723658

② 在终端或者命令行输入,终端或者命令行不要关闭,在浏览器地址栏输入http://localhost:8888或者http://127.0.0.1:8888

jupyter-notebook

出现jupyter登陆页面则初步安装成功,输入设置的登陆密码,新建一个 Python 文件,即.ipynb文件

print("Hello Jupyter") # 按shift+enter运行

正常输出说明安装成功

4.2 配置开机自启与后台运行

① 在非系统目录下新建文本文档,修改文件名为jupyter.bat,需要设置文件显示后缀名。用记事本打开,输入以下代码:

@echo off
cd C:\ProgramData\Microsoft\Windows\Start Menu\Programs\StartUp
if "%1"=="h" goto begin
start mshta vbscript:createobject("wscript.shell").run("""%~nx0"" h",0)(window.close)&&exit
:begin
cd D:\PF\Anaconda3\Scripts
D:\PF\Anaconda3\Scripts\jupyter.exe notebook --no-browser --port=8888

其中,C:\ProgramData\Microsoft\Windows\Start Menu\Programs\StartUpD:\PF\Anaconda3\ScriptsD:\PF\Anaconda3\Scripts\jupyter.exe 根据自己系统和安装目录进行替换。

② 双击jupyter.bat 测试能否正常开启jupyter

③ 移动jupyter.bat到windows启动文件夹

  • win7 :C:\Users\admin\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startup,admin为自己电脑用户名,需要根据自己电脑实际情况手动修改。
  • win10:C:\ProgramData\Microsoft\Windows\Start Menu\Programs\StartUp

4.3 开启代码自动补全

开启代码自动补全,可以提高代码的编写效率。重点推荐配置

1.使用pip安装jupyter拓展包,本人选择在cmd中安装

pip install jupyter_contrib_nbextensions

或者

conda install jupyter_contrib_nbextensions

2.配置 nbextension,前提是先关闭jupyter notebook

jupyter contrib nbextension install --user --skip-running-check

3.点击Jupyter图标,在Jupyter Notebook里开启功能

image-20230725105907224

4.然后打开hinterland功能

image-20230725105959188

5.最后就可以使用代码补全了

image-20230725110055382

五、两种键盘输入模式

Jupyter Notebook 有两种键盘输入模式,即命令模式和编辑模式,这与 Vim 有些类似。在编辑模式下,可以往单元中键入代码或文本,此时单元格被绿色的框线包围,且命令模式下的快捷键不生效。在命令模式下,可以用快捷键命令运行单元格,移动单元格,切换单元格编辑状态等等,此时的单元格被灰色的框线包围,且编辑模式下的快捷键不生效。

从命令模式进入编辑模式需按 Enter 键,从编辑模式切换到命令模式需按 Esc 键。

5.1 编辑模式

当条框单元为绿色时,此时处于编辑模式。编辑模式下我们主要记住代码补全、代码提示和运行单元的快捷键。

快捷键作用
Tab代码补全或缩进
Shift + Tab查看函数参数,光标要在括号中
Shift + Enter运行本单元,选中下一单元
Ctrl + Enter运行本单元
Alt + Enter运行本单元并在下方插入一个单元
esc、点击输入框前面的 ln [ ]退出编辑模式

5.2 命令模式

当输入框为蓝色时,此时处于命令模式。我们主要记住单元格增删和单元格状态转换。

快捷键作用
y单元格进入代码模式
m单元格进入 markdown 格式
A上方插入新单元格
B下方插入新单元格
DD删除选中的单元格
enter进入编辑模式

此外,还有三种运行代码模式快捷键,和编辑模式下相同,这里不再例举。

5.3 其他常用快捷键

  • ctrl+a: 全选
  • ctrl+z: 撤销
  • ctrl+c: 复制
  • ctrl+v: 粘贴
  • 保存ctrl+s:
  • ctrl+/:注释或者取消注释
  • shift+1l: 选中多行

六、魔法命令

Jupyter Notebook 中有许多魔法命令,魔法命令提供了一种简便、快捷的方式来执行常见任务,因此被称为“魔法”。

6.1 查看帮助文档

用法作用
?查看对变量、函数等的描述
??查看更细致的描述

请看下面的代码示例:

len?

返回:

Signature: len(obj, /)
Docstring: Return the number of items in a container.
Type:      builtin_function_or_method

下面定义一个函数:

def get_one():
    """
    return the number 1
    """
    return 1

如果是一个问号:

get_one?

返回

Signature: get_one()
Docstring: return the number 1
File:      e:\temp\ipykernel_1692\2371390829.py
Type:      function
如果是两个问号:
get_one??

返回

Signature: get_one()
Source:   
def get_one():
    """
    return the number 1
    """
    return 1
File:      e:\temp\ipykernel_1692\2371390829.py
Type:      function

看得出来,两个问号给予的描述是更细致的,毕竟疑问号都多了一个嘛。

6.2 其他魔法命令

魔法命令基本上都是以 % 开头的,用于实现一些在常规Python语法中无法实现或不容易实现的功能,使得开发者能够轻松地执行一些特定任务,从而让整个交互式计算环境显得更加“神奇”和高效。

魔法命令作用
%run运行后导入自定义文件,运行完后,该文件内的函数、类等都可以直接使用
%timeit统计运行时间, 用于测试一行代码性能,一般是耗时较短的
%time统计运行时间,用于测试代码性能,一般是耗时较长的
%who查看当前会话的所有变量与函数名称
%whos显示变量类型和值
%who_ls以列表形式显示变量和函数名
pip install用于安装包
lsmagic查看所有魔法命令
?查看魔法命令的帮助文档

现有一个名为 test.py 文件,包含如下内容:

def display():
   """
   show the number
   """
   print('hello')
def add(x,y):
    return x+y
display()

下面演示魔法命令的使用,因为代码较为简短,因此直接以图片形式展示。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iglTQuH1-1690327331492)(C:\Users\崔羽飞\AppData\Roaming\Typora\typora-user-images\image-20230725111812375.png)]

七、结语

本期跟大家分享的内容就到此结束了!希望本文的内容能够帮助到你。

参考

Ubuntu与windows下配置安装jupyter-notebook以及其开机自启、后台运行与远程访问

windows环境 jupyter notebook 自启动 局域网访问

jupyter 的代码自动补全

Python实现读取txt文件并转换为excel的方法示例

Jupyter Notebook介绍、安装及使用教程

Jupyter Notebook介绍及使用操作

Jupyter Notebook 快捷键使用指南

Jupyter-notebook 常用魔法命令

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/790165.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

J2EE通用分页02

目录 一.重构-提取公用方法 1.为了进行公共方法的抽取,需要找出上面实习中的可通用部分,和差异化部分 2.公用方法封装思路 3. 具体实现 二.分页标签 2.1 准备一个Servlet 3.2 结果展示页面 三. 过滤器解决中文乱码问题 四.加入分页功能 四…

Qt Core学习日记——第七天QMetaObject(上)

每一个声明Q_OBJECT的类都具有QMetaObject对象 Q_OBJECT宏源代码: #define Q_OBJECT \ public: \ QT_WARNING_PUSH \ Q_OBJECT_NO_OVERRIDE_WARNING \ static const QMetaObject staticMetaObject; \ virtual const QMetaObject *metaObject() const; \ vir…

Rust vs Go:常用语法对比(五)

题图来自 Rust vs Go 2023[1] 81. Round floating point number to integer Declare integer y and initialize it with the rounded value of floating point number x . Ties (when the fractional part of x is exactly .5) must be rounded up (to positive infinity). 按规…

垃圾回收标记阶段算法

1.标记阶段的目的 主要是在GC在前,判断出哪些是有用的对象,哪些是需要回收的对象,只有被标记为垃圾对象,GC才会对其进行垃圾回收。判断对象是否为垃圾对象的两种方式:引用计数算法和可达性分析算法。 2.引用计数算法…

MySQL基础(一)

目录 前言 一、概述 1.什么是数据库 2.数据库能干什么 3.为什么要用数据库,优势、特性 二、数据库类型 (一)、关系型数据库,RDBMS 1.概述 2.特点 3.代表产品 (二)、非关系型数据库,No…

性能测试常见故障和解决思路

目录 一、性能问题分析流程 二、内存溢出 (一)堆内存溢出 (二)永久代/方法区溢出 (三)栈内存溢出 (四)系统内存溢出 三、CPU过高 (一)us cpu过高 &a…

flink cdc环境搭建

1.下载flink https://archive.apache.org/dist/flink/flink-1.12.2/ 2.修改flink-conf.yaml #根据自己电脑核数修改,这里我设置为4,因为系统分配了4核 jobmanager.rpc.address: localhost #主机名根据自己设定 taskmanager.numberOfTaskSlots: 4 3.下载…

Databend 开源周报第 103 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。 创建网络策略 …

机器学习深度学习——图像分类数据集

👨‍🎓作者简介:一位即将上大四,正专攻机器学习的保研er 🌌上期文章:机器学习&&深度学习——softmax回归(下) 📚订阅专栏:机器学习&&深度学习…

【腾讯云 Cloud Studio 实战训练营】沉浸式体验编写一个博客系统

文章目录 前言新建工作空间登录(注册)Cloud Studio 账号:进入 Cloud Studio 控制台:配置工作空间参数:确认并创建工作空间:项目搭建 配置nuxt 脚手架运行项目报错信息解决错误脚手架运行预览问题 开启博客代码配置layout首页配置 …

关于java中的内存回收机制

C中如果创建了一个对象,当不再使用的时候,需要手动调用delete方法来进行销毁。而Java提供了一套完整的垃圾回收机制(gc)。它会自动扫描内存中我们所创建过且不再使用的对象,进行自动销毁。但是gc并不完美,现…

7plus透明屏有哪些全新的使用体验?

7plus透明屏是指苹果公司推出的iPhone 7 Plus手机配备了透明屏幕的一种特殊版本。透明屏幕是一种新型的显示技术,可以使屏幕看起来透明,让用户感觉手机屏幕上的内容仿佛悬浮在空中一样。 透明屏幕的出现给用户带来了全新的使用体验。 首先,透…

对象存活判断

对象存活判断 在堆里存放着几乎所有的 Java 对象实例,在 GC 执行垃圾回收之前,首先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记为己经死亡的对象,GC 才会在执行垃圾回收时,释放掉其所占用的内存…

微信小程序客服系统-对接消息推送-对接模板订阅消息-嵌入webview客服链接

想要给自己的小程序增加客服系统功能 小程序客服对接导自己的系统等需求,可以参照我开发的客服系统,实现私有化部署搭建对接的微信小程序 小程序消息推送对接 首先登录小程序后台在小程序后台>开发管理>开发设置>服务器域名部分,配置…

基于Java+SpringBoot+vue前后端分离学科竞赛管理系统设计实现

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

Linux中的库

一、库是什么 库是一种可执行代码的二进制形式,可以被操作系统载入内存执行。就是将源代码转化为二进制格式的源代码,相当于进行了加密,别人可以使用库,但是看不到库中的内容。 二、库的分类和优缺点 静态库:是在程…

Shell 排序法 - 改良的插入排序

说明 插入排序法由未排序的后半部前端取出一个值,插入已排序前半部的适当位置,概念简单但速度不快。 排序要加快的基本原则之一,是让后一次的排序进行时,尽量利用前一次排序后的结果,以加快排序的速度,Shel…

云安全攻防(二)之 云原生安全

云原生安全 什么是云原生安全?云原生安全包含两层含义:面向云原生环境的安全和具有云原生特征的安全 面向云原生环境的安全 面向云原生环境的安全的目标是防护云原生环境中的基础设施、编排系统和微服务系统的安全。这类安全机制不一定会具有云原生的…

git恢复删除的分支

1.查看被删除的分支 git remote prune --dry-run origin 被删除的分支是191 2.找到被删除分支的最后一次提交记录的commit SHA值 git reflog 最后一次提交的commit SHA值是3fa7532 3.恢复分支 git checkout -b xiaomeng 3fa7532 4.恢复成功后提交到远端,over&…

[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora(部分)

文章目录 LLaMA大模型及其衍生模型1. LLaMA2. stanford_alpaca3. ChatDoctor4. alpaca-lora5. Chinese-LLaMA-Alpaca6. BELLE 大模型综述 A Survey of Large Language Models 关键词:大模型,LLaMA,Alpaca,Lora,Belle&a…