新手如何快速学会Python?

news2024/10/6 8:37:06

d0a7c01a5d20ee2b73ac7ab0102dbb47.jpeg

在本文中,我们将介绍如何有效地学习 Python 。你应该知道「数据科学」是用于解决、探究问题并从数据中提取有价值信息的科学。

为了有效地做到这一点,你需要整理数据集、训练机器学习模型、可视化结果等等。

这是学习 Python 的最佳时机。

事实上,从就业需求增长的角度而言,福布斯将其列为十大技术技能。今天让我们来讨论一下这是为什么……

为什么要学习 Python?

Python 是世界上使用最广泛的语言之一,它拥有一个热情的用户社区:

494b1ba8899e86a5e75e121bf8fed963.jpeg

Python 流行度,TIOBE 指数

它在数据科学专业中拥有更忠实的追随者。

有些人通过「你好,世界!」的简单程序来判断编程语言的质量。按照这个标准,Python 可以做得很好:

print( "hello, world!" )

为了比较,下面是 Java 中的相同输出:

public class Main {
    public static void main(String[] args) {
        System.out.println("hello, world!");
    }
}

好吧,说真的,简单是 Python 的最大优势之一。由于其精确高效的语法,Python 可以用比其他语言更少的代码完成相同的任务。这使得实施解决方案的速度令人耳目一新。

此外,Python 充满活力的数据科学社区意味着您将能够找到大量的教程、代码片段和修复常见错误。Stackoverflow将成为您最好的朋友之一。

最后,Python 拥有用于数据分析和机器学习的 全明星库(也称为包)阵容,这大大减少了产生结果所需的时间。稍后会详细介绍这些。

如何有效地学习 Python ?

在我们讨论你需要学习的内容之前,让我们讨论一下你不需要的内容。

你不需要 CS 学位。

大多数数据科学家永远不会处理诸如内存泄漏、密码学或「Big O」符号之类的主题。只要您可以使用 Python 或 R 等脚本语言编写干净、符合逻辑的代码,就可以了。

你不需要完整的 Python 课程。Python 和数据科学不是同义词。

c70bc9899bc576bc4c55f813ce76e21a.png

你不需要记住所有的语法。

相反,专注于掌握直觉,例如何时函数合适或条件语句如何工作。在谷歌搜索、阅读文档和良好的实践之后,你将逐渐记住语法。

我们建议采用自上而下的方法。

我们提倡自上而下的方法,目标是首先获得结果,然后随着时间的推移巩固概念。事实上,我们更愿意放弃「课堂」学习,转而进行现实世界的实践。

1、你将从学习核心编程概念开始。

2、接下来,您将获得基本数据科学库的实用知识。

3、最后,您将通过实际项目练习和完善您的技能。

这种方法可以让你获得更多乐趣的同时迅速掌握。

 通过 Anaconda 安装 Python 

在您的计算机上安装 Python 的方法有很多种,但我们推荐使用Anaconda 捆绑包捆绑包,它包含数据科学所需的库。

第 1 步:核心编程概念

有效的编程不是要记住语法,而是掌握一种新的思维方式。

因此,花点时间为核心编程概念打下坚实的基础。这些将帮助您将头脑中的解决方案转化为计算机的指令。

如果你是编程新手.......我们推荐优秀的 Automate the Boring Stuff with Python 一书,该书已在创作共用许可下免费在线发布。

这本书承诺「为初学者提供实用的编程」,并且让每节课都脚踏实地。阅读第 6 章 - 操作字符串并完成练习题。

d831d038bb31be9cbaa279bb4455f2d7.png

如果你只需要复习 Python 语法,那么我们推荐以下视频:

https://youtu.be/N4mEzFDjqtA

同样,这一步的目标不是学习有关 Python 和编程的所有知识。相反,专注于直觉。

你应该能够回答以下问题:

• 整数、浮点数和字符串有什么区别?

• 如何使用 Python 作为计算器?

• 什么是 for 循环?我什么时候写一个?

• 函数的基本结构是什么?

• 如何使用条件语句(if...else...)来添加逻辑?

• 导入语句如何工作?

如果你想练习更多核心编程概念,请查看以下资源。

• Code Fights 是一个平台,有许多简短的编码挑战,可以在 5 分钟内完成(尽管它非常有趣,你可能会发现自己一次玩几个小时)。您将在此过程中获得积分并解锁新关卡,这也是跟踪你的进度的好方法。

• Python Challenge 是网络上最酷的谜题之一,所以不要被它 1990 年的图形吓到。你可以在 Python 脚本的帮助下完成所有 33 个级别。一位用户称它为「一种令人上瘾的学习 Python 细节的方式……」我同意!

• PracticePython.org 是 Python 中简短练习题的集合。它几乎每周都会更新一个新问题。真正好的是作者为每个问题包含了多个用户提交的解决方案,因此您可以看到解决它们的替代方法。

• How to Think Like a Computer Scientist  是一本很棒的交互式在线书籍,它通过关键的编程概念(使用 Python)进行了一次旋风之旅。如果您对编程完全陌生,这可能是一个不错的选择。这就像一个浓缩的「CS 101」课程。

第 2 步:基本数据科学库

接下来,我们将专注于「如何为数据科学学习 Python」的数据科学部分。

正如我们之前提到的,Python 拥有一系列用于数据科学的全明星库。库只是预先存在的函数和对象的捆绑,您可以将它们导入脚本以节省时间。

这些是我们推荐的有效获取新库的操作步骤:

1、打开一个新的 Jupyter Notebook(见下文)。

2、阅读图书馆的文档 30 分钟,了解其模块的高级介绍。

3、将库导入您的 Jupyter Notebook。

4、按照其分步快速入门教程查看库的运行情况。

5、再花 30 分钟查看它的文档,以了解它还能做什么。

我们不建议现在更深入地研究图书馆,因为当你进入项目时,你可能会忘记大部分你学到的东西。相反,旨在发现每个图书馆的能力。

如果你按照我们上面的建议通过 Anaconda 捆绑包安装了 Python,那么Jupyter Notebook也会附带它。Jupyter Notebook 是一个轻量级的 IDE,深受数据科学家的喜爱。我们为你的项目推荐它。你可以通过 Anaconda 附带的 Anaconda Navigator 打开一个新笔记本。查看此短视频以获取说明。

这些是你需要的基本库:

数字货币

NumPy 允许简单高效的数值计算,许多其他数据科学库都建立在它之上。

• 文档

• 快速入门教程

熊猫

Pandas 是用于数据结构和探索性分析的高性能库。它建立在 NumPy 之上。

• 文档

• 快速入门教程

Matplotlib

Matplotlib 是一个灵活的绘图和可视化库。它功能强大但有些麻烦。您现在可以选择跳过 Matplotlib 并使用 Seaborn 开始(请参阅下面的 Seaborn 建议)。

• 文档

• 快速入门教程

Scikit-学习

Scikit-Learn 是 Python 中首屈一指的通用机器学习库。它有许多流行的算法和模块,用于预处理、交叉验证等。

• 文档

• 快速入门教程

奖金:Seaborn

Seaborn 使绘制常见数据可视化变得更加容易。它建立在 Matplotlib 之上,并提供了一个更令人愉快的高级包装器。

• 文档

• 快速入门教程

第 3 步:端到端项目

到目前为止,你将对编程有基本的了解,并对基本库有一定的应用知识。这实际上涵盖了你开始使用数据科学所需的大部分 Python。

此时,有些学生会感到有些不知所措。没关系,这很正常。

如果你采用缓慢且传统的自下而上的方法,你可能不会感到不知所措,但到达这里需要 10 倍的时间。现在的关键是立即投入并开始将所有东西粘合在一起。同样,我们到这里的目标只是学到足够的东西才能开始。

接下来,是时候通过大量的实践和项目来巩固你的知识了。你有几个选择:

Kaggle 比赛

第一种选择是参加 Kaggle,这是一个举办数据科学竞赛的网站。

Kaggle 的主要优势是每个项目都是独立的。你将获得数据集、目标和教程以帮助您入门。

竞赛的主要缺点是它们通常不能代表真实世界的数据科学。「入门」比赛太基础了,而标准比赛(即有奖池的比赛)通常对初学者来说太难了。

如果你对这条路径感兴趣,请查看我们的 Kaggle 初学者指南。

DIY项目

另一种选择是构建你自己的项目并选择你感兴趣的数据集。

这种方法的主要优点是项目更能代表现实世界的数据科学。你可能需要定义自己的目标、收集数据、清理数据集、设计功能等等。

DIY 项目的缺点是你需要已经熟悉适当的数据科学工作流程。没有一个,你可能会错过重要步骤或在不知道如何继续的情况下陷入困境。如果你选择这条路,请查看我们的文章,其中包含几个 DIY 项目想法。

2d6a4efaae34b7b57cae706543bbba76.jpeg

 ⬇️点击「阅读原文」

 免费报名 数据分析训练营

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/477235.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【五一创作】数据可视化之美 ( 三 ) - 动图展示 ( Python Matlab )

1 Introduction 在我们科研学习、工作生产中,将数据完美展现出来尤为重要。 数据可视化是以数据为视角,探索世界。我们真正想要的是 — 数据视觉,以数据为工具,以可视化为手段,目的是描述真实,探索世界。 …

[创新工具和方法论]-01- DOE课程基础知识

文章目录 1.DOE实验设计的介绍1.1 什么是实验设计DOE?1.2 DOE的优势有哪些?1.3 如何开展DoE研究?步骤 2.DOE实验培训3.数据分析步骤4.实验的随机化5.偏差6.R方 相关系数假设检验 7.三因子二水平全因子设计 1.DOE实验设计的介绍 实验设计是一种安排实验和分析实验数…

【网络进阶】服务器模型Reactor与Proactor

文章目录 1. Reactor模型2. Proactor模型3. 同步IO模拟Proactor模型 在高并发编程和网络连接的消息处理中,通常可分为两个阶段:等待消息就绪和消息处理。当使用默认的阻塞套接字时(例如每个线程专门处理一个连接),这两…

Ubantu docker学习笔记(八)私有仓库

文章目录 一、建立HTTPS链接1.在仓库服务器上获取TLS证书1.1 生成证书颁发机构证书1.2 生成服务器证书1.3 利用证书运行仓库容器 2.让私有仓库支持HTTPS3.客户端端配置 二、基本身份验证三、对外隐藏仓库服务器3.1 在服务器端3.2 在客户端进行 四、仓库可视化 在前面的学习中&a…

数据库三范式与反范式详解

🏆今日学习目标: 🍀数据库三范式与反范式详解 ✅创作者:林在闪闪发光 ⏰预计时间:30分钟 🎉个人主页:林在闪闪发光的个人主页 🍁林在闪闪发光的个人社区,欢迎你的加入: 林…

阿里云服务器通用算力u1性能测评CPU处理器网络PPS

阿里云服务器u1通用算力型Universal实例高性价比,CPU采用Intel(R) Xeon(R) Platinum,主频是2.5 GHz,云服务器U1实例的基准vCPU算力与5代企业级实例持平,最高vCPU算力与6代企业级实例持平,提供2c-32c规格和1:1/2/4/8丰富…

贪心算法讲解

文章目录 1. 贪心算法的概念2. 讲解贪心 1. 贪心算法的概念 贪心算法是:用一种局部最功利的标准,总是做出当前看来是最好的选择。如果局部最优解可以得出全局最优解,说明贪心假设成立,否则就失败。 举个例子: 这里有…

尚融宝26-投标

目录 一、需求 (一)投资人投标 (二)流程 二、标的详情 (一)需求 (二)后端 (三)前端 三、计算收益 (一)四种还款方式 &#…

基于 A* 搜索算法来优化无线传感器节点网络的平均电池寿命(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 A*(念做:A Star)算法是一种很常用的路径查找和图形遍历算法。它有较好的性能和准确度。本文…

一篇带你快速入门DDD领域驱动设计

一、什么是领域驱动 领域驱动设计 Domain-Driven Design,简称DDD。软件对于行业并没有这么高的要求,他本身就是帮助其他行业更好的发展,赋能其他行业的。各个行业都有软件的身影,但是他们的业务场景是不同的,所以就需…

【MYSQL】数据类型和约束

目录 数据类型 1.数值类型 1.1.位--类型bit(M) 1.2. 整数类型--tinyint,smallint,int,bigint 1.3.小数类型--float、decimal 2.字符类型--char、varchar 3.日期类型--datetime、timestamp 4.string类型--enum和set mysql的约束 1.空…

Mybatis 知识总结2(基于注解的增删改查操作)

3.3 MyBatis 增删改查(注解方式) MyBatis 的增删改查是最基础最核心的功能,需要重点掌握。 需求说明 对员工信息进行增删改查操作。 查询(查询结果分页展示后续实现) 根据主键ID查询根据条件查询 新增更新删除 根据主…

海思芯片(hi3536av100)启动模式选择

1、支持多种模式可配置 (1)支持BootRom启动 (2)支持从 SPI NOR Flash 启动 (3)支持从 SPI NAND Flash 启动 (4)支持从 eMMC 启动 (5)支持 PCIe 从片启动 2、启动方式的选择 BOOT_SEL[1:0]SFC_EMMC_BOOT_MODEMODE000SPI Nor Flash 3 Byte001SPI Nor Flash 4 Byte010SPI Nand Fl…

2005-2020全国及各省家庭承包耕地流转总面积及经营耕地面积

2005-2020全国及各省家庭承包耕地流转总面积及经营耕地面积 1、时间:时间:2005-2020年 2、范围:包括全国及30个省份不包括西藏 3、指标包括:家庭承包耕地流转总面积(亩)、家庭承包经营耕地面积(亩) 4、来源:农村经…

荔枝派Zero(全志V3S) tftp下载 kernel 和 nfs 挂载文件系统

文章目录 前言一、U-Boot 适配 Ethernet1、配置 U-Boot2、修改 dts 文件3、编译4、烧写到 SD 卡5、测试<1>、查看启动打印信息<2>、ping 测试 二、Kernel 适配 Ethernet1、配置 kernel2、修改 dts 文件3、编译4、拷贝到 SD 卡5、测试<1>、启动网络接口&#…

【嵌入式环境下linux内核及驱动学习笔记-(7-内核 I/O)-多路复用】

目录 2、多路复用2.1 函数select相关2.1.1 应用层select()2.1.2 FD_ZERO2.1.3 FD_SET2.1.4 FD_ISSET 2.2 函数poll相关2.2.1 poll函数 2.3 驱动层 函数2.4 实例 接上篇&#xff0c;继续内核 I/O的五种模式的解读。 2、多路复用 select&#xff0c;poll&#xff0c;epoll都是IO…

常见的接口优化技巧思路

一、背景 针对老项目&#xff0c;去年做了许多降本增效的事情&#xff0c;其中发现最多的就是接口耗时过长的问题&#xff0c;就集中搞了一次接口性能优化。本文将给小伙伴们分享一下接口优化的通用方案。 二、接口优化方案总结 1.批处理 批量思想&#xff1a;批量操作数据…

windows如何确认服务器上程序端口是否正常

方式1&#xff1a;ping命令 ping命令说明 ping命令是个使用频率极高的网络诊断工具&#xff0c;在Windows、Unix和Linux系统下均适用。它是TCP/IP协议的一部分&#xff0c;用于确定本地主机是否能与另一台主机交换数据报。根据返回的信息&#xff0c;我们可以推断TCP/IP参数设…

类和对象 -上(C++)

目录 认识面向过程和面向对象 类的引入 类的定义 语法&#xff1a; 类的两种定义方式&#xff1a; 成员变量命名规则建议 类的访问限定符及封装 访问限定符 C 中 class 和 struct 的区别&#xff1f; 封装 类的作用域 类的实例化 类对象模型 如何计算类对象的大小 结构体的内存…

想保护你的网站?用Python来生成验证码图片

前言 随着互联网的发展&#xff0c;我们越来越多地依赖于网站和应用程序&#xff0c;而这些网站和应用程序也面临着各种各样的安全威胁&#xff0c;其中之一就是用户可能会通过脚本攻击你的网站。为了缓解这些安全风险&#xff0c;一个常见的做法是在用户进行操作时&#xff0…