跟我一起从零开始学python(六)数据库编程:MongoDB数据库

news2025/1/20 17:08:51

前言

回顾之前讲了python语法编程 ,必修入门基础和网络编程,多线程/多进程/协程等方面的内容,昨天和今天讲到了数据库编程篇MySQL,Redis今天第三篇MongoDB篇,前面没看的也不用往前翻,系列文已经整理好了:

1.跟我一起从零开始学python(一)编程语法必修
2.跟我一起从零开始学python(二)网络编程
3.跟我一起从零开始学python(三)多线程/多进程/协程
4.跟我一起从零开始学python(四)数据库编程:MySQL数据库
5.跟我一起从零开始学python(五)数据库编程:Redis数据库

本篇讲:python数据库编程:MongoDB数据库

本系列文根据以下学习路线展开讲述,由于内容较多,:

从零开始学python到高级进阶路线图

关注公众号:python技术训练营,学习进阶一步到位

适用于零基础学习和进阶人群的python资源:

① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程(零基础-高级进阶JS逆向)
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档
⑥ 交流学习
⑦ 想要兼职接单

下章讲:机器学习模块

一丶MongoDB简单介绍

Python MongoDB是一种非关系型数据库,也被称为NoSQL数据库。旨在提供高性能、高可用性和可扩展性的数据存储解决方案。Python MongoDB使用JSON格式存储数据,这使得它非常适合处理大量非结构化数据。

Python MongoDB的主要特点包括

  • 高性能:Python MongoDB使用内存映射技术,可以快速读取和写入数据。

  • 高可用性:Python MongoDB支持主从复制和分片技术,可以保证数据的可靠性和可用性。

  • 可扩展性:Python MongoDB可以轻松地扩展到多个节点,以满足不断增长的数据需求。

  • 灵活性:Python MongoDB支持动态模式,可以根据需要随时更改数据结构。

  • 易用性:Python MongoDB提供了简单易用的API,可以轻松地进行数据操作。

Python MongoDB的安装非常简单,只需要使用pip命令即可安装。安装完成后,可以使用pymongo库来连接和操作MongoDB数据库。

Python MongoDB的应用场景非常广泛,特别是在大数据处理和实时数据分析方面。它可以用于存储日志数据、社交媒体数据、物联网数据等各种类型的非结构化数据。同时,Python MongoDB也可以与其他数据存储解决方案(如关系型数据库)进行集成,以满足不同的数据处理需求。

总之,Python MongoDB是一种高性能、高可用性和可扩展性的数据存储解决方案,可以帮助开发人员轻松地处理大量非结构化数据。

二丶关于database的基础命令

MongoDB是一种非关系型数据库,它使用文档存储数据,而不是使用表格。Python是一种流行的编程语言,它可以与MongoDB数据库进行交互。在Python中,我们可以使用PyMongo库来连接和操作MongoDB数据库。

在MongoDB中,我们可以使用以下基础命令来管理数据库:

创建数据库

在MongoDB中,我们可以使用use命令来创建一个新的数据库。例如,要创建一个名为mydatabase的数据库,我们可以使用以下命令:

use mydatabase

如果数据库不存在,则MongoDB将创建一个新的数据库。如果数据库已经存在,则MongoDB将返回该数据库的引用。

显示数据库

要显示MongoDB中所有的数据库,我们可以使用以下命令:

show dbs

这将列出MongoDB中所有的数据库。

删除数据库

要删除MongoDB中的数据库,我们可以使用以下命令:

db.dropDatabase()

这将删除当前选定的数据库。

切换数据库

要切换到MongoDB中的另一个数据库,我们可以使用以下命令:

use anotherdatabase

这将切换到名为anotherdatabase的数据库。

显示当前数据库

要显示当前选定的数据库,我们可以使用以下命令:

db

这将返回当前选定的数据库的引用。

总之,Python与MongoDB数据库的交互非常方便,可以使用PyMongo库来连接和操作MongoDB数据库。在Python中,我们可以使用基础命令来管理数据库,例如创建、显示、删除和切换数据库。

三丶关于集合的基础命令

Python MongoDB数据库关于集合的基础命令

在Python中使用MongoDB数据库时,集合是MongoDB中的一个重要概念。集合类似于关系型数据库中的表,但是MongoDB是一个文档型数据库,因此集合中存储的是文档。

以下是Python MongoDB数据库关于集合的基础命令

创建集合

要创建一个集合,可以使用MongoDB的db.create_collection()方法。在Python中,可以使用pymongo库中的Collection类的insert_one()方法来创建集合。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 创建一个名为mycollection的集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

插入文档

要向集合中插入文档,可以使用MongoDB的db.collection.insert()方法。在Python中,可以使用pymongo库中的Collection类的insert_one()方法来插入文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 插入一条文档
mydict = { "name": "John", "address": "Highway 37" }
x = mycol.insert_one(mydict)

查询文档

要查询集合中的文档,可以使用MongoDB的db.collection.find()方法。在Python中,可以使用pymongo库中的Collection类的find()方法来查询文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 查询所有文档
for x in mycol.find():
  print(x)

更新文档

要更新集合中的文档,可以使用MongoDB的db.collection.update()方法。在Python中,可以使用pymongo库中的Collection类的update_one()方法来更新文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 更新一条文档
myquery = { "address": "Highway 37" }
newvalues = { "$set": { "address": "Park Lane 38" } }
mycol.update_one(myquery, newvalues)

删除文档

要删除集合中的文档,可以使用MongoDB的db.collection.remove()方法。在Python中,可以使用pymongo库中的Collection类的delete_one()方法来删除文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 删除一条文档
myquery = { "address": "Park Lane 38" }
mycol.delete_one(myquery)

四丶数据类型

MongoDB数据库支持以下数据类型

  • String(字符串):存储文本数据,最常用的数据类型。

  • Integer(整型):存储整数。

  • Boolean(布尔型):存储布尔值(true/false)。

  • Double(双精度浮点型):存储浮点数。

  • Min/Max keys(最小值/最大值):用于比较值的最小值和最大值。

  • Arrays(数组):用于存储数组或列表。

  • Timestamp(时间戳):记录文档修改或添加的时间。

  • Object(对象):用于嵌入式文档。

  • Null(空值):用于表示空值或不存在的字段。

  • Symbol(符号):类似于字符串,但是用于特定的上下文环境。

  • Date(日期):用于存储日期和时间。

  • Object ID(对象ID):用于唯一标识文档。

  • Binary data(二进制数据):用于存储二进制数据,如图片、音频等。

  • Code(代码):用于存储JavaScript代码。

  • Regular expression(正则表达式):用于存储正则表达式。

五丶数据操作

Python中操作MongoDB数据库的方式有多种,可以使用官方提供的pymongo库,也可以使用第三方库mongoengine等。

以下是pymongo库的基本数据操作:

连接数据库

import pymongo

client = pymongo.MongoClient('mongodb://localhost:27017/')
db = client['testdb']

插入数据

collection = db['testcollection']
data = {'name': 'Tom', 'age': 18}
collection.insert_one(data)

查询数据

# 查询所有数据
result = collection.find()
for item in result:
    print(item)

# 查询指定条件的数据
result = collection.find({'name': 'Tom'})
for item in result:
    print(item)

更新数据

# 更新一条数据
collection.update_one({'name': 'Tom'}, {'$set': {'age': 20}})

# 更新多条数据
collection.update_many({'name': 'Tom'}, {'$set': {'age': 20}})

删除数据

# 删除一条数据
collection.delete_one({'name': 'Tom'})

# 删除多条数据
collection.delete_many({'name': 'Tom'})

聚合操作

# 统计数据总数
count = collection.count_documents({})

# 按条件分组统计
result = collection.aggregate([
    {'$group': {'_id': '$name', 'count': {'$sum': 1}}}
])
for item in result:
    print(item)

以上是pymongo库的基本数据操作,其他库的操作方式也类似

六丶数据的备份与恢复

Python中备份和恢复MongoDB数据库可以使用mongodumpmongorestore命令,也可以使用pymongo库中的函数进行操作。

使用mongodumpmongorestore命令备份和恢复MongoDB数据库

备份MongoDB数据库:

mongodump --host <host> --port <port> --db <database> --out <backup_directory>

其中,是MongoDB服务器的IP地址或主机名,是MongoDB服务器的端口号,默认为27017,是要备份的数据库名称,<backup_directory>是备份文件存放的目录。

恢复MongoDB数据库:

mongorestore --host <host> --port <port> --db <database> <backup_directory>

其中,、、和<backup_directory>的含义与备份命令相同。

使用pymongo库备份和恢复MongoDB数据库

备份MongoDB数据库:

import pymongo
import datetime

client = pymongo.MongoClient("<mongodb_uri>")
db = client["<database>"]
collection = db["<collection>"]

backup = collection.find()

with open("<backup_file>", "w") as f:
    for doc in backup:
        f.write(str(doc) + "\n")

其中,<mongodb_uri>是MongoDB服务器的URI,和是要备份的数据库和集合名称,<backup_file>是备份文件的路径。

恢复MongoDB数据库:

import pymongo

client = pymongo.MongoClient("<mongodb_uri>")
db = client["<database>"]
collection = db["<collection>"]

with open("<backup_file>", "r") as f:
    for line in f:
        doc = eval(line.strip())
        collection.insert_one(doc)

其中,<mongodb_uri>、、和<backup_file>的含义与备份命令相同。注意,这种方法只适用于备份和恢复小型数据库,对于大型数据库,建议使用mongodumpmongorestore命令进行操作。

七丶聚合操作

MongoDB的聚合操作是指将多个文档进行分组、筛选、排序、计算等操作,以生成新的文档集合的过程。Python中可以使用pymongo库来进行MongoDB的聚合操作。

以下是一个简单的聚合操作示例,假设我们有一个名为students的集合,其中包含每个学生的姓名、年龄和成绩:

from pymongo import MongoClient

client = MongoClient()
db = client['test']
collection = db['students']

pipeline = [
    {"$group": {"_id": "$age", "avg_score": {"$avg": "$score"}}},
    {"$sort": {"_id": 1}}
]

result = collection.aggregate(pipeline)

for doc in result:
    print(doc)

上述代码中,我们使用了MongoDB的group和group和avg操作符来计算每个年龄段的平均成绩,并使用$sort操作符按年龄升序排序。最终的结果将会是一个包含每个年龄段平均成绩的文档集合。

除了group和group和avg操作符外,MongoDB还提供了许多其他的聚合操作符,如match、match、project、sort、sort、limit等,可以根据具体需求进行组合使用。

八丶索引

MongoDB中的索引是用于提高查询性能的一种数据结构。在MongoDB中,可以使用多种类型的索引,包括单字段索引、复合索引、全文索引等。

以下是使用Python操作MongoDB索引的示例:

创建单字段索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建单字段索引
collection.create_index("name")

# 查询是否创建成功
print(collection.index_information())

创建复合索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建复合索引
collection.create_index([("name", 1), ("age", -1)])

# 查询是否创建成功
print(collection.index_information())

创建全文索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建全文索引
collection.create_index([("content", "text")])

# 查询是否创建成功
print(collection.index_information())

查询使用索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 查询使用索引
result = collection.find({"name": "Tom"}).explain()["executionStats"]
print(result)

以上是Python操作MongoDB索引的示例,可以根据实际需求选择不同类型的索引来提高查询性能。

九丶pymongo的操作

Python中操作MongoDB数据库需要使用pymongo库,以下是pymongo库的常用操作:

连接MongoDB数据库

import pymongo

client = pymongo.MongoClient('mongodb://localhost:27017/')

选择数据库

db = client['database_name']

选择集合

collection = db['collection_name']

插入文档

data = {'name': 'John', 'age': 25}
collection.insert_one(data)

查询文档

result = collection.find_one({'name': 'John'})

更新文档

collection.update_one({'name': 'John'}, {'$set': {'age': 30}})

删除文档

collection.delete_one({'name': 'John'})

查询多个文档

results = collection.find({'age': {'$gt': 20}})
for result in results:
    print(result)

以上是pymongo库的常用操作,可以根据实际需求进行调用。

本系列文根据以下学习路线展开讲述,由于内容较多,:

从零开始学python到高级进阶路线图

关注公众号:python技术训练营,学习进阶一步到位

适用于零基础学习和进阶人群的python资源:

① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程(零基础-高级进阶JS逆向)
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档
⑥ 交流学习
⑦ 想要兼职接单

下章讲:机器学习模块

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/738180.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

多线程与并发编程【线程对象锁、死锁及解决方案、线程并发协作、生产者与消费者模式】(四)-全面详解(学习总结---从入门到深化)

目录 使用Class作为线程对象锁 使用自定义对象作为线程对象锁 死锁及解决方案 线程并发协作(生产者/消费者模式) 实现生产者与消费者模式 使用Class作为线程对象锁 语法结构&#xff1a; synchronized(XX.class){//同步代码} 或 synchronized public static void access…

【大语言模型】LLM应用程序的新兴体系结构

LLM应用程序的新兴体系结构 LLM应用栈设计模式&#xff1a;In-context learningData Preprocessing/EmbeddingPrompt Construction/RetrievalPrompt Execution/Inference What about agents?展望参考资料 大型语言模型是构建软件的强大新基元。但由于它们非常新颖且与常规计算…

css写法、颜色显示方式

一、什么是css 二、css的几种写法 1、行内样式 css写在标签的style属性上&#xff0c;优先级非常高&#xff0c;但是有多个标签具有相同样式代码重复高 2、页面样式 此时写在head&#xff08;不可见&#xff09;中&#xff0c;用style标签 3、外联样式 css样式也可以导入 一…

C++primer(第五版)第十六章(模板与泛型编程)

16.1定义模板 关于模板,第一个要提的点就是,这个字念mu模板而不是mo(一开始打字就发现拼音错了,突然觉得自己要会小学深造一下). 模板就是将一个特定场合使用的东西变成可以在多个场合使用的东西. 16.1.1函数模板 template<typename T> bool bijiao(T &a,T &…

了解 IPNS:我们可以使用 4EVERLAND IPNS Manager 做什么?

关键词&#xff1a;4EVERLAND、IPNS、4EVERLAND IPNS 管理器、去中心化内容 IPNS 是星际名称系统的缩写&#xff0c;是一个允许我们在 IPFS&#xff08;星际文件系统&#xff09;内创建可变指针以及名称和地址内容的系统。IPFS 使用内容标识符 (CID) 作为唯一文件标识符&#…

Photoshop制作Alphas(没有显卡好痛苦,两个MAYA交替弄)

做个选区&#xff0c;选白色 擦除背景 在把背景填充上白色

【PyGIS】GDAL及Rasterio多线程转换NC格式文件为TIFF

汇总 【GIS】使用cdsapi下载ERA5和ERA5_land逐小时数据 NC格式介绍 说明 NC文件读取使用netCDF4,NC文件转换为TIF使用rasterio或者GDAL。 一些细节: 格点数据转换为TIFF文件时候,计算六参数时候,应该要考虑,格点数据存储的坐标属于栅格中心点的位置,转换为TIFF时候,…

Java----使用eureka进行注册连接(微服务简单实现)

当采用微服务架构时&#xff0c;各个业务流程被逐一分解&#xff0c;虽说是分解&#xff0c;但还是要进行连接的&#xff0c;最简单的就是使用http请求&#xff0c;将他们联系起来&#xff0c;通过给容器注入restTemplate&#xff0c;然后使用内置的方法进行请求&#xff0c;但…

基于Javaweb实现ATM机系统开发实战(四)用户修改删除功能实现

我们点一下修改&#xff0c;发现页面进行了跳转&#xff0c;跳转到了/toUpdate&#xff0c;并传递了用户的卡号。 我们可以先查看一下用户列表展示界面的前端代码&#xff1a;userlist.jsp&#xff0c;可以看到前端代码中做了跳转的动作&#xff0c;我们需要在后端中完成相应的…

VectorCAST单元测试参数配置

一、打开 VectorCAST 通常情况下&#xff0c;技术人员会配置一个脚本文件&#xff08;.bat、.cmd&#xff09;&#xff0c;用户可以通过这个脚本文件来启动 VectorCAST。使用脚本文件启动 VectorCAST&#xff0c;可以在启动时设置好编译器相关的环境变量&#xff0c;方便 Vecto…

企业毛利高,进项抵扣少,增值税高,怎么办?

企业毛利高&#xff0c;进项抵扣少&#xff0c;增值税高&#xff0c;怎么办&#xff1f; 《税筹顾问》专注于园区招商、企业税务筹划&#xff0c;合理合规助力企业节税&#xff01; 金税四期的出现&#xff0c;让很多企业都陷入了税负重的不利局面。当然了在此环境之下&#x…

回溯法总结

文章目录 回溯法如何理解回溯法 回溯算法模板框架如下&#xff1a;树枝去重树层去重回溯法去重什么时候去重&#xff1f;树层去重数组used[i-1]&#xff1a;回溯函数的参数startIndex&#xff1a;回溯函数的参数用Set的对象uset&#xff1a;局部变量例题 其它细节对于组合问题&…

测试开发知识图谱

目录 前言&#xff1a; 1 测试方法与理论 2 Shell脚本相关 3 数据库相关 4 git 代码管理 5 Python 编程语言与测试框架 6 Web 自动化测试 7 移动端 app 自动化测试 8 常用开源测试平台 9 客户端专项测试 10 服务端接口测试 11 服务端接口自动化测试 12 服务端性能…

国产CAN收发器XL1050可替代NXP的TJA1050T,性能参数基本一致

CAN收发器是CAN控制器和物理总线之间的接口&#xff0c;在工控等需要CAN通信的应用场合是必要的&#xff0c;工程师通常采用NXP、TI等品牌的&#xff0c;TJA1050T是常见型号之一。XL1050是信路达一款CAN收发器&#xff0c;本文讨论信路达的XL1050 替代NXP的TJA1050T的可行性。 …

前后端分离,前端代理设置

1. 没有vue.config.js的配置方法 1.1 在config目录下的index.js里面加入如下所示代码 proxyTable: {"/api": { // 不能写成^/apitarget: "http://localhost:50000", // 只写域名即可ws: true,changeOrigin: true, // 允许跨域pathRewrite: { // 重写&…

leetcode:除自身以外数组的乘积

除自身以外数组的乘积 medium 给你一个整数数组 nums&#xff0c;返回 数组 answer &#xff0c;其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请**不要使用除法&a…

抖音seo矩阵系统源码搭建技术+二开开源代码定制部署

抖音SEO源码是指将抖音平台上的视频资源进行筛选、排序等操作&#xff0c;进而提升其在搜索排名中的权重&#xff0c;从而让更多的用户能够发现并观看到这些视频资源。而抖音SEO矩阵系统源码则是指通过建立一个分析系统&#xff0c;分析抖音中的用户、视频、标签等数据&#xf…

【数据分类】基于蜣螂优化算法优化支持向量机的数据分类方法 DBO-SVM分类算法【Matlab代码#47】

文章目录 【可更换其他群智能算法&#xff0c;获取资源请见文章第6节&#xff1a;资源获取】1. 蜣螂优化算法&#xff08;DBO&#xff09;2. 支持向量机&#xff08;SVM&#xff09;3. DBO-SVM分类模型4. 部分代码展示5. 仿真结果展示6. 资源获取 【可更换其他群智能算法&#…

Java Leetcode 动态规划 91. 解码方法

未优化版本代码展示&#xff1a; class Solution {public int numDecodings(String s) {char[]charss.toCharArray();int lengths.length();//创建dp数组int[]dpnew int[length];//初始化if(chars[0]!0){dp[0]1;}//特殊情况处理if(length1){return dp[0];}if(chars[1]!0){dp[1…

Postman高级应用——变量、流程控制、调试、公共函数、外部数据文件

目录 流程控制 调试 公共函数 外部数据文件 总结&#xff1a; Postman 提供了四种类型的变量 环境变量&#xff08;Environment Variable&#xff09; 不同的环境&#xff0c;使用不同的环境变量&#xff0c;例如&#xff1a;测试过程中经常会用到 测试环境&#xff0c;外…