Study Git - Data Model

news2025/1/11 5:51:40

前言

本文章主要记录学习git底层原理时的一些知识点
文章参考

  • MIT missing class
  • How to explain git in simple words?
  • The anatomy of a Git commit
  • Pro Git

Git的数据模型

  • blob: 压缩并保存所有文件内容的数据结构 blob = array<byte>
  • tree: 存储目录的结构,保存所属文件和tree(子目录)tree = map<string, tree | blob>,(这里的blob实际上是一个哈希值)。永远存在一个root树。
  • commit: commit是指向tree的数据结构,每个提交都有自己的哈希值,它还会保存您的消息、时间戳和您的信息。当改变了追踪的文件blob1并且提交后,git会将更改文件后的内容存储在新的blob2中,这时commit会创建一个新的tree,tree也会通过一个新的hash值指向blob2,(但指向其它没有更改的blob的哈希是没有变化的,也就是依然指向原blob) 这样,通过两次commit,git repo中就保存了两个不同版本的的snapshot。
// 伪代码
type commit = struct {
    parents: array<commit>
    author: string
    message: string
    snapshot: tree
}
  • Objects : 一个Object是tree/blob/commit中的统一表达。很显然,如果要让tree中直接包含blob/tree本身或者一个副本,commit包含tree的全部内容(递归地继续包含blob和tree),磁盘开销会很大。所以实际上,当tree指向blob/tree时或者commit指向tree时,实际上是通过引用它们的hash值(SHA-1)实现的。也就是说一个commit指向的tree和一个tree中包含的内容实际上都是哈希值,这些哈希值指向blob或者tree,并且这个tree本身通过哈希可以被commit或者tree引用。所有Object通过SHA-1哈希寻址。
// 伪代码
type object = blob | tree | commit
objects = map<string, object>

def store(object):
    id = sha1(object)
    objects[id] = object

def load(id):
    return objects[id]
  • references: 实际上是指向commit的指针,因为用哈希值去让人交互非常难记,所以用reference代替.例如,master reference 通常指向开发主分支中的最新提交。在 Git 中,“我们当前所在的位置”是一个名为“HEAD”的特殊引用。
references = map<string, string>

def update_reference(name, id):
    references[name] = id

def read_reference(name):
    return references[name]

def load_reference(name_or_id):
    if name_or_id in references:
        return load(references[name_or_id])
    else:
        return load(name_or_id) 

git对一个目录的表示(最上层是root tree)
在这里插入图片描述


working directory | Stage OR Index

working directory:工作目录。当用checkout切换commit时,工作目录也会切换到commit对应的snapshot

This the git directory in which you are working. When you check-out a commit, your whole directory with all files is changed/replaced to match that commit (except ignored files)

Stage OR Index:暂存区。在git commit保存到git repo前的缓存区,可以在这个缓存区中决定哪些改动过的文件需要被添加进repo中。试想一下如果没有Stage,那么每次提交就直接是工作目录到git repo的提交,有一些还没有完成的工作也会不得不添加进去。
详情参考:The anatomy of a Git commit


History

每次commit都会生成一个commit object,每个commit实际上会指向它之前的commit(parent),但每个commit的parent有可能有多个,参考之前的伪代码,这是因为当并行开发两个独立的功能,彼此独立,之后merge,新生成的commit就会指向多个parent。
在这里插入图片描述

经过多次提交后,commit组成的链就形成了,这个链上的每个commit都保留了那一次提交时的root tree的哈希值。如果某个文件改变了,那么那个文件对应的哈希值会改变,所以需要一个新的blob存储,同时存储它的tree由于需要保存指向它的哈希值,所以tree的内容也改变,那么tree作为object的哈希也改变。最后自底向上就体现在根目录的哈希发生改变。通过这样形成保存的snapshot。

在这里插入图片描述


branch

branch实际上是一个可移动的指针,它指向的内容是当前commit的分支中最新的那一个,每次提交时,它都会移动到新提交的内容。 Git 将默认分支命名为 master。您当前加载的分支或提交由 HEAD 跟踪。 Head 始终指向您当时所在的提交或分支
在这里插入图片描述


Tag

可以把tag当成git history中的一个书签,它是一个不可移动的,指向一个确定的commit的书签。标签对于指定版本很有用。
在这里插入图片描述


一些个人理解

Object的设计感觉有点像EXT文件系统,用指针(哈希)而不是直接存储blob的原因就是为了避免每次使用直接载入时需要载入全部的子节点的blob,但其实用不到而且内存开销太大。要用的时候再载入内存。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/13736.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Cholesterol艾美捷胆固醇基参方案

艾美捷Cholesterol胆固醇以固体形式提供。可以通过将胆固醇溶解在所选择的溶剂中来制备储备溶液&#xff0c;该溶剂应使用惰性气体吹扫。胆固醇以约30mg/ml的浓度溶于有机溶剂氯-仿中。 艾美捷Cholesterol胆固醇基本参数&#xff1a; Formal Name (3β)-cholest-5-en-3-ol C…

Element Tiptap Editor - 免费开源的 Vue 富文本编辑器,专门为搭配 Element UI 使用优化,使用很简单

一款很容易上手配置的富文本编辑器&#xff0c;和 Element plus 一起使用效果非常好&#xff0c;还能自定义功能。 关于 Element Tiptap Editor Element Tiptap Editor 是一个在 web 开发领域“所见即所得”的富文本编辑器&#xff0c;基于 tiptap 编辑器和 element-ui 开发&…

Android程序设计之音乐播放器实现

Android毕设音乐播放器实现 基于MediaPlayer技术实现在线音乐播放器&#xff0c;播放在线音乐&#xff0c;后端使用SpringBoot将音乐存放在Tomcat服务器。app通过网络请求获取音乐&#xff0c;从而实现在线音乐播放。该项目分为用户端和管理员端 一、核心技术Service组件介绍 …

远程教育:低代码重塑教育技术

新冠肺炎大流行对世界各地的行业产生了影响&#xff0c;其中一些行业的影响远远超过其他行业。食品、零售、供应链、娱乐和航空业是受影响最大的行业&#xff0c;为确保不间断运营&#xff0c;这引发了一场数字革命。相信&#xff0c;这种数字化的采用将长期保持下去&#xff0…

​电脑上的回收站怎么隐藏 ,怎么隐藏桌面回收站图标

回收站是电脑上不可分割的一部分&#xff0c;往往被放在电脑的桌面上&#xff0c;我们是不能够删除桌面上的回收站的&#xff0c;但是如果想要一个很干净的桌面&#xff0c;不想让回收站出现在电脑桌面上&#xff0c;​电脑上的回收站怎么隐藏&#xff1f; 通过本文&#xff0c…

List接口

集合框架图 list接口的常用实现类 list接口的常用方法 ■void add(int index, E element);向指定位置上添加元素&#xff0c;原始数据后移■E remove(int index);删除指定位置上的元素&#xff0c;并返回被删除的元素&#xff0c;原始位置上的元素前移■E get(int index);按照索…

Maven 【ERROR】 不再支持源选项 5。请使用 7或更高版本解决方案:修改Maven默认JDK(含完整代码及详细教程)

文章目录一、前言二、项目场景三、问题描述四、原因分析五、解决方案1. 查看本机安装的jdk版本2. 找到settings.xml文件3. 编辑settings.xml文件4.找到pom.xml文件5.修改pom.xml文件六、验证七、结语一、前言 博主在遇到这个问题时&#xff0c;找遍了百度的方法也没办法解决&a…

[附源码]Python计算机毕业设计java视频点播系统

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

AI+教育的结合

1、AI 目前有哪些应用方向 我们所说的 AI 到底是什么&#xff1f;先定义清楚&#xff0c;我们先不要被这个被过度包装的概念迷惑说 AI 能代替人类&#xff0c;无所不能。 实际上&#xff0c;人工智能&#xff0c;是属于计算机科学的一个分支&#xff0c;我们常听到的 机器学习…

java读取局域网共享文件夹中文件并保存到本地文件夹

在磁盘新建一个文件夹&#xff0c;右击文件夹属性&#xff0c;点击共享 点击网络和共享中心 设置文件夹可访问权限 到此就可以用本地ip加文件夹名称访问了&#xff0c;同局域网也可以通过改地址访问 文件夹的名称来自这张图的 网络路径 如果需要通过java的jcifs包访问请继…

负载均衡-动静分离

文章目录一.Nginx负载均衡实现原理1、反向代理原理2、反向代理的概念3、反向代理的优势4、Nginx四层反向代理和七层反向代理二、Nginx动静分离实现原理1、动静分离的概念2、动静分离的原理3、Nginx 静态处理优势三、Nginx负载均衡调度算法&#xff08;6种&#xff09;1、轮询&a…

Sentinel源码剖析之执行流程

1、说明 Sentinel主要用来流控&#xff0c;熔断降级保护目标资源用的&#xff0c;常用集成SCG&#xff0c;SpringBoot&#xff0c;SprinMVC这些&#xff0c;但底层本质没变&#xff0c;但是体现形式上会有差别。例如SCG底层是Netty 和 SpringWebFlux 采用Reactor Stream处理&a…

策略验证_买入口诀_三杆通底反弹在即

写在前面&#xff1a; 1. 本文中提到的“股票策略校验工具”的具体使用操作请查看该博文&#xff1b; 2. 文中知识内容来自书籍《同花顺炒股软件从入门到精通》 3. 本系列文章是用来学习技法&#xff0c;文中所得内容都仅仅只是作为演示功能使用 目录 解说 策略代码 结果 解…

【POJ No. 1988】 方块栈 Cube Stacking

【POJ No. 1988】 方块栈 Cube Stacking POJ 题目地址 【题意】 贝西正在玩方块游戏&#xff0c;方块编号为1&#xff5e;N&#xff08;1≤N ≤30,000&#xff09;&#xff0c;开始时每个方块都相当于一个栈。 贝西执行P 个&#xff08;1≤P ≤100,000&#xff09;操作&…

深圳市数字经济指数发布:数字经济蓬勃发展,数字用户深度渗透

2022年1月&#xff0c;国务院印发了《“十四五”数字经济发展规划》。规划提出&#xff0c;到2025年&#xff0c;数字经济核心产业增加值占国内生产总值比重达到10%&#xff0c;数据要素市场体系初步建立&#xff0c;产业数字化转型迈上新台阶&#xff0c;数字产业化水平显著提…

【论文精读4】MVSNet系列论文详解-CVP-MVSNet

CVP-MVSNet全文名为“Cost Volume Pyramid Based Depth Inference for Multi-View Stereo”&#xff0c;主要创新点在于使用由粗到细&#xff08;coarse-to-fine&#xff09;模式来构建代价体金字塔&#xff08;cost volume pyramid&#xff09;&#xff0c;流程如下&#xff1…

Java虚拟机之运行时数据区(一)

Java虚拟机之运行时数据区 简述 Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域有各自的用途&#xff0c;以及创建和销毁的时间&#xff0c;有的区域随着虚拟机进行启动而一直存在&#xff0c;有些区域则是依赖用户线程的启动和结…

房子装修有哪些注意事项要注意?

房子装修有哪些注意事项要注意&#xff1f;这里的东西太多了&#xff0c;可能三天三夜都搞不清楚&#xff0c;而且对于初次装修的业主来说&#xff0c;很多专业术语都是一头雾水&#xff0c;所以本文就简单介绍一下&#xff0c;从装修到装修&#xff0c;以及需要注意的几点。 房…

【深度学习】实验4答案:脑部 MRI 图像分割

DL_class 学堂在线《深度学习》实验课代码报告&#xff08;其中实验1和实验6有配套PPT&#xff09;&#xff0c;授课老师为胡晓林老师。课程链接&#xff1a;https://www.xuetangx.com/training/DP080910033751/619488?channeli.area.manual_search。 持续更新中。 所有代码…

数据之道读书笔记-05面向“联接共享”的数据底座建设

数据之道读书笔记-05面向“联接共享”的数据底座建设 在从信息化向数字化转型的过程中&#xff0c;企业积累了海量的数据&#xff0c;并且还在爆发式地增长。数据很多&#xff0c;但真正能产生价值的数据却很少。数据普遍存在分散、不拉通的问题&#xff0c;缺乏统一的定义和架…