【Golang开发面经】字节跳动(三轮技术面)

news2025/1/10 16:26:33

一面

epoll、select、poll 区别

select 机制刚开始的时候,需要把 fd_set 从用户空间拷贝到内核空间,并且检测的 fd 数是有限制的,由 FD_SETSIZE 设置,一般是1024。数组实现

poll 的实现和 select 非常相似,只是描述 fd集合 的方式不同,poll使用 pollfd结构 而不是 select的 fd_set 结构,其他的都差不多。链表实现

epol l引入了 epoll_ctl系统调用,将高频调用的 epoll_wait 和低频的 epoll_ctl 隔离开。epoll_ctl 通过(EPOLL_CTL_ADD、EPOLL_CTL_MOD、EPOLL_CTL_DEL)三个操作来分散对需要监控的fds集合的修改,做到了有变化才变更,将select或poll高频、大块内存拷贝(集中处理)变成epoll_ctl的低频、小块内存的拷贝(分散处理),避免了大量的内存拷贝。 epoll使用 红黑树 来组织监控的fds集合

epoll 的水平触发和边缘触发的区别

Edge Triggered (ET) 边沿触发:

  1. socket 的接收缓冲区状态变化时触发读事件,即空的接收缓冲区刚接收到数据时触发读事件。
  2. socket 的发送缓冲区状态变化时触发写事件,即满的缓冲区刚空出空间时触发读事件。
  3. 仅在缓冲区状态变化时触发事件。

Level Triggered (LT) 水平触发:

  1. socket 接收缓冲区不为空,有数据可读,则读事件一直触发。
  2. socket 发送缓冲区不满可以继续写入数据,则写事件一直触发。

TCP 的流量控制

因为我们总希望数据传输的更快一些。但如果发送方把数据发得过快,接收方就可能来不及接收,这就会造成数据的丢失。流量控制(flow control)就是让发送方的发送速率不要太快,要让接收方来得及接收。

利用滑动窗口机制可以很方便地在 TCP连接上实现发送方流量控制。通过接收方的确认报文中的窗口字段,发送方能够准确地控制发送字节数。

为什么有了流量控制还要有拥塞控制?

流量控制是避免发送方的数据填满接收方的缓存,但并不知道网络中发生了什么。

计算机网络是处在一个共享的环境中。因此也有可能会发生网络的拥堵。在网络出现拥堵时,如果继续发送大量的数据包,可能会导致数据包时延丢失,这时 TCP 就会重传数据,但是⼀重传就会导致网络的负担更重,于是会导致更大的延迟以及更多的丢包

控制的目的就是避免发送方的数据填满整个网络。为了在发送方调节所要发送数据的数据量,定义了⼀个叫做「拥塞窗口」的概念。拥塞窗口 cwnd 是发送方维护的⼀个的状态变量,它会根据网络的拥塞程度动态变化的。

TCP 不是可靠传输吗?为什么会丢包呢?

TCP的可靠传输是会在丢包的时候进行重传,来形成可靠的传输,丢包这是网络的问题,而不是TCP机制的问题。

那你介绍一下拥塞控制的算法?

拥塞控制一共有四个算法:

  1. 慢启动:TCP 在刚建立连接完成后,首先是有个慢启动的过程,这个慢启动的意思就是⼀点⼀点的提高发送数据包的数量。慢启动的算法规则:当发送方每收到⼀个 ACK,拥塞窗⼝ cwnd 的大小就会加 1
  2. 拥塞避免:当拥塞窗口 cwnd「超过」慢启动门限 ssthresh 就会进⼊拥塞避免算法。那么进⼊拥塞避免算法后,它的规则是:每当收到⼀个 ACK 时,cwnd 增加 1/cwnd
  3. 快重传:当接收方发现丢了⼀个中间包的时候,发送三次前⼀个包的ACK于是发送端就会快速地重传,不必等待超时再重传。
  4. 快恢复:快重传和快恢复⼀般同时s使用,快速恢复算法是认为,你还能收到 3 个重复的 ACK 说明网络也不那么糟糕,所以没有必要像 RTO 超时那么强烈。进⼊快速恢复之前, cwnd 和 ssthresh 已被更新了:cwnd = cwnd/2 ,也就是设置为原来的⼀半; ssthresh = cwnd 。

进程、线程的区别

进程线程
系统中正在运行的一个应用程序系统分配处理器时间资源的基本单元
程序一旦运行就是进程进程之内独立执行的一个单元执行流
资源分配的最小单位程序执行的最小单位

进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径。

线程有自己的堆栈和局部变量,但线程没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率要差一些。但对于一些 要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程

Go里面GMP模型是怎么样的?

G:表示goroutine,存储了goroutine的执行stack信息、goroutine状态以及goroutine的任务函数等;另外G对象是可以重用的。 P:表示逻辑processor,P 的数量决定了系统内最大可并行的 G 的数量(前提:系统的物理cpu核数 >= P的数量);P的最大作用还是其拥有的各种G对象队列、链表、一些cache和状态。 M:M 代表着真正的执行计算资源,物理 Processor。

G 如果想运行起来必须依赖 P,因为 P 是它的逻辑处理单元,但是 P 要想真正的运行,他也需要与 M 绑定,这样才能真正的运行起来,P 和 M 的这种关系就相当于 Linux 系统中的用户层面的线程和内核的线程是一样的

算法:旋转矩阵,牛客上写过,easy,秒

二面

上来就一个算法,结束又一个算法,难受。。

如何用栈实现队列

我们可以通过切片来模拟出队列。 只需要完成简单的 push,pop,再判断是否为空即可!

package test_queue

import (
	"fmt"
	"testing"
)

//结构体,包含两个一维切片
type GoQueue struct {
	stack []int
	back  []int
}

//初始化,
func NewQueue() GoQueue {
	return GoQueue{
		stack: make([]int, 0),
		back:  make([]int, 0),
	}
}

func (q *GoQueue) Push(x int) {
	q.stack = append(q.stack, x)
}

func (q *GoQueue) Pop() int {
	if len(q.back) == 0 {
		for len(q.stack) != 0 {
			val := q.stack[len(q.stack)-1]
			q.stack = q.stack[:len(q.stack)-1] //切片,更新栈
			q.back = append(q.back, val)
		}
	}
	val := q.back[len(q.back)-1]
	q.back = q.back[:len(q.back)-1]
	return val
}

func (q *GoQueue) Empty() bool {
	return len(q.back) == 0 && len(q.stack) == 0
}

func TestQueue(t *testing.T) {
	q := NewQueue()
	q.Push(1)
	q.Push(2)
	q.Push(3)
	for !q.Empty() {
		fmt.Println(q.Pop())
	}
}
复制代码

如何判断一个链表有没有环?

  1. 用hash来判断是否存在相同的值,也就是环。
  2. 快慢指针:快指针走两步,慢指针走一步,最终会相遇。

那为什么快慢指针一定能够相遇?

因为当快指针出现在慢指针后面之后,每一次快指针往前走两步、慢指针往前走一步,相当于快指针和慢指针之间的相对距离减少1步。当快指针刚刚绕到慢指针后面时,快指针离慢指针有 n 步。那么,对于接下来的每一次快指针往前走两步、慢指针往前走一步,快指针和慢指针之间的距离由 n 步变成 n-1 步、由 n-1 步变成 n-2 步、……、由 3 步变成 2 步、由 2 步变成 1 步、由 1 步变成 0 步。最终相遇。

  • 快慢指针第一次相遇的时候,慢指针少走了多少?

我们设从起点到 X 点的距离是 x,因此当在第一次相遇的时候,在n点,慢指针的路程是 x+n ,而因为快指针的速度是慢指针的一倍,它们从头开始,运动时间就是完全一致的,因此当二者发生相遇的时候,有如下几点值得注意:

  1. 当二者发生相遇时,慢指针一定已经进入了环中;
  2. 快指针一定先于慢指针进入环中;
  3. 快指针移动过的路程累计是慢指针的1倍,也就是2 * ( x + n ),其中早在路程为x时,快指针已经进入了环,它在环中运动了 x+2n 的路程。

在 n 点时,慢指针的路程是 x+n,快指针的路程是2*(x+n),说明此时快指针比慢指针多走了 x+n,这同时也说明,从 n 处开始,继续往后推移 x+n 个距离,可以再次回到Z点,因此 x+n 的距离至少是环巡距离的一倍。慢指针和快指针在环中第一次相遇时的路程差值,是环路程的倍数。 所以慢指针少走了环巡距离的一倍。

你用的是 mysql 是吧,那 B树 和 B+树 的区别是?

B 树

B+树

  1. B+ 树内节点不存储数据,所有 data 存储在叶节点导致查询时间复杂度固定为log (n)。而 B-树 查询时间复杂度不固定,与 key 在树中的位置有关,最好为 O(1)
  2. B+ 树叶节点两两相连可大大增加区间访问性,可使用在范围查询等,而 B- 树 每个节点 key 和 data 在一起,则无法区间查找。同时我们访问某数据后,可以将相近的数据预读进内存,这是利用了空间局部性
  3. B+ 树更适合外部存储。由于内节点无 data 域,每个节点能索引的范围更大更精确。

介绍一下死锁产生的必要条件

互斥条件,请求和保持条件,不剥夺条件,环路等待条件。

如何实现互斥锁?

一个互斥锁需要有阻塞和唤醒功能,所以需要一下几个情况。

  1. 需要有一个标记锁状态的 state 变量。
  2. 需要记录哪个线程持有了锁。
  3. 需要有一个队列维护所有的线程。

如何实现自旋锁?

当时真不会,只磕磕绊绊说了一些自旋锁的东西。。

大家可以看这篇博客 自旋锁C++实现方式

算法:三数之和。秒

三面

kafka 和 其他消息队列,比如 rocketmq,rabbitmq ,有什么优势?

kafka 具备非常高可靠的分布式架构,功能简单,只支持一些主要的MQ功能,像一些消息查询,消息回溯等功能没有提供。时效是在ms级别以内的。

kafka如何保证消息不丢失?

那我们可以从两个方面也就是生产者,消费者以及 broker ,来说说

  1. 生产者:生产者(Producer) 调用 send 方法发送消息之后,消息可能因为网络问题并没有发送过去。Kafka提供了同步发送消息方法,会返回一个Future对象,调用get()方法进行阻塞等待,就可以知道消息是否发送成功。如果消息发送失败的话,可以通过 Producer 的 retries(重试次数)参数进行设置,当出现网络问题之后能够自动重试消息发送,避免消息丢失。另外,建议还要设置重试间隔,因为间隔太小的话重试的效果就不明显。
  2. 消费者:消息在被追加到 Partition(分区) 的时候都会分配一个特定的偏移量(offset)。偏移量(offset)表示 Consumer 当前消费到的 Partition(分区)的所在的位置。 Kafka 通过偏移量(offset)可以保证消息在分区内的顺序性。当消费者拉取到了分区的某个消息之后,消费者会自动提交了 offset。自动提交的话会有一个问题,试想一下,当消费者刚拿到这个消息准备进行真正消费的时候,突然挂掉了,消息实际上并没有被消费,但是 offset 却被自动提交了。 可以通过enable.auto.commit设置为false,关闭自动提交 offset ,每次在真正消费完消息之后之后再自己手动提交 offset
  3. broker:当消息发送到了分区的leader副本,leader 副本所在的 broker 突然挂掉,那么就要从 follower 副本重新选出一个 leader ,但是 leader 的数据还有一些没有被 follower 副本的同步的话,就会造成消息丢失。解决办法就是 将producer设置 acks = all

https为什么是安全的?

因为 https 是基于 ssl 和 tls 加密而成的,https 的 s 就代表 ssl 和 tls。

ssl/tls 是怎么保证安全的?经过几次握手?

经过四次握手,客户端向服务器端索要并验证公钥,双方协商生成"对话密钥",双方采用"对话密钥"进行加密通信。 四次握手主要是交换以下信息:

  1. 数字证书:该证书包含了公钥等信息,一般是由服务器发给客户端,接收方通过验证这个证书是不是由信赖的CA签发,或者与本地的证书相对比,来判断证书是否可信;假如需要双向验证,则服务器和客户端都需要发送数字证书给对方验证;
  2. 三个随机数:这三个随机数构成了后续通信过程中用来对数据进行对称加密解密的“对话密钥”。

首先客户端先发第一个随机数N1,然后服务器回了第二个随机数N2(这个过程同时把之前提到的证书发给客户端),这两个随机数都是明文的;而第三个随机数N3,客户端用数字证书的公钥进行非对称加密,发给服务器; 而服务器用只有自己知道的私钥来解密,获取第三个随机数。 这样,服务端和客户端都有了三个随机数N1+N2+N3,然后两端就使用这三个随机数来生成“对话密钥”,在此之后的通信都是使用这个“对话密钥”来进行对称加密解密。 因为这个过程中,服务端的私钥只用来解密第三个随机数,从来没有在网络中传输过,这样的话,只要私钥没有被泄露,那么数据就是安全的。

  1. 加密通信协议:就是双方商量使用哪一种加密方式,假如两者支持的加密方式不匹配,则无法进行通信;

事务的四大特性?

原子性、隔离性、一致性、持久性

用过哪些排序?

快排,堆排,归并比较常用。

快排一定最快吗?

不一定,当待排序的序列已经有序,不管是升序还是降序。此时快速排序最慢,一般当数据量很大的时候,用快速排序比较好,为了避免原来的序列有序。

场景题:如果我有100G文件,但是只有 500 M 的内存,这些文件存着一行行的数字,如何获取最小的10个?

这是经典的 Top K 问题,分治+堆排,我们可以先进行一个将文件进行分治,将100G的文件的分成一个个的 500 M,以此放到内存中每个500M的文件取出进行最小堆的排序,取出前10个写到新文件中。再对着一个个的新文件进行合并成 500 M 再进行最小堆的排序,最终获取最小的10个数字。

算法:最长有序括号,常见题,秒

参考链接

[1] blog.csdn.net/weixin_3597… [2] www.cnblogs.com/yaochunhui/…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/417621.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Node【一】初识Node

文章目录🌟前言🌟Node.js🌟特性:🌟1. 单线程🌟2.异步IO🌟前端中的异步🌟Node中的异步🌟3.跨平台🌟4.运行速度快🌟 劣势:🌟…

ASP一个物流商品运输系统的设计与实现

物流运输行业的今天正朝着追求高效、低成本、稳定可靠的方向发展。本文详细介绍了网上物流管理系统,涉及到客户端运输线路设计、过程跟踪等功能模块以及管理员端的相应模块的具体实现,分析了整个系统的架构、工作原理、实现功能等。系统采用ASPMS SQL以B…

代码随想录算法训练营第43天 | 动态规划 背包理论基础 LeetCode1049.最后一块石头的重量II,494.目标和,474.一和零

代码随想录算法训练营第43天 | 动态规划 背包理论基础 LeetCode1049.最后一块石头的重量II,494.目标和,474.一和零 1049.最后一块石头的重量II 第一遍读题思考 重点在于背包问题的理论基础建议阅读以下两个链接。 背包问题理论基础,用二维…

sed命令基础

sed编辑器即流编辑器(stream editor),根据命令处理数据流中的数据,这些命令可从命令行输入,或者指定文件中输入。 sed执行的操作如下: 1)从输入读取一行数据 2)根据提供的命令匹配数…

KSS-ICP: 基于形状分析技术的点云配准方法

目录 1. 概述 2. 算法实现 3. 实验结果 总结 Reference 三维点云配准是三维视觉领域一个经典问题,涉及三维重建,定位,SLAM等具体应用问题。传统的配准可以被分为两条技术路线,即基于全局姿态匹配的方法以及基于特征点对应的方法。…

疫情下社区管理系统的设计与实现(论文+源码)_kaic

疫情下社区管理系统 摘 要:新冠疫情下的社区人员管理系统是基于SpringBoot搭建的一套前后端分离系统。面向疫情下的社区管理人员和社区用户,主要用于进行社区服务,进行高效的社区人员管理。具有一定的经济效益和社会效益。本文分析了新冠疫情…

计算机网络第三章(数据链路层)【湖科大教书匠】

1. 概述 物理层发出去的信号需要通过数据链路层才知道是否到达目的地;才知道比特流的分界线 链路(Link):从一个结点到相邻结点的一段物理线路,中间没有任何其他交换结点数据链路(Data Link):把实现通信协议的硬件和软件加到链路…

【ROS实操2话题订阅输出乌龟位姿】

需求描述 已知turtlesim中的乌龟显示节点,会发布当前乌龟的位姿(窗体中乌龟的坐标以及朝向),要求控制乌龟运动,并时时打印当前乌龟的位姿。 实现分析 1.首先,需要启动乌龟显示以及运动控制节点并控制乌龟运动。 2.要通过ROS命令…

网络原理TCP协议

hi,我们又见面了,今天为大家带来TCP协议,一共为大家介绍TCP协议的十个核心特性 1.确认应答 2.超时重传 3连接管理 4滑动窗口 5流量控制 6拥塞控制 7延迟应答 8捎带应答 9面向字节流(粘包问题) 10异常情况(心跳包) 11基于TCP应用层协议 TCP协议位于传输层,我们知道T…

微信小程序开发 | API应用案例(上)

API应用案例(上)5.1【案例1】用户登录5.1.1 案例分析5.1.2 前导知识5.1.3 搭建开发者服务器5.1.4 实现用户登录5.1.5 检查用户是否已经登录5.1.6 获取用户信息5.1.7 开放数据校验与解密5.2【案例2】个人中心5.2.1 案例分析5.2.2 前导知识5.2.3 实现底部标…

BE-SSL:基于边界增强自监督学习的脑结构分割

文章目录Boundary-Enhanced Self-supervised Learning for Brain Structure Segmentation摘要本文方法Supervoxel BranchRegistration BranchAtlas Selection实验结果Boundary-Enhanced Self-supervised Learning for Brain Structure Segmentation 摘要 边界增强自监督学习(…

用Pytorch搭建一个房价预测模型

本文参加新星计划人工智能(Pytorch)赛道:https://bbs.csdn.net/topics/613989052 目录 一、项目介绍 二、准备工作 三、实验过程 3.1数据预处理 3.2拆分数据集 3.3构建PyTorch模型 3.3.1.数据转换 3.3.2定义模型架构 3.3.3定义损失准则和优化器 3.3.4创建…

Linux查看端口

目录 1.查看已知端口的使用情况 2.查看所有端口的占用情况 3.查看占用端口的程序的进程号 4.杀死进程号 1.查看已知端口的使用情况 #例:8080 可使用命令: netstat -anp | grep 8080 结果如下: 还可以使用这条命令: netstat -tln | grep 8080 结果如下: 区别:第一条命令后面显示…

评分卡模型(二)基于评分卡模型的用户付费预测

评分卡模型(二)基于评分卡模型的用户付费预测 小P:小H,这个评分卡是个好东西啊,那我这想要预测付费用户,能用它吗 小H:尽管用~ (本想继续薅流失预测的,但想了…

DevExpress WinForms电子表格控件,更快拥有现代办公体验!(二)

DevExpress WinForm Spreadsheet组件能读写XLSx、XLS、CSV、TXT文件、打印并导出为PDF等,为终端用户提供了当今流行的办公UI体验!在上文中(点击这里回顾>>),我们介绍了DevExpress WinForm中Excel启发式的电子表格…

【计算机网络-数据链路层】集线器、网桥、交换机

本文许多文字和图片使用了湖科大教书匠(高军老师)的 PPT,在此表示感谢。正是他让非科班的我能以奇妙的方式走进网络的世界。 文章目录1 【物理层】集线器(Hub)——共享式以太网1.1 为什么使用集线器?1.2 集…

救命,我好像发现了测试工程师面试通关秘籍

一、自我介绍 (自我介绍不局限于下面模板,灵活表达) 面试官你好,我叫xxx,今年xx岁,家乡是xx省xx市。20xx年毕业后一直从事软件测试工作,到现在已经x年了。 目前为止,经历过x家公司…

基于SpringBoot的大学生体质测试管理系统源码数据库论文

目录 目录 1 绪 论 1.1系统背景介绍 1.2课题研究的目的和意义 1.3系统的研究现状 1.4系统实现的功能 1.5系统的特点 2 开发工具和技术 2.1 B/S体系结构 2.2 Java语言简介 2.3 SpringBoot框架 2.4 MySQL简介 3 系统需求分析 3.1 系统可行性分析及目的…

JS数组reduce()方法详解及高级技巧

reduce()方法可以搞定的东西,for循环,或者forEach方法有时候也可以搞定,那为啥要用reduce()?这个问题,之前我也想过,要说原因还真找不到,唯一能找到的是:通往成功的道路有很多&#…

QtableWidget插入数据卡顿优化方法

最近要使用Qtablewidget保存4300多的数据,发现以下刷新4300条数据,界面会变得非常卡顿,于是想了优化一下;因为要对所有数据排序,想用一下Qtablewidget自动排序功能,而且数据量不多,不想采用动态…