2024年大数据高频面试题(中篇）

2024年大数据高频面试题(中篇）

news2025/10/17 14:20:25

文章目录

Kafka
- 为什么要用消息队列
- 为什么选择了kafka
- kafka的组件与作用(架构)
- kafka为什么要分区
- Kafka生产者分区策略
- kafka的数据可靠性怎么保证
- ack应答机制（可问：造成数据重复和丢失的相关问题）
- 副本数据同步策略
- ISR
- kafka的副本机制
- kafka的消费分区分配策略
- - Range分区分配策略
  - RoundRobinAssignor分区分配策略
  - StickyAssignor分区分配策略
- kafka的offset怎么维护
- kafka为什么这么快
- Kafka消费能力不足怎么处理
- kafka事务是怎么实现的
- Kafka中的数据是有序的吗
- Kafka可以按照时间消费数据吗
- Kafka单条日志传输大小
- Kafka参数优化
- Kafka适合以下应用场景
- Exactly Once语义
Zookerper
- 特点
- 选举机制
- - 新集群选举
- 非全新集群选举
- Kafka依赖Zookeeper的选举
- Kafka依赖ZK做了哪些事
- - Kafka选举
  - Kafka为什么要放弃ZK
- 基于ZooKeeper的Hadoop高可用
- Yarn高可用
Flink
- 运行时架构
- Flink 应用
- 处理数据API
- 核心抽象
- Flink 异步IO
- 窗口
- Watermark （水印）
- 内存管理
- 内存模型
- 资源管理
- 调度
- 作业调度失败
- 容错
- 保存点恢复
- 端到端严格一次
- Flink SQL
- FLINK API

Kafka

为什么要用消息队列

解耦
允许你独立的扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束。
可恢复性
系统的一部分组件失效时，不会影响到整个系统。消息队列降低了进程间的耦合度，所以即使一个处理
消息的进程挂掉，加入队列中的消息仍然可以在系统恢复后被处理。
缓冲
有助于控制和优化数据流经过系统的速度，解决生产消息和消费消息的处理速度不一致的情况。
灵活性与峰值处理能力
在访问量剧增的情况下，应用仍然需要继续发挥作用，但是这样的突发流量并不常见。如果为以能处理
这类峰值访问为标准来投入资源随时待命无疑是巨大的浪费。使用消息队列能够使关键组件顶住突发的
访问压力，而不会因为突发的超负荷的请求而完全崩溃。
异步通信
很多时候，用户不想也不需要立即处理消息。消息队列提供了异步处理机制，允许用户把一个消息放入
队列，但并不立即处理它。想向队列中放入多少消息就放多少，然后在需要的时候再去处理它们。

为什么选择了kafka

在这里插入图片描述

高吞吐量、低延迟：kafka每秒可以处理几十万条消息，它的延迟最低只有几毫秒。
可扩展性：kafka集群支持热扩展。
持久性、可靠性：消息被持久化到本地磁盘，并且支持数据备份防止数据丢失。
容错性：允许集群中

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1931120.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

单链表算法 - 环形链表I

单链表算法 - 环形链表I

. - 力扣（LeetCode）. - 备战技术面试？力扣提供海量技术面试资源，帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/linked-list-cycle/description/思路: 代码: /*** Definition for sin…

阅读更多...

Docker的数据管理和网络通信

Docker的数据管理和网络通信

目录一、Docker 的数据管理 1．数据卷 2．数据卷容器二、端口映射三、容器互联（使用centos镜像） 四、*Docker 镜像的创建 1．基于现有镜像创建 2．基于本地模板创建 3．基于Dockerfile 创…

阅读更多...

第二十章 Nest 大文件分片上传

第二十章 Nest 大文件分片上传

在前端的文件上传功能中，只要请求头里定义 content-type 为 multipart/form-data，内容就会以下面形式传递到服务端，接着服务器再按照multipart/form-data的格式去提取数据获取文件数据但是当文件体积很大时就会出现一个问题文件越大请求的…

阅读更多...

cpp 强制转换

cpp 强制转换

一、static_cast static_cast 是 C 中的一个类型转换操作符，用于在类的层次结构中进行安全的向上转换（从派生类到基类）或进行不需要运行时类型检查的转换。它主要用于基本数据类型之间的转换、对象指针或引用的向上转换（即从派生…

阅读更多...

Mysql缓存调优的基本知识（附Demo）

Mysql缓存调优的基本知识（附Demo）

目录前言1. 配置2. 缓存3. 策略前言基本的知识推荐阅读： java框架零基础从入门到精通的学习路线附开源项目面经等（超全）Mysql优化高级篇（全）Mysql底层原理详细剖析常见面试题（全） MySQL…

阅读更多...

【网络安全的神秘世界】HackBar绕过许可证

【网络安全的神秘世界】HackBar绕过许可证

🌝博客主页：泥菩萨 💖专栏：Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 🍄问题描述用Firefox浏览器安装hackbar插件后，按F12键，发现如下提示：无法使…

阅读更多...

防火墙的带宽管理

防火墙的带宽管理

一、实验拓扑目录一、实验拓扑二、实验要求三、实验步骤 3.1将防火墙组网改成双机热备的组网形式，做负载分担模式，游客区和DMZ区走FW3，生产区和办公区的流量走FW1 3.1.1心跳线设置 3.2启用双机热备，并配置VRRP组 3.2.1…

阅读更多...

MySQL常用命令的实战应用

MySQL常用命令的实战应用

MySQL常用命令全攻略：从入门到精通的实用指南在数字化时代的浪潮中，MySQL作为关系型数据库管理系统的佼佼者，以其稳定性和高效性赢得了全球用户的青睐。无论是新手还是资深开发者，掌握MySQL的常用命令都是提升数据库管理能力的基…

阅读更多...

内行人才知道的白酒术语

内行人才知道的白酒术语

😜宝子们，今天来给大家分享一些只有内行人懂的白酒术语，让你在酒桌上也能显得很专业！💪 ⬆️基酒术语解释：所谓基酒就是最基础的酒，也叫原浆酒，是指成酒后不经过勾调的酒液。基酒度…

阅读更多...

数据库内核研发学习之路（三）创建postgres内置函数

数据库内核研发学习之路（三）创建postgres内置函数

本章之前已经讲明白了我们的postgres如何进行编译安装，这是很重要的一步，接下来就是学会对postgres进行小的改动，然后保证依然能够顺利编译安装运行！ 本章续讲内容如何创建一个内置函数。 1、内置函数和用户自定义函数的区别熟…

阅读更多...

国产精品ORM框架-SqlSugar详解进阶功能集成整合脚手架应用附源码云草桑专题二

国产精品ORM框架-SqlSugar详解进阶功能集成整合脚手架应用附源码云草桑专题二

国产精品ORM框架-SqlSugar详解 SqlSugar初识专题一-CSDN博客 sqlsugar 官网-CSDN博客 4、进阶功能 5、集成整合 6、脚手架应用 4、进阶功能 4.1、生命周期 Queryable 什么时候操作库 Queryable是一个引用类型 Queryable拷贝机制 {ISugarQueryable<Student> quer…

阅读更多...

[Vulnhub] devt-improved slog_users+vim权限提升+nano权限提升+passwd权限提升+Lxc逃逸权限提升

[Vulnhub] devt-improved slog_users+vim权限提升+nano权限提升+passwd权限提升+Lxc逃逸权限提升

信息收集 IP AddressOpening Ports192.168.101.149TCP:22,113,139,445,8080 $ nmap -p- 192.168.101.149 --min-rate 1000 -sC -sV PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 7.6p1 Ubuntu 4 (Ubuntu Linux; protocol 2.0) | ssh-hostkey: | …

阅读更多...

Python基础语法篇（上）

Python基础语法篇（上）

Python基础语法（上） 一、基知二、基本数据类型（一）标准数据类型（二）数据类型转换三、字符串基本操作（一）字符串的索引和切片（二）字符串的拼接三、运算符四、…

阅读更多...

51单片机嵌入式开发：11、 STC89C52RC 实现一个滑动的led点阵程序

51单片机嵌入式开发：11、 STC89C52RC 实现一个滑动的led点阵程序

STC89C52RC 实现一个滑动的led点阵程序 1 概述2 LED点阵介绍2.1 LED概述2.2 LED点阵注意事项 3 LED点阵原理3.1 Led点阵内部电路3.2 原理图电路 4 软件实现点阵图案的滑动4.1 软件工程代码4.2 Protues仿真 5 扩展74HC595（后续专题开展）6 总结第十一节 1…

阅读更多...

MySQL篇：主从复制

MySQL篇：主从复制

概述话不多说，直接上概念： DDL（Data Definition Language）语句： 数据定义语言，主要是进行定义/改变表的结构、数据类型、表之间的链接等操作。常用的语句关键字有 CREATE、DROP、ALTER 等。 DML&#xff…

阅读更多...

Redis实战—附近商铺、用户签到、UV统计

Redis实战—附近商铺、用户签到、UV统计

本博客为个人学习笔记，学习网站与详细见：黑马程序员Redis入门到实战 P88 - P95 目录附近商铺数据导入功能实现用户签到签到功能连续签到统计 UV统计附近商铺利用Redis中的GEO数据结构实现附近商铺功能，常见命令如下图所示。…

阅读更多...

逻辑漏洞-支付漏洞

逻辑漏洞-支付漏洞

【实验目的】通过本次实验，掌握最基础的支付漏洞【实验环境】 win7操作机：10.0.0.2 centos7靶机：10.0.0.3 【实验步骤】 1. 启动实验环境点击“启动场景”按钮，成功启动后，点击操作机按钮进入操作界面。打开浏…

阅读更多...

景区客流统计系统提升服务精准度

景区客流统计系统提升服务精准度

在当今旅游业蓬勃发展的时代，景区面临着越来越多的挑战和机遇。如何在保障游客良好体验的同时，实现景区的高效管理和可持续发展，成为了摆在景区管理者面前的重要课题。景区客流统计系统的出现，为解决这一问题提供了有力的支持&…

阅读更多...

如何通过成熟的外发平台，实现文档安全外发管理？

如何通过成熟的外发平台，实现文档安全外发管理？

文档安全外发管理是企业信息安全管理的重要组成部分，它涉及到企业向外发送的文件，需要进行严格的控制和管理，防止敏感或机密信息的泄露。以下是一些关键考虑因素： 文件外发的挑战：企业在文件外发时面临的主要挑战包括…

阅读更多...

Python数据分析-植物生长数据分析（机器学习模型和神经网络模型）

Python数据分析-植物生长数据分析（机器学习模型和神经网络模型）

一、研究背景植物生长受多种环境因素的影响，包括土壤类型、日照时间、浇水频率、肥料类型、温度和湿度等。这些因素不仅影响植物的生长速度和健康状况，还对植物在不同生长阶段的表现有显著影响。随着气候变化和环境污染问题的加剧，研究如何…

阅读更多...

推荐文章

最新文章