【Apache Doris】周FAQ集锦:第 2 期

news2025/1/17 3:10:38

【Apache Doris】周FAQ集锦:第 2 期

  • SQL问题
  • 数据操作问题
  • 运维常见问题
  • 其它问题
  • 关于社区

在这里插入图片描述

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!
在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。
通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。

SQL问题

❓Q1 查询报错:timeout when waiting for send fragments RPC

💡A1 fragments rpc通信超时导致,处理步骤:

  1. 检查网络是否正常
  2. 可升级至2.x.x新版本(2.0之前出现的较多,2.0比较少出现该异常)
  3. 可参考如下相关参数调整后再观察:
be.conf:
fragment_pool_thread_num_max = 2048 

fragment_pool_queue_size = 4096 

brpc_num_threads = 256 

fe.conf
remote_fragment_exec_timeout_ms = 30000 

具体可以查阅Doris论坛帖子:
https://ask.selectdb.com/questions/D1F4/she-qu-wen-ti-timeout-when-waiting-for-send-fragments-rpc-yi-chang/E1G4

❓Q2 为什么with select语法兼容,但insert into with select不支持?

💡A2 两种方式参考:

  1. insert into tabl with lable xxx
  2. insert into table (xxx)

具体demo可以查阅官方文档对应章节:
https://doris.apache.org/zh-CN/docs/data-operate/import/import-way/insert-into-manual/

数据操作问题

❓Q1 导入报错:get tableList write lock timeout

💡A1 如下:

  1. 通常是因为FE JVM内存设置太小,或者FE/BE混布导致的
  2. 出现该异常时,单独打一个 jstack,联系社区同学具体分析:
    jstack -l pid > 1.js
    具体可以查阅Doris论坛帖子:
    https://ask.selectdb.com/questions/D1O5/doris-2-0-4-get-tablelist-write-lock-timeout

❓Q2 stream load时报错:[PUBLISH TIMEOUT]transaction commit successfully, BUT
data will be visible later

💡A2 导入实际时成功的,只是延迟可见。在Apache Doris 2.0.4已优化,建议升级至>=2.0.4的版本。
Release 2.0.4,可以查阅:
https://doris.apache.org/zh-CN/docs/releasenotes/release-2.0.4

❓Q3 表中有个insertTime字段是默认生成时间的,streamload导入csv数据(不包含insertTime)时报错:actual column number in csv file is less than schema column number

💡A3 如果指定 columns ,需要包含所有表字段,例如
-H “columns: a,b,c,d,insertTime=current_timestamp()”

运维常见问题

❓Q1 BE无法正常启动:

W0304 16:03:13.052549 14927 olap_meta.cpp:80] rocks db open failed, reason:IO error: While lock file: /data/doris/be/storage/meta/LOCK: Resource temporarily unavailable 

W0304 16:03:13.053174 14927 data_dir.cpp:203] init OlapMeta failed, error: [IO_ERROR]open rocksdb failed, path=/data/doris/be/storage

💡A1 如下:

  1. be节点的磁盘损坏,需要检查目录磁盘是否健康
  2. 确认是否有自动拉起进程,可能是连续启动be导致:
    a. 若有自动拉起进程,则先stop
    b. 将be/storage/meta的LOCK文件移走
    c. 重启be即可

❓Q2 是否可以跨2个机房搭建Doris集群?

💡A2 如下:

  1. 不建议跨机房部署;跨机房之间的延迟一般是毫秒级,正常同机房时延级别在0.1ms以内,容易频繁出现brpc timeout异常
  2. 如果是主备场景,可以使用CCR:Apache Doris 2.0 推出跨集群数据复制功能

❓Q3 FE集群异常,fe.log :Clock delta: xxxx ms. between Feeder: xxxx and this Replica exceeds max permissible delta: xxxx ms

💡A3 非主 FE 到主 FE 主机之间的最大可接受时钟偏差超过默认值5秒导致,需要开启 ntp 确保时间同步,小于默认的5秒时差。由fe的max_bdbje_clock_delta_ms参数控制。
FE配置项:
https://doris.apache.org/zh-CN/docs/admin-manual/config/fe-config

❓Q4 Doris出现事务回滚失败后,回滚失败的数据会怎么处理?

💡A4 内部会有 GC 的逻辑,去定期删除清理。

其它问题

❓Q 基于Doris做数据分层和实时计算,有哪些方案?

💡A 关于Doris做数据分层和实时计算的方案可参考:

  1. 借助外部调度工具,比如DolphinScheduler,按分钟级微批调度分层
  2. 物化视图,实时地同步聚合(预聚合);2.1版本会发布多表物化视图,相当于大部分场景可以不借助外部调度工具,在Doris内部即可实现异步定时分层了
  3. Flink APP中进行分层将数据sink至doris,例如ods -> kafka -> flink -> dw -> kafka -> flink -> doris
  4. 后续规划doris binlog,即可实现ods -> doris <-> flink,当前还未出具体计划、可以持续关注中

在doris binlog未发之前,大部分用户选择的是前两种方式,因为绝大多数用户场景是允许3-5分钟左右的数据可见延迟。

关于社区

在这里插入图片描述

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。
如果您对 Apache Doris 感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:

💡官方文档

💡社区论坛

💡GitHub

💡dev邮件组:dev@doris.apache.org

非常欢迎您在社区论坛中与其他用户分享您的使用经验和技巧,或者向dev邮件组提交反馈和意见。

相信,您的参与将帮助Apache Doris变得更加完善。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1569327.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Azure的VFP和虚拟IP地址

Azure 的Virtual filtering platform (VFP) 是Azure 网络地址转换,端口转换和端口分配的基础。 下面我们来深入介绍一下VFP的工作方式。 VFP的出站动作。 对于客户端地址作为虚拟IP的出站目的地址的时候,VFP 驱动会负责做以下两个动作。 源地址转换。端口地址转换。VFP 和 S…

flink1.18源码编译后standalone模式-master启动

1、编译成功后 2、准备运行环境 • 在项⽬根⽬录下&#xff0c;创建如下两个⽂件夹&#xff1a; • 找到如下⼦模块&#xff0c;并展开如图 • 将上图中conf下的⽂件&#xff0c;拷⻉到项⽬根⽬录下创建的conf下 • 将上图中的lib下的jar包&#xff0c;拷⻉到项⽬根⽬录下…

论文阅读:Walk These Ways: 通过行为多样性调整机器人控制以实现泛化

Walk These Ways: 通过行为多样性调整机器人控制以实现泛化 摘要&#xff1a; 通过学习得到的运动策略可以迅速适应与训练期间经历的类似环境&#xff0c;但在面对分布外测试环境失败时缺乏快速调整的机制。这就需要一个缓慢且迭代的奖励和环境重新设计周期来在新任务上达成良…

Cortex-M7 中断优先级

1 前言 除了Reset&#xff08;优先级-3&#xff09;,NMI&#xff08;优先级-2&#xff09; 和 HardFault&#xff08;优先级-1&#xff09;三个异常的有限制为固定值外&#xff0c;对于其他优先级可配置的异常&#xff0c;Cortex-M7最大支持0~255共计256个优先级。具体支持的优…

Mac电脑清理垃圾软件 Mac电脑清理垃圾的文件在哪 cleanMyMac X 4.8.0激活号码

Mac用户经常会有这样一些烦恼&#xff0c;比如软件之间的管理&#xff0c;应用生成的缓冲文件怎样删除&#xff0c;还有软件的卸载等等... 如何有效清理Mac中的垃圾文件&#xff0c;删除多余的软件成为Mac用户迫切的需求。本文就为大家介绍几款好用的Mac电脑清理垃圾软件&#…

Linux学习:进程(4)程序地址空间(笔记)

目录 1. Linux下各种资源的内存分布2. 物理地址与虚拟(线性)地址3. 程序地址空间的区域划分4. 地址映射与页表5. 缺页中断 1. Linux下各种资源的内存分布 2. 物理地址与虚拟(线性)地址 在有关进程创建的初步学习中&#xff0c;我们了解了fork函数创建子进程的方式。此种进程的创…

Acwing-石子合并

282. 石子合并 - AcWing题库 所需知识&#xff1a;区间dp 区间dp模板题。 区间dp常用模板&#xff1a; for (int len 1; len < n; len) { // 遍历区间的长度for (int i 1; i len - 1 < n; i) { // 枚举区间起点int j i len - 1; // 区间…

黑马java-JavaWeb-Maven

1.Maven是专门用于管理和构建java项目的工具&#xff0c;它的主要功能有&#xff1a; 提供了一套标准化的项目结构提供了一套标准化的构建流程提供了一套依赖管理机制&#xff08;管理项目所依赖的第三方资源&#xff09; 2.Maven仓库 本地仓库&#xff1a;自己计算机上的一个目…

Lvgl9 WindowsSimulator Visual Studio2017

因为在操作过程中遇到了一些错误&#xff0c;所以将操作及解决问题的过程记录下来。 一、下载lv_port_pc_visual_studio github链接:GitHub - lvgl/lv_port_pc_visual_studio: Visual Studio projects for LVGL embedded graphics library. Recommended on Windows. Linux su…

代码随想录阅读笔记-二叉树【验证二叉搜索树】

题目 给定一个二叉树&#xff0c;判断其是否是一个有效的二叉搜索树。 假设一个二叉搜索树具有如下特征&#xff1a; 节点的左子树只包含小于当前节点的数。节点的右子树只包含大于当前节点的数。所有左子树和右子树自身必须也是二叉搜索树。 思路 要知道中序遍历下&#x…

金融中的数学知识

随机偏微分方程相比普通偏微分方程具有额外的随机项&#xff0c;反映了其描述的现象具有随机性质

认识 Redis 与 分布式

Redis 官网页面 Redis官网链接 Redis 的简介 Redis 是一个在内存中存储数据的中间件 一方面用于作为数据库&#xff0c;另一方面用于作为数据缓存&#xff0c;适用于分布式系统中 Redis 基于网络&#xff0c;进行进程间通信&#xff0c;把自己内存中的变量给别的进程&#xf…

Redis中的复制功能(五)

心跳检测 概述 在命令传播阶段&#xff0c;从服务器默认会以每秒一次的频率&#xff0c;向主服务器发送命令: REPLCONF ACK < replication_offset >其中replication_offset是从服务器当前的复制偏移量。 发送REPLCONF ACK命令对于主从服务器有三个作用: 1.检测主从服…

prompt 工程案例

目录 prompt 工程是什么&#xff1f; 案例 vllm 推理加速框架 prompt 工程是什么&#xff1f; prompt&#xff1a;提示词&#xff0c;也就是我们使用网页版输入给大模型的内容就叫 prompt&#xff0c;那什么是 prompt 工程呢&#xff1f; 简单理解其实就是利用编写的 prom…

Spark-Scala语言实战(12)

在之前的文章中&#xff0c;我们学习了如何在spark中使用键值对中的join,rightOuterJoin,leftOuterJoin三种方法。想了解的朋友可以查看这篇文章。同时&#xff0c;希望我的文章能帮助到你&#xff0c;如果觉得我的文章写的不错&#xff0c;请留下你宝贵的点赞&#xff0c;谢谢…

数据结构课堂考勤管理系统

摘要 高校的不断扩张让在校学生数量不断的增加&#xff0c;对于教师和管理人员的需求也在不断地增强&#xff0c;对日常的学生考勤管理的工作量也在日益增加&#xff0c;传统的人工点名签到的考勤管理模式已经给无法适用于当前高校考勤管理的需求&#xff0c;同时手动录入的考…

Spring重点知识(个人整理笔记)

目录 1. 为什么要使用 spring&#xff1f; 2. 解释一下什么是 Aop&#xff1f; 3. AOP有哪些实现方式&#xff1f; 4. Spring AOP的实现原理 5. JDK动态代理和CGLIB动态代理的区别&#xff1f; 6. 解释一下什么是 ioc&#xff1f; 7. spring 有哪些主要模块&#xff1f;…

使用c语言libexpat开源库解析XML数据

1 libexpat简介 Expat 是一个用 C 语言编写的开源 XML 解析库&#xff0c;以其高性能和小巧的体积著称。Expat 兼容多种操作系统平台&#xff0c;包括但不限于 Windows、Linux、macOS 等。由于其跨平台特性和简单易用的API&#xff0c;Expat 成为了许多C/C程序员解析XML文档的…

【项目实战】【Docker】【Git】【Linux】部署V2rayA项目

今天着手了一个全新领域的项目&#xff0c;从完全没有头绪到成功运行&#xff0c;记录一下具体的部署流程 github项目链接V2rayA 一开始拿到以后完全没有抓手&#xff0c;去阅读了一下他的帮助文档 写着能用docker运行&#xff0c;就去下载了一个Docker配置了一下 拉取代码到…

LeetCode-543. 二叉树的直径【树 深度优先搜索 二叉树】

LeetCode-543. 二叉树的直径【树 深度优先搜索 二叉树】 题目描述&#xff1a;解题思路一&#xff1a;DFS解题思路二&#xff1a;另一种写法DFS解题思路三&#xff1a;0 题目描述&#xff1a; 给你一棵二叉树的根节点&#xff0c;返回该树的 直径 。 二叉树的 直径 是指树中任…