1.简单介绍
来自百度百科:
Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的开源框架。提供了数据分析、数据可视化等功能。是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等。
Zeppelin 官网 的介绍:
简单翻译:
- 数据摄取
- 数据发现
- 数据分析
- 数据可视化与协作
支持较多的解释器:
2.下载安装配置启动
官网的 QuitStart文档,环境要求:
JDK1.8永远嘀神!!!当前的安装环境:
# 系统
[root@tcloud ~]# cat /etc/centos-release
CentOS Linux release 7.9.2009 (Core)
# JDK
[root@tcloud ~]# java -version
java version "1.8.0_241"
Java(TM) SE Runtime Environment (build 1.8.0_241-b07)
Java HotSpot(TM) 64-Bit Server VM (build 25.241-b07, mixed mode)
2.1 下载
官网的速度大家懂的,华为的镜像站 速度还是可以的,最新版本为zeppelin-0.10.1
,这里下载安装包含所有解释器的版本。官网对两个包的描述:
Two binary packages are available on the download page. Only difference between these two binaries is whether all the interpreters are included in the package file.
- all interpreter package: unpack it in a directory of your choice and you’re ready to go.
- net-install interpreter package: only spark, python, markdown and shell interpreter included. Unpack and follow install additional interpreters to install other interpreters. If you’re unsure, just run ./bin/install-interpreter.sh --all and install all interpreters.
2.2 安装
# 解压即可
tar -zxvf zeppelin-0.10.1-bin-all.tgz
包含以下解释器:
2.3 配置
Zeppelin默认监听127.0.0.1:8080
,想要远程使用需要修改配置文件conf/zeppelin-site.xml
:
# 1.复制配置文件
cp conf/zeppelin-site.xml.template conf/zeppelin-site.xml
# 2.修改配置文件
vim conf/zeppelin-site.xml
# 3.修改zeppelin.server.addr
更多配置这里不做介绍。
2.4 启动
# 启动命令
bin/zeppelin-daemon.sh start
# 停止命令
bin/zeppelin-daemon.sh stop
[root@tcloud zeppelin-0.10.1-bin-all]# bin/zeppelin-daemon.sh start
Please specify HADOOP_CONF_DIR if USE_HADOOP is true
Log dir doesn't exist, create /opt/zeppelin/zeppelin-0.10.1-bin-all/logs
Pid dir doesn't exist, create /opt/zeppelin/zeppelin-0.10.1-bin-all/run
Zeppelin start [ OK ]
# 验证
[root@tcloud zeppelin-0.10.1-bin-all]# jps -l
20738 sun.tools.jps.Jps
20564 org.apache.zeppelin.server.ZeppelinServer
如果无法启动可查看日志文件ZEPPELIN_HOME/logs/zeppelin-server-*.log
。启动成功后可以通过http://tcloud:8080/#/
访问Web端。
3.总结
高端的工具只需要简单的部署!Zeppelin的使用小伙伴儿们需要慢慢学习!