[flink] flink macm1pro 快速使用从零到一

news2025/3/12 23:33:02

文章目录

快速使用

快速使用

打开 https://flink.apache.org/downloads/ 下载 flink

因为书籍介绍的是 1.12版本的，为避免不必要的问题，下载相同版本

解压

 tar -xzvf flink-1.11.2-bin-scala_2.11.tgz

启动 flink

./bin/start-cluster.sh

打开 flink web 页面 localhost:8081

编写结合 Kafka 词频统计程序

具体参考 https://weread.qq.com/web/reader/51032ac07236f8e05107816k1f032c402131f0e3dad99f3?

package org.example;

import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.api.common.typeinfo.Types;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import org.apache.flink.util.Collector;

import java.util.Properties;

public class WordCountKafkaInStdOut {

    public static void main(String[] args) throws Exception {

        // 设置Flink执行环境 
        StreamExecutionEnvironment env =
            StreamExecutionEnvironment.getExecutionEnvironment();

        // Kafka参数 
        Properties properties = new Properties();
        properties.setProperty("bootstrap.servers", "localhost:9092");
        properties.setProperty("group.id", "flink-group");
        String inputTopic = "Shakespeare";
        String outputTopic = "WordCount";

        // Source 
        FlinkKafkaConsumer<String> consumer =
            new FlinkKafkaConsumer<String>(inputTopic, new SimpleStringSchema(),
                properties);
        DataStream<String> stream = env.addSource(consumer);

        // Transformation 
        // 使用Flink  API对输入流的文本进行操作 
        // 按空格切词、计数、分区、设置时间窗口、聚合 
        DataStream<Tuple2<String, Integer>> wordCount = stream
            .flatMap((String line, Collector<Tuple2<String, Integer>> collector) -> {
                String[] tokens = line.split("\\s");
                // 输出结果  
                for (String token : tokens) {
                    if (token.length() > 0) {
                        collector.collect(new Tuple2<>(token, 1));
                    }
                }
            })
            .returns(Types.TUPLE(Types.STRING, Types.INT))
            .keyBy(0)
            .timeWindow(Time.seconds(5))
            .sum(1);

        // Sink 
        wordCount.print();

        // execute 
        env.execute("kafka streaming word count");

    }
}

打包应用(当然在这之前需要本地调试一下，至少得运行通吧😄)
使用Flink提供的命令行工具flink，将打包好的作业提交到集群上。命令行的参数 --class 用来指定哪个主类作为入口。

./bin/flink run --class org.example.WordCountKafkaInStdOut xxtarget/flink_study-1.0-SNAPSHOT.jar

class 建议直接拷贝引用

web 页面查看作业提交成功

kafka 生产者随便发点消息

查看作业日志,词频统计结果

关闭 flink

./bin/stop-cluster.sh

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1552488.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

[flink] flink macm1pro 快速使用从零到一

文章目录

快速使用

相关文章

【JavaSE】String类详解

大模型智能体智能玩具智能音箱构建教程 wukong-robot

计算机网络——29ISP之间的路由选择：BGP

JavaEE初阶Day 4：多线程（2）

学习笔记——微信小程序读取当前时间

公链角逐中突围，Solana 何以成为 Web3 世界的流量焦点？

nacos的各种类型的配置文件 yml 、json、 Properties、 text 等文件类型发生变化怎么热更新，实现实时监听nacos配置文件变化

Postman传对象失败解决

图腾柱PFC：HP1010为您的电动两轮车之旅提供绿色，高效，安全的动力

HackTheBox-Machines--Legacy

Unity 窗口化设置

Unity2018发布安卓报错 Exception: Gradle install not valid

通用指南-营销和设计中的增强现实（AR）

网络工程师实验命令（华为数通HCIA）

Intellij IDEA安装配置Spark与运行

持续集成流程主要系统构成介绍（CI）

uniApp使用XR-Frame创建3D场景(5)材质贴图的运用

向量法求点在直线上的投影

基于单片机的二维码LCD显示控制设计

AI新工具又一个开源大模型DBRX击败GPT3.5；根据音频和图像输入生成会说话、唱歌的动态视频