Spark编程基础

news2024/11/28 2:28:32

一、RDD入门

1.RDD是什么?

RDD是一个容错的、只读的、可进行并行操作的数据结构,是一个分布在集群各个节点中的存放元素的集合,即弹性分布式数据集。

2.RDD的三种创建方式

  • 第一种是将程序中已存在的集合(如集合、列表、数组)转换成RDD。
  • 第二种是读取外部数据集来创建RDD。
  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.1准备数据:将程序中已存在的集合(如集合、列表、数组)转换成RDD
    val rdd1 = sc.parallelize(List(1,2,3,4))
    val rdd2 = sc.makeRDD(List(1,2,3,4))
    //2.2准备数据:读取外部数据集来创建RDD
    val rdd3 = sc.textFile("dataset/words.txt")
    //3.查看数据
    rdd1.collect().foreach(println)
    println("-------------------------")
    rdd2.collect().foreach(println)
    println("-------------------------")
    rdd3.collect().foreach(println)
    }
  • 第三种是对已有RDD进行转换得到新的RDD(在RDD的操作方法中讲解)。

 二、单个RDD的转换操作

Spark RDD提供了丰富的操作方法(函数)用于操作分布式的数据集合,包括转换操作和行动操作两部分。

  • 转换操作:可以将一个RDD转换为一个新的RDD,但是转换操作是懒操作,不会立刻执行计算;
  • 行动操作:是用于触发转换操作的操作,这时才会真正开始进行计算。

1)map()方法

作用:把 RDD 中的数据 一对一 的转为另一种形式。

格式:def map[U: ClassTag](f: T ⇒ U): RDD[U]

Map 算子是 原RDD → 新RDD 的过程, 传入函数的参数是原 RDD 数据, 返回值是经过函数转换的新 RDD 的数据。

 def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(1,2,3,4))
    //3.RDD的转换操作map
    var rdd2 = rdd1.map(x => x * 10)
    //4.打印数据
    rdd2.collect().foreach(println)//10 20 30 40
    }

2)flatMap()方法

作用:flatMap 算子和 Map 算子类似, 但是 flatMap 是一对多。

格式:def flatMap[U: ClassTag](f: T ⇒ List[U]): RDD[U]

参数是原 RDD 数据, 返回值是经过函数转换的新 RDD 的数据, 需要注意的是返回值是一个集合, 集合中的数据会被展平后再放入新的 RDD。

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List("How are you","I am fine","What about you"))
    //3.RDD的转换操作flatMap
    var rdd2 = rdd1.flatMap(x => x.split(" "))
    //4.打印数据
    rdd2.collect().foreach(println) //How are you I am fine What about you
    }

3)sortBy()方法

作用:用于对标准RDD进行排序,有3个可输入参数。

格式:def sortBy(func, ascending, numPartitions)

参数:func指定按照哪个字段来排序,通过这个函数返回要排序的字段;scending 是否升序,默认是true,即升序排序,如果需要降序排序那么需要将参数的值设置为false。;numPartitions 分区数。

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List((1,3),(45,2),(7,6)))
    //3.RDD的转换操作sortBy,按照元组第二个值进行false降序
    val rdd2 = rdd1.sortBy(x =>x._2,false,1)
    //4.打印数据 
    rdd2.collect().foreach(println) //(7,6) (1,3) (45,2)
    }

4)mapPartitionsWithIndex()方法

作用:对RDD中的每个分区(带有下标)进行操作,通过自己定义的一个函数来处理。

格式:def mapPartitionsWithIndex[U](f: (Int, Iterator[T]) => Iterator[U])

参数:f 是函数参数,接收两个参数:
       (1)Int:代表分区号
       (2)Iterator[T]:分区中的元素
       (3)返回:Iterator[U]:操作完后,返回的结果

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据,并设置为2个分区
    val rdd1 = sc.parallelize(List(1,2,3,4,5),2)
    //3.RDD的转换操作mapPartionsWithIndex
    val rdd2 = rdd1.mapPartitionsWithIndex(
      (index,it)=>{
        it.toList.map(x=>"["+index+","+x+"]").iterator
      }
    )
    //4.打印数据:【分区编号,数据】
    rdd2.collect().foreach(println) //[0,1] [0,2] [1,3] [1,4] [1,5]
    }

5)filter()方法

作用:是一种转换操作,用于过滤RDD中的元素。

格式:def filter(f: T => Boolean): RDD[T]

将返回值为true的元素保留,将返回值为false的元素过滤掉,最后返回一个存储符合过滤条件的所有元素的新RDD。

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(1,2,3,4))
    //3.RDD的转换操作filter,过滤偶数
    val rdd2 = rdd1.filter(x => x%2==0)
    //4.打印数据
    rdd2.collect().foreach(println) //2 4
    }

6)distinct()方法

作用:是一种转换操作,用于RDD的数据去重,去除两个完全相同的元素,没有参数。

格式:def distinct(): RDD[T]

将数据集中重复的数据去重,返回一个没有重复元素的新RDD。

def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(1,1,2,3,3))
    //3.RDD的转换操作filter
    val rdd2 = rdd1.distinct()
    //4.打印数据
    rdd2.collect().foreach(println) //1 2 3
    }

三、多个RDD的集合操作

1)union()方法

作用:是一种并集转换操作,用于将两个RDD合并成一个,不进行去重操作,而且两个RDD中每个元素中的值的数据类型需要保持一致

格式:def union(other: RDD[T]): RDD[T]

对源 RDD 和参数 RDD 求并集后返回一个新的 RDD。

def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(1,2,3,4))
    val rdd2 = sc.parallelize(List(1,3,5,6))
    //3.RDD的转换操作union
    val rdd3 = rdd1.union(rdd2)
    //4.打印数据
    rdd3.collect().foreach(println) //1,2,3,4,1,3,5,6
    }

2)intersection()方法

作用:是一种交集转换操作,用于将求出两个RDD的共同元素。

格式:def intersection(other: RDD[T]): RDD[T]

对源 RDD 和参数 RDD 求交集后返回一个新的 RDD,两个RDD的顺序不会影响结果。

def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(1,2,3,4))
    val rdd2 = sc.parallelize(List(1,2))
    //3.RDD的转换操作intersection
    val rdd3 = rdd1.intersection(rdd2)
    //4.打印数据
    rdd3.collect().foreach(println) //1,2
    }

3)subtract()方法

作用:是一种补集转换操作,用于将前一个RDD中在后一个RDD出现的元素删除,返回值为前一个RDD去除与后一个RDD相同元素后的剩余值所组成的新的RDD。

格式:def subtract(other: RDD[T]): RDD[T]

将原RDD里和参数RDD里相同的元素去掉后返回一个新的 RDD,两个RDD的顺序会影响结果。

def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(1,2,3,4))
    val rdd2 = sc.parallelize(List(1,2,5))
    //3.RDD的转换操作subtract
    val rdd3 = rdd1.subtract(rdd2)
    val rdd4 = rdd2.subtract(rdd1)
    //4.打印数据
    rdd3.collect().foreach(println) //3,4
    println("----------------------")
    rdd4.collect().foreach(println) //5
    }

4)cartesian()方法

作用:是一种求笛卡儿积操作,用于将两个集合的元素两两组合成一组。

格式:def cartesian(other: RDD[T]): RDD[T]

将原RDD里的每个元素都和参数RDD里的每个组合成一组,返回一个新的RDD。两个RDD的顺序会影响结果。

 def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(1,3,4))
    val rdd2 = sc.parallelize(List(1,2))
    //3.RDD的转换操作cartesian
    val rdd3 = rdd1.cartesian(rdd2)
    val rdd4 = rdd2.cartesian(rdd1)
    //4.打印数据
    rdd3.collect().foreach(println) //(1,1)    (1,2)    (3,1)    (3,2)    (4,1)    (4,2)
    println("----------------------")
    rdd4.collect().foreach(println) //(1,1)    (1,3)    (1,4)    (2,1)    (2,3)    (2,4)
    }

四、单个键值对RDD的转换操作

Spark的大部分RDD操作都支持所有种类的单值RDD,但是有少部分特殊的操作只能作用于键值对类型的RDD。键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。PairRDD提供了并行操作各个键或跨节点重新进行数据分组的操作接口。

1)创建键值对RDD

1.将一个普通RDD通过map转化为Pair RDD。当需要将一个普通的RDD转化为一个PairRDD时可以使用map函数来进行操作,传递的函数需要返回键值对。

2.通过List直接创建Pair RDD。

3.使用zip()方法用于将两个RDD组成Pair RDD。要求两个及元素数量相同,否则会抛出异常。 

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List("I like spark","He likes spark"))
    //3.1 通过flatMap和map方法将一个普通的RDD转化为一个键值对RDD
    val rdd2 = rdd1.flatMap(x => x.split(" "))
    val rdd3 = rdd2.map(x => (x,1))
    //3.2 通过List直接创建Pair RDD
    val rdd4 = sc.parallelize(List(("张三",100),("李四",90),("王五",80)))
    //3.3 使用zip()方法用于将两个RDD组成Pair RDD
    val dataRdd1 = sc.parallelize(List(1,2,3),2)
    val dataRdd2 = sc.parallelize(List("A","B","C"),2)
    val dataRdd3 = dataRdd1.zip(dataRdd2)
    //4.打印数据
    rdd2.collect().foreach(println) //(I,like,spark,He,likes,spark)
    println("---------------------")
    rdd3.collect().foreach(println) //(I,1) (like,1) (spark,1) (He,1) (likes,1) (spark,1)
    println("---------------------")
    rdd4.collect().foreach(println) //(张三,100) (李四,90)  (王五,80)
    println("---------------------")
    dataRdd3.collect().foreach(println) //(1,A) (2,B) (3,C)
    }

2)键值对RDD的keys和values方法

键值对RDD,包含键和值两个部分。 Spark提供了两种方法,分别获取键值对RDD的键和值。

  • keys方法返回一个仅包含键的RDD。
  • values方法返回一个仅包含值的RDD。
  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(("张三",100),("李四",90),("王五",80)))
    //3.1 获取keys
    val rdd2 = rdd1.keys
    //3.2 获取values
    val rdd3 = rdd1.values
    //3.打印数据
    rdd2.collect().foreach(println) //张三 李四 王五
    println("---------------------")
    rdd3.collect().foreach(println) //100 90  80
  }

3)键值对RDD的reduceByKey()

作用:将相同键的前两个值传给输入函数,产生一个新的返回值,新产生的返回值与RDD中相同键的下一个值组成两个元素,再传给输入函数,直到最后每个键只有一个对应的值为止。

格式:def reduceByKey(func: (V, V) => V): RDD[(K, V)]

可以将数据按照相同的 Key 对 Value 进行聚合。

def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List("I like spark","He likes spark"))
    //3.1 通过flatMap和map方法将一个普通的RDD转化为一个键值对RDD
    val rdd2 = rdd1.flatMap(x => x.split(" "))
    val rdd3 = rdd2.map(x => (x,1)) // (I,1) (like,1) (spark,1) (He,1) (likes,1) (spark,1)
    //3.2 使用reduceByKey将相同键的值进行相加,统计词频
    val rdd4 = rdd3.reduceByKey((a,b) => a+b)
    //4.打印数据
    rdd4.collect().foreach(println) //(I,1) (He,1) (spark,2) (like,1) (likes,1)
  }

3)键值对RDD的groupByKey()

作用:按照 Key 分组, 和 reduceByKey 有点类似, 但是 groupByKey 并不求聚合,只是列举 Key 对应的所有 Value。

格式:def groupByKey(): RDD[(K, Iterable[V])]

对于一个由类型K的键和类型V的值组成的RDD,通过groupByKey()方法得到的RDD类型是[K,Iterable[V]],可以将数据源的数据根据 key 对 value 进行分组。

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(("a",1),("a",2),("b",1),("c",1),("c",1)))
    //3.使用groupByKey进行分组
    val rdd2 = rdd1.groupByKey()
    //4.使用map方法查看分组后每个分组中的值的数量
    val rdd3 = rdd2.map(x => (x._1,x._2.size))
    //5.打印数据
    rdd2.collect().foreach(println) //(a,CompactBuffer(1, 2)) (b,CompactBuffer(1)) (c,CompactBuffer(1, 1))
    rdd3.collect().foreach(println) //(a,2) (b,1) (c,2)
  }

五、多个键值对RDD的转换操作

在Spark中,键值对RDD提供了很多基于多个RDD的键进行操作的方法。

1)join()方法

作用:用于根据键,对两个RDD进行内连接,将两个RDD中键相同的数据的值存放在一个元组中,最后只返回两个RDD中都存在的键的连接结果。

格式:def join[W](other: RDD[(K, W)]): RDD[(K, (V, W))]

在类型为(K,V)和(K,W)的 RDD 上调用,返回一个相同 key 对应的所有元素连接在一起的。

def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(("a",1),("b",2),("c",3)))
    val rdd2 = sc.parallelize(List(("a",2),("b",4),("e",5)))
    //3.使用join进行内连接
    val rdd3 = rdd1.join(rdd2)
   //4.打印数据
    rdd3.collect().foreach(println) //(a,(1,2)) (b,(2,4))
  }

2)rightOuterJoin()方法

作用:用于根据键,对两个RDD进行右外连接,连接结果是右边RDD的所有键的连接结果,不管这些键在左边RDD中是否存在。

格式:def rightOuterJoin[W](other: RDD[(K, W)]): RDD[(K, (V, Option[W]))]

类似于 SQL 语句的右外连接。如果在左边RDD中有对应的键,那么连接结果中值显示为Some类型值;如果没有,那么显示为None值。

3)leftOuterJoin()方法

作用:用于根据键,对两个RDD进行左外连接,连接结果是左边RDD的所有键的连接结果,不管这些键在右边RDD中是否存在。

格式:def leftOuterJoin[W](other: RDD[(K, W)]): RDD[(K, (V, Option[W]))]

类似于 SQL 语句的右外连接。如果在右边RDD中有对应的键,那么连接结果中值显示为Some类型值;如果没有,那么显示为None值。

4)fullOuterJoin()方法

作用:用于对两个RDD进行全外连接,保留两个RDD中所有键的连接结果。

格式:def fullOuterJoin[W](other: RDD[(K, W)]): RDD[(K, (V, Option[W]))]

类似于 SQL 语句的全外连接。

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(("a",1),("b",2),("c",3)))
    val rdd2 = sc.parallelize(List(("a",2),("b",4),("e",5)))
    //3.使用rightOuterJoin进行右外连接
    val rdd3 = rdd1.rightOuterJoin(rdd2)
    //4.使用leftOuterJoin进行左外连接
    val rdd4 = rdd1.leftOuterJoin(rdd2)
    //5.使用fullOuterJoin进行全外连接
    val rdd5 = rdd1.fullOuterJoin(rdd2)
    //6.打印数据
    rdd3.collect().foreach(println) //(a,(Some(1),2)) (b,(Some(2),4)) (e,(None,5))
    println("--------------------")
    rdd4.collect().foreach(println) //(a,(1,Some(2))) (b,(2,Some(4))) (c,(3,None))
    println("--------------------")
    rdd5.collect().foreach(println) //(a,(Some(1),Some(2))) (b,(Some(2),Some(4))) (c,(Some(3),None)) (e,(None,Some(5)))
  }

5)sortByKey()方法

作用:作用于Key-Value形式的RDD,并对Key进行排序。

格式:def sortByKey(ascending: Boolean = true, numPartitions: Int = self.partitions.length)
 : RDD[(K, V)]

参数:scending 是否升序,默认是true,即升序排序,如果需要降序排序那么需要将参数的值设置为false。numPartitions 为分区数。

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List((1,3),(45,2),(7,6)))
    //3.RDD的转换操作sortByKey
    val rdd2 = rdd1.sortByKey(true) //按key进行升序
    val rdd3 = rdd1.sortByKey(false) //按key进行降序
    //4.打印数据
    rdd2.collect().foreach(println)
    println("---------------------")
    rdd3.collect().foreach(println)
    }

6)lookup()方法

作用:作用于键值对RDD,返回指定键的所有值。

格式:def lookup(key : K) : scala.Seq[V]

作用于K-V类型的RDD上,返回指定K的所有V值

  def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //2.准备数据
    val rdd1 = sc.parallelize(List(("张三",100),("李四",90),("王五",80)))
    //3.使用lookup()方法查找指定键的值
    val result = rdd1.lookup("李四")
    //4.打印数据
    println(result) //WrappedArray(90)
  }

7)combineByKey()方法

作用:用于将键相同的数据聚合,并且允许返回,类型与输入数据的类型不同的返回值。

格式:def combineByKey[C](
                 createCombiner: V => C,
                 mergeValue: (C, V) => C,
                 mergeCombiners: (C, C) => C): RDD[(K, C)]

combineByKey()方法接收3个重要的参数,具体说明如下:

  • createCombiner:V=>C,V是键值对RDD中的值部分,将该值转换为另一种类型的值C,C会作为每一个键的累加器的初始值。
  • mergeValue:(C,V)=>C,该函数将元素V聚合到之前的元素C(createCombiner)上(这个操作在每个分区内进行)。
  • mergeCombiners:(C,C)=>C,该函数将两个元素C进行合并(这个操作在不同分区间进行)。

小练习:将数据 List(("zhangsan", 99.0), ("zhangsan", 96.0), ("lisi", 97.0), ("lisi", 98.0), ("zhangsan", 97.0)),求每个 key的平均值。

 def main(args: Array[String]): Unit = {
    //1.入口:创建SparkContext
    val conf = new SparkConf().setMaster("local[*]").setAppName("spark")
    val sc = new SparkContext(conf)
    //需求:将数据 List(("zhangsan", 99.0), ("zhangsan", 96.0), ("lisi", 97.0), ("lisi", 98.0), ("zhangsan", 97.0)),求每个 key的平均值
    //2.准备数据
    val rdd1 = sc.parallelize(List(("zhangsan", 99.0), ("zhangsan", 96.0), ("lisi", 97.0), ("lisi", 98.0), ("zhangsan", 97.0)))
    //3.1 通过combineByKey方法将RDD安装key进行聚合,返回值形式:(key,(值总和,key个数))
    val rdd2 = rdd1.combineByKey(
      score => (score,1),
      (scoreCount:(Double,Int),newScore:Double) => (scoreCount._1+newScore,scoreCount._2+1),
      (scoreCount1:(Double,Int),scoreCount2:(Double,Int)) => (scoreCount1._1+scoreCount2._1,scoreCount1._2+scoreCount2._2)
    )
    //打印combineByKey聚合之后的数据,形式:(key,(值总和,key个数))
    rdd2.collect().foreach(println) //(zhangsan,(292.0,3)) (lisi,(195.0,2))
    //3.2 将按值聚合相加后的结果(zhangsan,(292.0,3)) (lisi,(195.0,2)),求每个人的平均值,返回值形式:(key,平均值)
    val result = rdd2.map(item =>(item._1,item._2._1/item._2._2))
    //4 打印数据
    println("------------------")
    result.collect().foreach(println)
  }

combineByKey()方法执行过程的图解:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1581982.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

若依二次开发总结

基于若依进行二次开发总结 后端启动 1.idea中打开项目 maven加载依赖 2.配置数据库,运行sql文件 3.配置yml文件 4.用命令redis-server启动redis 5.运行启动类,启动后端 前端启动 1.在vscode中打开文件夹ruoyi-ui 2.安装依赖 npm install3.启动前端 …

通往 AGI 的道路上,OpenAI 逐渐构建了全模态的工具集

几天前,OpenAI 公司官宣将发布一个名为“Voice Engine”的小规模模型,引起巨大的声浪。 该模型支持仅使用文本输入和单个 15 秒音频样本来生成与原始说话者非常相似的自然语音。可应用于“语音转录”、“语音克隆”、“语音翻译”等场景。 笔者感叹 AI …

linux查看硬盘空间使用情况

df (1)查看磁盘空间的占用情况 -h是给大小带上单位 df -h 总空间不一定等于已用未用,系统可能留出来一点空间另做他用 (2)查看INode的使用情况 df -idu du命令比df命令复杂一点,是查看文件和目录占用的…

VUE3的有关知识

学习vue3的原因 在vue2当中的组件的实例,都是data一块,computed一块,当我们去找某一变量相关的则十分麻烦,vue3是组合式API,vue2是选项式, vue3的优点: 1)组合式更易维护 2)更快的速度 3)更小的体积 4)更好的响应式proxy 使用vue3相关脚手架创建项目 步骤: 1)node -v node版…

文献学习-32-新生儿皮质表面重建的条件时间注意网络

Conditional Temporal Attention Networks for Neonatal Cortical Surface Reconstruction Authors: Qiang Ma, Liu Li, Vanessa Kyriakopoulou, Joseph V. Hajnal, Emma C. Robinson, Bernhard Kainz, and Daniel Rueckert Source: MICCAI 2023 Abstract 皮层表面重建在模拟…

深度学习的模型有几类,能干嘛用?

1、基础模型 (1)卷积神经网络 **卷积:**卷积的本质是通过矩阵运算9的方式将输入数据进行空间上的滤波,有效地提取数据中的局 部特征,从而实现特征数据更高程度的抽象表示。 **池化:**可以理解成“压缩”…

RabbitMQ的自动应答和手动应答,解决重试死循环

RabbitMQ的自动应答和手动应答,解决重试死循环 1.应答模式 RabbitMQ 中的消息应答模式主要包括两种:自动应答(Automatic Acknowledgement)和手动应答(Manual Acknowledgement)。 1、自动应答:…

20240309web前端_第三周作业_教务系统页面

作业&#xff1a;教务系统页面 成果展示&#xff1a; 完整代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1…

机器学习 —— 使用机器学习进行情感分析 详细介绍版

机器学习 —— 使用机器学习进行情感分析 详细介绍版 机器学习 —— 使用机器学习进行情感分析 演示版 目录 一、 绪论二、 数据处理1. 构建CSV文档2. 构建模型前的思考2.1. 问题2.2. 解决方法 3. 读取数据4. 用正则表达式来进行对特定符号的剔除5. 使用口袋模型进行文本处理和…

科研学习|研究方法——定性数据的定量编码方法

一、关于数据的分类 数据可以根据不同的属性和特征进行分类。以下是数据常见的分类方式&#xff1a; 1. 数值型数据&#xff1a;表示为具体的数值&#xff0c;可以进行数学运算和统计分析。例如年龄、身高、体重等。2. 分类型数据&#xff1a;表示为不同的类别或标签&#xff0…

XUbuntu22.04之Typora添加水印并输出pdf文件(二百二十七)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒体系统工程师系列【原创干货持续更新中……】🚀 优质视频课程:AAOS车载系统+AOSP…

el-drawer二次封装进行可拖拽

1.想要的效果 鼠标放到上面出现箭头显示可拖拽得图标 2.代码实现 2.1封装成自定义指令 // drawerDragDirective.js // 定义指令 const drawerDragDirective {// 指令绑定时的处理函数bind(el, ) {const minWidth 300;const dragDom el.querySelector(.el-drawer);// 创…

leetcode106题

思路 根据中序遍历和后序遍历的特性可知&#xff0c;后序遍历的最后一个元素为根元素。然后找到中序遍历中对应的序号。将中序遍历的划分为两部分&#xff0c;左边为左子树&#xff0c;右边为右子树。 方法 由思路可知&#xff0c;可以使用递归。递归函数的入口为划分的区间…

mysql双机热备

MySQL双机热备&#xff1a;保障数据库高可用性的关键技术 在当今信息化社会中&#xff0c;数据库作为企业信息系统的核心组成部分&#xff0c;其高可用性和数据安全性至关重要。MySQL作为广泛应用的开源关系型数据库管理系统&#xff0c;其双机热备技术成为保障数据库稳定运行…

性能测试工具JMeter

简介&#xff1a; 1.概述 一款工具&#xff0c;功能往往是很多的&#xff0c;细枝末节的地方也很多&#xff0c;实际的测试工作中&#xff0c;绝大多数场景会用到的也就是一些核心功能&#xff0c;根本不需要我们事无巨细的去掌握工具的所有功能。所以本文将用带价最小的方式讲…

代码随想录阅读笔记-回溯【组合总和III】

题目 找出所有相加之和为 n 的 k 个数的组合。组合中只允许含有 1 - 9 的正整数&#xff0c;并且每种组合中不存在重复的数字。 示例 1: 输入: k 3, n 7 输出: [[1,2,4]] 示例 2: 输入: k 3, n 9 输出: [[1,2,6], [1,3,5], [2,3,4]] 说明&#xff1a; 所有数字都是正整数。…

部署Kafka集群图文详细步骤

1 集群规划 共三台虚拟机同处overlay网段&#xff0c;每台虚拟机部署一套kafka和zookeeper&#xff0c;kafka_manager安装其中一台虚拟机上即可。 HostnameIP addrPortListenerzk1docker-swarm分配2183:2181zk2docker-swarm分配2184:2181zk3docker-swarm分配2185:2181k1docke…

使用C语言函数对数组进行操作

前言 在我们了解数组和函数之后&#xff0c;我们对数组和函数进行结合&#xff0c;之后完成一些操作吧 题目描述 杰克想将函数与数组结合进行一些操作&#xff0c;以下是他想要达到的效果&#xff0c;请你帮帮他吧&#xff01; 创建一个整型数组&#xff0c;完成对数组的操作 1…

亿级表优化「TIDB 分区篇」,值得收藏

这是亿级别表优化的第二篇&#xff0c;对第一篇感兴趣的可以看看。 亿级表优化思路之SQL篇 - 掘金 写作背景 距上次写亿级别优化已经有一个多月了&#xff0c;这段时间也没闲着&#xff0c;Q1 对模型做了梳理&#xff0c;重构了这部分业务&#xff0c;主要做了下面这些优化 …

大厂面试:找出数组中第k大的数的最佳算法

一.前置条件 假如数组为a,大小为n&#xff0c;要找到数组a中第k大的数。 二.解决方案 1.使用任意一种排序算法&#xff08;例如快速排序&#xff09;将数组a进行从大到小的排序&#xff0c;则第n-k个数即为答案。 2.构造一个长度为k的数组&#xff0c;将前k个数复制过来并降序…