R语言实践——rWCVP 的函数清单

news2025/1/11 0:28:34

rWCVP 的函数清单

  • 1. get_area_name()
    • 用法
    • 参数
    • 详介
    • 例子
  • 2. get_wgsrpd3_codes()
    • 用法
    • 参数
    • 详介
    • 例子
  • 3. powo_map()
    • 用法
    • 参数
  • 4. powo_pal(), scale_color_powo(), scale_colour_powo(), scale_fill_powo()
    • 用法
    • 参数
  • 5. redlist_example
    • 用法
    • 格式
    • 资源
  • 6. taxonomic_mapping
    • 用法
    • 格式
    • 资源
  • 7. wcvp_checklist()
    • 用法
    • 参数
    • 详介
  • 8. wcvp_distribution()
    • 用法
    • 参数
    • 详介
  • 9. wcvp_distribution_map()
    • 用法
    • 参数
    • 详介
    • 例子
  • 10. wcvp_match_exact()
    • 用法
    • 参数
    • 另请参阅
    • 例子
  • 11. wcvp_match_fuzzy() phonetic_match() edit_match()
    • 用法
    • 参数
    • 详介
    • 另请参阅
    • 例子
  • 12. wcvp_match_names()
    • 用法
    • 参数
    • 详介
    • 另请参阅
    • 例子
  • 13. wcvp_occ_mat()
    • 语法
    • 参数
    • 详介
    • 例子
  • 14. wcvp_reformat()
    • 用法
    • 参数
    • 详介
  • 15. wcvp_summary()
    • 用法
    • 参数
    • 详介
    • 例子
  • 16. wcvp_summary_gt()
    • 用法
    • 参数
    • 例子
  • 17. wgsrpd3
    • 用法
    • 格式
    • 资源
  • 18. wgsrpd_mapping
    • 用法
    • 格式
    • 资源

1. get_area_name()

根据地区编码获得地区名称

用法

get_area_name(area_codes)

参数

  • area_codes:包含要映射到名称的代码集的字符向量

字符。长度为1的向量,带有3级区域集的名称,或者(如果该区域集没有名称)代码的输入向量。

详介

get_wgsrpd3_codes函数执行相反的功能。适用于压缩代码集,例如文件名、绘图和表格格式。

例子

get_area_name(get_wgsrpd3_codes("Brazil"))
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
[1] "Brazil"

2. get_wgsrpd3_codes()

提取WGSRPD3级编码

用法

get_wgsrpd3_codes(geography, include_equatorial = NULL)

参数

  • geography:字符变量。要转换为3级代码的地理位置。可能是WGSRPD区域(3级)、地区(2级)或洲(1级)、国家(政治)或半球(“北半球”、“南半球”或“赤道”)
  • include_equatorial:逻辑变量。包括跨越赤道的3级区域?默认为NULL,这将生成一条消息并包括这些区域。如果地理不是半球,则忽略。

具有属于该地理区域的区号(级别3)的字符。

详介

国家绘图遵循加Gallagher et al. (2020)。重要的是,这意味着一些海外领土在此系统中不被视为国家的一部分,例如加那利群岛被指定为它们自己的 3 级区域,而不是此映射中西班牙的一部分。在不明确的地方,可以使用View(wgsrpd_mapping)来研究映射。

例子

get_wgsrpd3_codes("Brazil")
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
[1] "BZC" "BZE" "BZL" "BZN" "BZS"

3. powo_map()

为给定的范围和范围质心绘制 POWO 样式地图。

用法

powo_map(range_sf, centroids_sf)

参数

  • range_sf:等高多边形的简单要素(sf)数据框
  • centroids_sf:范围质心的简单要素(sf)数据框

该范围的ggplot地图

4. powo_pal(), scale_color_powo(), scale_colour_powo(), scale_fill_powo()

POWO网站上展示的范围地图有一个固定的、离散的调色板,它基于一个地区的分类群类型。

用法

powo_pal()

scale_color_powo(...)

scale_colour_powo(...)

scale_fill_powo(...)

参数

  • :传递给discrete_scale的参数
  • palette:一个调色板函数,当用单个整数参数(标尺中的级别数)调用时,返回它们应该取的值(例如scales::hue_pal())
  • limits:下列之一:
    1. 默认为NULL
    2. 定义了尺度可能的值和顺序的字符向量
    3. 接受现有(自动)值并返回新值的函数。也接受rlang lambda函数表示法。
  • drop:是否应从量表中省略未使用的因子水平?默认值TRUE使用数据中出现的级别;FALSE使用因子中的所有级别。
  • na.translate:与连续刻度不同,离散刻度可以很容易地显示缺失值,默认情况下会这样做。如果要从离散刻度中删除缺失值,请指定na.translate = FALSE。
  • scale_name:应用于与此刻度关联的错误消息的刻度的名称。
  • name:尺度名称。用于轴或图例标题。如果是waiver(),默认值,尺度名称从首次绘图时获得。如果为NULL,图例标题将被忽略。
  • labels:以下之一:
    1. NULL表示没有标签
    2. waiver() 用于转换对象计算的默认标签
    3. 提供标签的字符向量(必须与 breaks 等长)
    4. 表达式向量(必须与 breaks 等长)。详见 ?plotmath
    5. 一个函数,它将breaks作为输入,并将标签作为输出返回。也接受rlang lambda函数表示法。
  • guide:用于创建指南或其名称的函数。详见 guides()
  • super:用于构建标尺的父类

字符。与POWO相匹配的名称和十六进制值的向量。

5. redlist_example

名称匹配的示例数据集。一个包含20个红名单评估样本的数据集,用于名称匹配

用法

redlist_example

格式

具有 20 行和 4 个变量的数据框:

  • assessmentId:红色名录标识符
  • scientificName:类群名称
  • redlistCategory:红色名录威胁类别
  • authority:类群命名人

资源

从 https://www.iucnredlist.org/ 下载并采样

6. taxonomic_mapping

用于将植物科映射到目或更高分类的数据。包含更高分类(被子植物、裸子植物、蕨类植物和石松植物)和 WCVP 中每个科的顺序的数据集。

用法

taxonomic_mapping

格式

一个包含457行和3个变量的数据框架:科、目和更高分类阶元

资源

PPG I 中的蕨类植物和石松类植物分类学。来自APG IV的被子植物分类学。Forest 等人的裸子植物分类学。

7. wcvp_checklist()

从 WCVP 生成物种清单

用法

wcvp_checklist(
  taxon = NULL,
  taxon_rank = c("species", "genus", "family", "order", "higher"),
  area_codes = NULL,
  synonyms = TRUE,
  render_report = FALSE,
  native = TRUE,
  introduced = TRUE,
  extinct = TRUE,
  location_doubtful = TRUE,
  hybrids = FALSE,
  infraspecies = TRUE,
  report_filename = NULL,
  report_dir = NULL,
  report_type = c("alphabetical", "taxonomic"),
  wcvp_names = NULL,
  wcvp_distributions = NULL
)

参数

  • taxon:字符变量。指包含的类群。默认为NULL(不进行类群筛选,所有类群)
  • taxon_rank:字符变量。“species”, “genus”, “family”, “order” or "higher"之一,指定 taxon的分类阶元。除非 taxonNULL,否则必须指定
  • area_codes:字符变量。单个或多个WGSRPD3级区域代码。默认为NULL(全球范围)
  • synonyms:逻辑变量。在清单中包含异名。默认为TRUE
  • render_report:逻辑变量。将清单呈现为标记语言报告。默认为FALSE
  • native:逻辑变量。包含未标记为 introduced,extinct或doubful的物种发现记录
  • introduced:逻辑变量。包含标记为引入的物种发现记录。默认为TRUE
  • extinct:逻辑变量。包含标记为灭绝的物种发现记录。默认为TRUE
  • location_doubtful:逻辑变量。包含标记为产地存疑的物种发现记录。默认为TRUE
  • hybrids:逻辑变量。清单包含杂交种。默认为FALSE
  • infraspecies:逻辑变量。清单包含亚种。默认为TRUE
  • report_dir:字符变量。HTML文件的存储路径。用户必须提供
  • report_type:字符变量;alphabeticaltaxonomic之一。生成的清单按字母顺序或分类顺序排列。默认为alphabetical
  • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
  • wcvp_distributions:从WCVP 版本7或更新中获得的分布区数据集。如果为NULL(默认),将从rWCVPdata::wcvp_distributions加载名称

返回筛选数据后的数据集,如果 render_report=TRUE,还有一个HTML报告文件

详介

使用synonyms参数可以只返回接受名。如果synonyms=TRUR,则废弃名、不合法名和其他非接受名都会返回(例如,清单并不限制名称:taxon_status==“Synonym”)。*rWCVP**提供两种清单类型:字母顺序型和分类顺序型。在字母顺序型清单中,所有名称都按照字母顺序排列,接受名加粗而异名接在接受名后。在分类顺序型清单中,名称按接受名分组,异名列在对应接受名下方。两种类型清单都包含命名人、参考文献和分布信息,注意科级标头仅在字母顺序清单中支持。

8. wcvp_distribution()

生成物种、属、科的空间分布对象*

用法

wcvp_distribution(
  taxon,
  taxon_rank = c("species", "genus", "family", "order", "higher"),
  native = TRUE,
  introduced = TRUE,
  extinct = TRUE,
  location_doubtful = TRUE,
  wcvp_names = NULL,
  wcvp_distributions = NULL
)

参数

  • taxon:字符变量。要映射的分类单元。必需的。
  • taxon_rank:字符变量。“species”, “genus”, “family”, “order” or "higher"之一。指定taxon的分类阶元
  • native:逻辑变量。包含原生分布区?默认为TRUE
  • introduced:逻辑变量。包含引种分布区?默认为TRUE
  • extinct:逻辑变量。包含灭绝分布区?默认为TRUE
  • location_doubtful:逻辑变量。包含存疑区?默认为TRUE
  • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
  • wcvp_distributions:从WCVP 版本7或更新中获得的分布区数据集。如果为NULL(默认),将从rWCVPdata::wcvp_distributions加载名称

包含分类单元范围多边形的简单特征 (sf) 数据框。

详介

taxon_rank指定高于物种阶元,那么返回整个组的分布区,而不是该组中单个物种的分布区。当改变选项时也适用,比如,不管native=TUREnative=FALSE,如果在原生分布区外有引入发现记录,也会包含紧取。要分辨原生分布区内的灭绝、引种或存疑记录,可以使用wcvp_summarywcvp_occ_mat

9. wcvp_distribution_map()

绘制物种、属、科的分布地区

用法

wcvp_distribution_map(
  range,
  crop_map = FALSE,
  native = TRUE,
  introduced = TRUE,
  extinct = TRUE,
  location_doubtful = TRUE
)

参数

  • range:由wcvp_distribution返回的简单要素(sf)数据集
  • crop_map:逻辑变量。裁剪地图至分布区?默认为FALSE
  • native:逻辑变量。包含原生分布区?默认为TRUE
  • introduced:逻辑变量。包含引种分布区?默认为TRUE
  • extinct:逻辑变量。包含灭绝分布区?默认为TRUE
  • location_doubtful:逻辑变量。包含存疑记录分布区?默认为TRUE

ggplot2::ggplot绘制的分布区

详介

世界植物 (POWO; https://powo.science.kew.org/) 使用的配色方案镜像,其中绿色是原生的,紫色是引入的,红色是灭绝的,橙色是可疑的。有关如何使用自定义颜色的信息,请参见示例。

例子

wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus"))

在这里插入图片描述

wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus"), crop_map = TRUE)

在这里插入图片描述

wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus")) +
  ggplot2::scale_fill_manual(values = c("red", "blue")) +
  ggplot2::scale_colour_manual(values = c("red", "blue"))

在这里插入图片描述

10. wcvp_match_exact()

与 WCVP 完全匹配。名称与 WCVP 的精确匹配,可选择使用作者字符串来优化结果。

用法

wcvp_match_exact(names_df, wcvp_names, name_col, author_col = NULL, id_col)

参数

  • names_df:用于匹配的名称数据框。
  • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
  • name_col:字符变量。names_df中用于匹配类群名称的列
  • author_colnames_df中含有名称命名人、用于辅助匹配的列。设置为NULL让匹配忽略命名人字符串
  • id_colnames_df中含有发现记录id的列

将WCVP中的结果与names_df中的原始数据进行匹配。

另请参阅

** wcvp_match_fuzzy(), wcvp_match_names()**

例子

wcvp_names = rWCVPdata::wcvp_names
wcvp_match_exact(redlist_example, wcvp_names = wcvp_names, "scientificName", author_col = "authority", id_col = "assessmentId")
# A tibble: 20 × 16
   assessmentId scientificName  redlistCategory authority match_type
          <dbl> <chr>           <chr>           <chr>     <chr>     
 1     11081542 Antimima quart… Least Concern   (Dinter)… NA        
 2     19395021 Avena hybrida   Data Deficient  Peterm.   Exact (wi…
 3     64135503 Citrus garrawa… Least Concern   F.M.Bail… NA        
 4    189601563 Croton campanu… Endangered      Caruzo &… Exact (wi…
 5    115968141 Cynanchum free… Endangered      (N.E.Br.… NA        
 6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… NA        
 7     11001316 Geissanthus pi… Endangered      (Lundell… NA        
 8    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
 9    198678856 Leichhardtia v… Vulnerable      (Guillau… Exact (wi…
10    135836392 Mouriri myrtil… Least Concern   (Sw.) Po… NA        
11    146459149 Neocussonia um… Least Concern   (Sond.) … Exact (wi…
12    170239556 Papuodendron l… Least Concern   C.T.White Exact (wi…
13     68117888 Plerandra sp. … Endangered      Lowry & … NA        
14    133242195 Psammisia scle… Least Concern   A.C. Sm.  NA        
15       580432 Rebutia albipe… Endangered      Rausch    NA        
16    133163169 Senecio canesc… Least Concern   (Bonpl.)… NA        
17    185585004 Serruria colli… Endangered      Salisb. … NA        
18      8379911 Sesbania brevi… Least Concern   J.B.Gill… NA        
19    122659437 Trichilia demi… Critically End… D.Penn.   NA        
20      1433575 Vicia mollis    Least Concern   Boiss. &… NA        
# ℹ 11 more variables: multiple_matches <lgl>,
#   match_similarity <dbl>, match_edit_distance <dbl>,
#   wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
#   wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
#   wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
wcvp_match_exact(redlist_example, wcvp_names = wcvp_names, "scientificName", id_col = "assessmentId")
# A tibble: 23 × 16
   assessmentId scientificName  redlistCategory authority match_type
          <dbl> <chr>           <chr>           <chr>     <chr>     
 1     11081542 Antimima quart… Least Concern   (Dinter)… NA        
 2     19395021 Avena hybrida   Data Deficient  Peterm.   Exact (wi…
 3     64135503 Citrus garrawa… Least Concern   F.M.Bail… NA        
 4    189601563 Croton campanu… Endangered      Caruzo &… Exact (wi…
 5    115968141 Cynanchum free… Endangered      (N.E.Br.… NA        
 6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Exact (wi…
 7     11001316 Geissanthus pi… Endangered      (Lundell… NA        
 8    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
 9    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
10    198678856 Leichhardtia v… Vulnerable      (Guillau… Exact (wi…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
#   match_similarity <dbl>, match_edit_distance <dbl>,
#   wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
#   wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
#   wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows

11. wcvp_match_fuzzy() phonetic_match() edit_match()

在WCVP中模糊匹配。使用语法匹配和编辑距离对 WCVP 中的名称进行模糊匹配。

用法

wcvp_match_fuzzy(names_df, wcvp_names, name_col, progress_bar = TRUE)

phonetic_match(names_df, wcvp_names, name_col)

edit_match(names_df, wcvp_names, name_col)

参数

  • names_df:用于匹配的名称数据框。
  • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
  • name_col:字符变量。names_df中用于匹配类群名称的列
  • progress_bar:逻辑变量。展示匹配进度条。默认为TRUE;如果选取了标记语言报告,请更改为FALSE

将WCVP中的结果与names_df中的原始数据进行匹配。

详介

wcvp_match_fuzzy函数首先使用语法匹配,种后再基于编辑距离查找最接近匹配结果

语法匹配使用了phonics::metaphoe,最大可以处理20个字符长度。

编辑距离匹配根据Levenshtein相似性查找最接近的匹配,使用RecordLinkage::levenshteinSim计算。

另请参阅

wcvp_match_exact(), wcvp_match_names()

例子

wcvp_match_fuzzy(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 23 × 16■■■■■■■■■■■■■■■         80% | ETA:  4s
   assessmentId scientificName  redlistCategory authority match_type
          <dbl> <chr>           <chr>           <chr>     <chr>     
 1     19395021 Avena hybrida   Data Deficient  Peterm.   Fuzzy (ph…
 2     64135503 Citrus garrawa… Least Concern   F.M.Bail… Fuzzy (ph…
 3    189601563 Croton campanu… Endangered      Caruzo &… Fuzzy (ph…
 4    115968141 Cynanchum free… Endangered      (N.E.Br.… Fuzzy (ph…
 5     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Fuzzy (ph…
 6    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ph…
 7    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ph…
 8    198678856 Leichhardtia v… Vulnerable      (Guillau… Fuzzy (ph…
 9    135836392 Mouriri myrtil… Least Concern   (Sw.) Po… Fuzzy (ph…
10    146459149 Neocussonia um… Least Concern   (Sond.) … Fuzzy (ph…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
#   match_similarity <dbl>, match_edit_distance <dbl>,
#   wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
#   wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
#   wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows
phonetic_match(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 24 × 16
   assessmentId scientificName  redlistCategory authority match_type
          <dbl> <chr>           <chr>           <chr>     <chr>     
 1     11081542 Antimima quart… Least Concern   (Dinter)… NA        
 2     19395021 Avena hybrida   Data Deficient  Peterm.   Fuzzy (ph…
 3     64135503 Citrus garrawa… Least Concern   F.M.Bail… Fuzzy (ph…
 4    189601563 Croton campanu… Endangered      Caruzo &… Fuzzy (ph…
 5    115968141 Cynanchum free… Endangered      (N.E.Br.… Fuzzy (ph…
 6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Fuzzy (ph…
 7     11001316 Geissanthus pi… Endangered      (Lundell… NA        
 8    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ph…
 9    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ph…
10    198678856 Leichhardtia v… Vulnerable      (Guillau… Fuzzy (ph…
# ℹ 14 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
#   match_similarity <dbl>, match_edit_distance <dbl>,
#   wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
#   wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
#   wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows
edit_match(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 23 × 16■■■■■■■■■■■■■■■■■■■     95% | ETA:  3s
   assessmentId scientificName  redlistCategory authority match_type
          <dbl> <chr>           <chr>           <chr>     <chr>     
 1     11081542 Antimima quart… Least Concern   (Dinter)… Fuzzy (ed…
 2     19395021 Avena hybrida   Data Deficient  Peterm.   Fuzzy (ed…
 3     64135503 Citrus garrawa… Least Concern   F.M.Bail… Fuzzy (ed…
 4    189601563 Croton campanu… Endangered      Caruzo &… Fuzzy (ed…
 5    115968141 Cynanchum free… Endangered      (N.E.Br.… Fuzzy (ed…
 6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Fuzzy (ed…
 7     11001316 Geissanthus pi… Endangered      (Lundell… Fuzzy (ed…
 8    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ed…
 9    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ed…
10    198678856 Leichhardtia v… Vulnerable      (Guillau… Fuzzy (ed…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
#   match_similarity <dbl>, match_edit_distance <dbl>,
#   wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
#   wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
#   wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows

12. wcvp_match_names()

在WCVP中匹配名称。将名称与 WCVP 匹配,首先使用精确匹配,然后对任何剩余的未匹配名称使用模糊匹配。

用法

wcvp_match_names(
  names_df,
  wcvp_names = NULL,
  name_col = NULL,
  id_col = NULL,
  author_col = NULL,
  join_cols = NULL,
  fuzzy = TRUE,
  progress_bar = TRUE
)

参数

  • names_df:用于匹配的名称数据框。
  • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
  • name_col:字符变量。names_df中用于匹配类群名称的列
  • progress_bar:逻辑变量。展示匹配进度条。默认为TRUE;如果选取了标记语言报告,请更改为FALSE
  • author_colnames_df中含有名称命名人、用于辅助匹配的列。设置为NULL让匹配忽略命名人字符串
  • id_colnames_df中含有发现记录id的列
  • join_cols:字符变量。如果没有提供name_col,通过该向量各部分组建一个类群名称
  • fuzzy:逻辑变量;是否应该对无法精确匹配的名称使用模糊匹配。

将WCVP中的结果与names_df中的原始数据进行匹配。

详介

一般来说,精确匹配只使用类群名称(name_col),除非提供了作者名(author_col)。

还可以通过join_cols来组建类群名称,但必须要确保它们的组建顺序正确(例如,c(“genus”, “species”, “infra_rank”, “infra”))。

模糊匹配使用语法和编辑距离匹配相结合,可以使用fuzzy=FALSE关闭模糊匹配。

另请参阅

wcvp_match_exact(), wcvp_match_fuzzy()

例子

wcvp_match_names(redlist_example, wcvp_names, name_col = "scientificName", id_col = "assessmentId")
── Matching names to WCVP ──────────────────────────────────────────
ℹ Using the `scientificName` column                       
! No author information supplied - matching on taxon name only
                                                          
── Exact matching  names ──                               
                                                          
✔ Found 12 of  names                                      
                                                          
── Fuzzy matching 8 names ──                              
                                                          
✔ Found 7 of 8 names                                      
                                                          
── Matching complete! ──                                  
                                                          
✔ Matched 19 of 20 names                                  
ℹ Exact (without author): 12                              
ℹ Fuzzy (edit distance): 4                                
ℹ Fuzzy (phonetic): 3                                     
! Names with multiple matches: 3                          
# A tibble: 23 × 16■■■■■■■■■■■■■■■         80% | ETA:  4s
   assessmentId scientificName  redlistCategory authority match_type
          <dbl> <chr>           <chr>           <chr>     <chr>     
 1     11081542 Antimima quart… Least Concern   (Dinter)… Fuzzy (ed…
 2     19395021 Avena hybrida   Data Deficient  Peterm.   Exact (wi…
 3     64135503 Citrus garrawa… Least Concern   F.M.Bail… Fuzzy (ph…
 4    189601563 Croton campanu… Endangered      Caruzo &… Exact (wi…
 5    115968141 Cynanchum free… Endangered      (N.E.Br.… Fuzzy (ph…
 6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Exact (wi…
 7     11001316 Geissanthus pi… Endangered      (Lundell… Fuzzy (ed…
 8    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
 9    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
10    198678856 Leichhardtia v… Vulnerable      (Guillau… Exact (wi…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
#   match_similarity <dbl>, match_edit_distance <dbl>,
#   wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
#   wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
#   wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows

13. wcvp_occ_mat()

生成类群和区域的发现记录矩阵

语法

wcvp_occ_mat(
  taxon = NULL,
  taxon_rank = c("species", "genus", "family", "order", "higher"),
  area_codes = NULL,
  native = TRUE,
  introduced = TRUE,
  extinct = TRUE,
  location_doubtful = TRUE,
  wcvp_names = NULL,
  wcvp_distributions = NULL
)

参数

  • taxon:字符变量。指包含的类群。默认为NULL(不进行类群筛选,所有类群)
  • taxon_rank:字符变量。“species”, “genus”, “family”, “order” or "higher"之一,指定 taxon的分类阶元。除非 taxonNULL,否则必须指定
  • area_codes:字符变量。单个或多个WGSRPD3级区域代码。默认为NULL(全球范围)
  • synonyms:逻辑变量。在清单中包含异名。默认为TRUE
  • render_report:逻辑变量。将清单呈现为标记语言报告。默认为FALSE
  • native:逻辑变量。包含未标记为 introduced,extinct或doubful的物种发现记录
  • introduced:逻辑变量。包含标记为引入的物种发现记录。默认为TRUE
  • extinct:逻辑变量。包含标记为灭绝的物种发现记录。默认为TRUE
  • location_doubtful:逻辑变量。包含标记为产地存疑的物种发现记录。默认为TRUE
  • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
  • wcvp_distributions:从WCVP 版本7或更新中获得的分布区数据集。如果为NULL(默认),将从rWCVPdata::wcvp_distributions加载名称

含有taxon_nameplant_name_id的一个数据集

详介

请参阅此处的示例,了解如何将此输出格式化以供发表。

例子

wcvp_occ_mat(taxon = "Poa", taxon_rank = "genus",
             area = c("TAS","VIC","NSW"),
             introduced = FALSE)
# A tibble: 37 × 5
   plant_name_id taxon_name          NSW   TAS   VIC
           <dbl> <chr>             <dbl> <dbl> <dbl>
 1        435044 Poa affinis           1     0     1
 2        469193 Poa amplexicaulis     0     0     1
 3        435565 Poa cheelii           1     0     0
 4        435598 Poa clelandii         0     1     1
 5        435599 Poa clivicola         1     1     1
 6        435658 Poa costiniana        1     1     1
 7        435661 Poa crassicaudex      0     0     1
 8        435797 Poa drummondiana      0     0     1
 9        435841 Poa ensiformis        1     0     1
10        435878 Poa fawcettiae        1     1     1
# ℹ 27 more rows
# ℹ Use `print(n = ...)` to see more rows

14. wcvp_reformat()

WCVP本地版本的重新格式化

用法

wcvp_reformat(wcvp_local, version = NULL)

参数

  • wcvp_local:数据集。WCVP的本地副本。
  • version:9或”v9“。

返回相同结构的一个数据集

详介

请注意,并非所有原始变量在重新格式化期间都会保留。例如,publication 在 v9 中是单个变量,但在数据包中拆分为多个变量。因此不可能简单地重命名这个变量。数据包中存在但 v9 中不存在的变量用 NA 填充。

15. wcvp_summary()

从WCVP中生成一个概要表

用法

wcvp_summary(
  taxon = NULL,
  taxon_rank = c("species", "genus", "family", "order", "higher"),
  area_codes = NULL,
  grouping_var = c("area_code_l3", "genus", "family", "order", "higher"),
  hybrids = FALSE,
  wcvp_names = NULL,
  wcvp_distributions = NULL
)

参数

  • taxon:字符变量。指包含的类群。默认为NULL(不进行类群筛选,所有类群)
  • taxon_rank:字符变量。“species”, “genus”, “family”, “order” or "higher"之一,指定 taxon的分类阶元。除非 taxonNULL,否则必须指定
  • area_codes:字符变量。单个或多个WGSRPD3级区域代码。默认为NULL(全球范围)
  • grouping_var:字符变量;“area_code_l3”, “genus”, “family”,“order” or "higher"之一,指定摘要如何排序。默认为area_code_l3
  • hybrids:逻辑变量。是否统计杂交种。默认为FALSE
    • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
  • wcvp_distributions:从WCVP 版本7或更新中获得的分布区数据集。如果为NULL(默认),将从rWCVPdata::wcvp_distributions加载名称

筛选后的数据集,或一个gt表格

详介

分类阶元higher的可用值有 Angiosperms, Gymnosperms, Ferns and Lycophytes 。请注意,分组变量(如果是分类学的)应低于 taxon 和 taxon_rank 的级别,以生成有意义的摘要(即,按属、科或更高分类对属进行分组没有意义)。此外,如果分组变量是分类变量,则物种出现在整个输入区域。这意味着如果一个物种是任何输入区域的本地物种(即使它是在其他地区引入或灭绝的),它也被视为“本地”。同样,引入的事件优先于灭绝的事件。请注意,在此类汇总表中,“地方性”表示输入区域特有,不一定是输入区域内的单个 WGSRPD 第 3 级区域。

例子

ferns = wcvp_summary("Ferns", "higher", get_wgsrpd3_codes("New Zealand"), grouping_var = "family")
wcvp_summary_gt(ferns)
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
ℹ Aggregating occurrence types across input area ("New Zealand") - see `?wcvp_summary()` for details.
Matching ■■■■■■■■■■■■■■■■■■■■■■■■■         80% | ETA:  4s

在这里插入图片描述

16. wcvp_summary_gt()

wcvp_summary结果中呈现摘要表

用法

wcvp_summary_gt(x)

参数

  • x:列表

gt表格

例子

见15. 例子

17. wgsrpd3

生物多样性信息标准 (TDWG) 记录植物分布的世界地理计划 (WGSRPD)。WGSRPD 3级的空间数据,用于绘制地图

用法

wgsrpd3

格式

一个包含20行和4个变量的“sf”对象:

  • LEVEL3_NAM:区域名称
  • LEVEL3_COD:区域代码
  • LEVEL2_COD:2级代码
  • LEVEL1_COD:1级(大陆)

geometry:sf几何
fillcol:用于映射

资源

https://github.com/tdwg/wgsrpd/tree/master/level3添加链接描述

18. wgsrpd_mapping

将 WGSRPD 地理映射到其他级别的数据。一个数据集,包含每个3级地区的地区(3级)、#'地区(2级)、大陆(1级)、国家(政治)和半球类别。

用法

wgsrpd_mapping

格式

一个包含370行和7个变量的数据集:

  • HEMISPHERE:北、南或赤道(跨赤道)
  • LEVEL1_COD:大陆代码
  • LEVEL1_NAM:大陆
  • LEVEL2_COD:区域代码
  • LEVEL2_NAM:区域
  • COUNTRY:国家(行政)
  • LEVEL3_COD:地区代码
  • LEVEL3_NAM:地区

资源

https://github.com/tdwg/wgsrpd

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/567660.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【万字长文】深度解析 Transformer 和注意力机制(含完整代码实现)

深度解析 Transformer 和注意力机制 在《图解NLP模型发展&#xff1a;从RNN到Transformer》一文中&#xff0c;我介绍了 NLP 模型的发展演化历程&#xff0c;并用直观图解的方式为大家展现了各技术的架构和不足。有读者反馈图解方式虽然直观&#xff0c;但深度不足。考虑到 Tra…

Java设计模式七大原则-单一职责原则

✨作者&#xff1a;猫十二懿 ❤️‍&#x1f525;账号&#xff1a;CSDN 、掘金 、个人博客 、Github &#x1f389;公众号&#xff1a;猫十二懿 单一职责原则 1、单一职责介绍 单一职责原则&#xff08;SRP&#xff1a;Single Responsibility Principle&#xff09;是指一个类…

二层交换机和三层交换机的区别

交换机端口是现代 IT 生态系统中网络通信过程的重要组成部分。通过将数据包从一个网段或网络设备转发到另一个网段或网络设备&#xff0c;它们可实现网络连接和可访问性。但是&#xff0c;并非所有交换机都是平等的。为您的网络选择合适的交换机归结为一个关键决策&#xff1a;…

【Prompt 思考】AI 产品的交互必须是对话和聊天吗?

AI 产品的交互必须是对话和聊天吗&#xff1f; 1. 界面设计2. 对话和聊天3. 提示工程4. 思考5. 工具辅助用户写prompt的界面自动优化promptChatWeb的提示器商店 1. 界面设计 对话没有预设用途&#xff1a;用户不知道它能做什么&#xff0c;其实是什么也能干。提供更好的用户体…

【2023 · CANN训练营第一季】基于昇腾910的TF网络脚本训练(ModelArts平台)

准备工作: 1.注册华为云账号&#xff0c;获取AK/SAK&#xff0c;授权ModelArts&#xff0c;并申请华为云代金券 2.获取训练数据集&#xff0c;并进行数据预处理&#xff0c;比如离线制作成tfrecords(建议&#xff0c;可选) 3.将数据集(训练脚本)上传到OBS 4.安装PycharmIDE及To…

一文细说vDSO机制原理

1. 什么是 vDSO 众所周知&#xff0c;操作系统为我们管理硬件资源&#xff0c;并以系统调用的方式对用户进程提供 API&#xff0c;但是 syscall 很慢&#xff0c;涉及陷入内核以及上下文切换。对于少量频繁调用的系统调用&#xff08;比如获取当期系统时间&#xff09;来说&am…

CDN 回源与CDN 多级缓存原理

一、什么是回源 回源是指浏览器在发送请求报文时&#xff0c;响应该请求报文的是源站点的服务器&#xff0c;而不是各节点上的缓存服务器&#xff08;比如Nginx开启缓存&#xff09;&#xff0c;那么这个过程相对于通过各节点上的缓存服务器来响应的话就称作为回源。回源的请求…

Mac 原神电脑版下载安装使用教程,MacBook 上也可以玩原神了

最近发现了一个很棒的工具&#xff0c;他可以让你的 Mac 苹果电脑运行原神&#xff0c;而且画质和流畅度都是在线的&#xff0c;今天分享给大家 软件名字叫 playCover &#xff0c;根据作者的介绍这款软件最初就是国外的一位博主想在 Mac 上玩原神特意开发的一款软件&#xff…

Faster R-CNN网络架构详解和TensorFlow Hub实现(附源码)

文章目录 一、RPN网络1. RPN网络简介2. backbone网络简介 二、Faster R-CNN网络架构1. Faster R-CNN网络简介2. 基于TensorFlow Hub实现Faster R-CNN 前言&#xff1a;Faster R-CNN的简介见 上一篇文章 一、RPN网络 1. RPN网络简介 RPN网络全称Region Proposal Network&#…

【星戈瑞】BODIPY-530/550氟化硼二吡咯荧光染料

BODIPY是一种荧光染料&#xff0c;其分子结构稳定、荧光强度高、荧光寿命长、光谱范围广&#xff0c;因此在许多领域都有应用。在生物医学领域&#xff0c;BODIPY作为荧光探针&#xff0c;可用于细胞成像、生物分子探测、药物筛选等方面。例如&#xff0c;一些研究者将BODIPY修…

如何在华为OD机试中获得满分?Java实现【计算某字符出现次数】一文详解!

✅创作者&#xff1a;陈书予 &#x1f389;个人主页&#xff1a;陈书予的个人主页 &#x1f341;陈书予的个人社区&#xff0c;欢迎你的加入: 陈书予的社区 &#x1f31f;专栏地址: Java华为OD机试真题&#xff08;2022&2023) 文章目录 1. 题目描述2. 输入描述3. 输出描述…

今天面了个字节拿23k出来的小伙,让我见识到了什么才是天花板...

2023年堪称大学生就业最难的一年&#xff0c;应届毕业生人数是1158万&#xff0c;再次刷新记录。 但是我观察到一个数据&#xff0c;那就是已经就业的毕业生中&#xff0c;计算机通信等行业最受毕业生欢迎&#xff01; 计算机IT行业薪资高&#xff0c;平均薪资是文科其他岗位的…

Java之旅(二)

Java安装 检查您是否在 Windows PC 上安装了 Java&#xff0c;请在开始栏中搜索 Java 或在命令提示符 (cmd.exe) 中键入以下内容&#xff1a;java -version 在 Windows 上安装 Java&#xff1a; 转到“系统属性”&#xff08;可以在控制面板 > 系统和安全 > 系统 >…

android aidl及binder基础知识总结

1、什么是binder binder是android framework提供的&#xff0c;用于跨进程方法调用的机制&#xff0c;具有安全高效等特点。 我们知道&#xff0c;在 Android 系统中&#xff0c;每个应用程序都运行在一个独立的进程中&#xff0c;各个进程之间需要进行数据交换和调用&#x…

元宇宙应用领域-医疗

元宇宙&#xff08;Metaverse&#xff09;是一个虚拟空间&#xff0c;用户可以通过数字技术和设备在其中生活和工作。元宇宙由一系列相关的技术和应用组成&#xff0c;包括区块链、虚拟现实、增强现实、人工智能、网络安全、大数据和云计算等。 元宇宙是一种新型的虚拟空间&am…

【加解密】bcryptjs | CryptoJS | JSEncrypt | node-rsa 加密| 解密 | RSA | ASE | MD5

加解密 1、 bcryptjs 解密 - 只可加密&#xff0c;比对密码&#xff0c;不可解密 下载 npm i bcryptjs 作用&#xff1a;字符串加密&#xff0c;已加密的字符串不可破解&#xff0c;只可比对。优点&#xff1a;加密的字符不可解密缺点&#xff1a;已加密的字符不可解密&#…

【TI毫米波雷达笔记】IWR6843AOPEVM开箱功能测试

【TI毫米波雷达笔记】IWR6843AOPEVM开箱功能测试 我用的是IWR6843AOPEVM-G 相关资源可以在ti官网下载 要用的软件是 TI官方上位机 mmWave_Demo_Visualizer 可以用网页版 也可以用软件包 建议先上网页版看看版本支不支持对应的板子 网页版&#xff1a; dev.ti.com/gallery/…

CMake之安装

目录 公共选项安装目标安装文件安装目录安装导出 公共选项 install有多个签名&#xff0c;这些签名公用的选项有以下&#xff1a; DESTINATION&#xff1a;指定文件要安装的目录&#xff0c;可以是相对路径或绝对路径。 相对路径&#xff1a;会使用 CMAKE_INSTALL_PREFIX 作为…

rttread-nano 使用记录:rt_kprintf函数格式化打印无法左对齐

rttread-nano 使用记录&#xff1a;rt_kprintf函数格式化打印无法左对齐 今天用rt_kprintf函数打印输出一个表格&#xff0c;为了表格好看每一列我都使用格式化参数-负号符号设置为了左对齐&#xff0c;但是发现无法打印&#xff0c;也无法打印浮点数&#xff0c;换成微库的pri…

通过注册表显示和隐藏“我的电脑”、“回收站”等图标

注册表路径&#xff1a; HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\HideDesktopIcons\NewStartPanel 其中{208D2C60-3AEA-1069-A2D7-08002B30309D}是我的电脑&#xff0c;值的类型为REG_DWORD&#xff0c;改为0后隐藏&#xff0c;1代表显示。 其…