FrameNet介绍——从同义词语义知识库到框架语义知识库

news2024/9/20 15:07:20

        FrameNet 是一个为期三年的项目,获得了 NSF(美国国家科学基金会)的支持,专注于基于语料库的计算词典编纂。

项目特点

        FrameNet承诺使用语料库证据(corpus evidence)来进行语义和句法的概括; 并对目标词(主要是名词、形容词和动词)的搭配方式进行表示,其中语义部分使用了框架语义学

        最终的数据库将包含所描述词语的语义框架描述,以及几千个词语和短语的搭配表示(语义和句法),每个词语或短语都附有一组代表性的标注语料实证,这些实证共同展示了“框架元素”及其句法实现(例如,语法功能、短语类型和其他句法特征)之间的观察到的链接。

项目成果

        FrameNet 项目正在为数千个英语词汇项生成框架语义描述,并通过当代英语语料库中的语义标注实证支持这些描述。这些描述基于从大型文本语料库中提取的例句的手工语义标注,以及词典编纂者和语言学家对这些例句所体现的语义模式的系统分析。因此,该项目的主要重点是将语义知识以机器可读的形式编码,由人类完成。词典编纂者的直觉受到基于语料库研究结果的指导和限制,这些研究使用高性能的软件工具进行。

        该项目的主要成果有两个部分:

  • 一个名为 FrameNet 数据库的词汇资源
  • 相关的软件工具。

        这个数据库有三个主要部分:  

  • 一个词典,包含的词条由以下部分组成:
    •  一些传统的字典类型数据,主要供人类读者使用;
    • 公式,这些公式捕捉了语义框架的元素在围绕该词构建的短语或句子中的形态句法实现方式;
    • 与语义标注的例句的链接,这些例句说明了公式中识别出的每种潜在实现模式;
    • 与框架数据库及其他机器可读资源(如 WordNet 和 COMLEX)的链接。  
  • 一个框架数据库,包含每个框架基本概念结构的描述,并为参与这些结构的元素命名和描述。
  • 注释过的例句,这些句子被标注以说明词汇项的语义和形态句法属性。这些句子为框架数据库和词典条目中的词典编纂分析提供了实证支持。

概念模型

        在 FrameNet 中,角色名称(称为框架元素或 FEs)是特定概念结构(框架)所特有的。一些框架非常通用,而另一些则特定于一小类词汇项。例如,在运动(MOTION)领域内的交通(TRANSPORTATION)框架提供了行动者(MOVERS)、运输方式(MEANS of transportation)和路径(PATHS)。

        例如,DRIVING属性指定了一个DRIVER (主要的MOVER),VEHICLE (具体的MEANS元素),以及潜在的CARGO或RIDER作为次要的MOVER。在这一帧中,DRIVER启动并控制车辆的移动。在这个框架中,大多数动词都可以实现为DRIVER或VEHICLE的主语;车辆、乘员或货物可以作为直接对象出现;PATH和VEHICLE可以作为斜补语出现。

项目概述

        生成 FrameNet 的框架语义表示数据库需要四个处理步骤:

  • 准备:生成语义和句法模式的初始描述,用于语料库查询和注释
  • 子语料库提取:提取好的例句
  • 标注:手动标记感兴趣的成分
  • 词条写作:根据标注和其他数据构建词汇语义表示的数据库

代码

import nltk
from nltk.corpus import framenet as fn

# 下载 FrameNet 数据(如果尚未下载)
nltk.download('framenet_v17')

# 查看所有可用的框架
frames = fn.frames()
print(f"Total frames: {len(frames)}")

# 查找一个特定的框架,例如 "Commerce_buy"
commerce_buy = fn.frame('Commerce_buy')

# 打印框架名称
print(f"Frame name: {commerce_buy.name}")

# 打印框架的核心元素和非核心元素
print("Core Frame Elements:")
for element in commerce_buy.FE:
    print(f"- {element}")

print("\nNon-Core Frame Elements:")
for non_core in commerce_buy.FEcoreSet:
    print(f"- {non_core}")

# 打印例句
print("\nExample Sentences:")
for sentence in commerce_buy.exemplars:
    print(sentence.text)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2085711.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络基础-实现在Windows系统下的socket环境地址通信

实现客户端和服务端的数据交互 1.写所要实现功能的声明&#xff08;封装在tcpsocket.h文件&#xff09; #ifndef TCPSOCKET_H #define TCPSOCKET_H//在Windows下进行网络编程&#xff0c;需要引入Windows的socket库 #include <winsock2.h> //做一些预编译工作&#xff…

MyBatis结果集复杂映射超详细版(一对多关系映射)

目录 1.一对多关系映射 1.1创建两个表&#xff1a;goods表与goods_class表 1.2xml文件中两部分&#xff1a;与(存放SQL语句)1.3数据库中&#xff1a;测试SQL语句&#xff0c;涉及到的知识点&#xff1a;左连接 1.一对多关系映射 1.1创建两个表&#xff1a;goods表与goods_c…

C++对C的扩充(8.28)

1.使用C手动封装一个顺序表&#xff0c;包括成员数组1个&#xff0c;成员变量n个 代码&#xff1a; #include <iostream>using namespace std;//类型重命名 using datatype int; #define MAX 30struct seqList { private: //私有权限datatype *data; //相当于 …

【项目源码】终于有人将打字游戏和编程英语结合起来啦!编程初学者的福音

Hello&#xff01;各位彦祖&#xff0c;亦菲们&#xff01;又是美好的一天&#xff01;今天给大家分享一个Java项目源码&#xff1a;Java打字游戏项目源码&#xff01; 看到这里&#xff0c;你可能会说&#xff01; 一个破打字游戏有什么可神气的&#xff01;&#xff01;&…

【自由能系列(中级)】状态与动作的协同机制解析 ——从马尔可夫毯到大脑功能的全方位剖析

状态与动作的协同机制解析 ——从马尔可夫毯到大脑功能的全方位剖析 Synergistic Mechanism of States and Actions —— A Comprehensive Analysis from Markov Blanket to Brain Function 核心结论&#xff1a; 中文总结&#xff1a; 系统将状态划分为内部状态和隐藏或外…

Flutter中的Key

在Flutter 中&#xff0c;Key 是 几乎所有 widget 都具有的属性。为什么 widget 具有 Key 呢&#xff1f;Key的作用是什么&#xff1f; 什么是 Key Key是Widget、Element 和 SemanticNodes 的标识符。 Key 是Widget、Element 和 SemanticNodes的唯一标识。例如对于 Widget 在 …

MyBatis的学习————下篇

目录 一、动态SQL 简介 1、if标签 2、where标签 3、trim标签 4、choose、when、otherwise 5、foreach 5.1、批量删除 5.2、批量添加 6、sql标签 二、MyBatis的缓存 1、一级缓存 2、二级缓存 3、二级缓存的相关配置 4、MyBatis缓存查询的顺序 5、 第三方缓存EHCac…

如何在Windows 11上关闭无响应的应用程序?这里有详细步骤

序言 无响应的应用程序令人沮丧,但更糟糕的是这些应用程序拒绝关闭。如果你发现自己处于这种情况,我们有几种方法可以帮助你强制关闭Windows 11 PC上的这些应用程序。让我们找出可用的解决方案。 使用键盘快捷键结束程序 关闭无响应应用程序的最简单方法是使用Windows键盘…

DataWhale AI夏令营 2024大运河杯-数据开发应用创新赛-task2

DataWhale AI夏令营 2024大运河杯-数据开发应用创新赛 YOLO(You Only Look Once)上分心得分享 YOLO(You Only Look Once) YOLO算的上是近几年最火的目标检测模型了&#xff0c;被广泛的应用在工业、学术等领域。 YOLOv1&#xff08;You Only Look Once 第一版&#xff09;于 2…

基于麒麟信安操作系统的光伏发电功率预测系统完成大规模部署建设

麒麟信安操作系统&#xff0c;作为行业数智化建设的安全根基&#xff0c;为电力业务系统提供了稳定可靠的底层平台&#xff0c;在全球能源结构转型大潮中扮演着至关重要的角色。某光伏电站项目中&#xff0c;基于麒麟信安操作系统的光伏发电功率预测系统完成大规模部署建设&…

c#如何加密exe程序防止反编译附软件

1. 先说软件&#xff0c;使用的软件是Dotfuscator&#xff0c;下载地址如下&#xff1a; 链接&#xff1a;https://pan.quark.cn/s/6f2e785c003f2. 软件使用方法&#xff0c;打开软件&#xff0c;选择Create New Project 3. 找到input&#xff0c;把你需要加密的文件导入 4.…

k8s项目的发布

目录 三种发布方式 1.蓝绿发布 2.金丝雀发布&#xff08;灰度发布&#xff09; 实验&#xff1a;k8s实现金丝雀发布 3.滚动发布&#xff08;默认形式&#xff09; 因为应用升级以及新旧业务切换&#xff0c;所以在这个过程当中如何保证对外的服务正常是一个非常重要的问题…

手把手教你如何使用Python连接MySQL数据

数据库编程是在应用程序中与数据库交互和管理数据的关键部分。MySQL是一种流行的关系型数据库管理系统&#xff08;RDBMS&#xff09;&#xff0c;在Python中进行MySQL数据库编程相对容易。 本文介绍如何使用Python进行MySQL数据库编程&#xff0c;包括连接数据库、执行SQL查询…

高频面试题:SpringMVC的执行流程

SpringMVC一直以来都是面试中的重点&#xff0c;尽管随着近年来springboot和微服务的广泛流行&#xff0c;关于对springMVC的考察比重略有下降&#xff0c;但依然是面试中的重点&#xff0c;也需要我们对其有一个比较清楚和全面的认识。 如果将java的发展史中重要的组件进行排…

备忘录模式 详解

备忘录模式 简介: 保存一个对象的某个状态&#xff0c;以便在适当的时候恢复对象, 允许在不破坏封装性的前提下&#xff0c;捕获和恢复对象的内部状态。 场景: 很多地方都用到了备忘录模式, 比如网络消息的序列化和反序列化, 数据的本地保存与加载等, 最简单的json的dump和loa…

全能与专精:探索AI模型的未来之路

AI模型&#xff1a;追求全能还是专精&#xff1f; 近日&#xff0c;OpenAI预计在秋季推出代号为“草莓”的新AI。从专注于数学问题到处理主观营销策略&#xff0c;"草莓"模型展现出惊人的多样性。而这种全能型 AI 是否代表了未来趋势&#xff1f;相比专攻于某一领域…

OpenAI 将于今年秋天推出新的先进“Strawberry草莓”生成式人工智能产品

今年秋季&#xff0c;OpenAI将推出一款备受瞩目的新型生成式人工智能产品——“草莓”。据悉&#xff0c;这款名为“草莓”的AI程序将带来一系列创新突破&#xff0c;它将大幅提升人工智能处理复杂数学题、执行战略任务以及深入探索各种主题的能力&#xff0c;而这一切无需依赖…

前景堪忧?SaaS巨头Salesforce,25年辉煌后能否继续领跑市场?

最近&#xff0c;时常听到有人说Salesforce失去了活力&#xff0c;这或许是对整个生态系统的普遍感受。多年来&#xff0c;Salesforce一直保持着巨大的发展势头&#xff0c;通过收购、创新和建立良好的合作伙伴关系已发展成为云计算行业巨头。在经历了近25年创纪录的增长和创新…

记Spring HTTP Invoker远程调用的使用(二)基于Servlet方式,配置servlet映射url-pattern实现

目录 前言 一、概念 二、代码实现 1. 服务端实现 2. 客户端实现 前言 本篇接上一篇记Spring HTTP Invoker远程调用的使用&#xff08;一&#xff09;基于Url映射方式&#xff0c;DispatcherServlet统一处理实现-CSDN博客https://blog.csdn.net/u011529483/article/details/141…

论文解读:Prompt-aligned Gradient for Prompt Tuning

摘要 得益于CLIP等大型预训练的视觉语言模型VLM&#xff0c;我们可以通过离散的提示设计构建Zero-shot分类器&#xff0c;例如&#xff0c;利用图像与提示语句" a photo of a [ CLASS ] "之间的相似度&#xff0c;可以获得图像属于某个类别的置信度分数。此外&#…