使用华为云免费资源训练Paddle UIE模型

news2024/10/1 12:23:14

一、创建虚拟环境

好习惯,首先创建单独的运行环境

conda create -n uie python=3.10.9
conda activate uie

二、安装paddle框架及paddlenlp

2.1 参考官方文档安装paddle

开始使用_飞桨-源于产业实践的开源深度学习平台

首先查看自己服务器cuda版本,如下我的版本时10.2

(PyTorch-1.8) [ma-user work]$nvidia-smi
Wed Apr 19 23:35:11 2023       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.33.01    Driver Version: 440.33.01    CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla P100-PCIE...  Off  | 00000000:00:0E.0 Off |                    0 |
| N/A   39C    P0    28W / 250W |      0MiB / 16280MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

在Paddle官网直接复制命令即可。

2.2  安装paddlenlp 

pip install --upgrade paddlenlp 

2.2.1 问题一 ERROR: Failed building wheel for numpy Failed to build numpy

-x86_64-3.10/numpy/core/src/multiarray/scalartypes.o -MMD -MF build/temp.linux-x86_64-3.10/build/src.linux-x86_64-3.10/numpy/core/src/multiarray/scalartypes.o.d" failed with exit status 1
            [end of output]
      
        note: This error originates from a subprocess, and is likely not a problem with pip.
        ERROR: Failed building wheel for numpy
      Failed to build numpy
      ERROR: Could not build wheels for numpy, which is required to install pyproject.toml-based projects
      [end of output]
  
  note: This error originates from a subprocess, and is likely not a problem with pip.
error: subprocess-exited-with-error

× pip subprocess to install backend dependencies did not run successfully.
│ exit code: 1
╰─> See above for output.

note: This error originates from a subprocess, and is likely not a problem with pip

手工安装numpy包,再次执行nlp包安装,还是不行。 

pip install numpy

换另外一种方式成功

python3 -m pip install --upgrade paddlenlp -i https://mirror.baidu.com/pypi/simple

三、下载PaddleNLP源码

$git clone https://github.com/PaddlePaddle/PaddleNLP.git

四、执行训练

4.1、对标注数据进行预处理

python ../PaddleNLP/model_zoo/uie/doccano.py --doccano_file ./data.json --task_type ext --save_dir ./ --splits 0.7 0.2 0.1 --schema_lang ch

4.2、模型精调

$python ../PaddleNLP/model_zoo/uie/finetune.py 
 --device gpu   
 --logging_steps 10  
 --save_steps 100    
 --eval_steps 100    
 --seed 42           
 --model_name_or_path uie-base    
 --output_dir $finetuned_model   
 --train_path ./train.txt  
 --dev_path ./dev.txt   
 --max_seq_length 512      
 --per_device_eval_batch_size 16     
 --per_device_train_batch_size  16     
 --num_train_epochs 20     
 --learning_rate 1e-5     
 --label_names "start_positions" "end_positions"    
 --do_train     
 --do_eval     
 --do_export     
 --export_model_dir $finetuned_model     
 --overwrite_output_dir     
 --disable_tqdm True     
 --metric_for_best_model eval_f1     
 --load_best_model_at_end  True     
 --save_total_limit 1

出现下图及训练成功 

 五、模型应用

from pprint import pprint
from paddlenlp import Taskflow
schema = ['时间', '地区', '指标名']
ie = Taskflow('information_extraction', schema=schema, task_path="./checkpoint/model_best")
pprint(ie("我想查询2022年山东省主营业务收入数据"))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/437626.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

redis_5种数据结构及其底层实现原理详解

1、 redis中的数据结构 Redis支持五种数据类型:string(字符串),hash(哈希),list(列表),set(无序集合)及zset(有序集合) 在秒杀项目里…

LED显示屏有色差要怎么处理?

LED显示屏在销售的时候不可避免的会产生尾货。这些尾货由于是不同批次的产品,亮度不可避免的有差异,拼装之后显示效果不佳,这时候就必须使用逐点校正技术。你知道LED显示屏的亮度和对比度是如何调节的吗? 消除差异逐点校正是一项用…

winForm常用控件

一般控件 Label TextBox:文本框 Button RadioButton CheckBox ComboBox:下拉框 CheckedListBox:带复选框的列表项 DateTimePicker:日期时间选择控件 ListBox:列表项 ListView:以五种不同视图显示项的集合 MaskedTextBox:格式化文本框 MonthCalendar:月历 NumberIcUp…

选择Zoho CRM的三大原因

上周,美国IT杂志PCMag发布了关于CRM系统的新评价,Salesforce Sales Cloud Lightning Professional、Zoho CRM、HubSpot CRM、Zendesk、SugarCRM等多个CRM品牌上榜。借此机会,我们来说说Zoho CRM为什么值得推荐? PCMag&#xff0c…

答对这道面试题,直接原地入职:说一下公司常用MySQL分库分表方案

一、数据库瓶颈 不管是IO瓶颈,还是CPU瓶颈,最终都会导致数据库的活跃连接数增加,进而逼近甚至达到数据库可承载活跃连接数的阈值。在业务Service来看就是,可用数据库连接少甚至无连接可用。接下来就可以想象了吧(并发…

XML概述和编写文件

XML概述 XML是一种可扩展的标记语言 标记语言&#xff1a;通过标签来描述数据的一门语言&#xff08;标签有时我们也将其称之为元素&#xff09; 可扩展&#xff1a;标签的名字是可以自己定义的 语法规则示例代码是由一对尖括号和一组合法标识符组成<student>在xml标…

CDN在流媒体的如何内容交付

流媒体是当今最大的趋势之一&#xff0c;这是一种全新的内容消费方式&#xff0c;涉及特定的技术和挑战&#xff0c;视频是目前互联网上要求最多的内容格式&#xff0c;使用CDN分发视频需要与分发其他内容不同。 视频作为内容的本质是不同的&#xff0c;因为用户通常希望立即观…

机器学习入门实例-MNIST手写数据集-二分分类效果评估

接上文的Binary Classifier&#xff0c;将数据分成“是2”和“非2”两类。 Performance Measures 分类效果评价方法 Accuracy&#xff08;准确性&#xff09; y_train_2 (y_train 2) ... from sklearn.linear_model import SGDClassifier sgd_clf SGDClassifier(random_s…

连锁店销售管理系统有哪些功能?应该如何选购?

不管是直营还是加盟&#xff0c;想要实现门店的精细化管理&#xff0c;把不同门店的业绩做好&#xff0c;离不开连锁店销售管理系统的支持。 一款真正能够为连锁店经营带来帮助的连锁店销售管理系统应该具备哪些基本功能&#xff0c;以及选择连锁店销售管理系统时有哪些常见的问…

【科研工具】Zotero实现自动翻译

科研党基本都用过Zotero吧&#xff0c;方便文件管理和做笔记。我常使用的一款插件&#xff0c;可以实现paper英文内容的自动翻译为中文&#xff0c;非常简单、好用&#xff0c;现推荐给大家。 目录 一、下载zotero-pdf-translate插件 1.1 登录GitHub 1.2 找到.xpi文件并下载…

java 拼接字符串的方法

1.拼接字符串的方法&#xff0c;先要将字符串转化为数字类型&#xff0c;再根据需要拼接。这样可以避免直接拼接导致的错误。 2.将字符串转化为数字类型&#xff0c;这个就是一个循环。可以使用循环的方法&#xff0c;但是循环次数不宜太多&#xff0c;否则容易出错。 3.可以使…

微信小程序登陆(全流程-前后端)

环境要求 1.注册一个小程序 2.微信开发者工具 3.idea(springboot) 目录 项目准备 用户登陆 前端开发&#xff0c;传递code index.wxss index.js 后端编写&#xff0c;调用微信接口&#xff0c;获取openId 现在用户的所有信息都拿不到&#xff0c;只能用户自己填写 其…

MySQL的停止与启动、与客户端的连接(参见黑马程序员)

1、启动与停止 &#xff08;1&#xff09;Windowsr 输入 services.msc 在其中找MySQL并点鼠标右键&#xff0c;即可设定是停止还是启动 &#xff08;2&#xff09;以管理员身份打开cmd命令 &#xff08;具体步骤&#xff1a;左下角点搜索输入cmd&#xff0c;在出现的选项里…

数字温湿度传感器DHT11

今天我们来说说一个新的模块DHT11——温湿度传感器 顾名思义&#xff0c;通过开发DHT11能够进行温湿度检测&#xff0c;是一个非常实用且有趣的模块&#xff0c;下面我们先对DHT11基本信息做一个了解&#xff0c;然后进行开发。 DHT11的优点&#xff1a; ►相对湿度和温度测…

算法篇——N个数之和大集合(js版)

1.两数之和 给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出 和为目标值 target 的那 两个 整数&#xff0c;并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是&#xff0c;数组中同一个元素在答案里不能重复出现。 你可以按…

如何招生?一文教你高职院校有效的招生技巧

生源&#xff0c;是每一所高校的生存之本和生命线。 近几年招生宣传工作作为高职院校招生工作中的重要环节之一&#xff0c;具有政策性强&#xff0c;涉及面广&#xff0c;工作量大等特点&#xff0c;直接关系到学校可持续发展问题。 随着新媒体时代的发展&#xff0c;高职院…

炫酷的3DCSS卡片样式

先效果图展示&#xff1a; 再上代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><style>*,*::after,*::before {margin: 0;padding: 0;box-sizing: bord…

【LeetCode】94.二叉树的中序遍历

1.问题 给定一个二叉树的根节点 root &#xff0c;返回 它的 中序 遍历 。 示例 1&#xff1a; 输入&#xff1a;root [1,null,2,3] 输出&#xff1a;[1,3,2] 示例 2&#xff1a; 输入&#xff1a;root [] 输出&#xff1a;[] 示例 3&#xff1a; 输入&#xff1a;root […

Vue3中使用 EventBus 实现兄弟组件传参

前言&#xff1a;EventBus vue3中没有了&#xff0c;EventBus&#xff0c;所以我们要自己写&#xff0c;但是非常简单。 步骤一&#xff1a;创建&#xff08;EventBus 容器&#xff09; 在src目录&#xff0c;创建个bus文件夹&#xff0c;存放 自己建立的 bus.js class Bus…

Springboot 中快速完成文件上传,整合多平台神器

哈喽&#xff0c;大家好~ 又是做好人好事的一天&#xff0c;有个小可爱私下问我有没有好用的springboot文件上传工具&#xff0c;这不巧了嘛&#xff0c;正好我私藏了一个好东西&#xff0c;顺便给小伙伴们也分享一下&#xff0c;demo地址放在文末了。 文件上传在平常不过的一…