基于开源WQ装备知识图谱的智能问答优化2

news2024/9/29 13:31:24

基于笔者之前写的博客基础上:https://blog.csdn.net/zhanghan11366/article/details/142139488【基于开源WQ装备知识图谱的智能问答全流程构建】进行优化。新增处理基于特定格式下的WQ文档,抽取文档的WQ属性和关系,并抽取对应WQt图片存储至minio中。

1 文档格式如下:

在这里插入图片描述

2 提取文档中的WQ信息

  • 配置如下:
import argparse

class Args:
    @staticmethod
    def parse():
        parser = argparse.ArgumentParser()
        return parser

    @staticmethod
    def initialize(parser):
        parser.add_argument('--weapon_realtion_api', default='http://0.0.0.0:6410/weapon',
                            help='Weapons and equipment relationship extraction API interface')
        parser.add_argument('--word_extraction_api', default='http://1.95.39.242:2011/attribute_all',
                            help='Parse word documents and extract weapons and equipment attributes api interface')
        parser.add_argument('--neo4j_url', default='bolt://localhost:7687',
                            help='neo4j login website')
        parser.add_argument('--neo4j_usename', default='neo4j',
                            help='neo4j login username')
        parser.add_argument('--neo4j_password', default='neo4jZH',
                            help='neo4j login password')
        parser.add_argument('--unstr_file_path', default='./data/unstr/武器装备-test.docx',
                            help='Unstructured document parsing path')
        parser.add_argument('--unstr_save_file_path', default='./data/unstr/word_weapon_basic_info.txt',
                            help='The path to save the unstructured document after parsing')
        parser.add_argument('--weapon_input_file', default='./data/weapon/weapon_data.txt',
                            help='Weapons and equipment relationship extraction input address')
        return parser

    def get_parser(self):
        parser = self.parse()
        parser = self.initialize(parser)
        return parser.parse_args()
  • 提取代码
import requests, config

# 调用
args = config.Args().get_parser()

def get_word_weapon(file_path):
    # 发送 POST 请求并上传文件
    with open(file_path, 'rb') as file:
        files = {'file': file}
        response = requests.post(args.word_extraction_api, files=files)
    # 检查响应状态码
    if response.status_code == 200:
        try:
            # 尝试以 JSON 格式解析响应
            response_json = response.json()
            return response_json.get('data')
        except ValueError:
            print("响应不是 JSON 格式:")
            print(response.text)
    else:
        print(f"请求失败,状态码: {response.status_code}")
        print(f"响应内容: {response.text}")


def save_word_weapon_basic_info(weapon_data, file_path):
    # 循环每个武器数据,将其基本情况写入TXT文件
    with open(file_path, 'w', encoding='utf-8') as file:
        for weapon in weapon_data:
            basic_info = weapon['基本情况'].replace('\n', ' ')
            file.write(basic_info + '\n')  # 换行区分不同武器的信息
    print(f"武器的基本情况已保存至 {file_path}")


if __name__ == "__main__":
    # 文件路径
    weapon_data = get_word_weapon(args.unstr_file_path)
    save_word_weapon_basic_info(weapon_data, args.unstr_save_file_path)
  • 其中接口信息如下:
    在这里插入图片描述

3 图文匹配

抽取对应WQt图片存储至minio中,结果如下。
在这里插入图片描述
后续流程与https://blog.csdn.net/zhanghan11366/article/details/142139488【基于开源WQ装备知识图谱的智能问答全流程构建】一致。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2176852.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

支付宝开放平台-开发者社区——AI 日报「9 月 29 日」

1 支付宝进军大模型医疗应用,技术一号位:我们有4个切入点 量子位|阅读原文 面对来势汹汹的大模型应用浪潮,支付宝医疗技术一号位魏鹏这样说道。今年,蚂蚁大举进军医疗,已是再明显不过。作为蚂蚁大模型应用…

零基础快速上手JAVA代码审计

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 《Java代码审…

吐血整理:国内一站式儿童有声绘本创作平台

儿童绘本儿童故事这个领域在Stable Diffusion、Midjourney、ChatGPT产品推出后开始有大量自媒体达人纷纷发布教程,热度一直都在。但由于创作门槛较高、需要对AI类和制作类软件都需要掌握、流程制作复杂,且由于创作者提示词的影响出图效果不稳定&#xff…

LeetCode 面试经典150题 69.x的平方根

题目:给你一个非负整数 x ,计算并返回 x 的 算术平方根 。 由于返回类型是整数,结果只保留 整数部分 ,小数部分将被 舍去 。注意:不允许使用任何内置指数函数和算符,例如 pow(x, 0.5) 或者 x ** 0.5 。 思…

「实战应用」如何用DHTMLX Gantt集成工具栏部件更好完成项目管理?

DHTMLX Gantt是用于跨浏览器和跨平台应用程序的功能齐全的Gantt图表。可满足项目管理应用程序的所有需求,是最完善的甘特图图表库。 今天给大家分享一种方法,通过将DHTMLX Gantt集成工具栏来简化交互,为此选用了DHTMLX Suite的Toolbar&#…

互联网大厂不喜欢提拔老实人,因为老实人除了老实和干活踏实之外,在职场没其他优点...

上一篇:一线体面男的收入 最近,在互联网上有一个热门的话题,戳中了很多人的内心。 一位来自互联网的朋友发帖吐槽职场,说领导都不喜欢提拔老实人。因为老实人一般除里老实和干活踏实外,在职场基本没有其他的优点&#…

L8打卡学习笔记

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 SVM与集成学习 SVMSVM线性模型SVM非线性模型SVM常用参数 集成学习随机森林导入数据查看数据信息数据分析随机森林模型预测结果结果分析 个人总结 SVM 超平面&…

Windows如何远程Kylin系统

Windows如何远程Kylin系统 一. 配置 yum源 二. 清理yum缓存 三. 安装VNC并配置 nkvers yum install tigervnc tigervnc-server -ycp /lib/systemd/system/vncserver.service /etc/systemd/system/vncserver:1.service 说明:vncserver:1.service中的:1表…

HCIP和HCIE有什么区别呢?

HCIP和HCIE有什么区别呢?今天给大家介绍下两者的不同 ‌认证层次‌:HCIE屹立于华为认证体系的顶端,定位为专家级认证;而HCIP则位于中坚位置,属于中级认证。 难度与专业要求‌:通往HCIE之路布满挑战&…

refline.js, 一款开箱即用的参考线吸附插件

嗨, 大家好, 我是徐小夕. 之前一直在社区分享零代码&低代码的技术实践,也陆陆续续设计并开发了多款可视化搭建产品,比如: H5-Dooring(页面可视化搭建平台)橙子试卷(表单搭建引擎)flowmix/fl…

Linux设备上cifx板卡作为ethercat从站的调试记录

调试目标: PC主机作为ethercat主站,linux设备上的cifx板卡作为ethercat从站,实现两边的正常交互。 环境准备: windows系统的PC,PC上的intel网卡(必须选用支持做主站的网卡型号),l…

【YashanDB知识库】GBK库,生僻字插入nvarchar2字段后乱码问题

本文内容来自YashanDB官网,具体内容可见(https://www.yashandb.com/newsinfo/7488287.html?templateId1718516) 问题现象 如下SQL,插入的人名中有两个GBK生僻字“ ”和“ ”,GBK编码中没有这两个字符。 插入后,客户端utf8编码…

【Router】路由功能之端口转发(Port Forward)功能介绍及实现

端口转发(Port Forward) 端口转发是一种网络技术,它允许将传入到一个网络设备特定端口的网络流量转发到另一个设备的特定端口上,端口转发会创建一条通过路由器的路径,以便数据包可以到达网络内的设备。在路由器中创建端…

区块链:数据安全与透明的未来触手可及

在这个数字化的时代,信息的安全与透明性就像社会发展的两根支柱,愈发显得重要。而区块链技术的崛起,宛如一道耀眼的曙光,照亮了我们面临的挑战。简单来说,区块链是一种去中心化的数据库技术,它允许信息在多…

大语言模型(LLM)效率优化技术全面综述:模型优化、数据优化、框架优化

大语言模型(LLMs)在自然语言理解、语言生成和复杂推理等重要任务中展示了显著的能力,并且有潜力对我们的社会产生重大影响。然而,这些能力伴随着它们所需的大量资源,突出了开发有效技术以解决它们的效率挑战的强烈需求…

深入浅出MongoDB(三)

深入浅出MongoDB(三) 文章目录 深入浅出MongoDB(三)复制副本集设置分片分片实例备份与恢复监控ObjectId 复制 复制时将数据同步在多个服务器的过程,提供了数据的冗余备份,在多个服务器上存储数据副本&#…

操作平台使用中应每月不少于几次定期检查?

在当今数字化时代,操作平台作为企业与个人日常运营的核心载体,其稳定性和安全性直接关系到业务的高效运行与数据的严密保护。因此,定期进行操作平台的检查与维护,成为了不可忽视的重要环节。特别是,确保每月进行不少于…

肯富来 CRM 数字化项目启动,引领企业“智”变新时代

近年来,广东肯富来泵业股份有限公司(以下简称“肯富来”)开启企业数字化、智能化转型之路,利用云计算技术贯通全制程的信息化管理系统、通过高速网络端到端全覆盖实现生产可视化,并通过远程数据系统,帮助客…

日志的艺术:深入理解 spdlog

目录 1. 为什么需要日志? 2. 同步日志 vs. 异步日志 3. spdlog 的核心组成部分 4. 如何创建一个Logger 5. 如何选择输出目标(Sink) 6. 个性化你的日志格式 7. 异步日志的魔法 8. 刷新策略:何时将日志写入 9. 调整线程池&…

强化学习入门——Pybullet初体验

Pybullet 最近一直在想如何进行RL的学习,在学习RL的过程中,好的模拟仿真平台是非常重要的。除了Gym,还了解到Pybullet模块可以简便快捷地创建仿真环境,所以学习一下。 1.简介 PyBullet 是一个用于机器人学、游戏开发和图形研究…