华为OD机试真题 Python 实现【知识图谱新词挖掘1】【2023Q1 100分】

news2024/11/24 9:45:43

在这里插入图片描述

目录

    • 一、题目描述
    • 二、输入描述
    • 三、输出描述
    • 四、解题思路
    • 五、Python算法源码
    • 六、效果展示
      • 1、输入
      • 2、输出
      • 3、说明

一、题目描述

小华负责公司知识图谱产品,现在要通过新词挖掘完善知识图谱。
新词挖掘: 给出一个待挖掘文本内容字符串Content和一个词的字符串word,找到content中所有word的新词。
新词:使用词word的字符排列形成的字符串。
请帮小华实现新词挖掘,返回发现的新词的数量。

二、输入描述

第一行输入为待挖掘的文本内容content
第二行输入为词word

三、输出描述

在中找到的所有word的新词的数量

四、解题思路

  1. 首先读取输入的待挖掘的文本内容 content 和词 word;
  2. 将词 word 转换为字符数组,并对字符数组进行排序,得到排好序的字符串 wordStr;
  3. 获取词 word 的长度 len;
  4. 初始化变量 count 为 0,用于记录新词的数量;
  5. 如果待挖掘文本内容的长度小于词的长度,则直接输出 count,表示没有新词;
  6. 使用循环从 0 到 line.length()-len,依次截取与词长度相等的子串进行处理:
    • 计算子串的结束位置 j;
    • 将子串转换为字符数组,并对字符数组进行排序,得到排好序的字符串 str2;
    • 如果 str2 与 wordStr 相等,则说明找到了一个新词,将 count 加一;
  7. 输出 count,即为发现的新词的数量;

五、Python算法源码

import sys
import itertools

content = sys.stdin.readline().strip()
word = sys.stdin.readline().strip()
word_len = len(word)

words = [''.join(res) for res in itertools.permutations(word, word_len)]

n = 0
for i, s in enumerate(content):
    if content[i: i + word_len] in words:
        n += 1

print(n)

六、效果展示

1、输入

nezhastudyjavaahz
zha

2、输出

2

3、说明

zha是zha的新词;
ahz是zha的新词;

在这里插入图片描述


🏆下一篇:华为OD机试真题 Python 实现【相对开音节】【2022Q4 100分】,附详细解题思路

🏆本文收录于,华为OD机试(Python)真题(A卷+B卷)

刷的越多,抽中的概率越大,每一题都有详细的答题思路、详细的代码注释、样例测试,订阅后,专栏内的文章都可看,发现新题目,随时更新,全天CSDN在线答疑。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/723352.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

apple pencil二代平替笔哪个好用?好用的苹果笔推荐

自从ipad和其他的平板电脑都搭配上了电容笔以后,电容笔很好地取代了我们的手指,书写的效率就大大提升了,但由于苹果原装电容笔的价格不够人性化,一直高居不下给普通人带来了很大的负担,特别是对于学生们来说&#xff0…

6个提高图片分辨率的在线网站,真的超级实用!

在日常生活中,我们经常会遇到保存的图片模糊不清的情况。有时候这可能是由于保存方式不当,有时候则是由于图片在上传至网站时被压缩所致,导致画质和分辨率下降。 那么,有没有办法可以提高图片的分辨率和画质呢?事实上…

【笔记】微机原理及接口技术5 -- MCS51单片机概述

MCS-51 CPU 由两个部分组成:运算器和控制器 运算器:算术逻辑单元(ALU)、位处理器、累加器 ACC 等组成; 控制器:主要有内部晶振和一些定时、控制逻辑组成 存储器 拥有三个存储器地址空间 程序存储器地址…

【内网穿透】Linux服务使用宝塔面板搭建网站,并内网穿透实现公网远程访问

文章目录 前言1. 环境安装2. 安装cpolar内网穿透3. 内网穿透4. 固定http地址5. 配置二级子域名6. 创建一个测试页面 转载自cpolar极点云文章:Linux使用宝塔面板搭建网站,并内网穿透实现公网访问 前言 宝塔面板作为简单好用的服务器运维管理面板&#xf…

第七章 商品详情三

流程: 1、用户在订单服务(192.168.232.101)下单后,订单服务以生产者身份往rabbitmq(192.168.232.104)推送消息,下单后将减库存信息推送到rabbitmq 2、数据worker(192.168.232.100&…

造船码头行车/电动葫芦限位器无线应用

一、应用背景 近年来,我国造船业在高技术船舶研发和建造方面持续取得新突破,据统计截止到2022年,我国造船业完工量、新接订单量、手持订单量三大指标国际市场份额均保持世界前列。连续13年位居全球居首。随着船舶制造的综合能力不断提高&…

【算法与数据结构】459、LeetCode重复的子字符串

文章目录 一、题目二、解法2.1 暴力破解法2.2 KMP算法2.3 Sunday算法2.4 官方查找算法 三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 2.1 暴力破解法 思路分析:子串多次循环才能构成整个…

【回溯算法part03】| 39.组合总和、40.组合总和||、131.分割回文串

目录 🎈LeetCode39. 组合总和 🎈LeetCode40.组合总和|| 🎈LeetCode131.分割回文串 🎈LeetCode39. 组合总和 链接:39.组合总和 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target ,找出 …

nuxt3 fullpage.js踩坑, fullpage.js 全屏滚动

nuxt3 fullpage.js踩坑, fullpage.js 全屏滚动, fullpage is underfind 我用的是 nuxt 3.6.1 1.引入 fullpage.js(3.0.1), 下载地址 github链接,下载后放到assets文件下 app: {head: {script: [{ src: /assets/fullpage.js, type: "text/javascript…

[BitSail] Connector开发详解系列二:SourceSplitCoordinator

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 ource Connector 本文将主要介绍创建、管理Split的角色SplitCoordinator。 SourceSplitCoordinator 大数据处理框架的核心目的就是将大规模的数据拆分成为多个合理…

皂液机低功耗红外测距感应方案 免触碰红外感应模块WTU201F2 B004

近年来,随着卫生意识的提高,自动感应设备在公共场所、家庭和工作场所中变得越来越重要。在这个领域中,皂液机的自动感应功能成为了关键。为了提供更为智能、高效的用户体验,深圳唯创知音推出了全新的皂液机红外测距感应方案——WT…

自动生成的webservice客户端设置请求消息头信息

这里讲的头消息是指发送webservice请求的HTTP头信息(MIME 头信息),而不是SOAP报文里面的Header标签内容。 package example;import mypackage.GetOperInfoRequest; import mypackage.GetOperInfoResponse; import mypackage.Webservice11; i…

怎么把MP3文件转换成OPUS,分享这两个方法给大家!

MP3和OPUS是两种常见的音频格式,用于存储和传输音乐、语音等内容。然而,随着技术的进步和需求的变化,有时我们需要将MP3文件转换为OPUS格式,以便在特定场景下获得更好的音频体验。本文将介绍两种简单而有效的方法,以帮…

flutter RepaintBoundary 截屏图片下载,保存图片不清晰的问题

flutter RepaintBoundary 截屏图片下载,保存图片不清晰的问题 前言一、什么是RepaintBoundary二、RepaintBoundary 能干什么三、RepaintBoundary 保存图片模糊的问题四、RepaintBoundary 使用小demo总结 前言 最近工作中,突然遇到截屏保存图片的问题&…

宝塔安装Jenkins-图文小白教程

一、Jenkins包下载 大家可以从Jenkins官网(https://www.jenkins.io/)根据自己的需要下载最新的版本。 但Jenkins官网下载较慢,容易造成下载失败。可以去国内的开源镜像网站下载Jenkins最新版本。目前博主使用的是清华大学的开源镜像网站&…

这样建立自己的『知识管理系统』,效率翻倍

在移动互联网时代,我们可以轻松获取大量的知识,但这些知识往往是碎片化的,没有系统性,缺乏深度。尽管我们努力学习了很多知识,但能力的提升却变得缓慢。 为了解决这个问题,我们需要建立一个系统化的知识体系…

【Leetcode】27.移除元素

给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素,并返回移除后数组的新长度。 不要使用额外的数组空间,你必须仅使用 O(1) 额外空间并原地修改输入数组。 元素的顺序可以改变。你不需要考虑数组中超出新长度后面的…

Gerrit REST API简单介绍

Gerrit是一款开源免费的代码审查工具,如果其它平台想要获取gerrit数据,比如统计仓库代码提交数据等信息,可以使用Gerrit提供的REST API来获取,本文记录一些我使用到的Gerrit API。 目录 准备工作gerrit APIGerrit REST API使用实例…

一例.bat脚本打包样本的分析

样本的基本信息 hosts.exe MD5: 72ddf833fa206326e15c2c97679d323e SHA1: ad148ff4b7f77831b469be8bb19d32d029c23b50banish.exe MD5: 4a43ea617017d5de7d93eb2380634eee SHA1: b0af5aa27cd0e49955f1ab2d18d69f7bc8fd4d21分析过程 查壳 脱掉upx壳,用IDA打开&…

【文件 part 6 - 格式化读写文件函数 随机读写】

格式化读写文件函数 /* 函数调用: */ fprintf ( 文件指针,格式字符串,输出表列); fscanf ( 文件指针,格式字符串,输入表列);/** 函数功能:* 从磁盘文件中读入或输出字符* fprint…