每日一题23：统计文本中单词出现的次数

news2026/2/14 19:02:56

一、每日一题

解答：

import pandas as pd
def count_occurrences(files: pd.DataFrame) -> pd.DataFrame:
    bull_cnt = len(files[files['content'].str.contains(r'\sbull\s')])
    bear_cnt = len(files[files['content'].str.contains(r'\sbear\s')])
    res_df = pd.DataFrame(
        {
            'word': ['bull', 'bear'],
            'count': [bull_cnt, bear_cnt]
        }
    )
    return res_df

题源：Leetcode

二、总结

files['content'].str.contains(r'\sbull\s'):

使用 str.contains() 方法来查找 content 列中包含匹配正则表达式 r'\sbull\s' 的行。
正则表达式 r'\sbull\s' 寻找以空白字符（空格）开头和结尾的 “bull” 字符串：
- \s 表示空白字符（比如空格、制表符等）。
- 因此，r'\sbull\s' 匹配的是整个单词 “bull”，而不会匹配诸如 “bulldog” 或 “bullish” 这样的部分匹配。

2024.5.26

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1697412.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【Text2SQL 论文】SeaD：使用 Schema-aware 去噪训练的 end2end 的 Text2SQL

论文：SeaD: End-to-end Text-to-SQL Generation with Schema-aware Denoising ⭐⭐ NAACL 2022, arXiv:2105.07911 本论文提出 SeaD 模型，使用 schema-aware 的去噪方法来训练一个 end2end、seq2seq 的 Transformer 模型来实现 Text2SQL。一、论文速读…

【LeetCode刷题记录】207.课程表

207 课程表你这个学期必须选修 numCourses 门课程，记为 0 到 numCourses - 1 。在选修某些课程之前需要一些先修课程。先修课程按数组 prerequisites 给出，其中 prerequisites[i] [ai, bi] ，表示如果要学习课程 ai 则必须先学习课程 b…

第20届文博会：“特别呈现”—周瑛瑾雷米·艾融双个展，著名美术评论家，批评家彭德教授对周瑛瑾作品进行评论

周瑛瑾不是学院派艺术家，但在彩墨画领域的天赋超出中国八大美院的同类型画家。相比具有批判意识的当代艺术，他的彩墨艺术如同我们这个苦难世界的创可贴和安慰剂。当我面对他的彩墨画，首先是惊艳，随之想到屈原的离骚，还…

淘工厂订单导出自动化工具

目录下载安装与运行主要目的其他工具的弊端本工具的优势视频演示下载新版后的注意事项支持的导出项什么叫一单多拍常见问题如何实现快捷登录导出卡住时如何操作如何精确导出下载安装与运行下载、安装与运行语雀主要目的导出订单信息&#xf…

【数据结构】哈希表的原理及其实现

文章目录哈希表的概念哈希函数的设计常见的哈希函数哈希冲突1. 闭散列代码实现 2. 开散列拉链法的优点针对开散列哈希的扩展基于开散列拉链法封装哈希表MyHash.h 基于哈希表实现unordered_map类Myunordered_map.h 基于哈希表实现unordered_set类Myunordered_map.h 哈希表的概…

Ethercat总线学习：CAN、CANopen、EtherCAT、PDO与SDO

各种XoE CoE是什么 CoE CAN application protocol Over EtherCAT，是EtherCAT应用层协议的一种，根据CiA402协议编写，使用对象和对象字典的功能来实现邮箱通讯。 PDO与SDO是常用的数据传输方式，他们在实现高效数据传输、同步方面发…

html中被忽略的简单标签

1： alt的作用是在图片不能显示时的提示信息 <img src"https://img.xunfei.cn/mall/dev/ifly-mall-vip- service/business/vip/common/202404071019208761.jp" alt"提示信息" width"100px" height"100px" /> 2&#…

Vue2基础及其进阶面试(二)

vue2的生命周期删除一些没用的 App.vue 删成这个样子就行 <template><router-view/></template><style lang"scss"></style>来到路由把没用的删除 import Vue from vue import VueRouter from vue-router import HomeView from .…

Java进阶学习笔记25——Objects类

为啥比较两个对象是否相等，要用Objects的equals方法，而不是用对象自己的equals方法来解决呢？ Objects： Objects类是一个工具类，提供了很多操作对象的静态方法供我们使用。 package cn.ensource.d14_objects;import ja…

无货源抖店怎么起店？教你两种起店方法，记得收藏！

大家好，我是喷火龙。开通抖音小店之后最重要的一步就是起店了，今天就给大家分享两种起店方法。大家都知道，产品是做店的核心，品不行，就算平台给你免费的流量，那你也承接不住。第一个，商品卡…

Steam在连接至服务器发生错误/连接服务器遇到问题解决办法

Steam作为全球最大的数字游戏分发平台，构建了一个活跃的玩家社区，用户可以创建个人资料，添加好友，组建群组，参与讨论，甚至直播自己的游戏过程。通过创意工坊，玩家还能分享自制的游戏模组、地图、…

【古董技术】ms-dos应用程序的结构

序制定一个MS-DOS应用程序计划需要认真分析程序的大小。这种分析可以帮助程序员确定MS-DOS支持的两种程序风格中哪一种最适合该应用程序。.EXE程序结构为大型程序提供了好处，因为所有.EXE文件之前都有额外的512字节（或更多）的文件头。另一方…

跨境选品师不是神话：普通人也能轻松掌握，开启全球贸易新篇章！

随着互联网技术的飞速发展，跨境电商行业已成为全球经济的新增长点。在这个背景下，一个新兴的职业——跨境选品师，逐渐走进了人们的视野。那么，跨境选品师究竟是做什么的?普通人又该如何成为优秀的跨境选品师呢? 一、跨境选品师的…

Docker compose 的方式一键部署夜莺

官方安装文档：https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v7/install/docker-compose/ 介绍：夜莺监控是一款开源云原生观测分析工具，采用 All-in-One 的设计理念，集数据采集、可视化、监控告警、数据分析…