书生大模型实战营-入门关卡-Python 基础知识

news2024/11/5 20:14:18

任务: https://github.com/InternLM/Tutorial/blob/camp3/docs/L0/Python/task.md

完成:

任务1:Python实现wordcount

import re
from collections import defaultdict

def wordcount(text):
    # 转换为小写并使用正则表达式分割单词
    words = re.findall(r'\b\w+\b', text.lower())
    
    # 使用 defaultdict 来自动处理字典中不存在的键
    word_counts = defaultdict(int)
    
    # 统计每个单词出现的次数
    for word in words:
        word_counts[word] += 1
    
    return dict(word_counts)


if __name__ == "__main__":
    # 示例
    text = "One, world! one dream."
    result = wordcount(text)
    print(result)

任务2:Vscode连接InternStudio debug笔记

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1991221.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

单细胞测序全基因组扩增(WGA)方法

1. 全基因组扩增(whole-genome amplification, WGA) 单细胞扩增能将pg级或fg级的单细胞DNA扩增为可满足测序要求的ug级DNA量,从而使单细胞测序变为可能。目前存在的主要三种扩增方法有:简并寡核苷酸引物PCR扩增&#…

一起学习LeetCode热题100道(32/100)

32.随机链表的复制(学习) 给你一个长度为 n 的链表,每个节点包含一个额外增加的随机指针 random ,该指针可以指向链表中的任何节点或空节点。 构造这个链表的 深拷贝。 深拷贝应该正好由 n 个 全新 节点组成,其中每个新节点的值都设为其对应…

LLM - 使用 Ollama + OpenWebUI 在 Linux 服务器中高效部署大语言模型

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/140992533 免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。 Ollama 是一个开源的大型语言模型(LLM)服务工具,目的是简化本地运行…

java消息队列ActiveMQ

安装 前置条件 activemq的运行依赖于jdk,需要提前安装jdk如果已经安装了jdk,需要根据jdk的版本来选择对应的版本进行安装activemq版本对应在官网上,使用java -version 看jdk的版本注意:jdk和mq的版本不一致会报错,电脑…

Python 异步编程:Sqlalchemy 异步实现方式

SQLAlchemy 是 Python 中最流行的数据库工具之一,在新版本中引入了对异步操作的支持。这为使用异步框架(如 FastAPI)开发应用程序带来了极大的便利。在这篇文章中,简单介绍下 SQLAlchemy 是如何利用 Greenlet 实现异步操作的。 什…

【计算机组成原理】2.CPU的原理

CPU的原理 为什么讲线程要讲CPU?因为线程和CPU有一对一的对应关系!(超线程除外) 当然,现代的计算机的核心,也就是芯片,是由10 0000 0000 个零件构成,我没有办法带你走遍这里面的每…

java.nio.charset.MalformedInputException: Input length = 1

1、问题 项目启动报错: Exception in thread "main" org.yaml.snakeyaml.error.YAMLException: java.nio.charset.MalformedInputException: Input length 1提示原因: Caused by: java.nio.charset.MalformedInputException: Input length 1…

机器学习-线性回顾

线性回归 线性回归1. 简介2. 线性回归问题求解3. 欠拟合与过拟合 线性回归 1. 简介 """ 简介:定义:利用回归方程对一个或多个自变量(特征值)和因变量(目标值)之间关系 进行建模的一种分析方式公式:见下图分类:一元线性回归:目标值与一个因变量有关系多远线性回…

PMP–知识卡片--盈亏平衡分析

盈亏平衡分析是通过盈亏平衡点(BEP)分析项目成本与收益的平衡关系的一种方法。各种不确定因素(如投资、成本、销售量、产品价格、项目寿命期等)的变化会影响投资方案的经济效果,当这些因素的变化达到某一临界值时&…

S2S服务端上报Appsflyer和Firebase事件

S2S 服务端上报 Appsflyer 和 Firebase 事件 Appsflyer 事件上报 接口文档地址:Send Event 你可以在 appsflyer 注册一个测试 APP 用于测试,选择 Android 项目比较好创建。 必填参数及 Api Secret 获取 点击在页面左侧 “Configuration - App Setting…

CentOS 介绍

引出 Linux 系统内核与 Linux 发行套件系统的区别? Linux 系统内核指的是一个由 Linus Torvalds(Linux之父,内核主要开发者)负责维护,提供硬件抽象层、磁盘、文件系统控制及多任务功能的系统核心程序。 Linux 发行套…

【Git】VS Code 中文件右侧字母(A M U)含义

VS Code项目关联git后,常常会出现如下标识 其中 M Modified 已经在仓库中添加过该文件,然后你对这个文件进行了修改,就会文件后标记M U Untracked 本地新建了这个文件,还未提交到仓库上,就会标记U D Delete 本…

sourcemap使用

sourcemap是什么以及怎么生成就不过多阐述了,这是之前看到的一篇文章感觉介绍的很详细:弄懂 SourceMap,前端开发提效 100% 浏览器加载sourcemap 我们线上代码一般不会开启sourcemap,在排查线上的问题时,可以通过浏览器…

信创安全 | 新一代内网安全方案—零信任沙盒

在当今数字化时代,访问安全和数据安全成为企业面临的重要挑战。传统的边界防御已经无法满足日益复杂的内网办公环境,层出不穷的攻击手段已经让市场单一的防御手段黔驴技穷。当企业面临越来越复杂的网络威胁和数据泄密风险时,更需要一种综合的…

S4 HANA标准现金流量表(IDCNCASH、J3RKKRS、J3RKKRD)

文章目录 一、概述二、配置2.1、路径2.2、说明事项2.3、现金流项目及会计科目 一、概述 传统输出现金流量表步骤(直接法现金流表): 定义现金流变动相关的原因代码(Reason Code);过账凭证里指定对应的原因…

python开发上位机 - PyCharm环境搭建、安装PyQt5及工具

目录 简介: 一、安装PyCharm 1、下载 PyCharm 2、PyCharm安装 1)配置安装目录 2)安装选项 3、问题及解决方法 二、安装PyQt5 1、打开 Pycharm,新建 Project 2、安装 pyqt5 3、安装很慢怎么办? 4、安装 pyq…

数据库规范化设计 5大基本原则

规范化设计原则是数据库设计的基本原则,有助于减少数据冗余,提高数据一致性和完整性,简化数据管理,增强数据安全性,对整个开发项目至关重要。而缺乏规范化设计会导致数据冗余,增加存储成本,引发…

【视频编码】调用x264库文件实现编码

调用x264库文件实现编码 整理前面记录的文章时发现还没有记录过如何实际操作x264编码器实现编码的功能,过去是通过FFmpeg调用libx264的接口来实现编码功能,这里记录一下直接调用x264的接口来实现编码的功能,同时存储编码之后的码流和重建的yu…

线上预约陪诊平台医院陪诊系统源码就医陪护小程序APP开发

项目分析 随着医疗行业的数字化转型和人们对健康需求的日益增长,线上预约陪诊系统作为一种新兴的医疗服务模式,正逐渐受到市场的关注和认可。本文将从市场前景、使用人群、盈利模式以及竞品分析等多个角度,全面探讨线上预约陪诊系统的技术性…

Windows长文件名支持

Windows 长文件名支持 🍔打开注册表🥗激活 🍔打开注册表 🥗激活 计算机\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem双击进入编辑模式 把0改成1,确定