当前位置: 首页 > news >正文

入门岛2-python实现wordcount并进行云端debug

书生大模型学习
任务:
1.实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出现的次数。
2.Vscode连接InternStudio debug
TIPS:记得先去掉标点符号,然后把每个单词转换成小写。不需要考虑特别多的标点符号,只需要考虑实例输入中存在的就可以。

任务1

python基础

1.大小写转换函数

text = text.lower() //小写
text = text.upper()	//大写

2.去掉标点符号
可以使用re或者string库处理

import re
//1.使用re库:正则表达式进行删除
text = re.sub(r'[^\w\s]','',text)

这里,re.sub() 函数用于替换匹配到的模式,而 r’[^\w\s]’ 是一个正则表达式,表示“非单词字符且非空白字符”的任何字符。
\w 匹配任何字母数字字符(等同于 [a-zA-Z0-9_])。
\s 匹配任何空白字符(如空格、制表符等)。
^ 在方括号内表示“非”。
re.sub() 将这些字符替换为空字符串(即删除它们),从而达到去除标点符号的目的。

//2.使用string库:去掉标点字符
import string
translator = str.maketrans('', '', string.punctuation)# 使用 translate() 方法去除标点符号	
text=text.translate(translator)

具体来说,我们可以利用 string 模块中的 punctuation 字符串,它包含了所有的标点符号,然后使用 str.translate() 方法来删除这些字符。
3.字符分割为列表
以空格为分割符号的分割函数

    # 拆分字符串为单词列表words = text.split()

split() 是字符串的一个方法,用于根据分隔符将字符串分割成一个列表。如果不提供任何参数,默认情况下 split() 方法会按照任意数量的空白字符(空格、制表符、换行符等)作为分隔符来分割字符串。
4.列表归档到字典
遍历列表,当存在该字符串则count+1,否则创建并赋值为1。

# 创建一个空字典用于存储单词出现次数word_count_dict = {}for word in words:if word in word_count_dict:word_count_dict[word]+=1else:word_count_dict[word] = 1

算法实现如下:

import string ,re
text = """
Got this panda plush toy for my daughter's birthday,
who loves it and takes it everywhere. It's soft and
super cute, and its face has a friendly look. It's
a bit small for what I paid though. I think there
might be other options that are bigger for the
same price. It arrived a day earlier than expected,
so I got to play with it myself before I gave it
to her.
"""
def wordcount(text):text = text.lower()print(text)  # 小写# 去除标点符号只保留字母和空格# text = re.sub(r'[^\w\s]','',text)translator = str.maketrans('', '', string.punctuation)# 使用 translate() 方法去除标点符号	text=text.translate(translator)# 拆分字符串为单词列表words = text.split()# 创建一个空字典用于存储单词出现次数word_count_dict = {}for word in words:if word in word_count_dict:word_count_dict[word]+=1else:word_count_dict[word] = 1# print(word_count_dict)return word_count_dict
print(wordcount(text))

输出情况:
在这里插入图片描述

任务2

1.连接服务器并打开调试
在这里插入图片描述
2.点击左边的运行与调试(或右上角选择下图所示选项)
在这里插入图片描述
出现如下图所示的界面,其中左上角为运行到当前断点状态下的参数信息,包括local和global的参数,global参数
在这里插入图片描述
中间的选项分别为继续,逐过程,单步调试,单步跳出,重启调试,停止调试。
在这里插入图片描述
左侧的参数表可以右键进行针对监控。
在这里插入图片描述

vscode支持通过remote的方法连接我们在命令行中发起的debug server

选择debugger时选择python debuger。选择debug config时选择remote attach(远程连接)就行,随后会让我们选择debug server的地址,因为我们是在本地debug,所以全都保持默认直接回车就可以了,也就是我们的server地址为localhost:5678。
在这里插入图片描述
选择后再进行debug出现debug选项
在这里插入图片描述

在命令行中发起debug

很多时候我们要debug的不止是一个简单的python文件,而是很多参数,参数中不止会有简单的值还可能有错综复杂的文件关系,甚至debug一整个项目。这种情况下,直接使用命令行来发起debug会是一个更好的选择。
如果没有安装debugpy的话可以先通过pip install debugpy安装一下

python -m debugpy --listen 5678 --wait-for-client ./python_code/temp.py

./temp.py可以替换为我们想要debug的python文件,后面可以和直接在命令行中启动python一样跟上输入的参数。记得要先在想要debug的python文件打好断点并保存。

–wait-for-client参数会让我们的debug server在等客户端连入后才开始运行debug。在这就是要等到我们在run and debug界面启动debug。
先在终端中发起debug server,然后再去vscode debug页面单击一下绿色箭头开启debug。
效果如下:
在这里插入图片描述

使用别名简化命令

这边有个不方便的地方,python -m debugpy --listen 5678 --wait-for-client这个命令太长了,每次都打很麻烦。这里我们可以给这段常用的命令设置一个别名。

在linux系统中,可以对 ~/.bashrc 文件中添加以下命令

alias pyd='python -m debugpy --wait-for-client --listen 5678'

然后执行

source ~/.bashrc

这样之后使用 pyd 命令(你可以自己命名) 替代 python 就能在命令行中起debug了,之前的debug命令就变成了

pyd ./python_code/temp.py

运行如下:
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • git中如何修改提交信息(版本号)
  • Linux系统安全及应用(一):密码安全、命令历史限制、终端自动注销、su命令和限制su命令
  • 停止项目大小调整,开始搜索层自动缩放!
  • HarmonyOS.FA开发流程
  • 企业微信推送消息的Java实现教程
  • 解决svn上传代码,遇到文件冲突的问题
  • Python必备——高效配置与使用Pip换源
  • C++ | Leetcode C++题解之第331题验证二叉树的前序序列化
  • 【从零开始一步步学习VSOA开发】发布订阅重连时同步
  • 代码随想录算法训练营Day26 | Leetcode 455 分发饼干 Leetcode 376 摆动序列 Leetcode 53 最大子序和
  • 【CSharp】简单定义一个异步方法
  • python连接MySQL数据库使用pymysql
  • 嵌入式day25
  • SAP与网易大数据系统集成案例
  • C++实现单例模式/工厂模式
  • 【笔记】你不知道的JS读书笔记——Promise
  • cookie和session
  • ES6 学习笔记(一)let,const和解构赋值
  • js ES6 求数组的交集,并集,还有差集
  • Median of Two Sorted Arrays
  • php ci框架整合银盛支付
  • Python 反序列化安全问题(二)
  • spring cloud gateway 源码解析(4)跨域问题处理
  • SpringBoot几种定时任务的实现方式
  • windows下使用nginx调试简介
  • 百度地图API标注+时间轴组件
  • 从零开始的无人驾驶 1
  • 发布国内首个无服务器容器服务,运维效率从未如此高效
  • 浮现式设计
  • 来,膜拜下android roadmap,强大的执行力
  • 如何优雅地使用 Sublime Text
  • 什么软件可以剪辑音乐?
  • 我看到的前端
  • 以太坊客户端Geth命令参数详解
  • ‌JavaScript 数据类型转换
  • #进阶:轻量级ORM框架Dapper的使用教程与原理详解
  • (day18) leetcode 204.计数质数
  • (笔记)M1使用hombrew安装qemu
  • (补充):java各种进制、原码、反码、补码和文本、图像、音频在计算机中的存储方式
  • (二)什么是Vite——Vite 和 Webpack 区别(冷启动)
  • (实战篇)如何缓存数据
  • (译) 函数式 JS #1:简介
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • *2 echo、printf、mkdir命令的应用
  • .DFS.
  • .form文件_一篇文章学会文件上传
  • .NET Compact Framework 多线程环境下的UI异步刷新
  • .NET Core中如何集成RabbitMQ
  • .Net 路由处理厉害了
  • .Net 转战 Android 4.4 日常笔记(4)--按钮事件和国际化
  • .NetCore部署微服务(二)
  • .NET未来路在何方?
  • /var/log/cvslog 太大
  • /var/spool/postfix/maildrop 下有大量文件
  • :“Failed to access IIS metabase”解决方法