当前位置: 首页 > news >正文

【自然语言处理】调用NLTK数据失败‘wordnet‘和‘punkt‘不存在[Errno 11004]问题解决

wordnet报错

明明已经按照了nltk包,但使用 WordNet 语料库时依然报错提示数据不存,依据以下代码在python中下载wordnet仍然报错:

import nltk
nltk.download('wordnet')

运行后始终提示:

[nltk_data] Error loading wordnet: <urlopen error [Errno 11004]
[nltk_data]     getaddrinfo failed>
False

下载这个语料库需要翻墙,挂了梯子仍然报错,估计是网络原因已经不支持在线下载了。于是尝试手动下载。
NLTK数据库官网:https://github.com/nltk/nltk_data
在这里插入图片描述

在这里插入图片描述

再运行代码就没有问题了,但需要注意在代码中加入下面的代码以定位到自己的路径:

nltk.data.path.append('/path/to/custom/nltk_data')
#引号里是自己保存nltk数据的路径

punkt报错

好不容易解决了wordnet问题,运行到一半又提示punkt找不到了。在刚刚下载的文件夹中找到“tokenizers”文件夹,发现里面是有“punkt”文件夹的,但没有解压,把它解压一下就行。
在这里插入图片描述
在这里插入图片描述
需要注意:解压后一般会自动再创建一个punkt文件夹将解压后的文件嵌套在其中,由此出现/tokenizers/punkt/punkt的情况,这样会导致路径读取失败,所以需要删掉一个,挪一下位置,保证最后的路径是 /tokenizers/punkt,具体如下图所示。再回头运行代码就不会报错了。
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • BIO、NIO、AIO 有什么区别?
  • 机器学习模型中的因果关系:引入单调约束
  • 【SQL】常见语句合集
  • 景联文科技:专业图像采集服务,助力智能图像分析
  • Banana Pi BPI-SM9 AI 计算模组采用算能科技BM1688芯片方案设计
  • 如何打造在线音乐网站?java springboot架构,vue前端开发,音乐分享新体验
  • Linux基础操作
  • java xml 转json json 转 json对象
  • 【二等奖成品论文】2024年数学建模国赛B题25页成品论文+完整matlab代码、python代码等(后续会更新)
  • java设计模式--(行为型模式:策略模式、命令模式、责任链模式)
  • VScode 的简单使用
  • 结合Python与GUI实现比赛预测与游戏数据分析
  • 代码随想录Day 36|滑铁卢了,leetcode题目:1049.最后一块石头的重量、494.目标和、474.一和零
  • 通俗易懂理解Hive四种排序
  • 【C++二分查找】1818. 绝对差值和
  • [原]深入对比数据科学工具箱:Python和R 非结构化数据的结构化
  • 《Javascript高级程序设计 (第三版)》第五章 引用类型
  • HashMap ConcurrentHashMap
  • Js基础知识(四) - js运行原理与机制
  • Leetcode 27 Remove Element
  • MySQL用户中的%到底包不包括localhost?
  • SpringBoot几种定时任务的实现方式
  • WinRAR存在严重的安全漏洞影响5亿用户
  • 爱情 北京女病人
  • 彻底搞懂浏览器Event-loop
  • 飞驰在Mesos的涡轮引擎上
  • 关于springcloud Gateway中的限流
  • 前端js -- this指向总结。
  • 使用iElevator.js模拟segmentfault的文章标题导航
  • 双管齐下,VMware的容器新战略
  • 新书推荐|Windows黑客编程技术详解
  • 异常机制详解
  • 原生JS动态加载JS、CSS文件及代码脚本
  • 阿里云ACE认证学习知识点梳理
  • 我们雇佣了一只大猴子...
  • ​【经验分享】微机原理、指令判断、判断指令是否正确判断指令是否正确​
  • ​直流电和交流电有什么区别为什么这个时候又要变成直流电呢?交流转换到直流(整流器)直流变交流(逆变器)​
  • (6)设计一个TimeMap
  • (html转换)StringEscapeUtils类的转义与反转义方法
  • (JS基础)String 类型
  • (PyTorch)TCN和RNN/LSTM/GRU结合实现时间序列预测
  • (亲测有效)解决windows11无法使用1500000波特率的问题
  • (五)c52学习之旅-静态数码管
  • (转)Android中使用ormlite实现持久化(一)--HelloOrmLite
  • (转)人的集合论——移山之道
  • . ./ bash dash source 这五种执行shell脚本方式 区别
  • ./mysql.server: 没有那个文件或目录_Linux下安装MySQL出现“ls: /var/lib/mysql/*.pid: 没有那个文件或目录”...
  • .bat批处理(十一):替换字符串中包含百分号%的子串
  • .Net Core 中间件验签
  • .NET Core引入性能分析引导优化
  • .NET 将混合了多个不同平台(Windows Mac Linux)的文件 目录的路径格式化成同一个平台下的路径
  • .NET6 开发一个检查某些状态持续多长时间的类
  • .NetCore Flurl.Http 升级到4.0后 https 无法建立SSL连接
  • .NETCORE 开发登录接口MFA谷歌多因子身份验证
  • .NET的数据绑定