当前位置: 首页 > news >正文

python下载网站数据-Python下载网络文本数据到本地内存的四种实现方法示例

本文实例讲述了Python下载网络文本数据到本地内存的四种实现方法。分享给大家供大家参考,具体如下:

import urllib.request

import requests

from io import StringIO

import numpy as np

import pandas as pd

"""

下载网络文件,并导入CSV文件作为numpy的矩阵

"""

# 网络数据文件地址

url = "http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data"

# 方法一

# ========================================================

# 下载文件

#r = urllib.request.urlopen(url)

# 导入CSV文件作为numpy的矩阵

#dataset = np.loadtxt(r, delimiter=",")

# 方法二

# ========================================================

# 下载文件

#r = requests.get(url)

# 导入CSV文件作为numpy的矩阵

#dataset = np.loadtxt(StringIO(r.text), delimiter=",") # 此处用到 StringIO !!!!!!

# 方法三

# ========================================================

#用genfromtxt直接下载网络文件,并将CSV文件导作numpy矩阵。爽!!!!!!!!

#dataset = np.genfromtxt(url, delimiter=",")

# 方法四

# ========================================================

# 用pandas.read_csv直接下载网络文件,并将CSV文件导作pandas.DataFrame。

# dataset = pd.read_csv("http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv", index_col=0)

dataset = pd.read_csv(url)

# ========================================================

# separate the data from the target attributes

X = dataset[:,0:7]

y = dataset[:,8]

print(X)

#print(y)

希望本文所述对大家Python程序设计有所帮助。

相关文章:

  • 嵌入式linux驱动程序设计从入门到精通_嵌入式Linux入门六部曲《新手请进》
  • g-sync钟摆演示怎么用_【软件工具】放映前应做些什么?放映中的问题如何解决?|PPT演示技术问题最全解答...
  • iPhone清理喇叭灰尘_一键重启,喇叭清灰...捷径来了
  • 如何升级浏览器_增值税发票管理系统2.0版升级上线啦!(附重要提醒)
  • 两个特征是独立好还是正相关好_不想恋爱的女生特征有哪些?这样的女生就别招惹她了...
  • 初一下册地理学霸笔记_部编人教版初中历史,初一(七年级),初二(八年级),初三(九年级)上下册,历史教材电子课本,欢迎关注!...
  • 液晶显示屏怎么显示泰文_广州TFT液晶显示屏多少钱
  • 苹果系统和windows系统怎么切换_MAC系统与Windows系统的对比与选择
  • 开发好还是实施好_2020年开发app好还是小程序好
  • matlab用regress方法求ln函数_高中数学:52种快速做题方法,公式定理结合,帮你快速搞定...
  • python编辑器是什么_世界上最好的Python编辑器是什么?我投PyCharm一票
  • python元组操作_Python 元组(Tuple)操作详解
  • python兼职平台信号处理_基于Python的数字信号处理初步
  • 安装python要注意什么_Python安装注意事项
  • c++定义一个动态对象数组_如何在Python中自定义一个可被调用的对象实例?
  • [译] 怎样写一个基础的编译器
  • 《Javascript高级程序设计 (第三版)》第五章 引用类型
  • 【391天】每日项目总结系列128(2018.03.03)
  • CSS 三角实现
  • ES6系统学习----从Apollo Client看解构赋值
  • Java 23种设计模式 之单例模式 7种实现方式
  • MySQL的数据类型
  • nginx(二):进阶配置介绍--rewrite用法,压缩,https虚拟主机等
  • PHP 7 修改了什么呢 -- 2
  • Spark in action on Kubernetes - Playground搭建与架构浅析
  • 案例分享〡三拾众筹持续交付开发流程支撑创新业务
  • 彻底搞懂浏览器Event-loop
  • 从PHP迁移至Golang - 基础篇
  • 基于Vue2全家桶的移动端AppDEMO实现
  • 将回调地狱按在地上摩擦的Promise
  • 如何利用MongoDB打造TOP榜小程序
  • 如何实现 font-size 的响应式
  • 什么软件可以剪辑音乐?
  • 算法-图和图算法
  • 为什么要用IPython/Jupyter?
  • 我的业余项目总结
  • 在Unity中实现一个简单的消息管理器
  • 容器镜像
  • 专访Pony.ai 楼天城:自动驾驶已经走过了“从0到1”,“规模”是行业的分水岭| 自动驾驶这十年 ...
  • ​比特币大跌的 2 个原因
  • $Django python中使用redis, django中使用(封装了),redis开启事务(管道)
  • %3cscript放入php,跟bWAPP学WEB安全(PHP代码)--XSS跨站脚本攻击
  • (0)Nginx 功能特性
  • (01)ORB-SLAM2源码无死角解析-(66) BA优化(g2o)→闭环线程:Optimizer::GlobalBundleAdjustemnt→全局优化
  • (27)4.8 习题课
  • (C语言版)链表(三)——实现双向链表创建、删除、插入、释放内存等简单操作...
  • (Demo分享)利用原生JavaScript-随机数-实现做一个烟花案例
  • (javascript)再说document.body.scrollTop的使用问题
  • (WSI分类)WSI分类文献小综述 2024
  • (超简单)使用vuepress搭建自己的博客并部署到github pages上
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (原創) 人會胖會瘦,都是自我要求的結果 (日記)
  • (转)Oracle存储过程编写经验和优化措施
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • .mkp勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复