当前位置: 首页 > news >正文

数据库实践

一.数据库简介

  1.数据库是一个非常神奇的存在,它是是按照 数据结构来组织、 存储和管理数据的仓库我们可以使用它对数据进行储存和管理!

  2.关于sqlite3的学习,SQLite3 可使用 sqlite3 模块与 Python 进行集成。

语句内容
sqlite3.connect(database [,timeout ,other optional arguments])该 API 打开一个到 SQLite 数据库文件 database 的链接。timeout 参数表示连接等待锁定的持续时间,直到发生异常断开连接。timeout 参数默认是 5.0(5 秒)。如果给定的数据库名称 filename 不存在,则该调用将创建一个数据库。如果您不想在当前目录中创建数据库,那么您可以指定带有路径的文件名,这样您就能在任意地方创建数据库。
connection.cursor([cursorClass])该例程创建一个 cursor,将在 Python 数据库编程中用到。
cursor.execute(sql [, optional parameters])该例程执行一个 SQL 语句。该 SQL 语句可以被参数化(即使用占位符代替 SQL 文本)。sqlite3 模块支持两种类型的占位符:问号和命名占位符(命名样式)。
connection.execute(sql [, optional parameters])该例程是上面执行的由光标(cursor)对象提供的方法的快捷方式,它通过调用光标(cursor)方法创建了一个中间的光标对象,然后通过给定的参数调用光标的 execute 方法。
cursor.executemany(sql, seq_of_parameters)该例程对 seq_of_parameters 中的所有参数或映射执行一个 SQL 命令。
connection.executemany(sql[, parameters])该例程是一个由调用光标(cursor)方法创建的中间的光标对象的快捷方式,然后通过给定的参数调用光标的 executemany 方法。
cursor.executescript(sql_script)该例程一旦接收到脚本,会执行多个 SQL 语句。它首先执行 COMMIT 语句,然后执行作为参数传入的 SQL 脚本。所有的 SQL 语句应该用分号(;)分隔。
connection.executescript(sql_script)该例程是一个由调用光标(cursor)方法创建的中间的光标对象的快捷方式,然后通过给定的参数调用光标的 executescript 方法。
connection.total_changes()该例程返回自数据库连接打开以来被修改、插入或删除的数据库

 

 

 

 

 

 

 

 

 

 

 

 

 

 3.创建一个数据库

import sqlite3
conn = sqlite3.connect('db21.db')
print ("成功打开数据库")

 

 

4.利用爬虫爬中国大学排名并存为csv文件  

import requests
from bs4 import BeautifulSoup
import pandas
# 1. 获取网页内容
def gettext(url):
    try:
        r = requests.get(url, timeout = 30)
        r.raise_for_status()
        r.encoding = 'utf-8'
        return r.text
    except Exception as e:
        print("Error:", e)
        return ""

# 2. 分析网页内容并提取有用数据
def getTabelList(soup): # 获取表格的数据
    tabel_list = []      # 存储整个表格数据
    Tr = soup.find_all('tr')
    for tr in Tr:
        Td = tr.find_all('td')
        if len(Td) == 0:
            continue
        tr_list = [] # 存储一行的数据
        for td in Td:
            tr_list.append(td.string)
        tabel_list.append(tr_list)
    return tabel_list

# 3. 可视化展示数据
def Print(tabel_list, num):
    # 输出前num行数据
    print("{1:^2}{2:{0}^10}{3:{0}^5}{4:{0}^5}{5:{0}^8}".format(chr(12288), "排名", "学校名称", "省市", "总分", "生涯质量"))
    for i in range(num):
        text = tabel_list[i]
        print("{1:{0}^2}{2:{0}^10}{3:{0}^5}{4:{0}^8}{5:{0}^10}".format(chr(12288), *text))

# 4. 将数据存储为csv文件
def save(filename, tabel_list):
    FormData = pandas.DataFrame(tabel_list)
    FormData.columns = ["排名", "学校名称", "省市", "总分", "生涯质量", "培养结果", "科研规模", "科研质量", "顶尖成果", "顶尖人才", "科技服务", "产学研合作", "成果转化","学生国际化"]
    FormData.to_csv(filename, encoding='utf_8_sig', index=False)

if __name__ == "__main__":
    url = "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"
    html = gettext(url)
    soup = BeautifulSoup(html, features="html.parser")
    data = getTabelList(soup)
    #print(data)
    Print(data, 5)   # 输出前5行数据
    save("paiming.csv", data)

 

 

 

5.成功创建Connection对象以后,再创建一个Cursor对象,并且调用Cursor对象的execute()方法来执行SQL语句创建数据表以及查询、插入、修改或删除数据库中的数据:

c = conn.cursor()
# 创建表,
c.execute('''CREATE TABLE stocks (date text, trans text, symbol text, qty real, price real)''')
# 插入一条记录
c.execute("INSERT INTO stocks VALUES ('2006-01-05','BUY', 'RHAT', 100, 35.14)")
# 提交当前事务,保存数据
conn.commit()
# 关闭数据库连接
conn.close()

 

6.如果需要查询表中内容,那么重新创建Connection对象和Cursor对象之后,可以使用下面的代码来查询。

for row in c.execute('SELECT * FROM stocks ORDER BY price'):
    print(row)

 

7.connect(database[, timeout, isolation_level, detect_types, factory]) :连接数据库文件,也可以连接":memory:"在内存中创建数据库。

sqlite3.Connection.execute():执行SQL语句
sqlite3.Connection.cursor():返回游标对象
sqlite3.Connection.commit():提交事务
sqlite3.Connection.rollback():回滚事务
sqlite3.Connection.close():关闭连接

 

 

8.将csv文件导入数据库:

import sqlite3
import openpyxl
lists=sqlite3.connect('db21.db') 
c=lists.cursor()
c.execute('''CREATE TABLE rankg("序号","排名","学校名称","省市","总分","生源质量","培养结果","科研规模","科研质量","顶尖成果","顶尖人才","科技服务","产学研合作","成果转化","学生国际化")''')
listinsheet=openpyxl.load_workbook(r'paiming.csv')
datainlist=listinsheet.active #获取excel文件当前表格
data_truck=('''INSERT INTO rankg("序号","排名","学校名称","省市","总分","生源质量","培养结果","科研规模","科研质量","顶尖成果","顶尖人才","科技服务","产学研合作","成果转化","学生国际化") VALUES (?,?,?,?,?,?,?,?,?,?,?,?,?,?)''')
for row in datainlist.iter_rows(min_row=2,max_col=14,max_row=datainlist.max_row): #使excel各行数据成为迭代器
    cargo=[cell.value for cell in row] 
    c.execute(data_truck,cargo)  
for row in c.execute('SELECT * FROM rankg ORDER BY "序号"'):
    print(row)

lists.commit()
lists.close()

 

 

 

 

 

 

转载于:https://www.cnblogs.com/lzz807237221/p/10963250.html

相关文章:

  • window安装vs报错
  • 线性表的链式存储结构——链表
  • autocare使用命令
  • 安卓自定义View进阶-Canvas之画布操作 转载
  • Android - 权限
  • 跳石板_牛客网
  • Google浏览器插件
  • 第二阶段冲刺4
  • python篇第10天【For 循环语句】
  • React实战之将数据库返回的时间转换为几分钟前、几小时前、几天前的形式。...
  • 2、CDH组件安装
  • 第一章 Vue介绍
  • awk使用记录
  • (¥1011)-(一千零一拾一元整)输出
  • 第六章 组件 51 组件化和模块化的区别
  • [微信小程序] 使用ES6特性Class后出现编译异常
  • 10个最佳ES6特性 ES7与ES8的特性
  • bootstrap创建登录注册页面
  • ES6系列(二)变量的解构赋值
  • java B2B2C 源码多租户电子商城系统-Kafka基本使用介绍
  • javascript 总结(常用工具类的封装)
  • js ES6 求数组的交集,并集,还有差集
  • Leetcode 27 Remove Element
  • miniui datagrid 的客户端分页解决方案 - CS结合
  • node-glob通配符
  • tweak 支持第三方库
  • use Google search engine
  • 动手做个聊天室,前端工程师百无聊赖的人生
  • 对话:中国为什么有前途/ 写给中国的经济学
  • 分享一份非常强势的Android面试题
  • 前端性能优化--懒加载和预加载
  • 试着探索高并发下的系统架构面貌
  • 腾讯优测优分享 | Android碎片化问题小结——关于闪光灯的那些事儿
  • 小而合理的前端理论:rscss和rsjs
  • 国内唯一,阿里云入选全球区块链云服务报告,领先AWS、Google ...
  • ​2021半年盘点,不想你错过的重磅新书
  • ​ssh-keyscan命令--Linux命令应用大词典729个命令解读
  • (03)光刻——半导体电路的绘制
  • (MIT博士)林达华老师-概率模型与计算机视觉”
  • (PyTorch)TCN和RNN/LSTM/GRU结合实现时间序列预测
  • (Pytorch框架)神经网络输出维度调试,做出我们自己的网络来!!(详细教程~)
  • (顶刊)一个基于分类代理模型的超多目标优化算法
  • (附源码)spring boot公选课在线选课系统 毕业设计 142011
  • (附源码)ssm学生管理系统 毕业设计 141543
  • (附源码)计算机毕业设计大学生兼职系统
  • (强烈推荐)移动端音视频从零到上手(上)
  • (四)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (算法)Travel Information Center
  • (原創) 如何使用ISO C++讀寫BMP圖檔? (C/C++) (Image Processing)
  • .apk文件,IIS不支持下载解决
  • .bat批处理(十):从路径字符串中截取盘符、文件名、后缀名等信息
  • .net core 3.0 linux,.NET Core 3.0 的新增功能
  • .net core开源商城系统源码,支持可视化布局小程序
  • .Net MVC4 上传大文件,并保存表单
  • .net6Api后台+uniapp导出Excel