当前位置: 首页 > news >正文

基于python社交网络大数据分析系统的设计与实现

项目:基于python社交网络大数据分析系统的设计与实现

摘 要

社交网络大数据分析系统是一种能自动从网络上收集信息的工具,可根据用户的需求定向采集特定数据信息的工具,本项目通过研究爬取微博网来实现社交网络大数据分析系统功能。对于采集微博热点群体发现信息数量较少的工作而言,实现一个网页下载程序不会很麻烦,但是,当从网络上采集海量信息的时候,爬虫系统的实现将变得十分复杂。

社交网络大数据分析系统爬虫技术仅仅处理数据抽取这一步。网络爬虫只将网络上的页面下载下来,对下载的非结构化数据没有进行处理,而直接将其保存到数据库之中。这样做的劣势在于:搜索引擎的后续操作首先要从数据库种获取到这些非结构化信息,然后再进一步的进行信息的处理。这样无形之中增添了两次操作数据库的任务量,在数据量极其庞大的背景下,会大大降低整个系统的效率。

社交网络大数据分析系统当前最为流程的python技术来实现对爬虫各功能。

关键词:msyql;信息;python;社交网络大数据分析 ;爬虫

目    录

本 科 生 毕 业 论 文(设计) II

题目:基于python社交网络大数据分析系统的设计与实现 II

摘 要 III

Abstract IV

第一章 概述 1

1.1 研究背景 1

1.2  目的及意义 1

1.3 系统体系结构 2

1.4 Python技术 2

第二章 系统需求分析 4

2.1可行性分析 4

2.1.1经济上的可行性 4

2.1.2技术上的可行性 4

2.1.3操作上的可行性 4

2.2功能需求分析 4

2.3 系统用例图 5

2.4 业务流程分析 6

2.5 系统数据流图 6

2.6 数据字典 8

第三章 系统总体设计 10

3.1网站功能结构图 10

3.3网站开发目标 10

3.4网站性能需求 11

第四章 数据库设计 12

4.1数据库概念结构设计 12

4.2数据库逻辑结构设计 13

第五章 系统详细设计 15

5.1爬虫功能模块设计 15

5.2  服务器数据库端 19

第六章  系统测试 23

6.1 测试的任务及目标 23

6.1.1测试的任务 23

6.1.2测试的目标 23

6.2测试方案 23

6.2.1模块测试 23

6.2.2集成测试 24

6.2.3验收测试 24

6.2.4平行运行 24

结 论 25

致 谢 26

参考文献 27

相关文章:

  • HTML学习笔记——08:表单<form>
  • 计算机网络课后第一章问答题
  • Java 9 响应式流(Reactive Streams)
  • 回显服务器
  • day07-实战-今日指数
  • 如何在 Angular 中为响应式表单创建自定义验证器
  • 如何对线上项目Debug
  • C语言希尔排序详解!!!速过
  • redis的缓存穿透,缓存并发,缓存雪崩,缓存问题及解决方案
  • 【MySQL】事务的一致性究竟怎么理解?
  • Spring Boot项目打包及依赖管理-瘦身
  • css中选择器的优先级
  • flink operator 1.7 更换日志框架log4j 到logback
  • 最近火的一键穿衣AI,这款服装设计软件也不赖
  • 【动态规划专栏】专题二:路径问题--------6.地下城游戏
  • 11111111
  • Android 初级面试者拾遗(前台界面篇)之 Activity 和 Fragment
  • CAP理论的例子讲解
  • IDEA常用插件整理
  • Js实现点击查看全文(类似今日头条、知乎日报效果)
  • Mysql数据库的条件查询语句
  • npx命令介绍
  • PHP变量
  • SSH 免密登录
  • storm drpc实例
  • Sublime Text 2/3 绑定Eclipse快捷键
  • 基于游标的分页接口实现
  • 极限编程 (Extreme Programming) - 发布计划 (Release Planning)
  • 开发了一款写作软件(OSX,Windows),附带Electron开发指南
  • 理解IaaS, PaaS, SaaS等云模型 (Cloud Models)
  • 区块链将重新定义世界
  • 日剧·日综资源集合(建议收藏)
  • 实现简单的正则表达式引擎
  • 应用生命周期终极 DevOps 工具包
  • 远离DoS攻击 Windows Server 2016发布DNS政策
  • 运行时添加log4j2的appender
  • 阿里云IoT边缘计算助力企业零改造实现远程运维 ...
  • ###STL(标准模板库)
  • #define MODIFY_REG(REG, CLEARMASK, SETMASK)
  • (01)ORB-SLAM2源码无死角解析-(66) BA优化(g2o)→闭环线程:Optimizer::GlobalBundleAdjustemnt→全局优化
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第2节(共同的基类)
  • (done) NLP “bag-of-words“ 方法 (带有二元分类和多元分类两个例子)词袋模型、BoW
  • (ZT)薛涌:谈贫说富
  • (附源码)springboot 校园学生兼职系统 毕业设计 742122
  • (附源码)springboot学生选课系统 毕业设计 612555
  • (九)c52学习之旅-定时器
  • (原創) 如何動態建立二維陣列(多維陣列)? (.NET) (C#)
  • (原創) 如何將struct塞進vector? (C/C++) (STL)
  • (终章)[图像识别]13.OpenCV案例 自定义训练集分类器物体检测
  • (转)Java socket中关闭IO流后,发生什么事?(以关闭输出流为例) .
  • (转)memcache、redis缓存
  • (转)程序员疫苗:代码注入
  • .NET Core实战项目之CMS 第十二章 开发篇-Dapper封装CURD及仓储代码生成器实现
  • .Net IOC框架入门之一 Unity
  • .net 微服务 服务保护 自动重试 Polly