当前位置: 首页 > news >正文

计算机毕业设计python+spark知识图谱音乐推荐系统 音乐数据分析可视化大屏 音乐爬虫 LSTM情感分析 大数据毕设 深度学习 机器学习

流程:
1.Python采集网易云音乐歌手、歌词、音乐、评论等约10-20万+海量数据,存入mysql数据库;
2.使用pandas+numpy/MapReduce对mysql中四类数据进行数据清洗,写入.csv文件并上传至hdfs(含评论NLP文本分类/lsm情感分析);
3.使用hive建库建表,导入.csv数据集;
4.一半分析指标使用hive_sql完成,一半分析指标使用Spark之Scala语法完成;
5.将分析结果使用sqoop导入mysql数据库的指标表;
6.使用Flask+Echarts搭建可视化大屏界面;
创新点:
1.Python爬虫采集海量数据;
2.lstml情感分析/NLP文本分类;
3.spark实时分析+(hadoop、hive离线分析数据仓库)双实现,可实时可离线防止导师喷人;
4.可视化大屏炫酷显摆;
注意:如果还觉得本系统太简单太low工作量不够,可以选装推荐系统、知识图谱、预测系统、后台管理

核心算法代码分享如下:

package com.bigdata.storm.kafka.util;import redis.clients.jedis.Jedis;
import redis.clients.jedis.JedisPool;
import redis.clients.jedis.JedisPoolConfig;/*** @program: storm-kafka-api-demo* @description: redis工具类* @author: 小毕* @company: 清华大学深圳研究生院* @create: 2019-08-22 17:23*/
public class JedisUtil {/*redis连接池*/private static JedisPool pool;/***@Description: 返回redis连接池*@Param: *@return: *@Author: 小毕*@date: 2019/8/22 0022*/public static JedisPool getPool(){if(pool==null){//创建jedis连接池配置JedisPoolConfig jedisPoolConfig = new JedisPoolConfig();//最大连接数jedisPoolConfig.setMaxTotal(20);//最大空闲连接jedisPoolConfig.setMaxIdle(5);pool=new JedisPool(jedisPoolConfig,"node03.hadoop.com",6379,3000);}return pool;}public static Jedis getConnection(){return getPool().getResource();}/*    public static void main(String[] args) {//System.out.println(getPool());//System.out.println(getConnection().set("hello","world"));}*/}

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • RoLabelImg下载及旋转目标检测数据标注
  • Linux | buildrootfs 添加mkfs.ext3/mkfs.ext4 支持
  • 【算法小记】深度学习——时间序列数据分析 Time series Data Analysis
  • C#操作MySQL从入门到精通(17)——使用联结
  • Android AOSP定制去掉Google搜索栏
  • 单词记忆(第二周)
  • 如何提高工作效率?
  • Git【版本控制命令】
  • 【C51】DIY电子音乐贺卡:C51单片机项目设计与实现
  • Activity->Activity中动态添加Fragment->Fragment回退栈BackStack
  • C# WPF入门学习主线篇(二十一)—— 静态资源和动态资源
  • 查询SQL02:寻找用户推荐人
  • 影子,介绍一下自己
  • 【嵌入式】波特率9600,发送8个字节需要多少时间,如何计算?
  • Spring运维之boo项目表现层测试匹配响应执行状态响应体JSON和响应头
  • 07.Android之多媒体问题
  • 30秒的PHP代码片段(1)数组 - Array
  • Android开源项目规范总结
  • android图片蒙层
  • Fundebug计费标准解释:事件数是如何定义的?
  • Js基础——数据类型之Null和Undefined
  • leetcode98. Validate Binary Search Tree
  • mongodb--安装和初步使用教程
  • Vue--数据传输
  • 阿里云ubuntu14.04 Nginx反向代理Nodejs
  • 阿里云购买磁盘后挂载
  • 不发不行!Netty集成文字图片聊天室外加TCP/IP软硬件通信
  • 不用申请服务号就可以开发微信支付/支付宝/QQ钱包支付!附:直接可用的代码+demo...
  • 动手做个聊天室,前端工程师百无聊赖的人生
  • 开源中国专访:Chameleon原理首发,其它跨多端统一框架都是假的?
  • 蓝海存储开关机注意事项总结
  • 两列自适应布局方案整理
  • 前端_面试
  • 嵌入式文件系统
  • 数组大概知多少
  • 算法之不定期更新(一)(2018-04-12)
  • 文本多行溢出显示...之最后一行不到行尾的解决
  • 一个JAVA程序员成长之路分享
  • 白色的风信子
  • 《码出高效》学习笔记与书中错误记录
  • 容器镜像
  • 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源 ...
  • ​ 全球云科技基础设施:亚马逊云科技的海外服务器网络如何演进
  • # Apache SeaTunnel 究竟是什么?
  • # 执行时间 统计mysql_一文说尽 MySQL 优化原理
  • #宝哥教你#查看jquery绑定的事件函数
  • #传输# #传输数据判断#
  • #调用传感器数据_Flink使用函数之监控传感器温度上升提醒
  • #微信小程序:微信小程序常见的配置传旨
  • (1)(1.11) SiK Radio v2(一)
  • (24)(24.1) FPV和仿真的机载OSD(三)
  • (二十三)Flask之高频面试点
  • (分布式缓存)Redis持久化
  • (附源码)springboot 个人网页的网站 毕业设计031623
  • (过滤器)Filter和(监听器)listener