当前位置: 首页 > news >正文

扩展学习|统计学习理论(SLT)与极限学习机(ELM)应用于大社会数据分析

文献来源:[1] Oneto L , Bisio F , Cambria E ,et al.Statistical Learning Theory and ELM for Big Social Data Analysis[J].IEEE Computational Intelligence Magazine, 2016, 11(3):45-55.DOI:10.1109/MCI.2016.2572540.
提取链接:链接:https://pan.baidu.com/s/1BF9m4GGzrSrnZlULnyzm-g 
提取码:nupf

        大社会数据分析是一个研究领域,专注于收集、检查和处理大型多模态和多源数据集,以发现模式/相关性并从社会网络中提取信息。这通常是通过使用计算成本高昂的监督和无监督机器学习算法来完成的,这些算法从可用数据中学习(例如,支持向量机- svm,人工神经网络- ann, k近邻- knn和随机森林- rf),而这些算法无法做到这一点处理当前数据卷。为了提高处理速度,已经提出了并行方法,但这显然需要支持分布式计算的技术。

        极限学习机(Extreme learning machine, ELM)是一种新兴的学习范式,为广义前馈神经网络提供了一种高效的统一解决方案。然而,与人工神经网络不同的是,由于存在伪逆计算,ELM不容易并行化。因此,本文旨在寻找一种可靠的方法来实现ELM的并行实现,该方法可以应用于典型的大数据问题的大数据集。在中可以找到基于MapReduce框架的并行ELM实现回归的示例,而为在线顺序ELM变体提供了并行集成方法。

        几种利用多层并行性的技术(例如,多核,多核,GPU,集群等)目前可用。Spark与云计算相结合,是高性能并行计算的最先进框架,旨在有效处理递归地对相同数据执行操作的迭代计算过程,如监督机器学习算法。

        除了有效地建立监督学习模型和可扩展的算法,大数据中的另一个重要问题是如何有效和高效地评估预测模型的性能。数据驱动模型利用非参数推理,期望有效的模型直接来自数据,不需要对模型族进行任何假设,也不需要数据集本身之外的任何其他信息。随着大数据时代的到来,这种方法越来越受欢迎,人们相信,通过简单地收集更大量的数据,可以生成具有所需准确性的有效预测模型(参见[21],作为一个例子,关于这种具有煽动性和不准确但不幸的是,普遍存在的信念的一些见解)。

        统计学习理论(SLT)解决了评估预测模型性能的问题,它试图找到非参数推理的必要和充分条件,以便从数据中构建预测模型,或者用SLT的语言来说,从数据中学习最优模型。长期以来,SLT被认为只是一个理论上的统计框架,尽管它非常健全和深入,但对实际问题没有任何真正的适用性。在过去十年中,该领域取得了重要进展,研究表明,SLT可以提供实用的答案,至少在针对数据驱动模型的推理进行分类时是如此。

        近年来,越来越多的群众意见和情绪通过社交网络、网络社区、博客、维基等网络协同媒体公开表达。这深刻地改变了人们分享知识和交流经验的方式。因此,从大量的意见中提炼有用的信息是营销人员试图在客户心目中创造产品、品牌或组织形象或身份的关键工具。这导致了情感分析领域的深入发展,该领域涉及使用数据挖掘和自然语言处理(NLP)技术从文本中检索信息和发现知识。

        社会大数据分析的主要方法大致可分为两类:基于知识的技术和统计方法。前者主要利用本体、词汇、语义网络或模式,后者则逐渐转向采用ELM、深度学习和卷积神经网络(CNN)。

相关文章:

  • 重新配置vue项目时出现的:连接已断开问题
  • 深度学习入门笔记(八)实战经验
  • 2024美赛E题数学建模思路代码数据分享
  • 微信小程序新手入门教程三:基础语法介绍
  • docker集成 nacos/nacos-server (包括踩的坑)
  • Python学习之路-Tornado基础:初识Tornado
  • 【前端】日期转换
  • 25.云原生之ArgoCD-app of apps模式
  • 基于python的新闻爬虫
  • 【算法与数据结构】718、1143、LeetCode最长重复子数组 最长公共子序列
  • 比较以下Unity AStar Pathfinding, NavMesh, Recast Navigation 寻路算法的优点与缺点
  • Java函数式编程详解
  • 升级 FATFS 笔记
  • MySQL中去除重复(十一)
  • vue使用pdf.js实现在线查看pdf文件
  • 【159天】尚学堂高琪Java300集视频精华笔记(128)
  • Angular 响应式表单之下拉框
  • Apache的80端口被占用以及访问时报错403
  • CSS 提示工具(Tooltip)
  • CSS选择器——伪元素选择器之处理父元素高度及外边距溢出
  • django开发-定时任务的使用
  • JavaScript异步流程控制的前世今生
  • JS笔记四:作用域、变量(函数)提升
  • leetcode98. Validate Binary Search Tree
  • Linux CTF 逆向入门
  • Map集合、散列表、红黑树介绍
  • MySQL常见的两种存储引擎:MyISAM与InnoDB的爱恨情仇
  • React-生命周期杂记
  • Sass 快速入门教程
  • seaborn 安装成功 + ImportError: DLL load failed: 找不到指定的模块 问题解决
  • SpriteKit 技巧之添加背景图片
  • storm drpc实例
  • webpack+react项目初体验——记录我的webpack环境配置
  • win10下安装mysql5.7
  • 百度贴吧爬虫node+vue baidu_tieba_crawler
  • 构造函数(constructor)与原型链(prototype)关系
  • 函数式编程与面向对象编程[4]:Scala的类型关联Type Alias
  • 基于MaxCompute打造轻盈的人人车移动端数据平台
  • 警报:线上事故之CountDownLatch的威力
  • 批量截取pdf文件
  • 双管齐下,VMware的容器新战略
  • 吐槽Javascript系列二:数组中的splice和slice方法
  • 一个SAP顾问在美国的这些年
  • 一加3T解锁OEM、刷入TWRP、第三方ROM以及ROOT
  • puppet连载22:define用法
  • 长三角G60科创走廊智能驾驶产业联盟揭牌成立,近80家企业助力智能驾驶行业发展 ...
  • ​学习一下,什么是预包装食品?​
  • #ifdef 的技巧用法
  • (LNMP) How To Install Linux, nginx, MySQL, PHP
  • (Pytorch框架)神经网络输出维度调试,做出我们自己的网络来!!(详细教程~)
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (附源码)基于ssm的模具配件账单管理系统 毕业设计 081848
  • (规划)24届春招和25届暑假实习路线准备规划
  • (过滤器)Filter和(监听器)listener
  • (每日持续更新)jdk api之FileReader基础、应用、实战