当前位置: 首页 > news >正文

第三章:推荐系统冷启动与CB

3.1冷启动问题简介:
冷启动问题(cold start)主要分三类:
•     用户冷启动
•     物品冷启动
•     系统冷启动
参考解决方案:
•     推热门
•     利用用户的信息。(如:性别、年龄、地域等)
•     利用登录帐号的社交网络信息
•     要求新用户登录时做一些反馈
3.2利用用户注册信息
下面介绍一种最简单的,基于用户信息的推荐算法。其核心问题就是计算每种特征的用户喜欢的物品。 也就是说,对于每种特征f, 计算具有这种特征的用户对各个物品的喜欢程度p(f,i)
p(f,i)可以简单定义为物品i在具有f的特征的用户中的热门程度:
Image
N(i)是喜欢物品i的用户集合,U(f)表示具有特征f的用户集合。
可以看出具有比较高的N(i)就很可能有比较高的p(f,i), 所以推出的结果很可能就是热门结果。因此我们可以将p(f,i)定义为喜欢物品i的用户中具有特征f的比例:
Image
在数据集做实验Last.fm
代码待写:
3.4 利用物品的内容信息
对于user-cf 来说,物品冷启动问题并不非常敏感。因为很多网站,给用户的内容不止有基于推荐的。
对于item-cf, 物品冷启动必须频繁更新物品相似度表,时间复杂度高。
基于物品内容的模型,没有冷启动问题,可适当解决冷启动。一般来说,物品内容可以通过向量空间模型(vector space model)表示。该模型会将物品表示成一个关键词向量。对于文本,可能会用到自然预言处理里面的分词技术。
image
向量空间模型在长文本可能会取得比较好的效果。(短文本不行,可以考虑word2vec,有待学习)
话题模型(Topic model)
代表性的LDA. LDA有三种元素,文档,话题,词语。每篇文档都会表现为词的集合,称为bag of words. 每个词在一篇文章中属于一个话题。
有待学习。。。。

转载于:https://www.cnblogs.com/Dzhouqi/p/3979893.html

相关文章:

  • 再学 GDI+[29]: TGPPen - 自定义复合画笔 - SetCompoundArray
  • WinAPI: PolyBezierTo - 绘制贝塞尔线(更新当前位置)
  • Delphi 与 DirectX 之 DelphiX(44): TDIB.DoAddColorNoise();
  • MVC与MVP(转)
  • IDisposable资源释放接口
  • 多角度看.NET面试题
  • java/.net-常用工具下载地址常用学习网址快捷键
  • 財哥面京东dm的经历【帮財哥发的】
  • 基于数据访问的集合类型-领域驱动设计的又一种特定对象
  • LVS负载均衡中arp_ignore和arp_annonuce参数配置的含义
  • Flex入门(三)——微架构之Cairngorm
  • Clink(Powerful Bash-style command line editing )
  • 通俗理解C#委托和事件
  • Select Year,Month,Day date from DropDownList control in ASP.NET
  • Codeforces Round #261 (Div. 2) D 树状数组应用
  • SegmentFault for Android 3.0 发布
  • [数据结构]链表的实现在PHP中
  • Angular 响应式表单 基础例子
  • Dubbo 整合 Pinpoint 做分布式服务请求跟踪
  • es6--symbol
  • es6要点
  • JavaScript类型识别
  • JS正则表达式精简教程(JavaScript RegExp 对象)
  • mysql外键的使用
  • SpiderData 2019年2月16日 DApp数据排行榜
  • Vue小说阅读器(仿追书神器)
  • 反思总结然后整装待发
  • - 概述 - 《设计模式(极简c++版)》
  • 关键词挖掘技术哪家强(一)基于node.js技术开发一个关键字查询工具
  • 你真的知道 == 和 equals 的区别吗?
  • 扫描识别控件Dynamic Web TWAIN v12.2发布,改进SSL证书
  • 事件委托的小应用
  • 用mpvue开发微信小程序
  • 2017年360最后一道编程题
  • k8s使用glusterfs实现动态持久化存储
  • ​渐进式Web应用PWA的未来
  • #基础#使用Jupyter进行Notebook的转换 .ipynb文件导出为.md文件
  • (2021|NIPS,扩散,无条件分数估计,条件分数估计)无分类器引导扩散
  • (C语言)fgets与fputs函数详解
  • (Note)C++中的继承方式
  • (二)【Jmeter】专栏实战项目靶场drupal部署
  • (附源码)ssm学生管理系统 毕业设计 141543
  • (个人笔记质量不佳)SQL 左连接、右连接、内连接的区别
  • (十八)三元表达式和列表解析
  • (转)LINQ之路
  • (转)拼包函数及网络封包的异常处理(含代码)
  • *上位机的定义
  • .bat批处理(七):PC端从手机内复制文件到本地
  • .NET 8 中引入新的 IHostedLifecycleService 接口 实现定时任务
  • .NET教程 - 字符串 编码 正则表达式(String Encoding Regular Express)
  • .NET开源全面方便的第三方登录组件集合 - MrHuo.OAuth
  • .NET设计模式(8):适配器模式(Adapter Pattern)
  • .pyc文件还原.py文件_Python什么情况下会生成pyc文件?
  • ??在JSP中,java和JavaScript如何交互?
  • @RequestParam详解