当前位置: 首页 > news >正文

Javascript抓取京东、淘宝商品数据(商品采集商品详情图片抓取)

之前用的方法:

let temp = []var lists = $('#J_goodsList li.gl-item')$.each(lists,function(idx,item){ temp.push({   id:$(item).data('sku'),   goods_img:$(item).find('img').attr('src'),   goods_name:$(item).find('.p-name em').text(),   market_price:$(item).find('.p-price i').text(), })})console.log(temp)
  1. 通过分类查询京东、淘宝的商品,比如搜索“电子产品”,获取到电子产品的列表

  2. 通过JavaScript操作页面dom元素,获取到商品信息数组

  3. 通过在线工具将json数组转成excel文件

  4. 处理图片地址,包裹上img标签,通过浏览器加载并下载图片

    //img13.360buyimg.com/n7/jfs/t1/181788/14/25091/44594/63c0c017F11c3c118/4521648b22e0dd3a.jpg 
    1. 原图片

    2. 将链接中的n7改成n1(尺寸变大),并且加上img标签

      <img src=https://img13.360buyimg.com/n1/s450x450_jfs/t1/181788/14/25091/44594/63c0c017F11c3c118/4521648b22e0dd3a.jpg />
    3. 将图片下载到本地

  5. 将生成的excel文件数据和EDI网站商品数据合并

  6. 将商品图片上传到服务器

  7. 手动给每个商品添加商品详情,这个是主要的工作量

这种方式主要有两个缺点:

  1. 列表获取不到商品详情图片,需要手动去抓取

  2. 过程比较繁琐,有很多需要手动操作的地方

优化后直接用API调用,稳定性好,支持高并发。

1、注册账号获取APIkey和密钥,点此注册

2、查看API文档,获取请求参数和响应参数表。

 

相关文章:

  • 算法思想总结:滑动窗口算法
  • DeformableAttention的原理解读和源码实现
  • QML与C++通信
  • Python电梯楼层数字识别
  • STM32第九节(中级篇):RCC(第一节)——时钟树讲解
  • Tomcat的部署及调优,jvm调优
  • Java8 新特性
  • Java-并发编程--ThreadLocal、InheritableThreadLocal
  • 《LeetCode热题100》笔记题解思路技巧优化_Part_3
  • QT 状态机的使用
  • RocketMQ架构详解
  • 17个工作必备的Python自动化代码分享(上篇)
  • 泽众云真机-机型支持ADB调试功能即将上线
  • 进程学习--02
  • 有来团队后台项目-解析7
  • 【402天】跃迁之路——程序员高效学习方法论探索系列(实验阶段159-2018.03.14)...
  • 〔开发系列〕一次关于小程序开发的深度总结
  • CentOS7简单部署NFS
  • GitUp, 你不可错过的秀外慧中的git工具
  • HomeBrew常规使用教程
  • java8-模拟hadoop
  • JavaScript 一些 DOM 的知识点
  • js如何打印object对象
  • JS学习笔记——闭包
  • Vue UI框架库开发介绍
  • 从地狱到天堂,Node 回调向 async/await 转变
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 精彩代码 vue.js
  • 开源SQL-on-Hadoop系统一览
  • 巧用 TypeScript (一)
  • 使用阿里云发布分布式网站,开发时候应该注意什么?
  • 小程序开发之路(一)
  • RDS-Mysql 物理备份恢复到本地数据库上
  • ​一帧图像的Android之旅 :应用的首个绘制请求
  • # .NET Framework中使用命名管道进行进程间通信
  • # 飞书APP集成平台-数字化落地
  • (4) openssl rsa/pkey(查看私钥、从私钥中提取公钥、查看公钥)
  • (过滤器)Filter和(监听器)listener
  • (免费领源码)python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐
  • (原創) 如何動態建立二維陣列(多維陣列)? (.NET) (C#)
  • (总结)Linux下的暴力密码在线破解工具Hydra详解
  • .describe() python_Python-Win32com-Excel
  • .htaccess配置常用技巧
  • .NET Core、DNX、DNU、DNVM、MVC6学习资料
  • .net 开发怎么实现前后端分离_前后端分离:分离式开发和一体式发布
  • .net 生成二级域名
  • .NET6实现破解Modbus poll点表配置文件
  • .NET开源项目介绍及资源推荐:数据持久层 (微软MVP写作)
  • .net利用SQLBulkCopy进行数据库之间的大批量数据传递
  • /usr/local/nginx/logs/nginx.pid failed (2: No such file or directory)
  • @selector(..)警告提示
  • @我的前任是个极品 微博分析
  • [ 蓝桥杯Web真题 ]-布局切换
  • [2544]最短路 (两种算法)(HDU)
  • [c]扫雷