当前位置: 首页 > news >正文

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,导出 excel 和 pdf

之前分享过文章 2024批量下载知乎回答文章想法专栏收藏夹,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf ,今天再整理分享下知乎知乎回答/文章/想法/专栏/视频/收藏夹下载。

苏生不惑

这个账号已经持续5年每周更新原创文章,分享些有趣实用的软件/网站和黑科技教程,来跟我一起高效地玩转互联网。

464篇原创内容

公众号

下载所有知乎回答以渤海小吏的号为例 再次破xx,苏生不惑新开发的工具 

图片

下载导出的excel包含所有知乎回答问题标题和链接。

图片

然后用脚本将excel里的回答批量下载:

图片

下载的所有回答html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf  。

图片

再将所有pdf合成一个pdf文件,效果见网盘https://pan.quark.cn/s/8522433ad346

图片

每个回答都有原知乎回答链接。

图片

顺便我还下载了渤海小吏这个公众号的所有文章,包含留言  2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数 。

图片

下载所有知乎文章以半佛仙人的号为例 :

图片

下载导出的excel数据包含知乎文章标题,链接,评论数和赞同数。

图片

然后用脚本将excel里的文章批量下载:

图片

下载的所有文章html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf。  

图片

再将所有pdf合成一个pdf文件,效果见网盘 https://pan.quark.cn/s/8522433ad346 ,每篇文章都有原知乎文章链接 再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excel 和 pdf   

图片

顺便我还下载了半佛仙人这个公众号的所有文章,包含留言。 2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数

图片

最近我又开发了知乎收藏夹批量下载工具,软件下载地址发布到我的知识星球 https://t.zsxq.com/qWLTU ,欢迎加入我的知识星球 加入我的知识星球 ,有问题可以加微信 sushengbuhuo 

图片

图片

打开工具输入知乎收藏夹地址https://www.zhihu.com/collection/40047806, 页数和cookie ,如何获取cookie见之前文章 总有人问我 cookie 到底是什么?

图片

默认下载500篇回答,视频,文章,如果要继续下,修改页数再次下载。

图片

下载的html文件在zhihu目录。

图片

下载的视频在video目录。

图片

下载完成后合并转换生成的pdf文件大小200MB ,因为依赖wkhtmltopdf ,需要将wkhtmltopdf.exe加入环境变量。

图片

点击左侧标题书签可以跳转到对应内容。

图片

如果转换pdf失败可以用我开发的html2pdf批量转换html为pdf。

图片

再用我开发的pdf_merge将pdf文件合并成一个文件。

图片

顺便导出收藏夹excel数据包含类型(回答,文章,视频),标题,链接,创建时间,更新时间,简介,评论数,赞同数,页数等。

图片

除了知乎收藏夹批量下载还有我开发的知乎专栏批量下载工具https://pan.quark.cn/s/a26076946612 ,输入专栏链接https://www.zhihu.com/column/c_1721130763582382082和cookie就可以下载了。

图片

下载专栏文章回答html文件:

图片

合成的pdf文件,大小10MB。

图片

图片

顺便导出专栏excel数据包含类型,标题,链接,创建时间,更新时间,简介,评论数,赞同数等。

图片

最后是之前发布的知乎问题回答下载工具 https://t.zsxq.com/e7cPX

图片

输入知乎问题id和cookie:

图片

导出的 excel数据包含回答链接,回答者主页,回答者昵称,回答内容,回答发布时间,回答更新时间等:

图片

玩转互联网达人

苏生不惑备用号,分享各种黑科技软件资源和技巧,带你玩转互联网。

19篇原创内容

公众号

最新原创文章:

加入我的知识星球

2024 更新版:苏生不惑开发过的那些原创工具和脚本

2024 公众号苏生不惑发布软件目录

2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数

2024 极品互联网宝藏资源库,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,导出 excel 和 pdf

2024批量下载知乎回答文章想法专栏收藏夹,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf

2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

2024苏生不惑精华帖合集,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,微博内容/图片/视频/评论/转发数据,导出 excel 和 pdf

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 运维工程师面试整理-操作系统
  • C++——矩阵无重复行列取数问题
  • 力扣周赛:第415场周赛
  • 探索轻量级语言模型 GPT-4O-mini 的无限可能
  • JavaScript考核详解
  • 基于鸿蒙API10的RTSP播放器(五:拖动底部视频滑轨实现跳转)
  • 深度解析 MintRich 独特的价格曲线机制玩法
  • 【宠物小精灵之收服(待更新)】
  • 【JavaWeb】利用IDEA2024+tomcat10配置web6.0版本搭建JavaWeb开发项目
  • 安全建设当中的冷门知识
  • 简单题27 - 移除元素(Java)20240917
  • 如何在win10Docker安装Mysql数据库?
  • JavaSE - 面向对象编程03
  • Qt | AI+Qt6.5.3+ubuntu20.04+FFmpeg实现音视频编解码(播放一个中秋节快乐视频为例)
  • 安全API
  • python3.6+scrapy+mysql 爬虫实战
  • [rust! #004] [译] Rust 的内置 Traits, 使用场景, 方式, 和原因
  • [译]如何构建服务器端web组件,为何要构建?
  • 【108天】Java——《Head First Java》笔记(第1-4章)
  • Apache Pulsar 2.1 重磅发布
  • HTTP中的ETag在移动客户端的应用
  • Java 11 发布计划来了,已确定 3个 新特性!!
  • Java,console输出实时的转向GUI textbox
  • Java新版本的开发已正式进入轨道,版本号18.3
  • JS正则表达式精简教程(JavaScript RegExp 对象)
  • miaov-React 最佳入门
  • puppeteer stop redirect 的正确姿势及 net::ERR_FAILED 的解决
  • Spring Security中异常上抛机制及对于转型处理的一些感悟
  • vue脚手架vue-cli
  • Vue实战(四)登录/注册页的实现
  • windows下使用nginx调试简介
  • 阿里云应用高可用服务公测发布
  • 闭包,sync使用细节
  • 给自己的博客网站加上酷炫的初音未来音乐游戏?
  • 前端临床手札——文件上传
  • 详解移动APP与web APP的区别
  • 正则表达式
  • 智能合约Solidity教程-事件和日志(一)
  • Spring第一个helloWorld
  • ​卜东波研究员:高观点下的少儿计算思维
  • # Redis 入门到精通(七)-- redis 删除策略
  • #Lua:Lua调用C++生成的DLL库
  • (152)时序收敛--->(02)时序收敛二
  • (33)STM32——485实验笔记
  • (ibm)Java 语言的 XPath API
  • (每日持续更新)信息系统项目管理(第四版)(高级项目管理)考试重点整理 第13章 项目资源管理(七)
  • (原創) 是否该学PetShop将Model和BLL分开? (.NET) (N-Tier) (PetShop) (OO)
  • .NET 4.0网络开发入门之旅-- 我在“网” 中央(下)
  • .NET NPOI导出Excel详解
  • .NET Reactor简单使用教程
  • .NET 中创建支持集合初始化器的类型
  • .NET/C# 使窗口永不激活(No Activate 永不获得焦点)
  • /bin、/sbin、/usr/bin、/usr/sbin
  • @NestedConfigurationProperty 注解用法
  • [ HTML + CSS + Javascript ] 复盘尝试制作 2048 小游戏时遇到的问题