当前位置: 首页 > news >正文

Python获取百度翻译的两种方法

一、引言

百度是我们常用的搜索工具,其翻译是与爱词霸合作,总体看其反应速度较快,可以作为项目中重要的翻译工具。根据大家的需要,现提供两种Python获取百度翻译的两种办法:

二、requests法

我们引用requests模块,向百度发出post请求,得到回复后,进行解释为json格式数据。代码如下:

import requests  #找一个趁手的工具,1. 导入这个工具
url = "https://fanyi.baidu.com/sug"  # 2. 确定爬取的网址,存到变量里面url
#3. 伪装爬虫
headers = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36","cookie":'PSTM=1715648276; BIDUPSID=4FAECEB2016218E5337788D59D97E028; BAIDUID=A4621D4AF575EB35000B164A4D71A6C9:FG=1; BDSFRCVID=gDDOJexroG3M1QJttZbIbSp-4cGQd7cTDYLEOwXPsp3LGJLVYVGdEG0PtEXPGLtMnhULogKKBeOTHg4F_2uxOjjg8UtVJeC6EG0Ptf8g0M5; H_BDCLCKID_SF=Jn-O_C82JKL3HJOmMJjE5bcHMhoK--Q0KKJyLR-8Kb7VbPQCyUnkbfJBDloD-l3-ajnJ0qboKfO2KDbTyT5OL447yajDJjOuXKJi_JC-QbT8ob53DJ7pQT8r2xDOK5OibmDqslnNab3vOpoNXpO1bT0zBN5thURB2DkO-4bCWJ5TMl5jDh3Mb6ksDhAtqj0OfnIe_I0KfbjjfbTCMJOBq4k0-qJ-a4JQa5TbsJOOaCv5OpOOy4oTj6D0KqonK46JbIcBsRoR-TCMepk4MU5o3MvBKHKjWlRQWbcLof3V2fnq_Ij9Qft20bIEeMtjBbQuJtj7KR7jWhvIeq72y-tMQlRX5q79atTMfNTJ-qcH0KQpsIJM5-DWbT8bjHCJt6K8JbujoKvK-nO5KRQphRrhq4tehH4O5xJ9WDTOQJ7TthCaVqcm5h6D0-D9K2FJ5MbI5nv2-pbwBp5Cfb5K0jJHyUIzynjkLfbb3mkjbPbNyUJn8-bEh47lX-4syPRGKxRnWIkJKfA-b4ncjRcTehoM3xI8LNj405OTbIFO0KJzJCFMMDLwjTK2DTPBKMbeet5Kaj5tsJOOaCkWHqOOy4oWK441DPFDQxTJbNQabnoR-TCMHp3hb5Jj3M04X-oN-PQpLRvKahcIWMQZSl3gQft20b0kWb3xWn3uaDbP2n7jWhvIeq72y-tMQlRX5q79atTMfNTJ-qcH0KQpsIJM5-DWbT8IjHCJt6K8JbujoKvt-5rDHJTg5DTjhPrMbPORWMT-MTryKKOztxjkf-bL-xrD0nODjMbxQ40fKanRhlRNB-3iV-OxDUvnyxAZWJjxKUQxtNRJKxnx3hRM8Jrd3fvobUPULxo9LUvMJgcdot5yBbc8eIna5hjkbfJBQttjQn3hfIkj2CKLK-oj-D8lj5AM3j; BD_UPN=12314753; H_WISE_SIDS=60360_60600_60728_60749; delPer=0; BD_CK_SAM=1; BAIDUID_BFESS=A4621D4AF575EB35000B164A4D71A6C9:FG=1; BDSFRCVID_BFESS=gDDOJexroG3M1QJttZbIbSp-4cGQd7cTDYLEOwXPsp3LGJLVYVGdEG0PtEXPGLtMnhULogKKBeOTHg4F_2uxOjjg8UtVJeC6EG0Ptf8g0M5; H_BDCLCKID_SF_BFESS=Jn-O_C82JKL3HJOmMJjE5bcHMhoK--Q0KKJyLR-8Kb7VbPQCyUnkbfJBDloD-l3-ajnJ0qboKfO2KDbTyT5OL447yajDJjOuXKJi_JC-QbT8ob53DJ7pQT8r2xDOK5OibmDqslnNab3vOpoNXpO1bT0zBN5thURB2DkO-4bCWJ5TMl5jDh3Mb6ksDhAtqj0OfnIe_I0KfbjjfbTCMJOBq4k0-qJ-a4JQa5TbsJOOaCv5OpOOy4oTj6D0KqonK46JbIcBsRoR-TCMepk4MU5o3MvBKHKjWlRQWbcLof3V2fnq_Ij9Qft20bIEeMtjBbQuJtj7KR7jWhvIeq72y-tMQlRX5q79atTMfNTJ-qcH0KQpsIJM5-DWbT8bjHCJt6K8JbujoKvK-nO5KRQphRrhq4tehH4O5xJ9WDTOQJ7TthCaVqcm5h6D0-D9K2FJ5MbI5nv2-pbwBp5Cfb5K0jJHyUIzynjkLfbb3mkjbPbNyUJn8-bEh47lX-4syPRGKxRnWIkJKfA-b4ncjRcTehoM3xI8LNj405OTbIFO0KJzJCFMMDLwjTK2DTPBKMbeet5Kaj5tsJOOaCkWHqOOy4oWK441DPFDQxTJbNQabnoR-TCMHp3hb5Jj3M04X-oN-PQpLRvKahcIWMQZSl3gQft20b0kWb3xWn3uaDbP2n7jWhvIeq72y-tMQlRX5q79atTMfNTJ-qcH0KQpsIJM5-DWbT8IjHCJt6K8JbujoKvt-5rDHJTg5DTjhPrMbPORWMT-MTryKKOztxjkf-bL-xrD0nODjMbxQ40fKanRhlRNB-3iV-OxDUvnyxAZWJjxKUQxtNRJKxnx3hRM8Jrd3fvobUPULxo9LUvMJgcdot5yBbc8eIna5hjkbfJBQttjQn3hfIkj2CKLK-oj-D8lj5AM3j; channel=baidusearch; baikeVisitId=356e66e5-f4fb-4dd9-99a8-06bbc9ceb739; __bid_n=18ea75651ea4944bc97197; BD_HOME=1; H_WISE_SIDS_BFESS=60360_60600_60728_60749; B64_BOT=1; COOKIE_SESSION=5687_0_7_7_7_16_0_0_4_6_0_0_715485_0_6_0_1727255911_0_1727255905|9#169_6_1718709886|3; PSINO=7; BDRCVFR[S4-dAuiWMmn]=mk3SLVN4HKm; BDRCVFR[k-3xBxsWSJs]=mk3SLVN4HKm; H_PS_PSSID=60600_60794_60826_60844; BA_HECTOR=85808lal0h0g0k8g8h258h8h8nq73q1jfd5bi1v; ZFY=CcXTJMCi9ht2ML4gezdFtbE9Uar1JmpUfQgd:BgWOiis:C'}
while True:word = input("请输入单词:")resp = requests.post(url,headers = headers, data = {"kw":word})  # 发请求for item in resp.json()['data']:#想看效果,就打印Itemprint(item["v"])

三、urllib法

导入urllib,发出Request向url请求,再用urlopen读取并编码为utf-8,最后获取单词的翻译,代码如下:

from urllib import request, parse
import json
def translate_word(string):url = "https://fanyi.baidu.com/sug"  # 请求数据的url链接data = {'kw': string}data_url = parse.urlencode(data)req = request.Request(url=url, data=data_url.encode('utf-8'))response = request.urlopen(req).read()res = json.loads(response)if 'data' in res and len(res['data']) > 0:trans_list = res['data'][0]['v']if ';' in trans_list:trans = trans_list.split(';')else:trans = trans_listelse:trans = "翻译失败"return trans_list
print(translate_word("think"))

四、学后反思

对比两种两法,获取的数据内容不尽相同,第二种获取的内容较少,第一种获取的内容更为全面,方法也简单,但是获取的内容有重复。

大家可以根据个人的需求,选择适合自己的代码。

相关文章:

  • C语言 | Leetcode C语言题解之第438题找到字符串中所有字母异位词
  • 【小程序】微信小程序课程 -2 快速上手
  • 鸿蒙开发(NEXT/API 12)【硬件(Pen Kit)】手写笔服务
  • HTML中的padding和margin
  • map(lambda x: x[0], sorted(count.items(), key=lambda x: (-x[1], x[0]))[:n])
  • mysql迁移postgreSql windows 工具
  • Redis的数据类型和编码方式
  • 上海电力大学《2020年+2021年830自动控制原理真题》 (完整版)
  • 二维数组的创建和初始化
  • 【高分系列卫星简介——高分辨率多模综合成像卫星】
  • tidb-一场select in百万参数引发的血案
  • 软件测试学习笔记丨curl命令发送请求
  • 前端框架的选择与考量:一场技术的盛宴
  • 电缆缺陷检测系统源码分享
  • 网页设计html心得
  • [case10]使用RSQL实现端到端的动态查询
  • HTTP请求重发
  • Invalidate和postInvalidate的区别
  • JavaScript设计模式与开发实践系列之策略模式
  • k8s如何管理Pod
  • leetcode388. Longest Absolute File Path
  • React-redux的原理以及使用
  • 简单基于spring的redis配置(单机和集群模式)
  • 聚簇索引和非聚簇索引
  • 理解 C# 泛型接口中的协变与逆变(抗变)
  • 聊聊springcloud的EurekaClientAutoConfiguration
  • 排序算法学习笔记
  • 深度学习之轻量级神经网络在TWS蓝牙音频处理器上的部署
  • Python 之网络式编程
  • 组复制官方翻译九、Group Replication Technical Details
  • ​【数据结构与算法】冒泡排序:简单易懂的排序算法解析
  • ​TypeScript都不会用,也敢说会前端?
  • !!java web学习笔记(一到五)
  • #Linux(权限管理)
  • #NOIP 2014#Day.2 T3 解方程
  • #图像处理
  • (02)Cartographer源码无死角解析-(03) 新数据运行与地图保存、加载地图启动仅定位模式
  • (20)docke容器
  • (delphi11最新学习资料) Object Pascal 学习笔记---第2章第五节(日期和时间)
  • (el-Date-Picker)操作(不使用 ts):Element-plus 中 DatePicker 组件的使用及输出想要日期格式需求的解决过程
  • (javaweb)Http协议
  • (JS基础)String 类型
  • (Repost) Getting Genode with TrustZone on the i.MX
  • (苍穹外卖)day03菜品管理
  • (论文阅读26/100)Weakly-supervised learning with convolutional neural networks
  • .“空心村”成因分析及解决对策122344
  • .Mobi域名介绍
  • .Net 6.0 处理跨域的方式
  • .NET core 自定义过滤器 Filter 实现webapi RestFul 统一接口数据返回格式
  • .NET Standard / dotnet-core / net472 —— .NET 究竟应该如何大小写?
  • .NET 编写一个可以异步等待循环中任何一个部分的 Awaiter
  • .NET/C# 中你可以在代码中写多个 Main 函数,然后按需要随时切换
  • .NETCORE 开发登录接口MFA谷歌多因子身份验证
  • .net分布式压力测试工具(Beetle.DT)
  • .net通过类组装数据转换为json并且传递给对方接口