当前位置: 首页 > news >正文

AI编程系列一1小时完成链家房价爬虫程序

背景   AI编程实在太火,写了很多年的Java,现在Python 和Go 简单好用,今天结合智谱清言快速完成一个程序爬虫程序,没有任何Python 编程经验,只需要会提问,熟悉简单HTML结构即可。未来一定是有业务能力者的福音。

步骤一:首先展示效果:

使用“”CodeGeeX编程助手

提问一:初始化代码

提问内容“使用Python 生成抓取链家杭州余杭的最新房价”

此时拷贝出来就可以运行的:

import requests
from bs4 import BeautifulSoupdef get_house_price():url = 'https://hz.lianjia.com/ershoufang/yuhang/'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}response = requests.get(url, headers=headers)soup = BeautifulSoup(response.text, 'html.parser')house_list = soup.find_all('div', class_='info clear')for house in house_list:title = house.find('div', class_='title').a.text.strip()price = house.find('div', class_='priceInfo').span.text.strip()print('标题:', title)print('价格:', price)print('---')if __name__ == '__main__':get_house_price()

运行结果:

提问二:HTML内容解析

提问内容:使用python解析获取里面的文本内容”<div class="positionInfo"><span class="positionIcon"></span><a href="https://hz.lianjia.com/xiaoqu/1811100699594/" target="_blank" data-log_index="10" data-el="region">新湖果岭 </a> "

提问三: URL规律解析

提问内容:使用python 找出URL的规律并输出从第1页到100页的相关代码” https://hz.lianjia.com/ershoufang/yuhang/ https://hz.lianjia.com/ershoufang/yuhang/pg2/ https://hz.lianjia.com/ershoufang/yuhang/pg3/ https://hz.lianjia.com/ershoufang/yuhang/pg4/"

最终代码

import requests
import time
from bs4 import BeautifulSoupdef get_house_prices(url):headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}response = requests.get(url, headers=headers)soup = BeautifulSoup(response.text, 'html.parser')house_list = soup.find_all('div', class_='info clear')house_data = []for house in house_list:price = house.find('div', class_='priceInfo').find('div', class_='totalPrice').text.strip()# 清理价格数据,去除非数字字符price = int(''.join(filter(str.isdigit, price)))house_name = house.find('div', class_='title').find('a', href=True).text.strip()estate_name = house.find('div', class_='positionInfo').find('a', href=True).text.strip()house_data.append((house_name,estate_name, price))# 按价格排序house_data.sort(key=lambda x: x[1])return house_dataif __name__ == '__main__':for i in range(2, 101):url = "https://hz.lianjia.com/ershoufang/yuhang/pg{}/".format(i)house_data = get_house_prices(url)for house_name,estate_name,price in house_data:print("【标题】" + house_name,"【小区】"+ str(estate_name),"【价格】"+ str(price))time.sleep(5)

总之,AI在编程领域的应用具有深远意义,作为技术总监,我们要充分利用这一技术,推动企业乃至整个行业的发展。同时,关注人才培养、安全保障、伦理道德等方面,确保技术应用的可持续发展。

  • 快速转变思维,从业务着手完成自己技能的升级。

  • 技术普惠:AI技术的进步使得编程不再只是专业程序员的专属技能。即使是编程基础薄弱的人,也能通过自然语言与AI助手互动,快速完成代码编写。这极大地降低了技术门槛,促进了技术的普及和普惠。

  • 效率提升:AI辅助编程可以让开发者将更多精力投入到业务逻辑和产品设计上,而不用担心代码实现的细节。这种效率的提升有助于加快项目进度,缩短产品上市时间。

  • 人才培养:借助AI编程助手,企业可以快速培养具备基本编程能力的人才,弥补人才缺口。这对于我国软件产业的发展具有重要意义。

  • 代码质量:AI通过对大量代码的学习,能够为开发者提供更加规范、高效的代码优化建议。这将有助于提高代码质量,降低系统维护成本。

  • 技术融合:在AI编程助手的基础上,我们可以进一步探索与其他技术的融合,如云计算、大数据、物联网等,为企业提供更加全面的技术支持。

  • 安全保障:随着AI编程的普及,代码安全愈发重要。技术总监需关注AI编程过程中的安全问题,确保生成的代码符合安全规范。

  • 持续学习:AI技术不断更新迭代,作为技术总监,我们要鼓励团队成员持续学习,紧跟技术发展趋势,提升自身竞争力。

  • 伦理道德:在利用AI技术优化代码的过程中,我们要关注伦理道德问题,确保AI编程助手遵循我国法律法规,尊重用户隐私。

  • 产业升级:借助AI编程助手,企业可以加快技术创新,推动产业升级,为我国经济发展贡献力量。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【MySQL】数据库约束
  • 【Kubernetes】k8s集群安全机制
  • CPU飙升 怎么定位问题
  • nginx代理转发如何配置
  • MySQL(SQL函数)
  • 适配器模式, 修饰器模式 与 代理模式
  • 三层switch转一层switch的处理方法
  • 大数据基础
  • C++第八章:多态性
  • 完美解决html2canvas + jsPDF导出pdf分页内容截断问题
  • 【产品经理】定价策略
  • DotPlot 的宽高自动设置 | 线性拟合
  • 英语写作中“传统的”traditional conventional 的用法
  • 游戏引擎phaser.js3的使用之玩家和静态物理组碰撞
  • AT_zone2021_d 宇宙人からのメッセージ 题解
  • 《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息
  • 【跃迁之路】【735天】程序员高效学习方法论探索系列(实验阶段492-2019.2.25)...
  • JavaScript中的对象个人分享
  • Java新版本的开发已正式进入轨道,版本号18.3
  • MySQL Access denied for user 'root'@'localhost' 解决方法
  • React中的“虫洞”——Context
  • Redis提升并发能力 | 从0开始构建SpringCloud微服务(2)
  • Spark in action on Kubernetes - Playground搭建与架构浅析
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • 分享几个不错的工具
  • 服务器之间,相同帐号,实现免密钥登录
  • 前端面试题总结
  • 前端之Sass/Scss实战笔记
  • 如何抓住下一波零售风口?看RPA玩转零售自动化
  • 首页查询功能的一次实现过程
  • 推荐一个React的管理后台框架
  • 微信公众号开发小记——5.python微信红包
  • 阿里云服务器如何修改远程端口?
  • ​LeetCode解法汇总1410. HTML 实体解析器
  • ​TypeScript都不会用,也敢说会前端?
  • ###C语言程序设计-----C语言学习(6)#
  • #HarmonyOS:软件安装window和mac预览Hello World
  • #LLM入门|Prompt#1.8_聊天机器人_Chatbot
  • #vue3 实现前端下载excel文件模板功能
  • (Java入门)学生管理系统
  • (ros//EnvironmentVariables)ros环境变量
  • (笔记)Kotlin——Android封装ViewBinding之二 优化
  • (超详细)语音信号处理之特征提取
  • (附源码)ssm基于jsp高校选课系统 毕业设计 291627
  • (论文阅读40-45)图像描述1
  • (四)JPA - JQPL 实现增删改查
  • (一)springboot2.7.6集成activit5.23.0之集成引擎
  • (转)全文检索技术学习(三)——Lucene支持中文分词
  • (转)四层和七层负载均衡的区别
  • (转)微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)...
  • .net core 实现redis分片_基于 Redis 的分布式任务调度框架 earth-frost
  • .NET命名规范和开发约定
  • .NET学习全景图
  • .NET中使用Redis (二)
  • @cacheable 是否缓存成功_Spring Cache缓存注解