生活资讯
运用Scrapy爬取药监局信息
2025-01-03 10:44  浏览:77

✅前言:在前面的学习Scrapy中,我们都是基于Get请求的,进行网站的数据抓取,今天我们练习的是基于Post请求的。练习:使用Scrapy爬取国家药监局-化妆品生成许可信息。

一、目标网址

  • http://scxk.nmpa.gov.cn:81/xk/

二、需求

  • 1.爬取每个页面中,每个企业生产许可的详情信息
  • 2.数据存储到MongoDB数据库中,以及本地一份(格式无要求!案例中用的是存储为xlsx格式

三、技术要点

  • 1.Scrapy框架的运用
  • 2.如何发送POST请求?(以及当一开始就需要发送POST请求又该如何发送?)
  • 3.当在不同请求传输数据时,如何保持多个请求之间的数据连接
  • 4.如何存储到MongoDB中
  • 5.如何存储为xlsx格式文件
  • 6.zip函数的应用。

四、分析网站

从网站中我们可以看出,无论是首页还是详情页面,都是动态数据,异步请求的。

五、主要代码

1/定义Item

在文件中,定义。

 
2/编写爬虫代码

在文件中,编写爬虫代码模块

主要的都在代码中已标明注释

 
3/Pipeline

在文件中,编写存储到的类跟存储到的类

1>存储为xlsx文件
 
2>存储到MongoDB数据库
 
4/应对反爬虫机制

在文件中,找到方法,伪造随机UA

 
 

在文件中,禁用cookies

 

可以的话,还能开启限速爬取,跟添加代理IP。

5.配置settings

开启中间件

 
 

关闭

 

六、完整代码

【点击下载完整代码】


新手上路,代码写得不好,如果有理解错误的,还请大佬在评论区指出来,非常感谢

以上就是运用 Scrapy爬取药监局信息 的所有内容了,点赞收藏加评论是最大的支持哦

    以上就是本篇文章【运用Scrapy爬取药监局信息】的全部内容了,欢迎阅览 ! 文章地址:http://ww.kub2b.com/tnews/4963.html
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站 http://ww.kub2b.com/mobile/ , 查看更多   
最新文章
耐水弹力海棉
产品属性用途区域产品包装、耐水 防潮密度0.02-0.18g/cm3原产地中国,江苏,常州品牌D-Foam形状可根据客户提供图纸生产颜色可根
耐水高强度海棉
产品属性用途区域产品包装、耐水 防潮密度0.02-0.18g/cm3原产地中国,江苏,常州品牌D-Foam形状可根据客户提供图纸生产颜色可根
防潮耐水EVA材料
产品属性用途区域产品包装、耐水 防潮密度0.02-0.18g/cm3原产地中国,江苏,常州品牌D-Foam形状可根据客户提供图纸生产颜色可根
耐油耐水海绵
产品属性用途区域产品包装、耐水 防潮密度0.02-0.18g/cm3原产地中国,江苏,常州品牌D-Foam形状可根据客户提供图纸生产颜色可根
供应耐水海绵
产品属性用途区域产品包装、耐水 防潮密度0.02-0.18g/cm3原产地中国,江苏,常州品牌D-Foam形状可根据客户提供图纸生产颜色可根
看了OPPO、vivo的新旗舰手机样张后,决定还是继续用微单吧
最近,OPPO、vivo都给出了自家旗舰手机的样张,大战一触即发。记得手机圈上一次这么火爆,还是小米15 Ultra的时候。具体来说,当
微信借钱不求人,6个步骤轻松搞定...手机微信怎么借钱「微信借钱不求人,6个步骤轻松搞定...」
微信,作为中国人日常生活中不可或缺的社交软件,不仅满足了人们的沟通需求,还悄然融入了金融服务,其中就包括微信借钱功能。无
小米8系列手机,有它才叫防摔保护手机爆屏「小米8系列手机,有它才叫防摔保护」
手机已成为日常生活必备品,而且小米8陶瓷后盖摔不得,维修的费用都赶上半个手机的钱了,选什么手机壳呢,贼难拆的磨砂硬壳?一
米其林指南开启江苏篇章,“江苏味”如何与世界“双向奔赴”
米其林指南作为餐饮界的“奥斯卡”,关注度高。2024年7月,米其林指南重调评价体系,转为省份榜单评选,并官宣江苏省、福建省成
重磅发布!5.4%!
4月16日,国家统计局发布的数据显示,一季度,在以习近平同志为核心的党中央坚强领导下,各地区各部门认真贯彻落实党中央、国务