本文主要介绍百度地图API中地点检索功能的应用以及如何运用python爬取这些数据并保存。
1、密钥申请
搜索“百度地图API”,找到官网(百度地图开放平台 | 百度地图API SDK | 地图开发 (baidu.com))进入,点击上方控制台,进入控制台后找到左侧“应用管理”里的“我的应用”,然后点击创建应用,随便起一个应用名称,应用类型选择服务端,IP白名单简单起见可以直接用0.0.0.0/0,但需注意阅读网页内红字提醒,点击提交,如下图所示。
2、地点检索
回到官网首页,找到上方“开发文档”点击“Web服务API”,点击地点检索——地点检索v2.0,可以查看官网给的使用说明,这里简单介绍我自己使用到的一些功能。
本文介绍的是行政区划区域检索,以搜索济南市的医院位置数据为例。
https://api.map.baidu.com/place/v2/search?query=医院®ion=济南市&output=json&page_size=10&page_num=1&ak= “申请的AK”
链接中,query为要查找的建筑类型,比如医院、超市、机场、火车站等等,output为数据输出的格式,page_size为一页里面包含的数据条数,默认为10最大可设置为20,page_num是要查看的页数默认为0,即第一页,ak即为上一步申请的密钥。
将上述链接加上自己的AK,直接新建网页搜索即可显示结果,如图。
最上方的"total"为查找的结果数量,共139条,设置的是每页显示10条,因此一共有14页,也就是page_num可设置的值为0-13.
从图中可以看出,搜出的数据包括医院名称、医院位置的经纬度、医院地址、医院所处省份、地市、区。接下来通过python将这些数据进行保存。
3、数据爬取
由于一共有14页的数据需要获取,所以需要访问14次网页,每次访问时,只有链接中的page_num值不同
代码示例:
结果如图
获取的结果可以存储在excel中,代码如下,只存储了名称和经纬度。
结果如图