用python爬取B站在线用户人数

日期：2024-12-30 作者：w4xki caijiyuan 评论：0 移动：http://ww.kub2b.com/mobile/news/16099.html

核心提示：最近在自学Python爬虫，所以想练一下手，用python来爬取B站在线人数，应该可以拿来小小分析一下首先查看网页源代码，找到相应的h

最近在自学Python爬虫，所以想练一下手，用python来爬取B站在线人数，应该可以拿来小小分析一下

首先查看网页源代码，找到相应的html，然后利用各种工具（BeautifulSoup或者直接正则表达式）得到数据，然后把数据和当且时间保存到本地，并且设置一定的时间间隔，反复得到数据， 不过后面我发现B站在线人数是通过js动态生成的，后面会提到

我们发现

在线人数是存储在类名为online的div中的a标签，当得到a标签的内容，然后把数字分割出来就可以

提取代码片段如下：

然后发现我们每次得到的number都为0，这显然是有问题的。

问题的关键在于B站在线人数的数据是动态生成的，这是一个动态的网页，这个数字是通过js代码填进去的，所以我们每次得到的是没经过js处理的HTML，所以需要另外的解决方法

这里我们在network里查找关键词online可以找到相应的的api

但是打开网址是找不到的， 主要因为我的url是有问题的把后面的参数去掉就可以访问
得到最后的api网址

所以后面我们只需要用python解析json，得到web_online的值就可以了
代码片段如下

把当前时间和在线人数写到一起，以做研究

最终可以把此程序放到服务器上（毕竟电脑也不能总是开着的）
当然在服务器实现定时运行可以通过crontab 来实现，然后把代码的循环改一下，就能实时监控了！
关于如何在服务器定时运行python可以看这篇博客，还是减少了很多错误的

https://blog.csdn.net/qq874455953/article/details/81586508

这是每隔30分钟的结果部分显示，仅供参考

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类最新文章

0 条相关评论

文章列表

相关文章

最新动态

推荐图文

最新文章

点击排行