生活资讯
腾讯微博10年数据对比,看看过去的辉煌,曾经的全球第一微博
2025-01-02 17:55  浏览:108

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

以下文章来源于早起Python ,作者早起Python

转载于

 

你用过腾讯微博吗?9月4日,腾讯微博团队突然发布公告称,将于9月28日停止服务和运营,此条消息一出,新浪微博立马安排了一条热搜并引发网友热议

 

部分用户很震惊腾讯微博居然关了,也有些用户很震惊腾讯微博居然还活着,还有部分用户甚至不知道腾讯微博的存在,腾讯微博已经被淹没在互联网的长流中,但互联网是有记忆的,本文就将通过Python爬取历史数据,尝试探索背靠数亿流量的腾讯微博是如何一步步退出舞台。

为了研究腾讯微博的历史数据,很自然的就想到从网页入手,但是让人遗憾的是,虽然官方公告说9月28日正式停止运营,实际上大概在去年就几乎打不开了

 

而就算经过不断尝试成功打开页面,你会发现除了报错代码后什么内容都没有,也无法登陆,那既然官方网站这条路走不通,要怎样才能找到腾讯微博的历史数据呢

我们都知道搜索引擎在收录网页时,会对网页进行备份,以网页快照的形式存在自己的服务器缓存里,这样我们就可以通过点击网页快照来查看网站的历史状态。除了搜索引擎,还有一些网站会对互联网做备份,比如Wayback Machine

 

自从1996年以来,Wayback Machine就在给整个互联网做备份,现在已经保存了3300亿网页,所以现在让我们搭乘网页时光机回到十年前吧

首先打开上述网站(国内暂时无法直接访问,请自行探索解决办法)并在地址栏输入t.qq.com

 

按下回车之后就会显示该网站收录的腾讯微博全部历史网页

 

并且自2010年2月1日以来,共采集了86942条历史快照,打开2012年的某一条微博

 

除了满满的年代感就是对青春的回忆,并且可以看到该网站对于腾讯微博最新的记录是2020.9.10,可能这条关停通知就是腾讯微博最终的画面

 

但是互联网的记忆不会被时间磨灭,现在我们将使用Python爬取Wayback Machine网站数据并进行分析,本节将不会对爬取过程做过多说明,详细的技术解析会在下一节进行讲解。

如果一个网站热度越高,那么被收录的次数就越多,首先来看对新浪微博与腾讯微博历史快照的总量进行分析

 

我们可以看到,在这10年间新浪微博的历史快照是腾讯微博的近2倍,而将数据单独拆开来看的话,从2010年两个微博网站被收录以来,新浪微博就以碾压的姿势超越腾讯微博,在2012年两者的新增快照数量均达到最高值,然后趋于稳定。

 

除了对比历史快照数总量,所有的快照都是由一个个HTML文件组成,现在我们将所有的快照内容进行拆解分析

 

可以看到,每一个快照文件中,新浪微博除了html文本,还有一部分为应用、图片、音视频多样化内容,而腾讯微博基本上就是html文本组成,是不是和和QQ空间有种同样的感觉,而微博却应该给用户提供一个不一样的发声平台,这可能也是腾讯微博不敌新浪微博的一点因素。

为了研究背靠庞大QQ流量的腾讯微博是在哪一年开始下滑,本小节将基于主持人何炅的腾讯微博历史数据(头部大V、2012年腾讯微博热门第一名,有较多的历史数据)进行分析,使用Python爬取该网站收录的何炅的全部历史微博

 

一共采集到1506条微博,每条微博分别有5条字段

  • 年份
  • 发博日期
  • 内容
  • 粉丝量
  • 粉丝互动量(转发与评论)

先对何炅的粉丝量变化进行可视化

 

可以看到何炅粉丝主要增长集中在2012年间,但增势放缓也发生在2012年末,因此2012年对于腾讯微博来说是非常关键的一年,在大量吸收粉丝后却没能留住粉丝。我们接着通过粉丝互动率来分析

 

通过对近十年粉丝的转发回复数量进行计算得到粉丝互动率,可以发现2012年依旧是腾讯微博最辉煌的一年,单条微博的互动率最高达到近2%,而后在2013年迅速下滑至0.19%,降低了10倍之多。

本节我们将用Python示例如何爬取何炅的历史微博,使用到的库有:

  • requests
  • pandas
  • bs4
  • waybackpack

首先打开https://web.archive.org/并搜索t.qq.com/hejiong

 

如上图所示,一共收录了何炅的107条腾讯微博历史数据,很自然的就想到如何把这些URL提取出来,此时我们只需要使用pip安装waybackpack库,并在Jupyter notebook中执行

 

该命令就会返回全部的URL,注意执行该命令依旧需要自行解决国内无法访问的问题

 

现在我们打开第一个网站并F12,按照下图的指示找到存储微博数据的数据包

 

接下来就是遍历每一个url,使用requests构造请求,接着使用bs4解析数据,再使用pandas清洗存储数据即可

    以上就是本篇文章【腾讯微博10年数据对比,看看过去的辉煌,曾经的全球第一微博】的全部内容了,欢迎阅览 ! 文章地址:http://ww.kub2b.com/tnews/4551.html
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站 http://ww.kub2b.com/mobile/ , 查看更多   
最新文章
看了OPPO、vivo的新旗舰手机样张后,决定还是继续用微单吧
最近,OPPO、vivo都给出了自家旗舰手机的样张,大战一触即发。记得手机圈上一次这么火爆,还是小米15 Ultra的时候。具体来说,当
微信借钱不求人,6个步骤轻松搞定...手机微信怎么借钱「微信借钱不求人,6个步骤轻松搞定...」
微信,作为中国人日常生活中不可或缺的社交软件,不仅满足了人们的沟通需求,还悄然融入了金融服务,其中就包括微信借钱功能。无
小米8系列手机,有它才叫防摔保护手机爆屏「小米8系列手机,有它才叫防摔保护」
手机已成为日常生活必备品,而且小米8陶瓷后盖摔不得,维修的费用都赶上半个手机的钱了,选什么手机壳呢,贼难拆的磨砂硬壳?一
米其林指南开启江苏篇章,“江苏味”如何与世界“双向奔赴”
米其林指南作为餐饮界的“奥斯卡”,关注度高。2024年7月,米其林指南重调评价体系,转为省份榜单评选,并官宣江苏省、福建省成
重磅发布!5.4%!
4月16日,国家统计局发布的数据显示,一季度,在以习近平同志为核心的党中央坚强领导下,各地区各部门认真贯彻落实党中央、国务
类似于模拟人生的游戏手机版大全2022 与模拟人生相似的游戏推荐模拟人生手机版「类似于模拟人生的游戏手机版大全2022 与模拟人生相似的游戏推荐」
不知道小伙伴们平时都玩什么类型的游戏呢?今天小编给大家带来的是类似于模拟人生的游戏手机版大全2022,为小伙伴们推荐几个好玩
手机安全模式怎么办?教你几招轻松退出与防范技巧手机怎么退出安全模式「手机安全模式怎么办?教你几招轻松退出与防范技巧」
在日常使用手机的过程中,用户有时会遇到一个较为特殊的状态——安全模式。这一模式虽然旨在保护手机免受潜在问题的进一步影响,
iPhone价格将大幅上涨:未来智能手机市场何去何从?苹果手机市场「iPhone价格将大幅上涨:未来智能手机市场何去何从?」
2024年11月,苹果公司的iPhone或将面临历史性的价格调整,预计每台产品将上涨近2000元。这一消息的背后,正是由于美国最近对外出
忘记华为手机锁屏密码?这五招轻松解锁!华为手机忘记密码「忘记华为手机锁屏密码?这五招轻松解锁!」
在数字时代,手机不仅是我们交流的工具,更是生活的助手。然而,随着信息量的增加,锁屏密码也可能成了我们最头疼的问题。华为手
手机恢复出厂设置,就会变得跟新机一样流畅吗?手机恢复出厂设置会怎么样「手机恢复出厂设置,就会变得跟新机一样流畅吗?」
大多数朋友都经历过手机卡顿的情况,手机作为电子产品是有一定寿命的,通常使用个两三年后,就会出现不同程度的卡顿现象,如果用