Google Analytics、站长统计、百度统计、腾讯统计工具哪一个统计的数据相对准确些?
相对比出的数据差距还挺大的。站内入口和受访页面,是有数据重叠的吗?如果有 A、B、C 3个页面,从A进入,那么站内入口和受访页面分别都+1吗?
这些监测分别更适合什么样的网站使用?
首先损耗来自于js加载的延时,理论上,google统计的损耗会更小,google有异步加载代码,你可以直接把代码放置到页面的最顶部,这样js加载延迟带来的损耗会几乎可以忽略,其他统计如果前置到页面顶部都会影响页面加载速度。 另外如果你仅考虑损耗,我更愿意推荐 51.la,他提供的iframe代码部署方式也不会有损耗。仅个人经验,因为个人比较鲁钝看不懂cnzz的部分指标所以没用过cnzz,也没机会使用腾讯统计。
很多朋友谈到的LOG分析,不适合日渐普及的cdn,访问压力被cdn分流以后,cdn的流量值体现在取源过程中,会遗漏很大一部分。
站内入口是受访页面的子集,第一个受访页面就是站内入口
个人认为,不用考虑损耗,网站分析应该是一个宏观层面的过程分析,微小损耗对这一分析过程几乎没有影响。
准确性不应该去对比不同工具的指标差异,对比百度统计和 GA 的 UV 谁更准确意义不大,同一指标在不同工具中会因这些因素而异:
数据采集方式。包括:统计程序的实现、如何部署、如何识别用户。
指标定义。如何定义 UV、Session…
数据加工方式。能够处理多大量级的数据,怎么进行采样,能否设置采样率……
这些在各家的帮助文档里多有,只要了解各家的作用机制,用来分析业务问题都不大。这方面,不得不说只有 GA 的帮助文档是写给人类看的。
从始至终使用同一个工具分析产品数据我觉得都没问题,数据本身的准确性问题各家都存在,特别是不要把自己部署 server log 的数据拿出来跟统计工具的数据做对比。如果各家定义的指标模型跟自家业务没有太大差异,这些准确性问题可忽略。
关于 GA 被翻墙的问题,发往 http://google-analytics.com 的统计数据可能有问题,据我观察自家产品的数据没有因此出现过大波动。
感觉 GA 的 js 加载慢的话,可以 host analytics.js,然后定时与 http://www.google-analytics.com/analytics.js 同步,保证速度的同时也保证功能跟上更新。
下面开始跑题。
不同工具之间的准确性对比,建议从更谁能「更准确」地帮我们分析产品数据去对比,更方便地解决自家业务独有的问题,我建议对比的是:
谁能提供更有用的维度、指标、流量过滤机制…
用户特征、时间、地域、网络…等,这方面 GA 挺好的,可用的维度可以看这里:https://developers.google.com/analytics/devguides/reporting/core/dimsmets,找不到头绪分析数据的时候,来这里翻一翻也许有新灵感。
说白了就是辅助分析的功能谁能科学、更实用。
社区活跃度
虽然跟准确性无直接相关,但是往往有一些问题是影响准确性的,社区能帮我尽快地找到方案。很多人在博客、论坛上讨论 GA,凡是 GA 稍有一些问题,大家都会群策群力地想办法解决,有新的玩法也会很快普及。其他工具讨论的范围相对小一些。
最后,建议多了解 GA,然后用它,我就是觉得他对开发者的体验是最好的,也是最懂业务模型的。除非是大公司,尽量不要自己去做 server log 的分析系统。
看了百度统计吐槽 GA 说百度统计能看 5min 前的数据,而 GA 只有昨天的,其实 Real-time 报表不是更让人热血沸腾吗。