生活服务
GA/百度统计/Piwik/JYC:网站分析工具的Cookie设置和访次切分规则
2024-12-31 05:32  浏览:64

目前主流的网站分析工具一般都是通过Javascript检测的方式进行访问监控的,包括商业产品(Omniture/JYC统计)、免费产品(GA/百度统计/CNZZ)、开源产品(Piwik)。虽然说原理大致相同,但是不同的工具在一些基础的统计方法上方式还是有一些微妙的差别。譬如,你在使用多种网站分析工具对同一个网站进行监控时,经常会发现不同的工具给出的Visits总是会有差异(绝对数量有差异,但趋势一致)。即使理论上所有外部条件都一样,这种差异也是会存在的。这是因为不同网站分析工具在cookie的使用和访次切分的策略有一些差异。

Visits是网站分析的基础,因此有必要不深入了解一下里面的“秘密”。

在展开这个话题之前,有必要做一些科普性的介绍,当然如果你精通javascript和cookie,完全可以跳过这一段。

两种不同的cookie

  • 第一方cookie:由您浏览器访问的网站所设置。
  • 第三方cookie:由您所浏览器访问网站的合作伙伴设置而成,通常通过嵌入javascript的方式实现。安全级别比第一方cookie要低。

cookie跨域访问问题

  • 网页中嵌入的第三方javascript有权限读取和设置第一方cookie和第三方cookie。
  • 当浏览器打开某个网站(如:abc.com/index.html)时,在发起HTTP请求时,只会携带abc.com域下的cookie(第一方cookie)。
  • 网页中嵌入的第三方javascript可以向第三方服务器发起HTTP请求,在发起HTTP请求时,只会携带第三方域下的cookie(第三方cookie)。

基于javascript网站监控

当网民访问一个安装了监控代码(javascript)的网页时,web浏览器会发送两个HTTP请求(如下图)。

  • 根据浏览器地址栏的url,访问网站服务器(abc.com,此HTTP请求会携带abc.com域名下cookie(第一方cookie
  • 当网页加载完成后,监控代码中的javascript将会被执行,javascript获取referer、第一方cookie(跨域)、第三方cookie等信息,组装HTTP请求包后向监控服务器(stat.xxx.com)发送数据。

科普的知识介绍完了,如果你还是有不太理解的地方,建议Google或Baidu一下,这会对你了解网站分析工具非常有帮助。

cookie的使用,GA vs 百度统计 vs Piwik vs JYC统计

  • GA:第一方cookie
  • 百度统计:第一方cookie+第三方cookie
  • Piwik:第三方cookie
  • JYC:第一方cookie(默认)和第三方cookie均可(用于跨域识别),可根据企业需求自行选择。

GA的cookie设置及访次切分规则

在默认的配置和使用情况下,Google Analytics(分析)仅会设置表中的4 个 cookie。(详见:http://code.google.com/intl/zh-CN/apis/analytics/docs/concepts/gaConceptscookies.html

名称用途有效期类型__utmaVisitor Identifier2 年第一方cookie__utmbVisit(Session) Identifier30 分钟第一方cookie__utmcVisit(Session) IdentifierSession第一方cookie__utmzCampaign Values6 个月第一方cookie

如果访客在网站上处于非活动状态的时间超过30 分钟(__utmb失效,或者退出了浏览器(__utmc失效,那么这次Visit将结束。无论缺少__utmb或__utmc,GA都会确定开始新的Visit。GA允许你使用 _setSessioncookieTimeout() 方法自定义默认会话时间的长度。

GA cookie详情

(1)__utma ,Visitor识别cookie

    通常来说“Time of initial”<“Beginning of previous session”<“Beginning of current session”,但由于这三个时间戳都是由客户端javascript计算得到的,所以三个值并没有严格的顺序关系,在访客操作系统时间出现误差时,有可能出现“Beginning of previous session”>“Beginning of current session”的情况。因此“Time of initial”、“Beginning of previous session”、“Beginning of current session”这三个跟访问相关的时间戳在GA服务器端统计时,只是作为visit unique id使用,并没有统计时间上意义。

   Session counter就像它的名字一样就是用来计数的,记录当前访客访问此网站的次数。

(2)__utmb && __utmc,Visit识别cookie

     以上是早些__utmb 和 __utmc的值,非常简单只有Domain Hash的值。从最新GA的cookie来看,__utmb已经有所变化。

     如上图,最新的__utmb包含domain_hash.current_session_pageviews.unknown.current_session_inittime。第三个字段暂时不知道
是什么意思,在我的Firefox和Opera浏览器始终是10,你是知情人的话,请留言,谢谢。

(3)__utmz,来源识别cookie(Google官方称之为Campaign Values

       __utmz主要是用于记录访客流量来源数据。GA在访客回访时,会根据前后两次的来源决定Visit的“来源归属”。Visit来源归属决策遵循以下规则

  • 投放活动永远能覆盖别的渠道
  • 自然搜索永远能覆盖别的渠道
  • 推介网站永远能覆盖别的渠道
  • 直接输入永远覆盖不了别的渠道

百度统计的cookie设置及访次切分规则

百度统计使用了两种cookie,第三方cookie用于识别访客,第一方cookie。

名称用途有效期类型HMACCOUNTVisitor Identifier,全局唯一永久第三方cookie,hm.baidu.com域Hm_lvt_siteid

记录访客当前访问序列的开始时间,如果没有设置这个cookie,则访客为新访客。当本次访问是一个新的访问开始时,更新该cookie为当前时间。

1年第一方cookieHm_lpvt_siteid当前浏览页面时的时间,每次浏览时设置该cookie为当前时间。Session第一方cookie

在百度统计中,以下三条任意一个条件成立,则认为是一个新访次。

  • 流量来源(referer)为非本站
  • Hm_lpvt_siteid为空
  • 服务器端进行计算,一个visit超过30分钟没有流量,结束当前访次

百度统计对cookie的使用非常简单,多数的状态信息存储和计算在服务器端进行。这种数据构架方式,对服务器端的统计程序来讲无疑是非常大的挑战(有机会我会单独写一篇文章介绍一下)。

补充:百度统计对于Visit来源归属决策是采用强制覆盖的方式。

Piwik的cookie设置及访次切分规则

名称用途有效期类型piwik_visitor天书2年第三方cookie

1%3DYTo2OntpOjE7czozMjoiNDhmODY0MTlhOWUyNmIxYTBlYWI4MjU3NmI4NjgyMmQiO2k6MjtpOjEyOTM3MDI3Njc7aTozO2k6MTI5MzcwMjc2NztpOjQ7czoxOiI3IjtpOjU7czoxOiIyIjtpOjExO2k6MTt9%3A_%3Df755e0a15992cbfa6715890342520e0daa1c562b

上面是一个完整的piwik_visitor cookie的值,看完后你一定很崩溃,真是又臭又长。还好Piwik是一款开源的工具,不然我这辈子是不能指望能理解上面这段天书的意思了。将“天书”解密,我们会看到它的真实面目。

piwik_visitor解密后是一个多维数组,形式如piwik_visitor[siteid][key],针对某个siteid,有以下几个key-value对。

key名称用途备注IDVISITOR Visitor Identifier2年TIMESTAMP_LAST_ACTION当前Visit最近一次行动(浏览)时间GA使用第一方cookie,都是由js进行设置。而Pikiw中的cookie是由服务器端来设置的,因此TIMESTAMP是服务器端的时间。TIMESTAMP_FIRST_ACTION当前Visit第一次行动(浏览)时间ID_VISITVisit IdentifierID_LAST_ACTION上一次行动IDREFERER_TIMESTAMP来源时间REFERER_NAME 来源名称REFERER_KEYWORD来源关键词VISITOR_RETURNING访客类型new or return

Piwik新访次判断条件

  • 访问来自于一个新访客。
  • TIMESTAMP_LAST_ACTION离当前时间超过30分钟

是否新访客,取决是否存在piwik_visitor cookie,以及cookie解密后一些合法性的检查。对于第一步检查失败,本应沦为“新访客”的可怜虫,Piwik还提供了一个非常温馨的选项 “enable_detect_unique_visitor_using_settings”。如果 enable_detect_unique_visitor_using_settings设置打开,那么Piwik会根据你当次的ip、浏览器、操作系统等属性在所有的历史记录中寻找你活动的痕迹,如果能匹配到,那么你就有了“旧访客”的身份了(当然这个是以牺牲性能为代价的)。

Piwik使用一个独立第三方的cookie来管理所有站点信息,适用于单个或少量站点的使用,对于需要监控多个站点的使用者来说存在一定的风险。

JYC统计的cookie设置及访次切分规则

key名称用途类型备注www%5Fadjyc%5Fcom Visitor Identifier唯一第一方cookie永久

cookie值:2019101912091455923781394代表2019年10月19日12时9分14秒+随机位数,共25位。

JYC新访次判断条件

  • 访问来自于一个新访客。
  • 如果f访客第二天访问,发现存在key值,则为老访客,否则为新访客。

评价与总结

GA

  • [cookie]充分、大胆的使用cookie进行信息存储。
  • [访次切分]访次切分的设计比较合理。
  • [备注]基本成为业界的标准。

百度统计

  • [cookie]cookie使用上还不够大胆。
  • [访次切分]访次切分依赖于来源判断,相对于GA的统计方法容易出现访次虚高的现象。
  • [备注]cookie中没有保持任何访次的状态信息,那么统计程序需要保存所有没有结束的Visit的状态信息。对于每天上亿访次服务来讲,长远来看这种设计的性能和扩展性无疑会受到非常大的挑战。

Piwik

  • [cookie]cookie加密验证的方式一定程度上减轻了cookie的存储量,也提高了恶意攻击者伪造cookie成本。但Piwik将所有的信息保存在第三方cookie中,多站点情况下有cookie溢出的风险。
  • [访次切分]访次切分规则GA非常类似。
  • [备注]适合单个小流量站点的监控,统计和查询算法性能很差。

JYC

  • [cookie]充分、大胆的使用cookie进行信息存储。
  • [访次切分]访次切分的设计比较合理,新老访客直观识别。
  • [备注]国内创新统计审计监控,支持鼠标轨迹录像功能,独有算法技术、轻松支持日均百万流量PV。
    以上就是本篇文章【GA/百度统计/Piwik/JYC:网站分析工具的Cookie设置和访次切分规则】的全部内容了,欢迎阅览 ! 文章地址:http://ww.kub2b.com/tnews/3736.html
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站 http://ww.kub2b.com/mobile/ , 查看更多   
最新文章
腾讯围棋(野狐)手机版最新版中国象棋手机版「腾讯围棋(野狐)手机版最新版」
中国象棋竞技版最新版是有着很多经典的象棋残谱的经典益智游戏,在这里解锁自己感兴趣的棋谱,不管是是和电脑竞技还是真人pk,都
小米手机掉水里了应该怎么处理手机掉水里怎么处理「小米手机掉水里了应该怎么处理」
在日常生活中,我们难免会遇到一些突发情况,比如小米手机不慎掉入水中。面对这种情况,如果处理不当,可能会导致手机严重损坏。
有钱人“买爆”上海豪宅,有楼盘卖出200亿!去年多个“10万+”豪宅“日光”
本文来源:时代财经 作者:陈泽旋图源:图虫创意有钱人仍在楼市发挥他们的“钞能力”。近日,来自上海的中高端改善型项目海玥黄
华为WatchGT3可以遥控拍照吗?华为WatchGT3遥控拍照介绍华为手机驱动「华为WatchGT3可以遥控拍照吗?华为WatchGT3遥控拍照介绍」
近日有些朋友询问能否用华为Watch GT 3远程控制拍摄照片?以下是相关说明。(注:以上为简化版文本)华为WatchGT3支持遥控拍照,
谱写中印尼命运共同体新篇章
王鲁彤 中国和印度尼西亚是隔海相望的好邻居、命运与共的好伙伴,两国友谊源远流长。古代海上丝绸之路曾将双方紧密联系在一起,
东京股市继续上涨
  新华社东京4月18日电(记者钱铮)受医药和生物相关股普遍上涨拉动,日本东京股市18日继续上涨。日经225种股票平均价格指数收
如何有效格式化手机以清理存储空间和提升性能手机格式化是什么意思「如何有效格式化手机以清理存储空间和提升性能」
  在现代社会,手机已经成为我们生活中不可或缺的一部分。随着时间的推移,手机中的数据会逐渐增多,可能会导致设备运行缓慢,
如何快速关闭手机勿扰模式?详细步骤解析!手机勿扰模式在哪里「如何快速关闭手机勿扰模式?详细步骤解析!」
如何在Android手机上关闭勿扰模式 通过快捷设置关闭:用户可从屏幕顶部向下滑动以打开通知面板,接着找到“勿扰模式”图标(通常
microsd卡是什么卡手机sd卡是什么「microsd卡是什么卡」
  microsd卡是什么卡,很多人都有这样的疑问吧?下面就让我来为大家介绍一下吧!microsd卡是什么卡?  其实,MicroSD卡是一种
名茶汇聚的安徽,何以大而不强?
01为何名茶多,但名企少、名牌也少?说起安徽茶叶,大家第一印象是名优茶多,但这并不意味着龙头企业、知名品牌也多。中国十大名