使用Google Analytics分析网站

[singlepic=14479,,,left]

Google Analytics(分析)是一款免费的 Web 分析产品,根据它提供的丰富详尽的图表式报告,网站管理员与营销人员可以更好地了解并影响访问者的行为,从而提高营销活动的投资回报率。
Google Analytics(分析)给网站管理员提供了这样一个途径:了解目前网站的状态,知道可以改进的方向。下面要做的事情就是每次只对网站作一次改动,并且给 Google Analytics(分析)一段时间,它会告诉您这次改动带来的改变是否符合预期。
就像 Google Analytics(分析)的高级经理 Brett Crosby 在 Analytics blog 里提到的:“不论您如何使用 Google Analytics(分析),最重要的是您已经在使用它。”您已经在试图通过对访问者行为的分析来理解您的访问者,并且朝着优化的方向努力。当您越了解访问者并且愿意朝着提升他们访问体验的方向努力时,也意味着您正走在一条通往拥有更多忠实访问者和提高您的投资回报率的康庄大道上。

1. Web分析产品之争
不可否认,JavaScript的登峰造极之作就是Web分析产品了。市面上有很多这样的产品可以选择,国内国外的都有,比如中国站长站,51.la都提供这样的分析产品,DreamHost之类的托管商也提供基于Apache日志的分析产品。我认为,Web分析工具是网站的核心工具之一,不应该随意的选择。
Google目前来看还是一个很负责任的公司,其产品值得信赖,关键的是Google Analytics确实也不错,尤其是其JavaScript控件库强大和完善,更是让我们这些JavaScript程序员无比崇拜。

[singlepic=14481,500,,center]

在这篇文章中,我想结合实际中的一个网站的数据信息,说明一下Google Analytics有什么用以及怎么用的问题。

2. Google Analytics原理及如何启用Google Analytics
Google Analytics是基于JavaScript的,只要把类似这样一段代码插入你的页面源代码中,就可以使用Google Analytics了。其中,UA-XXXXXXX-X是每创立一个分析帐户时生成的,你的帐户当然和我的不一样。

[code=’html’]


[/code]

或者使用新版本:

[code=’html’]


[/code]

主要原理是,将一个外链JavaScript脚本包含到本页中,然后设置一个参数,指定这是哪个站(即访问报告给哪个帐户),然后调用一个JavaScript函数,由里面的函数来收集当前用户的信息(IP,浏览器版本,当前页等等等等)。记录下信息之后,再用Google Analytics的网页来使用这些数据进行数据分析和数据挖掘。

3. 多元化分析的基础
注意一点,Google Analytics是一个网站分析工具,其数据基于对于网站浏览者的长期采样。一个刚刚使用Google Analytics的用户的数据是杂乱无章且没有多少意义的,长期使用,至少一个月,才能够看出趋势。
下图展示了一个较大的站最近两个月的数据。

[singlepic=14480,500,113,center]

可以观察到网站流量稳定在25000左右,但是在6月3日出现了一个奇点,这时候可以去网站搜索了一下这一天发生了什么事情,导致了这样的数据出现。原来,网站中包含一篇文章,是同济大学6月3日一场地震分析的报告会,被搜索引擎错误地当作6月3日地震预测的文章(是谣言!)排到了前面,这是应该主动去删除这样的不实信息(即便可能不是我们的错,而是搜索引擎的错误)。浏览量固然重要,但道德更重要,不要用谣言等手段骗取用户浏览。

下图是另外一个时间段的情况。明显观察到4月18日到4月20日数据出现了一个低谷。

[singlepic=14482,500,113,center]

这是因为,网站在这段时间由于内容审核被机房屏蔽了一段时间,不能够访问,网站管理员虽采取了转向到临时网站的策略,但仍旧因为内容不如原来丰富,导致流量大幅减少。

从上面可以看出,单纯看数据是没有意义的,应该数据结合网站的状况做多元化分析。

4. 浏览量数据
Google Analytics对数据进行区分,包括访问次数、绝对唯一访问者人数、综合浏览量、平均综合浏览量、网站停留时间、跳出率和新访问率。

[singlepic=14483,,,right]

  • 综合浏览量:一切数据的核心是综合浏览量(Page View)。每次网页被加载,调用Google Analytics代码都会增加一次综合浏览量,其他的数据都是根据这个数据以及其他参数区别出来的。
  • 绝对唯一访问者人数:Google Analytics使用cookie对访问者进行标识,这样,当用户隔了一段时间再次访问,即便因为ADSL等等原因换了IP,仍旧算作同一个访问者,并且计入回头客。当然,这个值只能表明一个大概的下限,因为可能有多个人共享同一台机器或者用户禁用了cookie而导致这个值比正确值小。
  • 平均综合浏览量:平均综合浏览量计算一个综合浏览量的平均值,说明一个用户一般看了几个(次)网页。
  • 网站停留时间:用户在网站大概看了多长时间。也不是精确的值,根据一次会话中最先的访问和最后的访问比较得到。
  • 跳出率:就是说别人进了你的网站后没有再查看你网站的其他的网页的比率,当然跳出率越高,就一定程度上说明你的网站的首页吸引力不够,需要对目标网页做一定优化。或者是网站SEO的关键字有问题,导致用户进来了才发现,这并不是他/她要找的网站。
  • 新访问率:第一次来的用户的比率,也不是精确值,用户可能会清空cookie,导致重复计算,一般这个值说明了一个新访问率的上限。

5. 用户信息
Google Analytics还可以记录下用户使用机器的一些特征,比如浏览器及其版本、Java版本、Flash版本、操作系统语言等等信息。这些信息可以为网站设计者提供重要参考,可以根据比例来选择重点测试平台和采用那个版本的技术等等。
比如,作为专业Web开发人员的我可能会觉得FireFox很好很强大,并且在自己的机器上使用FireFox来浏览各种网站,那么能否就以FireFox上的显示效果为准来编写我的网页?当然不能。

[singlepic=14484,,,center]

上图可以看出,虽然FireFox很热,但是IE仍然是最重要的客户端浏览器,这意味着如果你编写了一段只能在FireFox上运行正常的页面,仍然将会在91.40%的用户浏览器里变成一团乱麻。

6. 来源分析
Google Analytics可以通过用户访问的HTTP refer信息整理分析用户是从哪里进入了你的网站。

[singlepic=14485,,,center]

从图上可以看出,用户来源基本四分天下,直接通过地址访问、通过Google、通过Baidu和通过其他方式数量基本差不多。进一步也可以看出,Baidu在中国还是很有市场份额的。

3 comments

  1. 我看到你用的是anlytics新版代码
    之前使用的时候发现新版js下,统计里的pagetitle以及一些中文搜索词都会乱码
    请问一下现在还有这个问题么

  2. 受教了。一直烦于看Google Analytics帮助文件,这次看个简化版的。
    PS一下:网站风格不错,清新典雅,我很喜欢。(只是现在的网站自己不用主题制作,不然一定会朝这个方向努力。)

发表评论