行业动态

网站分析的最基本度量

发布日期：2014-05-02　阅读次数：

Visit，汉语翻译过来是“访问”。一个网站(Web Site)就好像一个大厦，里面有很多个不同内容的房间(Page)。你若是进了这个大厦，就是一个来访者(Visitor)。你进来了，东瞅瞅，西瞧瞧，打开一个房间的门，又退出去到另外的房间，或者从一个房间的另外一个门到另一个房间，总之你转悠了好一会儿，然后终于走出大厦。对于大厦而言，你刚才的一系列行为，就是一次来访(Visit)。同样，你在一个网站里东点西看，然后最终关掉所有与这个网站有关的页面，你也是对这个网站的一次来访(Visit)。

Visit对于我们而言，很容易理解。但是对于我们进行网络分析时候必须依靠的重要武器——网络分析工具(Webanalytics Tool)而言，那就不那么容易了。为什么呢?我举个例子：

你打开了互联网分析沙龙，饶有兴致的看了10分钟，然后忽然你的女朋友给你电话了。于是你站起来接电话，兴致勃勃的聊了足足20分钟，再也没有动鼠标。终于，你心满意足的挂了电话，重新回到电脑旁边，继续在页面上点动起来。

OK!软件工具会怎么看待你的这一段时间的行动呢?记录1次Visit，还是记录2次Visit?

如果记录1次，那么似乎中间间隔了20分钟，而且你离开了电脑，没有看任何内容了;但是如果记录2次，又毕竟中间只间隔了20分钟。

这种情况的出现，就要看网络分析工具如何定义Visit了，不同的定义，会得到不同的结果。

如果这个工具定义1个Visit是一系列在你网站上的点动鼠标的动作，且两个点击你网站页面超链接的时间不能超过30分钟。那么没问题，你的这20分钟中断没有被这个工具计为下一次访问。因此它仍然记录1次Visit，即在这段时间内Visit= 1。

如果这个工具定义1个Visit是两次点击不能超过10分钟算一个Visit，那么，你的这次中断，就让我的网站多出了1个Visit，即Visit = 2。

是不是觉得太随意了?科学怎么能这样啊……

网络分析毫无疑问是门科学，虽然不同的分析工具定义可能不同，但是至少有着很严格清晰的定义。还有一点非常重要的是，Visit也有另外一个说法，叫做Session，意思是一系列的动作。两个词的意思是完全一样的，完全可以混用。不过我还从来没有见过有人用Session，真是孤陋寡闻啊!

怎么样?是不是有些清楚了?虽然这不是关于Visit所有的内容，但是已经能帮你理解它了。还有什么想知道的，别犹豫，告诉我吧!

哦，对了，现在你可能会问我，如果我打开页面点了一下，然后就关了页面，过了2分钟又重新打开它，再点我想看的内容，那么这又算几次Visit呢?1次，还是2次?

UV，在网络分析里面是非常重要的一个Metric(Metric的意思是度量衡，例如一米两米的米就是一个Metric)，也是一个重要的KPI。(什么是KPI?KPI是Key Performance Indicator的缩写，意思就是最重要的参数)。UV是Unique Visitor的简称，意思是唯一的访问者。想要搞清楚这个KPI的意义。首先可以了解一下什么是Visitor。Visitor的汉语意思是访问者，就是访问网站的人。为什么不用“用户”(User)这个名词呢?User对应的是某个Application(应用)，或者是某种Service(服务)，但是访问网页的人，还是用Visitor更准确，而且也是约定熟成的咯。

访问网站的人很容易理解，但是前面加了一个Unique就有点儿费解了。——难道每个访问的人不是独一无二的吗?难道还有其他跟我一模一样的冒名顶替者?

不，不!不是这个意思，我们(人类)分辨一个一个的个体当然很容易，每个人都是独一无二的，没有两个Sidney Song，也没有两个你。可是，我们在进行网络分析的时候，都是要通过某种软件工具完成的，这些工具怎么能知道一段时间内访问网站的人，到底有多少呢?

举个例子：网络软件工具记录了访问互联网分析沙龙的来访纪录一天有10次，那么，它可以简单的告诉你，有10个人访问了你的网站。

显然，这是不符合真实情况的，因为，很可能，你，我亲爱的读者，登上了网页，然后看了半个小时，又关闭了浏览器，干别的去了，过了1个小时再回来，又重新打开收藏夹，点出我的页面，又看了一会儿。

对于记录访问网站的软件工具而言，你相隔1个小时的两次访问被毫无疑义的记录为两次访问，但是如果同时也记录下了有两个访问者分别访问就不正确了。因为你虽然访问了两次，但两次都是你，而不是换了一个人访问了我的网站。换句话说，你是这些不同访问记录的唯一的访问者。

也就是说，软件工具应该记录：Visit = 2; Visitor =1，而不是Visit = 2; Visitor = 2。由于你是这些访问记录的唯一访问者，因此我们可以让软件工具这样记录：Visit = 2; Unique Visitor = 1，或者更简单：Visit =2; UV = 1。

因此，我们前面假设的10次访问，很有可能不是来自于10个不同的访问者，而是来自于少于10个访问者，因为很有可能，某些访问者同您一样，一段时间内多次访问了我的网站。如果这10次访问是来自于9个访问者，那么我们可以确定一定有一个人访问了2次，而对这2次访问而言，这个人就是它们(2个Visits)的独一无二的访问者(UV)。当然，完全有可能出现1个人在一段时间内包办这所有10次访问的情况，那么这个人就是这10个Visits的UV。

绕口的说了这么多，我想你一定明白了，Unique Visitor，或称UV，是相对于访问(Visit)而言的，一个访问者可以产生多个Visits，这些Visits对应的只是这个独一无二的人，而没有其他人，因此就有了UV的概念。

同Visit有另外一个说法叫“Session”一样，Unique Visitor也有另外一个说法，叫“Reach”，不过后者因为意思不是很清晰，所以也用的很少。

现在的问题是，软件工具怎么知道哪些Visits是来自于某一个Visitor的呢?

在关于UV的上一个文章中(网站分析的最基本概念(2)——UV的概念)，我们留了一个尾巴。那就是网站分析工具是如何能够知道哪些Visits是来自于同一个Unique Visitor的。现在就让我揭开这个谜底吧!

其实，非常简单。亲爱的读者朋友，可能你已经猜到了。

有两种方法。但在讲这两种方法之前，必须要清楚一个概念，那就是服务器和浏览器(B/S)的概念，如果你已经清楚的了解这个概念。没关系，直接跳过下面字号较小的内容吧!

我们都知道我们在浏览网页的时候，网页是要通过浏览器(Browser，简写为B)来显示的。但是网页真正的存放地址肯定不是在你自己的电脑上(废话，如果这样还要网线干什么，每月也不用给电信局交钱了)，而是在某一个遥远的地方(就如同电视节目不在你自己家的电视机里，而是在遥远的电视台一样)。这个遥远的地方有一个很高级的电脑，里面存放了很多的网页内容，这个电脑叫做服务器(Server，简写为S)，或者更确切说叫网站服务器(Web Server)，而你自己的电脑叫做客户端。

当打开一个网页的时候，需要首先打开客户端的浏览器，然后在浏览器的地址栏输入你想上的网站的地址，此后你的浏览器就会通过我们伟大的互联网(Internet)立即给相应地址的网站服务器的发一个请求(Quest)，然后那个网站服务器接到这个请求后就会把它保存的相应的网页(Page)的代码(Code，主要是HTMLCode)发到你的浏览器上。

而浏览器有一个神奇的功能，那就是把这些Code变成可以供你阅读的文字(Text)，链接(Link)，图片(Graphic)，音乐(Music)或者是视频(Video)。这就是为什么你能访问互联网，也能够看到我的这个博客的原因。当然，其中的过程比我这一段文字要复杂的多，而且我的解释并不是100%的实际过程的再现。不过你能理解这样一个过程就足够了。

那么，网络分析软件有哪两种方法分辨出Unique Vistor呢?

方法一：让网站服务器分辨

道理很简单，网站服务器每时每刻都会接到很多的页面请求，每一个请求信息内都包含了你的（实际上是你的电脑的）一些信息。这些信息包括很多内容，比如你的IP地址（呵呵，IP地址就不用我解释了吧，不知道就当它是你的计算机在互联网上的一个门牌号码吧！）、你发出请求的时间、你的浏览器的版本、你的操作系统的版本，以及其他一些古古怪怪的信息（实际上都是有作用的哦，只是我们现在没必要弄清楚它们）。

网站服务器可以分析这些Request，如果这些Request满足一些共同的特征，比如来自同一个IP地址，且浏览器版本相同，或者再加上发出请求的时间接近等，它就认为这一串的Request对应的一系列Visits是来自于同一个Visitor的，这个Visitor就成为这些Visits的UV了。

当然，如何定义这些共同的特征是由网站服务器的设置决定的。一般而言，用IP地址+其他特征共同限定来定义的情况比较多，但是IP地址实际上并不准确，尤其在局域网内有共用IP地址的多台计算机的情况发生的时候。不过，聊胜于无了！

方法二：用Cookie分辨

另外一个方法使用Cookie的方法分辨。什么？什么是Cookie？不了解Cookie就查一下Google或者Baidu吧！我就不解释了，说起来话挺长的。

怎么分辨呢？当客户端第一次访问某个网站服务器的时候，网站服务器会给这个客户端的电脑发一个Cookie，放到这个电脑的某个区域，一般是C盘里。这个Cookie会分配给你一个独一无二的编号，还会记录一些你访问服务器的信息，例如访问时间，访问了什么网页，以及与你这次访问有关的其他一些信息。当你下一次再访问这个服务器的时候，服务器就可以直接从你的电脑上找到上一次它放进去的这个Cookie，并且会对它进行一定的更新，但那个独一无二的编号不会改变。如果一段时间内，服务器发现两个Visits的对应的Cookie实际上是一个编号，那么，服务器就知道，尽管在这段时间内有不少次Visits，但都来自于一个客户端，那么一定就是一个Visitor了！

这个方法比上一个要更精确些。但是存在的问题是，有些客户端为了保证更高级别的安全，关闭了Cookie的功能，或者你经常删除Cookie，这个方法就不能奏效了。

因此，这样看来，两个方法都只能得到UV的近似值，但是不能得到精确值。什么？想要百分之百精确？那……除非进行一次100%准确的普查（这实际上也是不可能的），或者只有上帝知道了。

关闭窗口