页面标签与服务器日志
页面标签通过访问者的浏览器收集数据,并且将数据发送到远程数据收据服务器。分析用户从远程服务器查看报告(见图2.1)。通常通过放置在你网站上每一页内的JavaScript代码(被称为标签或信标(beacons))捕捉这种信息。一些服务提供商还添加许多自定义标签来收集额外的信息。这种技术被称为客户端数据收集,通常被外包、软件即服务(SaaS)服务提供商解决方案所使用。
图2.1 页面标签法的图示:页面标签向远程的数据收集服务器发送信息。因此,分析客户能查看报告。
注:Google Analytics是一种SaaS页面标签服务。
日志文件指的是通过你的网站服务器收集数据而不是访问者的浏览器:网站服务器将它的活动记录在文本文件中,通常是本地的。分析客户在本地服务器上查看报告,如图2.2所示。这种技术被称为服务器端数据收集,捕捉对你的网站服务器提出的所有请求,包括页面、图片和PDF等,最常被单机授权的软件服务提供商所使用。
图2.2 日志法的图示:网站服务器把它的活动记录在本地的文件中。因此,分析客户能在本地服务器上查看报告。
在过去,服务器日志文件获取的便利性使这种技术成为了最被接受的、理解网站访问者行为的技术。事实上,大多数互联网服务服务提供商(ISPs)用他们的网站托管账户提供免费的日志分析(Analog、Webalizer以及AWStats就是一些例子)。尽管,这可能是人们首次接触网站分析的最普遍方式,但是,当涉及到测量访问者的行为时,这些免费工具太过基础,因此,在本书中不进行过多探讨。
近年来,页面标签成为了最受欢迎的收集访问者数据的方法。不仅仅是因为从技术角度页面标签更容易实施,而且也极大的减少数据管理的需要了,因为数据由外部的SaaS服务器(你的服务提供商)收集和处理,节约了网站所有者运行软件收集、存储和归档信息的费用及维护。
请注意,当单独考虑时,两种技术都有自己的缺点。表2.1总结了二者的不同。一种普遍存在的错误观点是页面标签比其他方法技术上有优势,但是,正如表2.1所显示的那样,这取决于你如何看。但是,通过结合,二者优势互补。这被称为混合法,一些服务提供商能够提供。
注:Google Analytics能设置为混合数据收集——请看第六章“起来与Google Analytics一起奔跑”中“备份:在本地保存你的数据”。
其他的数据收集方法
尽管日志文件分析和页面标签是目前为止最广泛使用的收集网站访问者数据的方法,但是,它们不是仅有的方法。网络数据采集设备(数据包嗅探器)从路由器到黑箱设备收集网站流量数据。另外一种技术是使用一种网站服务器应用程序接口或者可加载组件(被称为插件,尽管这并不是严格正确的术语)。这些程序扩展了网站服务器的能力——例如,增强或扩展了写入日志的领域。通常,收集到的数据实时传输到报告服务器。