网站流量统计原理

流量统计原理主要有两种:传统的基于日志文件统计和当前较为流行的基于脚本(JavaScript等)统计。

基于日志文件的统计

通过分析网站后台的日志文件来统计访客的浏览和点击行为。这种方法的优点是简单方便,无需修改网页代码,可以收集网络爬虫数据等。缺点是网站日志包含所有日志数据,需预处理来提升数据质量;而且无法统计到页面缓存导致的缓存浏览数据。

常见的服务器日志等,由于是原始数据很多时候我们使用这些数据需要进行数据清洗。常见的日志文件分析软件有:GoAccess AWStats等。下图使用宝塔面板的网站监测报表就是居于此

基于脚本的统计

此方法需要在网站的html代码中嵌入一段脚本(JavaScript等)用于统计访客的浏览等行为。这种方法的优点是技术难度低,只需嵌入脚本代码,无需配置服务器;能够快速获取点击、响应等数据并方便展现;不需要担心缓存带来的影响,数据的准确度较高。缺点主要是无法统计网络爬虫的信息。当前主流的流量分析系统绝大部分采用此种方法收集数据,包括百度统计和谷歌分析等。

优势在于数据方便部署,且功能支持多,例如网站热力图,网站点击图等都有

相关推荐

网站分析思路

很多人开始进行网站分析时候都感觉没有思路,不知道从那种角度看数据。以下将会先简述总体分析思路,再较为详尽地和大 ...