网站日志常见技术

进行网站分析,我们首先需要获取网站数据,只有通过清洗后的数据我我们才能够进一步看网站在seo以及sem那个环节出现问题进行优化,那么我们从哪里获取网站的基本数据呢!我们一般从三个方向获取网站原始数据。

网站日志文件

记录网站日志文件的方式是最原始的数据获取方式,主要在服务端完成,在网站的应用服务器配置相应的写日志的功能就能实现。常见的有apache日志 nginx日志 甚至是CDN日志文件。不仅有服务请求,网页状态码也包含如图片、CSS、文件(Flash、视频、音乐等记录。优点是不需要过多的部署,一般服务器端都有。缺点是数据量庞大,数据需要经过处理才能够使用。缺点是:很多用户行为,如点击等无法进行统计 。对于我来说,在推广过程中服务器日志文件仅仅是用于反向查询用户关键词。当然可以迅速统计页面状态代码,能够查看哪些页面存在问题。

打点

网上查询了叫 Web Beacons,Web Beacons的实现方式是在需要统计的网站页面或者模块上嵌入一个1×1像素的透明图片,用户完全察觉不到,当用户访问该网页的同时会请求透明图片,并完成页面访问的记录工作,就像是在纸上画了一个不易看到的小点来标记那张纸

打点的优势是,可以进一步压缩数据文件的打下,同时比日志的方式维度更多,更全面。但是会出现Cookies 丢失的情况,

JS页面标记

为了弥补打点和网站日志方面的问题 ,异步传输。但是当用户禁用Cookes 被禁用了就会出现问题。一般放置于页面的顶部或者底部

三种方式优缺点总结

相关推荐