Archive for the ‘网站统计分析’ Category:


由于twitter的技术问题导致谷歌url抓取失败

6月27号Google工具条PR更新了一次,然后很多人注意到Twitter首页PR降为零。(Google首页也降到9,不过这不是重点。)7月19号Google居然又更新一次工具条PR。Google更新工具条PR值从一个月一次变到3个月一次,甚至半年一次,所以这次不到一个月就再次更新有点蹊跷。据目前透露的信息,这次更新PR貌似主要就是为了修正Twitter PR值的问题。 今天看到SEL上Vanessa Fox的一篇文章,解释了为什么Twitter的一些技术失误导致Google抓取、URL规范化、PR计算等一系列问题,很值得一读,所以大致翻译一下供读者参考。 为什么不是Google的错误,Google却这么上心,更新了PR呢?猜测原因有二,一是无论任何情况下Twitter首页PR为零,大家肯定是说Google有问题,而不是Twitter有问题,虽然其实确实是Twitter自己造成的。二是,在Google+推出的同时,Google与Twitter合作合同到期了,不能直接通过API抓数据了,这时候Twitter PR降为零,大家恐怕心里会嘀咕,这Google真是过了河马上就拆桥啊,Google不想背这个黑锅。 言归正传。 Google一位发言人回复SEL关于Twitter PR时说: 最近Twitter不断修改它们的robots.txt文件和HTTP头信息,玩得太起劲了,暂时造成Google算法处理Twitter时的URL规范化问题。现在规范化问题差不多解决了,所以我们更新了工具条PR以反映最新数据。Twitter在Google索引库里一直有很高PR,没有惩罚。 所以Vanessa Fox研究了一下Twitter到底有什么robots文件、服务器头信息、URL规范化问题。真是不看不知道,一看吓一跳。顺便提一下,Vanessa Fox是前Google员工,负责网管工具webmaster tools的。 预感这篇帖子会比较长,才刚开始就这么长了… Vanessa Fox搜了一下自己名字“Vanessa Fox”,结果如下图: 有URL,但没标题,没说明,也就是其实没抓取,只是部分索引。   直接搜Vanessa Fox自己Twitter页面URL的结果是: 为什么出现了大写?URL最后面那个点(.)又是什么东东?到底怎么回事呢?   先来看看Twitter的robots.txt文件   twitter.com和www.twitter.com的robots.txt文件居然是不一样的。twitter.com/robots.txt是这样的:   #Google Search Engine Robot User-agent: Googlebot # Crawl-delay:

(Read More…)

百度在中国市场上靠什么来领先?

我看过吕伯望的博客,有一篇这样的博客。 他有这样一句话: 我的调查结果,从一个侧面证实,百度大量的流量是靠搜索MP3和百度贴吧得到的。 这里有两个意思, 1,百度靠mp3和贴吧,为百度打下了市场份额的江山,成功。 2,baidu的在网页搜索的市场上做的所的和google的差距还是很大的。 这个同很多站长的看法一致,就是Google在网页搜索的准确度,自然排名的效率来说都比Baidu好。 至于MP3搜索,这样的产品,不是Google不行,而是它不为,Google对于版权的问题一直比较重视,所以对于Google AdSense这样的产品,它都规定: 网站发布商不应将 Google 广告展示在带有 MP3 、视频、新闻组和图像结果等内容的网页上 可见,这是一个相当不作恶的公司。 所谓的低端用户,高端用户的争论,倒是一直都有。 我倒是觉得还是年龄来分,或者用用户成熟程度来分比较好。 一个成年人,上网经常搜索MP3的还是很少的,常去贴吧发帖的更少。 而一个学生,中学生,他未必会去搜索一个产品,而是常常去搜索MP3文件,到贴吧显露一番。 Baidu就是占领了中小学生这一块,主要是中学生,是MP3搜索的主要用户。 从这个调查报告中也可以看到,中学生同大学生相比,只用MP3搜索而不用网页搜索的要高一倍。 Google同Baidu在中国所占领的市场基本上有很大的区分,属于不同的市场定位,重叠的用户群不大,基本上两者没有很大的竞争,因为Google专注于高层次的,学术的,商业的市场;Baidu专注于娱乐的,消费的,无聊的市场。

如果不更新内容对流量有多大影响

过去的两个月里,我没有对博客做内容更新。到10天前才恢复。大家来看看不跟新对流量有多大的影响。 首先看看Google Analytics的报告。从30天环比来看,VIsits减少了1.83%,PV减少了0.38%。流量来源分析可以知道,通过百度来的流量增加了10%之多,而Google却减少了3%,当然直接流量也减少了8%。 似乎并不坏,即使停止更新一个月,也没有造成什么大的影响,只是更为长期的变化还没有看出来。从百度来看,内容的更新对其基本影响很小,而Google显然如它所说,更为喜欢新的,原创的独特内容,当博客停止更新后,来自Google搜索的流量就逐步减少了。 总的来说,谷歌喜欢新的内容,原创的内容,百度更新的速度似乎有些滞后,所以影响不大,从今天开始更新内容,我们来看看,一个月之后是什么样的情况。

谷歌发布平台Google Analytics可统计网站速度

近期不就,谷歌发布新平台。Google Analytics, 并且引入了新的报告,就是stie speed,要在后台看到这个报告必须修改跟踪代码,如果使用的是最新的代码,也都需要手工添加下面这个部分: _gaq.push(['_trackPageLoadTime']); 添加代码的24小时之后,在后台就可以看到相关的报告,包括 平均网页载入时间:网页在浏览器中从开始浏览(如点击网页链接)到完成载入所需的平均时间(以秒为单位)。浏览量:网页在所选日期范围内实际获得浏览的次数。网页载入取样:计算平均网页载入时间时,用来取样的实际网页浏览量。跳出率:对于”网页”报告,这是指对该网页的总浏览量中,该网页是会话中唯一浏览过的网页这种情况所占的百分比。退出百分比:对于”网页”报告,这是指对该网页的总浏览量中,该网页是会话中最后一个网页这种情况所占的百分比。 网站速度不只是对网站排名,网页排名有影响,如果有使用Google AdWords的话,也同样会影响质量分。 有了这个详细的报告,就可以有针对性的对那些流量量很大,但载入速度较慢的进行优化,以改善用户体验。 同Google Pagespeed,或者Yahoo的Yslow工具相比,这里有一个很大的区别,使用Analytics的报告,是从网站用户,从大量的实际用户那里获取的数据,会更准确的反应实际用户的情况。而是用另外两个工具,则只是反映某一台电脑,在某个地点的接入条件下的页面载入状况。 所以,建议有使用Google Analytics的,就可以开始添加代码,使用这个报告了。

© CNxushu所有