乔向阳:项目驱动学Python编程,一箭双雕【据说不会Python的都不是好SEOer】

最近需要对聚合页面SEO做研究,为了对比分析需要记录各同行网站的关键词排名情况。

手工记录的话效率太低,样本数量也有限。

于是要把这部分工作自动化,因为自学过PHP编程,实现这个需求没问题。

但我打算使用Python,给自己一天的时间边学边写代码,用项目来驱动Python学习。[……]

Read more

日志分析脚本

分享一个自己平常用的日志分析脚本,很简单,主要统计URL的抓取和流量数据,略细分。光年那宏观的数据感觉没多大用,就没往里加。因为是临时想到什么就往里加的什么,搞得好多变量自己都忘了是干嘛的,所以整体看上去比较繁琐。效率一般,i3处理器1G多日志3、4分钟。

执行命令:python log_fi[……]

Read more

人人会Python系列(1)——采集网页模拟表单利器pycurl

对于论坛较常见的贴自己写的代码的帖子,总的而言并不是很推荐,将他人的代码套入自己的需求往往比较难。而通用性的教程,可以帮到更多人更轻松的搞定自己的技术需求,这些是相对更推荐在论坛分享的内容。

这边就开一个系列,讲Python可以如何用来处理一些SEO需求,主要是一些模块的使用方法等。至于Pyt[……]

Read more

百度搜索研发部:浅谈互联网页面价值

搜索引擎如何判断网页页面价值?这篇来自百度搜索研发部的文章可以给我们提供一些线索,看看百度这一类商业搜索引擎,是怎么判断网页页面价值的。

百度搜索研发部:浅谈互联网页面价值

———————以下是文章的开始————————-

搜索引擎每天处理着数以亿计的查询[……]

Read more

如何保证网站长期的SEO健康度

本篇文章的意义之一,很多站长对自己网站健康状况没有头绪:

在百度举办的活动上,有不少的站长会向百度工作人员提出一些根本无法回答的问题:

  1. 收录掉了,怎么办?
  2. 抓取掉了,怎么办?
  3. 流量掉了,怎么办?
  4. 排名掉了,怎么办?
  5. 收录不及时,怎么办?

这些问题太笼统了,即[……]

Read more

百度蜘蛛(Baiduspider)的referer

什么是百度蜘蛛的referer

百度蜘蛛的referer,是指当百度蜘蛛抓取某一个URL的时候,在HTTP头中带的Referer字段。请注意,这个定义和百度最近声明去除Referer中关键词数据没有任何关系。这次讲的是spider发起的HTTP请求,百度而去除的是用户发起的。如果百度蜘蛛抓取百度首[……]

Read more