乔向阳:项目驱动学Python编程,一箭双雕【据说不会Python的都不是好SEOer】

最近需要对聚合页面SEO做研究,为了对比分析需要记录各同行网站的关键词排名情况。

手工记录的话效率太低,样本数量也有限。

于是要把这部分工作自动化,因为自学过PHP编程,实现这个需求没问题。

但我打算使用Python,给自己一天的时间边学边写代码,用项目来驱动Python学习。[……]

Read more

日志分析脚本

分享一个自己平常用的日志分析脚本,很简单,主要统计URL的抓取和流量数据,略细分。光年那宏观的数据感觉没多大用,就没往里加。因为是临时想到什么就往里加的什么,搞得好多变量自己都忘了是干嘛的,所以整体看上去比较繁琐。效率一般,i3处理器1G多日志3、4分钟。

执行命令:python log_fi[……]

Read more

百度搜索研发部:浅谈互联网页面价值

搜索引擎如何判断网页页面价值?这篇来自百度搜索研发部的文章可以给我们提供一些线索,看看百度这一类商业搜索引擎,是怎么判断网页页面价值的。

百度搜索研发部:浅谈互联网页面价值

———————以下是文章的开始————————-

搜索引擎每天处理着数以亿计的查询[……]

Read more

如何保证网站长期的SEO健康度

本篇文章的意义之一,很多站长对自己网站健康状况没有头绪:

在百度举办的活动上,有不少的站长会向百度工作人员提出一些根本无法回答的问题:

  1. 收录掉了,怎么办?
  2. 抓取掉了,怎么办?
  3. 流量掉了,怎么办?
  4. 排名掉了,怎么办?
  5. 收录不及时,怎么办?

这些问题太笼统了,即[……]

Read more

百度蜘蛛(Baiduspider)的referer

什么是百度蜘蛛的referer

百度蜘蛛的referer,是指当百度蜘蛛抓取某一个URL的时候,在HTTP头中带的Referer字段。请注意,这个定义和百度最近声明去除Referer中关键词数据没有任何关系。这次讲的是spider发起的HTTP请求,百度而去除的是用户发起的。如果百度蜘蛛抓取百度首[……]

Read more

如何避免大量URL重复收录

首先声明,我们只谈论有检索意义的URL,也就是用户会从搜索引擎查找的页面.其他页面按照常用的方法做屏蔽就好了.

鉴于很多站长都爱讨论整体的收录量,我必须泼一下冷水,也许你的有效收录是1/10.

URL参数

也叫URL query,是一个最复杂,最容易被忽视,最容易被妥协的问题.他是网站运营[……]

Read more

SEO PUSH API(如何实现SEO元素的定制化和需求分离)

一般的大网站会划分产品,运营,销售,营销,研发等部门。其中几乎所有职能部门都会给研发部提需求,排期,上线,改BUG。营销中的SEO往往是被排在优先级靠后的位置,SEO的需求实现很慢,而出了BUG也比较靠后才会修复。为了解决这个问题,我提出一个“SEO PUSH API”的概念。 相信很多公司已经这么[……]

Read more