在本地搭建一个搜索引擎

假设有一堆词,也有一堆内容。现在想知道:

  • 每个词的相关词有哪些?
  • 每个词的相关内容有哪些?
  • 每个内容的相关内容有哪些?

利用上述词与词、词与内容、内容与内容的关联,来优化页面的推荐信息,使用户和搜索引擎获得更好的浏览体验。

这些相关信息的推荐都可以通过搜索来实现,这[……]

Read more

从零搭建推荐体系:如何搭建标签体系?(下篇)

5. 推荐体系

5.1 推荐方法

很明显,推荐方法和推荐算法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。详细的方法介绍也放置在附录4当中以供参考,下面梳[……]

Read more

从零搭建推荐体系:如何搭建标签体系?(上篇)

概述

随着信息技术的迅速发展和信息内容的日益增长,“信息过载”问题愈来愈严重,愈发带来很大的信息负担。推荐系统可以有效缓解此难题,从而得到推崇并加以广泛应用。

简单来说:推荐系统是通过挖掘用户与项目之间的二元关系,帮助用户从大量数据中发现其可能感兴趣的项目如网页、服务、商品、人等,并生成个性[……]

Read more

【大拿分享】优秀SEO诊断书分享——张亚楠

通过SEO诊断师招募审核的SEOer们正在为蝶变行动获奖站点进行诊断,在此期间,我们先来看看途牛SEO负责人张亚楠的参选作品。
评委李华东的点评:
  众多方案书当中张亚楠的诊断书可执行性做的是最好的,从 分析数据分析到具体的SEO操作思路都是值得称赞的,不但 指出了问题,并且给出了建议和调整的[……]

Read more

【大拿分享】ZERO大神新鲜出炉网站SEO系统分析诊断书

Read more

第一期:页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。

站点求助:现象
  编织汇网站内容发布后几个礼拜都未曾收录。案例如[……]

Read more

第二期:服务器限制外网访问造成主动推送失败

《院长帮帮忙》栏目开始运营以后受到了广大站长欢迎,院长每天都会收到各种问题求助。为了更多站长获得收益,我们从中选取了最具有代表性的问题展现给大家。

项目背景:和讯网参加星火计划2.0内测,按照站长平台主动提交技术说明代码,共提交两次,均返回报错。

下面我们分享下整个case的排查过程:[……]

Read more

第四期:URL构成越简单越平常越好

SEO不是事后工作,在站点在建设之初就要考虑到如何对搜索引擎友好。在院长看来,与其出手阔绰、花大价钱买个域名,不如找个经验丰富的SEO人员在站点结构等基础工作上多下工夫——这期院长帮帮忙,说的正是一个大家容易忽略的细节问题:url构成。先说结论吧:url构成(或者叫url规则)越简单越平常,百度处理[……]

Read more

第二期:无效搜索结果页是个祸害

站点求助:现象
B2B新站上线有一个月,一开始的时候收录还是不错的,在百度里直接搜索网站名能排到首页第5位的样子,但是在百度站长平台认证了我们的站,修改了一下robots 文件,其他什么都没有做,就完全被拔毛了。现在搜索网站名完全找不到我们的网站的首页了。

站点求助:自查
1,ROBOTS[……]

Read more

【干货分享】一张图看懂收录与索引的区别

在过去的一段时间里,大家一度对收录和索引的概念非常模糊,百度工程师也曾“粗暴”地说过“收录和索引是一回事”。但实际工作中,院长发现,其实收录和索引都有其各自的重要意义,并不能含糊地混为一谈,于是制作了这样一张图,让大家快速了解收录与索引的区别。


1,收录和索引分别指什么
  收录:页面被[……]

Read more