大型网站标签系统的构建

最近看了《web信息架构》后感觉标签确实重要,但里面提到的标签方法还比较窄,后来网上看到去年豆瓣的标签ppt,感觉比较系统,遂整理了一份思维导图出来。另外附ppt下载地址曾俊瑀-阿里技术沙龙

感觉标签难的是自然语言的处理,最大作用是“推荐”。最近拿到百度商情1.3亿条词,也做了几个聚类的实验—[……]

Read more