如何解决页面相似度过高的题目?
1、获取词相干的内容荟萃,可以把id聚合在列表,进行倒排序;
2、对id荟萃进行去重,或相似度高的去重处理;
3、根据剩下的id荟萃,进行关键词的筛选,掏出合适的做;
剩下的一些相似度高的词或重复效果的词假如要做,就看id荟萃的数量了,假设效果有100个百度网站排名,每页表现20个 你可以把其中5个词只表现1页的数据,确保不重复。当然假如进行适当的混淆,还可以再多点的词。
假如有分页,nofollow去掉分页。
4、增长页面的评论功能;
5、增长随机文章页面;
6、TAG标签;
7、“热门文章”、“本周热门文章”、“统计热门排行”等。