找回密码
 注册会员

扫一扫,访问微社区

QQ登录

只需一步,快速开始

立即体验天翼云服务器(质量靠谱V3.6版本中需要设置的地方汇总点此领幸运券买阿里云优惠多
查看: 1638|回复: 0

要限制SE的爬行轨迹

[复制链接]

5

主题

68

回帖

0

积分

正式会员

积分
0
发表于 2013-2-17 09:18:28 | 显示全部楼层 |阅读模式
一个页面放置的功能版块的顺序,是把最活跃的代码放在最前面。这样才能刺激SE蜘蛛对我们网站产生吸引力。GOOGLE抓页面2500个字左右。可能对有的面只抓取几十个字。如果首页设计,要调取的内容非常的多。可能我们的新闻版块是最活跃的,可能我们的产品是固定的展示。我们在SE的最近方,就放活跃度最高的版块,产品介绍,公司介绍,联系我们。
   我们设置架构,要限制SE的爬行轨迹。每一块都是很重要的东西,这个情况下,要用程序造成相互串联。在串联的过程当中,不要串联的版块太多,路径太深。太深也不会去抓取,只会抓取4个以内的网页内容。
   重点的是网站的新闻,SE直接爬到新闻版块。如果新闻又分为行业新闻、国际新闻,它就会逐渐往下延伸。
   搜索引擎对重要页面的抓取。由于互联网中信息量极其庞大,为了向用户展示更多有价值的信息,搜索引擎会优先抓取每个网站中相对重要的页面(即权重较高的页面)然而,搜索引擎是怎样发现这些重要页面的呢?根据重要页面的链接指向的页面可能是重要页面的思路;搜索引擎首先会从权重相对较高的页面(即源页面)出发跟踪其中的链接,从而抓取其他相对重要的页面
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

QQ|Archiver|手机版|小黑屋|嘉缘软件官网 ( 沪ICP备12042403号-2 )

GMT+8, 2025-8-26 21:26 , Processed in 0.072422 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表