企业网站URL如何规划才算完美
企业网站URL 如何规划才算完美网站URL 的规范对SEO 来说是非常重要的,如果一个网站的连接都是乱七八糟的,搜索引擎怎么会喜欢你的网站呢?通常我们都知道网站的URL 有动态连接和静态连接,那么一般
企业网站URL 如何规划才算完美
网站URL 的规范对SEO 来说是非常重要的,如果一个网站的连接都是乱七八糟的,搜索引擎怎么会喜欢你的网站呢?
通常我们都知道网站的URL 有动态连接和静态连接,那么一般情况下我们在建设网站的时候会把动态连接转化成静态链接,或者伪静态,这样做是为了让搜索引擎更容易的抓去内容和在网站上爬行,那么为什么不建议用动态链接呢?其实我们不应该有连接的歧视,其实动态连接和静态连接是一样的,只是动态连接因为参数太多,很多时候参数越多搜索引擎就会爬进去之后一直循环爬不出来,这就是动态连接的缺点,所以我们一般要求转化成静态链接或者伪静态。我来局一个例子,这是以前在国平老师的博客里面看到的,有一个叫做无限空间,也可以称为无限循环,这样的连接有动态连接,也有静态连接,动态连接比较常见,而静态连接一般出现在比较大型的网站上面,比如网站上面的日历,我们发现这个日历是不是可以无限点击?是的日历可以无限点击,那么是不是代表这个日历有无数个页面呢?这个称为无限循环。
下面引用下国平老师的文章内容:
如很多博客上都会有一个日历,顺着这个日历的日期一直往下点,永远都有链接供你点击的,因为时间是无限的。
其实还有更多的“无限空间”的例子,只是“无限空间”这个名词没怎么翻译好,翻译做“无限循环”就容易理解多了。 举一个例子:
京东商城笔记本分类页面:
当点击“惠普” “11英寸”这2个条件后能出来一个页面,点击“联想” “14英寸” “独立显卡”也能出来一个页面。那总共能出来的页面有多少呢?
这个页面中,品牌有18个分类、价格9个分类、尺寸7个分类、平台3个分类、显卡2个分类。 那么可以组合成的URL 个数为:
按1个条件筛选: 18 9 7 3 2 = 39 。
按2个条件筛选:18×9 18×7 18×3 18×2 9×7 9×3 9×2 7×3 7×2 3×2=527 。 按3个条件筛选:18×9×7 18×9×3 18×9×2 18×7×3 18×7×2 18×3×2 9×7×3 9×7×2 9×3×2 7×3×2=3093。
按4个条件筛选:18×9×7×3 18×9×7×2 18×7×3×2 18×9×3×2 9×7×3×2=7776。 按5个条件筛选:18×9×7×3×2=6804。
总共可以组合出的URL 数量为:39 527 3093 7776 6804=18239 个。
笔记本分类里总共才 624个商品,要放在18239个页面中,而有的页面,一个页面就能放32个产品。势必造成大量的页面是没有商品的。如点击这几个筛选条件后,就没有匹配的商品出来了:
这样的结果,就是造成大量重复的内容以及消耗爬虫很多不必要的时间,这也可以认为是“无限空间”。 这类情况非常常见。如上面举的京东商城的例子还是不怎么严重的,有的网站能组合出几亿甚至无穷无尽个URL 出来。我在国内和国外看过那么多同类的网站,居然发现迄今为止只有两家网站注意到了这个问题。究其原因,还是因为很多SEO 人员不太重视数据,这种问题稍微分析爬虫的日志就可以看出来的。直到现在,还有一些SEOer 认为把这些以前是动态的页面静态化是个有积极意义的事情,没看到不好的一面就是这样的动作制造出了大量重复的页面,向来就是一个在SEO 方面不好的改动。
,另外在讲一下URL 的目录深度和蜘蛛是如何抓取比如URL 为www.xafeidu.com 的。URL 的深度我就不多讲了深度最好不要超过三级,因为搜索引擎的蜘蛛在爬行的时候爬到一个URL 会先保存下来,等所有蜘蛛爬完然后优先的顺序就是选择最短的URL 进行抓取,所以在保存下来的URL 并不能每个都抓取完成,很多目录太深的URL 都抓取不到,上面有讲到过URL 抓去会有很多重复,在这里如果重复URL 太多不同蜘蛛都抓取了重复的页面也就都会保存下来,保存下来的连接又会进行一次筛选,那么相同也页面太多也就浪费了时间,导致很多页面都没有抓取。