明白搜索引擎所看到的内容
搜索引擎看到的同你通过浏览器看到的是不一样的,要明白其中的道理需要知道页面是怎样被创建的。下面是这个过程:
1. 用户在浏览器中输入URL,或者点击一个链接,浏览器向服务器发出信息请求特定的页面。
2. web服务器抓取相关的页面并且快速的阅读看看在发送前还需要作怎样的处理。
3. web服务器编译页面,如果需要的话。比如,在一些情况下,web服务器端需要运行asp或者是php scripts。
4. 在完成编译后,发送到浏览器。
5. 当浏览器收到页面后,会通读页面查看相关的指令,如果需要会进一步的编译页面。这里有一些例子是浏览器需要处理的指令:
l 发现<script>标签,被告知需要从别的文件装载一个文件,而他又需要从服务器读取一个文件。
l 在文件中发现被包含的JavaScripts,需要运行该JavaScripts。
l 可能会发现包含了图片、多媒体、css等等。
6. 但上述步骤完成后,浏览器就向用户展示页面。
这就是一个页面呈现的一般的过程,但是,搜索引擎通过搜索程序索引页面的工作过程是完全不同等的。当搜索引擎请求一个页面的时候,服务器还是按照他的一般程序,按照指令创建页面,发送给搜索程序。但是,搜索程序并不是完全按照页面中的指令执行,他只读取页面内容,不会执行其中的scripts指令。
Scripts指令有两种:
l 基于浏览器端的。这是搜索引擎所不能执行的,所以搜索引擎不可见。如用 javascripts创建的导航。一些人还用这种方法来故意对搜索引擎隐藏内容。
l 基于服务器端的。如:SSI(server side include),这是搜索引擎可见的,因为服务器编译完成后传给搜索引擎的。