相关文章
从搜狗站长帮助看搜索引擎优化的基础
2024-12-21 17:31

一.引擎工作原理

百度站长学院有一篇比较详细的搜索引擎原理分析,概况来讲有如下几点SEOer必须掌握。

1.抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(Spider)。爬虫顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。

2.处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。

3.提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

二.当用户搜索关键词时,搜索引擎都做了什么?

1.提交网站搜索。站长主动向搜索引擎提交网址,它在一定时间内定向向你的网站派出爬虫,扫描你的网站并将有关信息存入数据库,以备用户查询。由于搜索引擎索引规则相对于过去已发生很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此站长应该在网站内容上多下功夫,并让搜索引擎有更多机会找到你并自动将你的网站收录。

2.当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置、频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

三.搜索引擎喜欢收录什么样的页面?

内容优良而独特的页面。如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 搜索引擎收录。链接层次较浅的页面。过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。

如果是动态网页,请控制参数的数量和URL的长度。搜狗更偏好收录静态网页。重定向次数越多的页面,越有可能被 搜索引擎丢弃、

四.哪些SEO行为会被判断作弊

隐藏文本/隐藏链接。一般指网页专为搜索引擎所设计,但普通访问者无法看到的文本内容或链接。在形形色色的隐藏技术中,最常见的就是把文本或链接文字的字体颜色设置为与背景色相同或十分接近。其他方法包括使用超小号文字、文字放在图片层的后面、页面底部下出现的多余内容、滥用图片 ALT 等;

网页与搜狗描述不符。一般发生于先向搜索引擎提交一个网站,等该网站被收录后再以其它页面替换该网站。常见的“诱饵行为”就属于此类偷梁换柱之举——创建一个优化页和一个普通页,然后把优化页提交给搜索引擎,当优化页被搜索引擎收录后再以普通页取而代之。

误导性关键词。在页面中使用与该网页毫不相干的误导性关键词来吸引查询该主题的访问者访问网站。这种做法严重影响了搜索引擎所提供结果的相关性和客观性,为搜索引擎所深恶痛绝。

重复性关键词。这种作弊技术也被称为“关键词堆砌欺骗”,它利用搜索引擎对网页正文和标题中出现的关键词的高度关注来对关键词进行不合理的(过度)重复。类似的其它做法还包括在HTML元标识中大量堆砌关键字或使用多个关键字元标识来提高关键词的相关性。这种技术很容易被搜索引擎察觉并受到相应惩罚。

恶意互换链接。在网页中互相建立大量指向对方网站的链接。

隐形页面。对实际访问者或搜索引擎任一方隐藏真实网站内容,以向搜索引擎提供非真实的对搜索引擎友好的内容提升排名。

欺骗性重定向。指把用户访问的第一个页面(着陆页)迅速重定向至一个内容完全不同的页面。

日志欺骗行为。是指通过对一些页面等级较高的站点进行大量的虚假点击以求名列这些站点的最高引用者日志中,从而获得它们的导入链接。

建立大量镜像网站复制网站或网页的内容并分配以不同域名和服务器,欺骗搜索引擎对同一页面内容进行多次索引。

页面包含恶意广告、恶意代码或恶意插件

页面有链接指向作弊网站的可能会被视为作弊网站。

此文为看点(智宇)原创内容,特此声明

    以上就是本篇文章【从搜狗站长帮助看搜索引擎优化的基础】的全部内容了,欢迎阅览 ! 文章地址:http://ww.kub2b.com/quote/8381.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站http://ww.kub2b.com/mobile/,查看更多   
发表评论
0评