• 桔子92

  • 每天学习一点
    • 首页
    • 微语
    • 归档
    • 相册
    • 登录
  • 百度搜索引擎的工作流程

    本文作者桔子92发表于2012-08-20 21:17:10 评论(0) | 引用() | 浏览(2963) | 分类(SEO优化)

    从输入关键词,到百度给出搜索结果的过程,往往仅需几毫秒即可完成。百度是如何在浩如烟海的互联网资源中,以如此之快的速度将您的网站内容展现给用户?这背后蕴藏着什么样的工作流程和运算逻辑?事实上,百度搜索引擎的工作并非仅仅如同首页搜索框一样简单。

    搜索引擎为用户展现的每一条搜索结果,都对应着互联网上的一个页面。每一条搜索结果从产生到被搜索引擎展现给用户,都需要经过四个过程:抓取、过滤、建立索引和输出结果。

    抓取

    Baiduspider,或称百度蜘蛛,会通过搜索引擎系统的计算,来决定对哪些网站施行抓取,以及抓取的内容和频率值。搜索引擎的计算过程会参考您的网站在历史中的表现,比如内容是否足够优质,是否存在对用户不友好的设置,是否存在过度的搜索引擎优化行为等等。

    当您的网站产生新内容时,Baiduspider会通过互联网中某个指向该页面的链接进行访问和抓取,如果您没有设置任何外部链接指向网站中的新增内容,则 Baiduspider是无法对其进行抓取的。对于已被抓取过的内容,搜索引擎会对抓取的页面进行记录,并依据这些页面对用户的重要程度安排不同频次的抓取更新工作。

    需您要注意的是,有一些抓取软件,为了各种目的,会伪装成Baiduspider对您的网站进行抓取,这可能是不受控制的抓取行为,严重时会影响到网站的正常运作。点此识别Baiduspider的真伪

    过滤

    互联网中并非所有的网页都对用户有意义,比如一些明显的欺骗用户的网页,死链接,空白内容页面等。这些网页对用户、站长和百度来说,都没有足够的价值,因此百度会自动对这些内容进行过滤,以避免为用户和您的网站带来不必要的麻烦。

    建立索引

    百度对抓取回来的内容会逐一进行标记和识别,并将这些标记进行储存为结构化的数据,比如网页的tag、title、metadescripiton、网页外链及描述、抓取记录。同时,也会将网页中的关键词信息进行识别和储存,以便与用户搜索的内容进行匹配。

    输出结果

    用户输入的关键词,百度会对其进行一系列复杂的分析,并根据分析的结论在索引库中寻找与之最为匹配的一系列网页,按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户。

    综上,您若希望通过搜索引擎为用户带来更好的体验,需要对进行您的网站严格的内容建设,使之更符合用户的浏览需求。需要您注意的是,网站的内容建设始终需要考虑的一个问题是,这对用户是否有价值。

    http://lusongsong.com/info/post/209.html

    标签: seo基础
    除非注明,博客内容均为桔子92原创,欢迎转载,转载请注明本文地址,谢谢。
    本文地址:https://ju.xuhehuan.com/seo/6.html
    et_highlighter51
    上一篇:Google搜索引擎的工作原理
    下一篇: 5条用来A/B测试PPC广告文本的思路
    取消回复

    发表评论:

  • 搜索

  • 最新微语

    • 早上妹妹不肯放我走,又跟我商量:爸爸上班,你在家陪我好不好?奶奶说爸爸上班挣钱买米买油,妈妈上班买花衣服。她不买账。我说妈妈不上班,就没钱给你买贴贴书了,她立马推我一下,妈妈你赶紧上班去吧!

      2022-05-12 14:37

    • 晚上陪欣欣一起读书,里面有提到“时间、永远”的话题,欣欣联想到了愚公移山的故事,大致讲了一遍,子子孙孙无穷尽也。然后她小脑瓜一转,如果有人不愿生孩子怎么办,或者生不了孩子怎么办,因为生孩子需要爸爸的爱呀。 -- 小娃已经有简单的思辨能力了,比我强。

      2021-09-06 11:09

    • 欣欣进入一年级了,入校第一天,半天活动,后天正式上课。

      2021-08-30 12:31

    • 时间要打多久,我想我们不要做决定。过去是由杜鲁门,以后由艾森豪威尔,或者由美国将来的什么总统,他们去做决定。他们要打多久,我们就打多久,一直打到完全胜利为止!

      2021-07-12 16:23

    • 理科男的温柔和浪漫!被感动到了!要像他一样优秀!

      2021-07-09 08:25

    • 更多»

  • 热门日志

    • 批量分批次打开excel表格中的超链接
    • Excel超链接的常用技巧
    • 从专业到专家:谷歌分析的多渠道通路功能
    • EMlog 时间轴文章归档插件展开全部
    • 免费移动网站制作工具
  • 日历

  • 最新评论

    • 河北SEO
      博主该更新博客了
    • 蔓草札记
      每天学习一点点。
    • xhhjin
      故不登高山,不知天之高也;不临深溪,不知...
    • xhhjin
      @小众博客:是啊,论坛骑士可不是吃素的喔
    • 小众博客
      @李明:哪里都有你。我发现用emlog做...
    • wys.me
      @xhhjin:CSS万岁!
    • 李明
      大家也是这样长大家,明天会更好的。
    • xhhjin
      @wys:在有些主题上要调整下CSS设置...
    • wys
      时间轴功能不支持某些模板,比如我正使用的...
    • 李明
      当你老了,头发白了,还有什么好说呢!
  • 分类

    • SEO优化(20) 订阅该分类
  • 标签

    • seo 工具 ROI seo基础 社会化营销 Adwords Google GA GAE 翻墙 臭美之心 工具 seo 网站分析 美文 邮件营销 EDM 网站分析—A/B测试 工作闲记 电子商务 Excel 淡季 营销 电影 评论 网站技术 备忘记事 育儿经验 黄山 游玩攻略
  • 存档

    • 2021年8月(1)
    • 2020年10月(2)
    • 2018年12月(1)
    • 2015年12月(1)
    • 2015年7月(3)
    • 2015年5月(2)
    • 2014年12月(1)
    • 2014年11月(1)
    • 2014年10月(1)
    • 2014年5月(1)
    • 2014年4月(1)
    • 2014年3月(1)
    • 2014年2月(2)
    • 2013年12月(2)
    • 2013年11月(2)
    • 2013年5月(2)
    • 2013年4月(2)
    • 2013年3月(1)
    • 2013年2月(1)
    • 2013年1月(6)
    • 2012年11月(3)
    • 2012年10月(4)
    • 2012年9月(4)
    • 2012年8月(18)
    • 2012年7月(1)
    • 2008年12月(1)
    • 日志数量:65
    • 评论数量:16
    • 网站年龄:3971天
订阅Rss
Powered by emlog | Copyright © 桔子92 | 手机访问 | 网站统计 | 返回顶部