找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
售后投诉-点我祝贺本站成立6周年,赠送站群seo全套工具包
购买软件必看VS销售客服必看守则
查看: 454|回复: 0

百度搜索引擎工作

[复制链接]

70

主题

0

回帖

440

积分

超级版主

积分
440
发表于 2020-12-10 16:14:18 | 显示全部楼层 |阅读模式
2011110917571320827073277.jpg
   百度搜索引擎工作大致可以分为以下几步?


      一、蜘蛛爬行网页抓取内容建库


        百度蜘蛛从一些重要的种子URL开始,通过页面上的超链接关系,不断的发现新URL并抓取网页。对于类似百度这样的大型spider系统,因为每时 每刻都存在网页被修改、删除或出现新的超链接的可能,因此,还要对spider过去抓取过的页面保持更新,维护一个URL库和页面库。


     二、建立索引,检索排序


       1)抓取入库,对页面进行分析,页面分析的过程实际上是将原始页面的不同部分进行识别并标记
       2)进行分词,分词的过程实际上包括了切词分词同义词转换同义词替换等等     
       3)  进行排序,影响搜索结果排序的因素:相关性、权威性、时效性、重要性、丰富度、受欢迎程度


    三、外部链接,即为外链


     吸引蜘蛛抓取、向搜索引擎传递相关性信息、提升排名。


    四、搜索结果展现



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则



手机版|泛目录站群

GMT+8, 2025-1-2 23:03 , Processed in 0.121900 second(s), 24 queries .

Powered by 泛站群 X3.5

© 2001-2028 黑侠泛站群官方网站

快速回复 返回顶部 返回列表