相关资讯
发表时间: 2021-03-25 11:06:19
蜘蛛抓取回来的页面,再经过搜索引擎的预处置后,页面就会保管在索引数据库中了,用户在搜索框中输入查询的关键词后,排名程序就会调用索引数据库中的数据,计算排名展现给用户。普通状况下,检索效劳能够分为两个步骤:
(1)处置查询词
搜索引擎首先会将用户查询的问题经过分词的办法停止拆分,例如问题为“哪里有靠谱的seo入门教程”可拆分为“seo入门教程”、“靠谱的seo教程”等等。
(2)获取排序
查询的问题被拆分之后,搜索引擎会将拆分结果与预处置时树立的索引数据停止比照,之后应用倒排索引将比照后最匹配的结果展现给用户。
在检索过程中,搜索引擎是依据用户搜索的词来展示给用户对应页面的。从这里我们能够看出,优化网站的时分,关键词的选择特别重要,我们一定要发掘出所在行业的用户习气搜索的词是哪些,然后将这些词在网站中停止合理规划优化。
综上,蜘蛛在互联网中抓取网页后,将网页寄存在原始数据库中。网页在原始数据库中经过预处置(提取文字、中文分词、页面去重、PR计算、树立索引、链接剖析),才干参与用户的搜索展示,流程大致如下: