Google 搜索的工作方式
date
Apr 14, 2022
slug
sitemap-work
status
Published
tags
基础知识
summary
SEO 是指网站更易于搜索引擎处理的过程。
type
Post
Google 抓取工具 会递归的追踪网页中含有href
属性的<a>
标签的链接
flowchart TB
capture[定时抓取]
index[编入索引到数据库]
show[呈现]
subgraph pages[页面]
direction TB
网页1
网页2
...
end
capture --> pages-->index --> show
robots.txt 文件
:定义了搜索引擎的 抓取规则
sitemap
:主动 向爬虫提供信息- 相对被动抓取,改优先级更高
- 变化频繁 或无法通过 链接发现 的页面很重要
参考文档: