为什么你的网站无法被浏览器收录?

如何让更多的用户看到我们的网站,如何让浏览器抓取我们的网页,本博文将教会大家如何把网站地图sitemap.xml提交给浏览器,让浏览器快速找到你的网站

你好,我是猿java。

当我们运维自己的网站时,都希望获取更多的用户,那么如何让用户在浏览器中看到我们的网站呢?下文将从几个点来讲解

什么是网站地图

所谓网站地图,就是按照浏览器要求的格式,把网站页面链接地址一个一个的罗列在一个sitemap.xml文件,,这样浏览器就可以顺着你给的文件抓取你的页面,如下给出一个网站地图文件的例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9"
>
<url>
<loc>https://www.yuanjava.cn</loc>
<priority>0.5</priority>
<lastmod>2022-07-27</lastmod>
<changefreq>weekly</changefreq>
</url>
</urlset>

sitemap.xml文件 文件说明

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
<?xml version="1.0" encoding="UTF-8"?>  告诉浏览器这是一个xml文件

<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9"
>
...
</urlset> 代表是一个url组,里面包含了网站地图中所有的URL

<url>
<loc>https://www.yuanjava.cn</loc>
<priority>0.5</priority>
<lastmod>2022-07-27</lastmod>
<changefreq>weekly</changefreq>
</url> 代表了一个URL
<loc> </loc> 指定URL地址,必填项
<lastmod>: 声明文件最后一次修改的时间。例如:2022–07-27,非必填项
<priority>: 指明该URL较网站其他URL的优先级。数值在0.0到1.0之间。数值越高表明越重要,非必填项
<changefreq>: 用于指明该页面可能更新的频率,告诉搜索引擎应该多久回头抓取一次这个URL,可以是总是、每小时、每天和每周,非必填项

为什么需要网站地图

sitemap.xml的作用是给搜索引擎看的,因为当爬虫很难爬行我们更深层次的内容的时候,只要有这个就能让爬虫按照顺序进行爬取了,方便我们更好的做seo优化

如何创建网站地图

在网站工程的根目录下创建一个sitemap.xml文件,然后把网页配置成一个个标签

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9"
>
<url>
<loc>https://www.yuanjava.cn</loc>
<priority>0.5</priority>
<lastmod>2022-07-27</lastmod>
<changefreq>weekly</changefreq>
</url>

<url>
<loc>https://www.yuanjava.cn/xxx.html</loc>
<priority>0.5</priority>
<lastmod>2022-07-27</lastmod>
<changefreq>weekly</changefreq>
</url>

</urlset>

如何向浏览器提交网站地图

百度浏览器
进入百度资源网站 百度地址, 没有账号的需要注册账号,然后是添加站点,如下图:

img.png

进入站点,按如下图操作,这样就把网站地图提交给百度浏览器了

img.png

google浏览器
进入Google Search Console地址Google Search Console地址,输入自己站点域名,如下图:

img.png

进入站点 google地址,将sitemap.xml文件上传,如下图:

img.png

到此我们就把sitemap.xml提交给了浏览器,接下来的事情就是等着浏览器爬虫抓取我们的页面,然后你可以在百度和google工具中去查看各类指标数据。

学习交流

如果你觉得文章有帮助,请帮忙转发给更多的好友,或关注公众号:猿java,持续输出硬核文章。

drawing