当前位置: 首页 > news >正文

用网站地图帮助搜索引擎

建立网站的目标在于提高知名度与增加用户流量。搜索引擎优化是增加网站流量的一种方法。另一种方法是使用网站地图,它允许你指定一个搜索引擎收录或索引哪些页面。网站地图这一概念最初由Google开发,最近雅虎与MSN也同意应用这一标准。本周我们对网站地图标准进行说明。

建立标准的需要

搜索引擎利用蜘蛛在互联网上爬行,定位网页并将它们收录到数据库中。这一过程需要大量资源,有时,你希望索引的网页被忽略,而无用的网页却被收录。在网络上搜寻变化与新网页,收录它们并进行相应归类的Google Googlebot蜘蛛就是一个典型的例子。

网站地图为网站明确应索引哪些网页,以及网站中增加了哪些新内容提供了一种方法。基本上,它在搜索引擎与网站间提供一个通信通道。理论上,它通过减少搜索引擎蜘蛛的处理对象来缓解资源负担,但当前网站地图不能代替爬行过程。

网站地图简介

网站地图是一个XML文件,它包含一个网址URL表和相关的属性,详细说明应索引某个特定网站的哪些内容。网站地图必须为UTF-8编码。下面是网站地图文件需要的XML元素:

<urlset> -- 网站地图文件以这个标签起始和结束,起始标签必须包括命名空间(xmlns)属性。

<url> -- 文件中的每一个网页包含在这个元素之中。

<loc> -- 文件中指定的网页的实际地址。它是<url>元素的一个子元素。

文件中还有下列可选元素:

<lastmod> -- <url>元素的一个子元素。它指定最近一次更新网页的时间。

<changefreq> -- <url>元素的一个子元素。它指定网页更新的频率(经常、每小时、每天、每周、每月、每年及从未更新)。

<priority> -- <url>元素的一个子元素。它指定网站内网页相对于其它网页的重要性,有效值为0.0-1.0,默认值为0.5。

下面的网站地图样本说明如何在一个样本网页中应用这些元素。它为一个假定的网站指定主页,以及它的更新频率,上次更新的时间和网站中的优先权。

以下为引用的内容:
<?xml version="1.0" encoding="UTF-8"?>
<urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.test.com/</loc>
<lastmod>2006-11-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.3</priority>
</url>
</urlset>

网站地图文件的位置由你自己决定,但它的位置决定了可能包含中文件中的URL集。例如,如果上面的样本网站地图文件位于http://www.test.com/sitemap.xml,那么网站地图文件中可能包含任何以http://www.test.com/开头的URL。因此,我们建议将网站地图文件存放在网站的根目录下。网站地图文件的大小不得超过10MB。如果一个文件超出这个限制,就需要使用gzip进行压缩。

建立一个网站地图

既然网站地图以XML为基础,就可以方便的使用任何文本编辑器建立并编辑它们,不过也可以应用专门的工具。下面的列表提供了一些当前的工具:

Node Map:一个生成并确认网站地图XML文件的工具。

Gsitemap:一个应用.NET Framework建立的网站地图生成工具。 phpSitemapNG:一个用PHP编写的免费网站地图生成器。

通告搜索引擎

建立一个网站地图文件后,应该将它提交给一个搜索引擎。每个搜索都拥有自己的网站地图提交界面。Google的Webmaster工具集中包含了一个网站地图提交页面。在使用之前你必须注册一个账户。雅虎也有一个免费的网站地图提交页面,但在使用之前同样必须注册一个账户。其它搜索引擎也会仿效Google、雅虎和MSN,提供相似的功能。

其它工具

搜索引擎收录网页的爬行过程缓慢而且需要大量资源。网站地图为网站指定应收录哪些内容而进行搜索提供了一种方法。它们建立像XML一样的简单文本格式文件,但有许多工具可以帮助你建立网站地图文件。现在,它们只是对当前的处理过程进行补充。

转载于:https://www.cnblogs.com/wzglweb/archive/2009/02/05/1384896.html

相关文章:

  • svn path already exists的解决办法
  • 千里奔丧
  • 浅谈性能测试
  • 第二节(下)数组
  • 乌克兰电网被黑事件功臣:不让类似事件再次上演
  • 2015年度中国智能路由器市场监测报告
  • [导入]构建WCF面向服务的应用程序系列课程(2):WCF契约设计.zip(14.27 MB)
  • [导入]视频游戏开发系列课程(3):游戏元素大观园.zip(10.69 MB)
  • [翻译]TempDB剩余空间监视与纠错
  • 面对流言,HDS要说:寒冬将至?未必如此!
  • 警惕匿名方法造成的变量共享
  • 原料是否能制约光伏产业的发展?
  • 温习static,sealed,abstract,virtual
  • 外媒:华为2013年就在为起诉三星做准备
  • Hibernate3.3配置日志文件详解
  • [原]深入对比数据科学工具箱:Python和R 非结构化数据的结构化
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • 2017前端实习生面试总结
  • CentOS 7 修改主机名
  • ES6--对象的扩展
  • exif信息对照
  • javascript面向对象之创建对象
  • Python语法速览与机器学习开发环境搭建
  • TiDB 源码阅读系列文章(十)Chunk 和执行框架简介
  • tweak 支持第三方库
  • weex踩坑之旅第一弹 ~ 搭建具有入口文件的weex脚手架
  • 基于Vue2全家桶的移动端AppDEMO实现
  • 解决jsp引用其他项目时出现的 cannot be resolved to a type错误
  • 深度学习在携程攻略社区的应用
  • 微服务入门【系列视频课程】
  • 小程序开发中的那些坑
  • 一些css基础学习笔记
  • 在Unity中实现一个简单的消息管理器
  • 正则表达式
  • Prometheus VS InfluxDB
  • 正则表达式-基础知识Review
  • ​DB-Engines 11月数据库排名:PostgreSQL坐稳同期涨幅榜冠军宝座
  • # MySQL server 层和存储引擎层是怎么交互数据的?
  • # 数论-逆元
  • #gStore-weekly | gStore最新版本1.0之三角形计数函数的使用
  • #HarmonyOS:Web组件的使用
  • #鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
  • #我与Java虚拟机的故事#连载18:JAVA成长之路
  • (12)Linux 常见的三种进程状态
  • (Arcgis)Python编程批量将HDF5文件转换为TIFF格式并应用地理转换和投影信息
  • (DFS + 剪枝)【洛谷P1731】 [NOI1999] 生日蛋糕
  • (草履虫都可以看懂的)PyQt子窗口向主窗口传递参数,主窗口接收子窗口信号、参数。
  • (读书笔记)Javascript高级程序设计---ECMAScript基础
  • (二)【Jmeter】专栏实战项目靶场drupal部署
  • (二)hibernate配置管理
  • (力扣)1314.矩阵区域和
  • (转)Android学习笔记 --- android任务栈和启动模式
  • .[hudsonL@cock.li].mkp勒索病毒数据怎么处理|数据解密恢复
  • .bat批处理(五):遍历指定目录下资源文件并更新
  • .bat批处理(一):@echo off