Sitemap

Un site map (o sitemap) es un archivo XML que lista las páginas en un sitio web, organizadas comúnmente de forma jerárquica. Esto ayuda a los visitantes y a los motores de búsqueda a hallar las páginas en un sitio.

Los site maps pueden mejorar la optimización para los motores de búsqueda de un sitio asegurándose que todas ellas puedan ser encontradas. Esto es especialmente importante si el sitio usa menús Macromedia Flash o JavaScript que incluyan enlaces HTML.

La mayoría de los motores de búsquedas sólo seguirán un finito número de enlaces desde una página, así si el sitio es muy grande, se deberán usar estrategias adicionales además del site map requerido por los motores de búsqueda y para que los visitantes puedan acceder al contenido.

Mientras que algunos desarrolladores argumentan que un índice del sitio (site index) sería un término más apropiado, los usuarios han estado usando este (site map) para referirse a la estructura del sitio.

XML Sitemaps

Google introdujo Google Sitemaps así los desarrolladores web pueden publicar listas de enlaces de sus sitios. La premisa básica es que algunos sitios tienen un número grande de páginas dinámicas que sólo están disponibles cuando se usan formularios (ej: cuando ingresa las palabras buscadas en un campo de búsqueda). Los archivos del site map pueden entonces usarse para indicar a un web crawler cuántas páginas deben ser encontradas.

Google, MSN y Yahoo recientemente se han unido support en el uso del protocolo site map.

Sitemap y SEO

El sitemap es de gran ayuda en los proyectos de seo ya que indica a los buscadores donde está el contenido que se tiene que indexar. Ningún buscador garantiza la indexación de todas las páginas del sitemap, pero está más que probado que websites con sitemap indexan más páginas lo que refleja en una mejor posición en los buscadores.

Formato standard del sitemap XML

A continuación ofrecemos un Sitemap de muestra que contiene únicamente una URL y usa todos los códigos opcionales. Los códigos opcionales están en cursiva.

<?xml version="1.0" encoding="UTF-8"?>
  < urlset xmlns="http://www.geeks.ms/blogs/dnudelman/">
   < url>
    < loc>http://www.geeks.ms/</loc>
    < lastmod>2008-10-10</lastmod>
    < changefreq>monthly</changefreq>
    < priority>0.8</priority>			
   </url>  
  </urlset>

 

El Sitemap debe:

  • Comenzar con un código de <urlset> de inicio y finalizar con un código de </urlset> de cierre.
  • Incluye una entrada de <url> para cada URL como código XML matriz.
  • Incluya una entrada secundaria de <loc> para cada código matriz de <url>.

Definiciones del código XML

Los códigos XML disponibles se describen a continuación.

 

<urlset>

obligatorio

Encapsula el archivo y hace referencia al protocolo estándar actual.

 

<url>

obligatorio

Código matriz de cada entrada de URL. Los demás códigos son secundarios de ése.

 

<loc>

obligatorio

URL de la página. Esta URL debe comenzar con el protocolo (como http) y acabar con una barra diagonal, si su servidor web así lo requiere. Este valor debe contener menos de 2.048 caracteres.

 

<lastmod>

opcional

La fecha de la última modificación del archivo. Esta fecha debe presentar el formato W3C de fecha y hora. Este formato le permite omitir la parte referente al tiempo, si lo desea, y utilizar AAAA-MM-DD.

 

<changefreq>

opcional

Frecuencia con la que puede cambiar esta página. Este valor proporciona información general a los motores de búsqueda y es posible que no se corresponda exactamente con la frecuencia de rastreo de la página. Valores aceptados:

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

El valor "always" se utiliza para describir documentos que cambian cada vez que se accede a ellos. El valor "never" se utiliza para describir URL archivadas.

Por favor, tenga en cuenta que el valor de este código se considera una sugerencia y no es obligatorio. A pesar de que los rastreadores de motores de búsqueda tienen en cuenta esta información cuando toman decisiones, pueden rastrear páginas marcadas "hourly" con menor frecuencia de lo que indica la marca, y también pueden rastrear páginas marcadas "yearly" con más asiduidad. Asimismo, es posible que rastreen periódicamente páginas marcadas "never" para poder hacer frente a los cambios inesperados de estas páginas.

 

<priority>

opcional

La prioridad de esta URL es relativa, en función de las demás URL de su sitio. Los valores aceptados abarcan desde 0,0 hasta 1,0. Este valor no afecta a sus páginas con respecto a las páginas de otros sitios, únicamente permite informar a los motores de búsqueda cuál de sus páginas considera más importante, de modo que puedan ordenar el rastreo de sus páginas en la forma en que usted prefiera.

La prioridad predeterminada de una página es 0,5.

Por favor, tenga en cuenta que la prioridad que asigne a la página no influye sobre la posición de sus URL en las páginas de resultados de los motores de búsqueda. Los motores de búsqueda utilizan esta información para elegir entre URL del mismo sitio, de modo que puede emplear este código para incrementar las probabilidades de que sus páginas más importantes se incluyan en un índice de búsqueda.

Asimismo, por favor, tenga en cuenta que la asignación de alta prioridad a todas las URL de su sitio no le servirá de ayuda, dado que la prioridad es relativa; sólo se utiliza para elegir entre las distintas URL de su sitio. La prioridad de sus páginas no se comparará con la de las páginas de otros sitios.

Para mas información consultar el protocolo de google relacionado con sitemaps.
Saludos,
David Nudelman
Published 23/10/2008 15:50 por David Nudelman
Archivado en: ,,,
Comparte este post:
http://geeks.ms/blogs/dnudelman/archive/2008/10/23/sitemap.aspx

Comentarios

# re: Sitemap

Hola David

Dejo por aqui la referencia a esta web

http://www.sitemaps.org/

A pesar que es facil generarlo con XMLWriter a partir de nuestro web.sitemap o de algun proveedor de sitemap personalizado en las aplicaciones ASP.NET a veces es bueno automatizar la tarea, por eso este control puede ser interesante

www.codeplex.com/sitemapgenerator

Saludos

Thursday, October 23, 2008 6:32 PM por José A. Fernández

# re: Sitemap

En las ASP.NET Futures también había una API para hacer esto: geeks.ms/.../sitemaps-y-asp-net.aspx.

Saludos,

Friday, October 24, 2008 12:18 AM por Sergio Tarrillo

# re: Sitemap

Gracias! Estan muy bien las referencias. En un post anterior mio hago referencia a una herramienta online gratis que genera los sitemaps.

Saludos!

(geeks.ms/.../seo-y-javascript.aspx)

Friday, October 24, 2008 6:38 PM por David Nudelman