Configurando el motor de búsqueda de SharePoint (Parte III) Orígenes de contenido

Una vez hemos configurado el servicio de búsqueda con acceso a todo el portal, (parte I y parte II) debemos crear y configurar el/los orígenes de contenido para especificar que contenido queremos rastrear y de dónde obtendremos los datos. Un origen de contenido, especifica las direcciones de inicio del rastreador. Por defecto, cuando se instala el producto, existe un origen de contenido creado denominado “Todos los sitios” mediante el cuál se rastrean todas las aplicaciones web existentes en la granja. Cada vez que se crea una nueva aplicación web, ésta se añade al origen de contenido por defecto, de modo que en los resultados de la búsqueda, pueden salir elementos de otra aplicación web (si el usuario tiene permiso en varias aplicaciones web). En muchas ocasiones, se recomienda crear un origen de contenido por aplicación web, o incluso varios orígenes de contenido para una misma aplicación web, dependiendo del funcionamiento deseado. A continuación veremos como se crea y configura un origen de contenido, y como se puede añadir eliminar contenido de éste.

Para crear un origen de contenido, hay que acceder a la administración central de la granja y posteriormente, seleccionaremos el proveedor de servicios compartidos, en mi caso, “SharedServicess1”.

Dibujo

A continuación, seleccionamos la opción “Configuración de Búsquedas” dentro de la sección “Búsqueda”.

Dibujo2

En la ésta página se muestra tras pulsar el enlace, aparece información del servicio de búsqueda, dónde se puede comprobar a simple vista, si el servicio está rastreando elementos, el número de orígenes de contenido que existen, los elementos que se han rastreado, número de errores,…

Dibujo3

En nuestro caso, seleccionamos “Orígenes de contenido y programaciones de rastreo” y pulsamos sobre “Nuevo”.

 dibujo4

En ésta página, nos solicitan los datos para la creación del origen de contenido, así como programar el rastreo para conseguir que se añade el contenido automáticamente al índice. Será necesario rellenar todos los campos.

  • Nombre: indica el nombre que le daremos al origen de contenido.
  • Tipo de origen de contenido: indicamos de dónde obtendremos el contenido, carpetas de red, sitios web, carpetas de Exchange, sitios de SharePoint…
  • Direcciones de inicio: Especificamos la dirección del sitio de SharePoint, carpeta de red,… en función del valor seleccionado en el caso anterior.

De ésta forma tendremos los orígenes de contenido disponibles para realizar búsquedas desde el portal, sobre elementos de SharePoint, o bien carpetas de red, otras páginas web, correo,…

Como punto importante a tener en cuenta, son las programaciones de rastreo dado que hasta que no se lance un nuevo rastreo (incremental) no se tendrá acceso en la búsqueda al contenido del portal. Esto puede inducir a reducir la frecuencia de los rastreos incrementales, y hay que tener en cuenta que es un proceso que accede al portal o por tanto reduce el rendimiento. Hay que buscar un equilibrio en función de las necesidades de cada uno.

Para ampliar la información acerca de los elementos que se pueden rastrear y como añadir o eliminar elementos del índice, os dejo los siguientes enlaces que pueden ser de ayuda.

TechNet – Configuración de búsqueda e indización

TechNet – Creación de orígenes de contenido

TechNet – Contenido a rastrear

TechNet – Administración de Orígenes de Contenido

Configurando el motor de búsqueda de SharePoint (Parte II) Reglas de rastreo

En la primera parte, vimos como configurar los servicios de búsqueda y la cuenta de acceso al contenido (leer entrada), de ésta forma, nos aseguramos que los servicios de rastreo tengan acceso al contenido de nuestras aplicaciones web, pero existen más opciones de configuración para evitar que se rastree determinada información, o bien agregar nueva información. Para ésto, utilizaremos las reglas de rastreo.

Las reglas de rastreo nos permiten añadir o excluir contenido del índice de elementos rastreados. Antes de ver como se crean las reglas de rastreo, es necesario resaltar la diferencia entre las reglas de rastreo y las reglas de los ámbitos. En el caso de las reglas de rastreo de exclusión, el contenido que cumple con el criterio especificado en la regla, se elimina del índice, de modo que nunca estará disponible para nadie/nada, mientras que si se añade una regla de un ámbito de exclusión, el contenido no se elimina del índice pero si del contenido de ese ámbito, de modo que el contenido estará disponible para el resto de los ámbitos.

Para crear las reglas de rastreo, hay que acceder a la administración central de la granja y posteriormente, seleccionaremos el proveedor de servicios compartidos, en mi caso, “SharedServicess1”.

Dibujo

A continuación, seleccionamos la opción “Configuración de Búsquedas” dentro de la sección “Búsqueda”.

Dibujo2

En la ésta página se muestra tras pulsar el enlace, aparece información del servicio de búsqueda, dónde se puede comprobar a simple vista, si el servicio está rastreando elementos, el número de orígenes de contenido que existen, los elementos que se han rastreado, número de errores,… A continuación, pulsaremos en “Reglas de Rastreo”.

reglas

 

Existen dos tipos de reglas:

  • Reglas de exclusión: reglas que eliminan del índice todos los elementos rastreados que cumplan el criterio especificado en la ruta de acceso. Por ejemplo, en la imagen siguiente, se muestra una regla de rastreo que no permite añadir al índice ningún elemento del sitio subsite1 que se encuentre en el sitio mySiteName.

exclude

  • Reglas de inclusión: reglas que añaden al índice elementos rastreados que cumplan el criterio especificado en la ruta. En este caso, la ruta puede ser otro servidor de SharePoint, o una sitio web. La peculiaridad de estas reglas de rastreo de inclusión, es la posibilidad de modificar la cuenta de acceso que será necesaria para rastrear el sitio especificado, o bien un certificado.

    include

    Más información:

    TechNet – Reglas de Rastreo

  • Configurando el motor de búsqueda de SharePoint (Parte I)

    Durante estos primeros posts, voy a escribir sobre la configuración del motor de búsqueda de SharePoint, y poco a poco me iré metiendo en otras opciones de configuración, en ocasiones desconocidas, que pueden repercutir en el rendimiento de la búsqueda, rastreo o resultados obtenidos. Pero antes de nada, será necesario tener configurados los servicios, orígenes de contenido, ámbitos, propiedades…

    En la mayoría de las aplicaciones web que se crean con MOSS, ya sea intranet o internet, es necesario incluir la funcionalidad de búsquedas para facilitar la localización del contenido dentro del portal. En esta entrada, veremos cómo activar el servicio de búsqueda para que indexe todo el contenido del portal.

    Antes de empezar:

    • Existen dos procesos encargados del rastreo de contenido.
      • Windows SharePoint Services Search, el cual proporciona indización y búsqueda de texto completo al usuario de SharePoint, además de contenido de ayuda.
      • Office SharePoint Server Search, el cual proporciona una indización y búsqueda mejoradas para el contenido de los servidores de Office SharePoint Server. Es importante tener en cuenta que este servicio reemplaza el servicio de búsqueda de Windows SharePoint Services para buscar en el contenido de usuario de SharePoint, de modo que si no se quiere indexar la ayuda no es necesario tener en marcha el servicio Windows SharePoint Services Search.
    • Es recomendable crear una cuenta de usuario en el directorio activo (si hay) o en local, que será la encargada de leer todo el contenido del portal. Esta cuenta deberá disponer de permisos de lectura en todas las aplicaciones web que se deseen rastrear.

    A continuación se detalla como configurar el servicio de búsqueda, así como configurar las cuentas de acceso al contenido.

    En primer lugar será necesario revisar el usuario que esta corriendo los servicios citados con anterioridad. Para ello, Inicio –> Ejecutar –> services.msc

    servicio

    En caso de disponer de una cuenta para el rastreo, será necesario cambiar el nombre de usuario que ejecuta el proceso. Para ello, pulsamos con el botón derecho sobre el nombre del servicio, e introducimos el nombre de usuario y contraseña correspondiente. Será necesario reiniciar los servicios después del cambio de usuario.

    Una vez realizado el cambio (si era necesario), abrimos la Administración central y accedemos a la administración de servicios compartidos. Una vez allí, pulsamos sobre configuración de búsquedas.

     acentral

    Finalmente pulsamos sobre la opción: Cuenta predeterminada de acceso al contenido.

    acentral2

    Aparecerá un ventana en la cual se introduce el nombre de usuario y contraseña que será la cuenta de acceso al contenido. Debe tener permisos de lectura en todas las aplicaciones/colecciones sitios/sitios/… para poder rastrear todo el contenido.

    Una vez realizados estos pasos, ya tendremos el motor de búsqueda correctamente configurado para que pueda acceder a todo el contenido del portal.

    En futuras entradas, veremos la forma de configurar el resto de opciones que proporciona la búsqueda de SharePoint como por ejemplo, los orígenes de contenido, ámbitos de búsqueda, reglas de rastreo, propiedades rastreadas,…

    Actualización: Configurando el motor de búsqueda de SharePoint (Parte II) – Reglas de Rastreo

    Actualización: Configurando el motor de búsqueda de SharePoint (Parte III) Orígenes de contenido