SharePoint 2010: Novedades en búsquedas (I)!

Siguiendo con la serie de post sobre novedades en SharePoint 2010, otra de las sesiones a las que he asistido en el Tech-Ed EMEA de Berlín es la relativa a lo nuevo en lo que a búsquedas se refiere. Antes de pasar al resumen, comentaros que este resumen incluye muy poco contenido relativo a la integración de FAST en SharePoint 2010. De todos modos, a groso modo la fotografía de las búsquedas en SharePoint 2010 es la siguiente:

imageLa mayor noticia es la incorporación de FAST en las búsquedas en SharePoint 2010. Lo importante es que tenemos más opciones. Empecemos.

Una pequeña introducción

Lo mejor antes de comenzar a hablar de novedades es hacer un pequeño resumen de conceptos clave en las búsquedas en SharePoint:

  • Content Sources: Contiene los contenidos.
  • Connectors:  Conocen como procesar los diferentes content sources.
  • Crawling: Espacio para almacenar los elementos en el catálogo de búsqueda.
  • Index Partition: Extraen información de los ítems para habilitar un matching más eficiente en las búsquedas.
  • Query Federation: Devuelven resultados de índices que no son de SharePoint.
  • Query Servers: Aceptan las peticiones de los usuarios y devuelven los resultados.
  • Search Center: Permiten que los usuarios realicen consultas y puedan interactuar con los resultados.

A partir de estos conceptos, podemos comenzar con las búsquedas en plataforma SharePoint 2010.

Mejoras para el usuario final

De cara al usuario final, nos encontraremos con mejoras como:

  • Refinamiento de los resultados devueltos en las búsquedas realizadas por los usuarios:
    • A través de las propiedades de los resultados.
    • A través de propiedades personalizadas.
  • Mejoras en el centro de búsquedas:
    • Mejoras en las Web Parts de búsquedas.
    • Mejores apuestas en las cabecera de los resultados.
    • Refinamiento de los resultados a través de una serie de filtros: autor, propiedades personalizadas, tipo de documento, etc.
    • Federación de consultas en fuentes externas incluyendo OpenSearch.
    •  
  • Mejoras en relevancia (ranking):
    • + ingredientes: URL fuzzy matching, social tags, …
  • Mejor soporte multi-idioma:
    • Detección automática del idioma de distintos tipos de documentos y de parte de los propios documentos.
  • Nuevos factores de búsqueda:
    • Desde un dispositivo móvil.
    • Integración con la búsqueda de Windows 7.
  • Nueva sintaxis de consulta:
    • Soporte para operadores booleanos y consultas FreeText. Por ejemplo: (“SharePoint Search” OR “Bing Search”) AND (title:“keyword syntax” OR title:”query syntax”).
    • Soporte de matching de prefijos. Por ejemplo: Micro* author:bill*
    • Se ha añadido soporte out-of-the-box para búsqueda mediante caracteres comodín (*).
  • Demo en torno a las capacidades de búsquedas:
    • Sugerencia de consulta dinámica: conforme el usuario especifica el contenido a buscar, se le sugieren términos.
    • Búsquedas relacionadas (realizadas por otras personas) con la búsqueda realizada.
    • Se puede filtrar el resultado por:
      • Tipo de resultado.
      • Por sitio.
      • Por autor.
      • Por fecha de modificación.
    • En los resultados devueltos aparecen las mejores apuestas.
    • Se puede guardar la búsqueda realizada como favorito en nuestra máquina y realizar las búsquedas desde la búsqueda de Windows.

Búsquedas sociales

Las búsquedas se vuelven + sociales. Las novedades en lo que a búsqueda de personas se refieren son las siguientes:

  • Buscar conocimiento y experiencia entre las personas de una organización:
    • Mejor experiencia en las búsquedas.
    • Búsquedas en modo “Libreta de direcciones”
  • El comportamiento “social” es el conductor de las búsquedas:
    • Ranking de relevancia en resultados.
    • Sugerencias en las consultas: a través del etiquetado de contenidos.
  • Demo sobre búsquedas sociales:
    • Si buscamos expertos en SharePoint 2010, la búsqueda nos devuelve información detallada de aquellas personas expertas en esta materia. Para cada resultado devuelto:
      • Podemos acceder a su posición en la jerarquía de la organización.
      • Contenido relacionado con la persona y el tema búsqueda.
    • Si nos equivocamos en la persona a buscar, el motor busca aproximaciones. Por debajo, se utiliza la tecnología Fonetic Lookup de Microsoft Research. Además, esta funcionalidad está disponible en modo multi-idioma de forma automática.

Arquitectura Scale-Out

La arquitectura de búsquedas es mucho + escalable con respecto a SharePoint 2010:

  • En SharePoint 2007, el Index Server y los Query Server constituían un punto único de fallo y un potencial cuello de botella.
  • En SharePoint 2010:
    • Podremos tener varios Index Server que permiten particionar el índice de búsqueda.
    • Se puede distribuir el Crawling entre varios servidores ya que se incorpora por defecto balanceo de carga. Además, se pueden añadir varios componentes de Crawling (BD’s) para minimizar tiempos de caida.
    • Se puede realizar mirroring de los Query Server y hacer particionado de las consultas.
    • Dispondremos de varias BDs de propiedades para las búsqueddas.
    • Soporte nativo de SQL Server Mirroring.
  • El resumen de esta alta escalabilidad de SharePoint 2010 lo podéis ver en la siguiente tabla:

To improve this…

 

 

 

Take these actions

 

 

 

Index freshness/crawl times

 

 

 

If Indexer machine is saturated , add more Indexer machines and/or crawl components

 

 

 

If Crawl Database is I/O bound on SQL Server, add additional crawl database on same SQL Server

 

 

 

If SQL server is Memory/CPU bound, add additional SQL Server with additional crawl databases

 

 

 

Query Latency/Throughput

 

 

 

If time spent in resolving query in full-text index is high, partition the index into smaller index partitions. Each index partition can contain ~10M items.

 

 

 

If query throughput is low, add query components with mirror index partitions.

 

 

 

If Property Database is I/O bound on SQL Server, add additional crawl database on same SQL Server

 

 

 

If SQL server is Memory/CPU bound, add additional SQL Server with additional crawl databases

 

 

 

Query Availability

 

 

 

Deploy redundant query servers, redundant index partitions and components, and use clustered or mirrored database servers to host property databases.

 

 

 

Crawl/Indexing Availability

 

 

 

Use multiple crawler components on redundant index servers, and add crawl databases.

 

 

 

Crawl components associated with a given crawl database can be distributed across index servers for availability and load distribution.

 

 

 

  • Otras mejoras en el motor de búsquedas:
    • Soporte de expresiones regulares en las reglas de crawling.
    • Soporte para el crawling de repositorios case sensitive.
    • Se puede priorizar los orígenes en los que se va a hacer el crawling para distribuir de forma adecuada los recursos.
    • Nueva política de crawling para definir como los crawler tratan las condiciones de error.
    • El downtime en la indexación es realmente bajo cuando se hacen backups de SQL.

image

Mejoras en extensibilidad

  • La extensibilidad a nivel de desarrollo viene dada por:
    • Extender o crear nuevas WebParts de búsqueda. Las Web Parts por defecto son públicas y se pueden extender. Por ejemplo, podemos extender la WebPart de resultados para que se muestre un preview de los mismos.
    • Modelos de objetos para consultas y federación de resultados.
    • Servicios Web de consultas.
  • Extender el centro de búsquedas ya que todas las WebParts de búsqueda exponen una interfaz pública SharedQueryManager que facilita la comunicación con ellas.
  • A nivel de interfaz de usuario:
    • A través de modificar las WebParts de usuario ya que son públicas. Se pueden modificar mediante XSLT o modificando los XML de configuración.
  • Federación de consultas:
    • Se dispone de un modelo de objetos de federación público.
    • Se trata de habilitar la búsqueda de fuentes externas en SharePoint  de acuerdo al estándar OpenSearch.
  • Connector Framework.

Despliegue y administración

El despliegue de las búsquedas se simplifica:

  • Herramienta de pre-requisitos.
  • Setup de SharePoint Server.
  • Configuración de SharePoint Server.
  • Asistentes de configuración de la granja.
  • Panel de búsquedas.

A nivel de administración:

  • Disponemos de las opciones de configuración relativas a los crawlers y particionado de índices desde el Search Dashboard.
  • Tendremos un mayor control de el comportamiento de las búsquedas gracias a los nuevos informes relativos a las búsquedas realizadas en la granja.

 

 

 

 

 

 

Y hasta aquí llega este pequeño resumen de lo que nos vamos a encontrar a nivel de búsquedas en SharePoint 2010.

Publicado por

Juan Carlos González

Juan Carlos es Ingeniero de Telecomunicaciones por la Universidad de Valladolid y Diplomado en Ciencias Empresariales por la Universidad Oberta de Catalunya (UOC). Cuenta con más de 12 años de experiencia en tecnologías y plataformas de Microsoft diversas (SQL Server, Visual Studio, .NET Framework, etc.), aunque su trabajo diario gira en torno a SharePoint & Office 365. Juan Carlos es MVP de Office Servers & Services desde 2015 (anteriormente fue reconocido por Microsoft como MVP de Office 365 y MVP de SharePoint Server desde 2008 hasta 2015), coordinador del grupo de usuarios .NET de Cantabria (Nuberos.Net, www.nuberos.es), co-fundador y coordinador del Grupo de Usuarios de SharePoint de España (SUGES, www.suges.es), así como co-director de la revista gratuita en castellano sobre SharePoint CompartiMOSS (www.compartimoss.com). Hasta la fecha, ha publicado 8 libros sobre SharePoint & Office 365 y varios artículos en castellano y en inglés sobre ambas plataformas.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *