SharePoint 2010: ¿Cómo funciona la relevancia en las búsquedas?

Como sabéis, una de las áreas core de SharePoint es la relativa a las búsquedas de información empleando el motor de búsquedas que incorpora la plataforma. Sin entrar en temas de posibilidades de búsquedas para las distintas versiones de producto, y centrándonos en SharePoint Server, las búsquedas  se apoyan sobre una serie algoritmos que no se pueden modificar, pero si se pueden influenciar mediante una serie de técnicas que nos permite modificar lo que SharePoint entiende por “relevante” a la hora de devolver los resultados de una búsqueda. Por ejemplo, un par de técnicas conocidas para poder cambiar la relevancia son:

  • El uso de páginas autoritativas.
  • Creando modelos de ranking personalizados.

Para entender el concepto de relevancia, es importante tener en cuenta que los algoritmos empleados son los que determinan que contenido es más relevante. La relevancia se mide en términos de uno o más marcadores (o niveles) numéricos de manera que cuando más bajo es un marcador, más relevante es el documento. Hay dos tipos de marcadores: estáticos vs dinámicos. Los marcadores dinámicos son los que representan lo cerca que un documento está de la consulta realizada por un usuario. En cambio, los marcadores estáticos representan la popularidad o valor de un cierto documento

Las búsquedas de SharePoint 2010 (no FAST) implementan el modelo de ranking BM25 implementado por la London City University. Este modelo se caracteriza por usar propiedades administradas para establecer un ranking dinámico. Por ejemplo, algunas propiedades son más importantes que otras como puede ser el “Título” o el “Rating social”. Para cálculos estáticos de ranking, SharePoint establece un ranking alto para el documento si el documento se ha visitado desde una página de resultados. También se tiene en cuenta la profundidad de la Url del documento (número de barras “/”) de manera que a más barras “/” menos valor tiene el documento. Por lo tanto, la estructura en carpetas que montemos en nuestros sitios de SharePoint tiene que ser tenida en cuenta a la hora de entender la relevancia de los resultados de las búsquedas. Otro factor que se tiene en cuenta a la hora de establecer el ranking estático es el tipo de documento. Así, las páginas web y los documentos Word se consideran como más relevantes.

El modelo de ranking que trae por defecto la búsqueda de SharePoint es le MainResultsDefaultRankingModel se usa en la Web Part Search Core Results y se basa en un cierto esquema XML que es el que usa el algoritmo de ranking usado: http://msdn.microsoft.com/en-us/library/dd954171(office.12).aspx.

Microsoft permite un cierto grado de personalización en la relevancia de las búsquedas a partir de poder agregar modelos de ranking personalizados tal y como se detalla en este artículo: http://sharepointfieldnotes.blogspot.com.es/2011/03/tuning-sharepoint-search-relevance-with.html. Básicamente la idea pasa por:

  • Añadir la relevancia que necesitemos mediante un modelo de raking personalizado. Por ejemplo, que los documentos de tipo PDF sean más relevantes.
  • Importar el modelo en nuestro ambiente de SharePoint.
  • Modificar la WebPart Search Core Results para que haga uso del modelo.

Finalmente os dejo una serie de referencias en las que se detalla muy bien todo lo comentado y se muestra como crear modelos de ranking personalizados:

Publicado por

Juan Carlos González

Juan Carlos es Ingeniero de Telecomunicaciones por la Universidad de Valladolid y Diplomado en Ciencias Empresariales por la Universidad Oberta de Catalunya (UOC). Cuenta con más de 12 años de experiencia en tecnologías y plataformas de Microsoft diversas (SQL Server, Visual Studio, .NET Framework, etc.), aunque su trabajo diario gira en torno a SharePoint & Office 365. Juan Carlos es MVP de Office Servers & Services desde 2015 (anteriormente fue reconocido por Microsoft como MVP de Office 365 y MVP de SharePoint Server desde 2008 hasta 2015), coordinador del grupo de usuarios .NET de Cantabria (Nuberos.Net, www.nuberos.es), co-fundador y coordinador del Grupo de Usuarios de SharePoint de España (SUGES, www.suges.es), así como co-director de la revista gratuita en castellano sobre SharePoint CompartiMOSS (www.compartimoss.com). Hasta la fecha, ha publicado 8 libros sobre SharePoint & Office 365 y varios artículos en castellano y en inglés sobre ambas plataformas.

Un comentario en “SharePoint 2010: ¿Cómo funciona la relevancia en las búsquedas?”

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *