Big Data, Hadoop y Windows Azure (II)

Siguiendo con el post anterior dónde hacía una introducción a Big Data y Hadoop, en este post intentaré entrar ya un poco más en detalle en la oferta de Microsoft, en qué ofrece y cómo funciona.

Como ya os comentaba Microsoft contribuye con este proyecto open source y entre otras cosas, ha incluido dos nuevas distribuciones, una para Windows Server 2008 y otra para Windows Azure. Yo principalmente hablaré de esta última, la cuál se encuentra en CTP, y que permite disponer un cluster de Hadoop en pocos minutos. Por si algunos os suena, el code-name de la distribución de Hadoop para Windows Server se llama Isotope.

La idea es Microsoft es aprovechar todo lo  bueno que tiene Hadoop, pero siendo capaz de ofrecerle un enfoque empresarial y corporativo, tratando a Hadoop como a cualquiera de los productos que tiene en la actualidad, por ejemplo, ofreciendo el mismo soporte.

Los mayores esfuerzos que está haciendo Microsoft es la integración de Hadoop con sus productos, para llegar a conseguir que se puede llegar a trabajar con Hadoop, pero desde las herramientas a las que están acostumbrados sus clientes…Herramientas de BI, Excel, PowerView, SharePoint…

Por ejemplo, está desarrollando conectores para cargar datos desde el marketplace de Azure, adaptadores para SQL Server para traer información desde y hacia Haddop, add-in para Excel y PowerPivot, integración con Active Directory, System Center etc…

Incluso también ofrece la posibilidad de trabajar con Visual Studio y C#, por ejemplo para hacer los scripts de MapReduce.

Otra contribución interesante que también han ofrecido, los primeros, es el soporte a JavaScript.

05-MicrosoftBigDataSolution

En los próximos post iré viendo cómo funciona Hadoop en Windows Azure, servicio que se encuentra disponible en https://www.hadooponazure.com/ y que a día de hoy sólo se puede entrar bajo invitación.

Aprovecharé también para ir entrando en algo más de detalle sobre cómo funciona Hadooop.

06-HadoopOnAzure

Y claro está, intentaré mostraros la integración con los productos de Microsoft, como el add-in de Hive para Excel.

06-Excel

Ibon Landa

bon Landa lleva más de 15 años dedicado al desarrollo de software. Durante este tiempo ha trabajado en diferentes empresas en las cuáles ha podido trabajar en diferentes entornos y tecnologías. Actualmente está focalizado principalmente en tareas de desarrollo, arquitectura, en las herramientas del ciclo de vida y en todo lo relacionado con la plataforma de Cloud Computing Microsoft Azure, área en el que ha sido reconocido como MVP. Participa de forma activa en la comunidad, escribiendo su blog, manteniendo un portal sobre Microsoft Azure y colaborando con Microsoft y grupos de usuarios en eventos de formación, talleres y giras de producto.

2 comentarios en “Big Data, Hadoop y Windows Azure (II)

  1. Ibon, es una excelente serie ésta. A mi particularmente, y con algunos compañeros que he hablado, sería interesante BigDAta-Haddop para Windows Server 2008. Espero más adelante haya un hueco destacado para ello en geeks. Saludos.

  2. Los ejemplos los que estoy haciendo con Azure porque para mí es mucho más fácil tener el cluster para las demos, aunque temas que quiero ir contando sobre los add-in de Hive o otros productos como sqooq funcionarían exactamente igual.

    A ver si puede sacar tiempo y hago algo propio para la distribución de Windows Server 2008.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *