Apuntes de un loco

Historias informáticas de ayer y hoy

Licencia

Buscar

Este Blog

Sindicación

Notas

  • Se ha deshabilitado el formulario de contacto del blog debido a abusos.

    Por determinación del administrador de Geeks.ms, los visitantes que no inicien sesión (visitantes anónimos) no podrán enviar comentarios a los blogs, para lo cual deberán registrar una cuenta de usuario e identificarse mediante la misma. También se admite la identificación a través de OpenID. Disculpen las molestias que les cause esta decisión.

Acerca de los contenidos

    La información ofrecida en este blog se proporciona tal cual, sin garantías de ningún tipo, y no otorga ningún derecho. Usted asume el riesgo de poner en práctica cuantos procedimientos se expongan aquí. En particular, si ha venido buscando alguna solución para una tarea o duda escolar y no le ha servido el contenido, por favor, no me eche la culpa. ;)

    Las anotaciones del blog representan una visión válida en el momento en que fueron publicadas o actualizadas. Más allá de esas fechas no se puede garantizar la veracidad de la información expuesta ni la exactitud o fiabilidad de los enlaces.

    Los comentarios son responsabilidad exclusiva de sus autores respectivos. El dueño del blog se reserva el derecho de editar, eliminar o no publicar aquellos comentarios que a su criterio infrinjan reglas básicas de respeto y convivencia en la red. En el caso de la edición, se expondrá claramente esta circunstancia y el motivo de la misma. El dueño del blog podrá asimismo borrar los enlaces que se desvíen demasiado de los temas tratados, muestren intenciones de autopromoción (publicidad descarada, spam convencional, etc.) o en general no inspiren confianza. Las direcciones de correo electrónico serán eliminadas o alteradas con el fin de reducir el riesgo de que sean objeto de "cosechadores" para el envío de mensajes basura masivos. El envío de comentarios implica el conocimiento de estas condiciones y la adhesión a las mismas.

Etiquetas

Archivo

Colegas y afines en Geeks.ms

Otros bloggers españoles

Bloggers de Microsoft

Herramientas interesantes

Geeks.ms

Mi blog personal

Webs y comunidades amigas

Retroinformática

Microsoft publica las especificaciones de formatos binarios de Office (DOC, XLS, PPT, XLSB, Office Drawing)

Hace unos tres o cuatro años, no recuerdo por qué motivo, Microsoft decidió ofrecer bajo determinadas condiciones legales la documentación de varios formatos binarios de Office. Los interesados debían enviar una solicitud mediante correo electrónico a una dirección específica. El artículo KB840817 documenta el proceso: How to extract information from Office files by using Office file formats and schemas.

Esto ya no es necesario. Tal como anunciaron hace pocas semanas algunos de sus bloggers, Microsoft acaba de publicar las especificaciones de los formatos binarios de documentos de Word, Excel y Powerpoint. Estas especificaciones se ofrecen bajo la Open Specification Promise (promesa de especificación abierta). No me preguntéis qué significa esto porque no alcanzo a comprender todas las implicaciones legales del asunto. Wink

Los formatos binarios documentados son los siguientes:

  • Archivos de Word, versiones 97 a 2007.
  • Archivos de Excel, versiones 97 a 2007.
  • Archivos de PowerPoint, versiones 97 a 2007.
  • Archivos XLSB de Excel 2007.
  • Office Drawing: autoformas y otros elementos gráficos.

Nota: La estructura de un archivo .XLSB está basada en el mismo estilo de empaquetado de XPS y Office Open XML. Sin embargo, las hojas no se almacenan en lenguaje XML, sino en el formato binario nativo de Excel conocido como BIFF (Binary Interchange File Format). Esto presenta ventajas considerables al abrir o guardar hojas de cálculo grandes. Para obtener más información sobre los formatos de archivo que admite Excel en particular, sugiero la entrada All About File Formats del blog del equipo de desarrollo de Excel.

También están disponibles otras especificaciones auxiliares:

  • Archivo compuesto (compound file). La estructura a bajo nivel de los documentos de Word, Excel y Powerpoint en formato antiguo es de este tipo.
  • Metarchivo de Windows (WMF).
  • Serialización de tinta digital.

Nota: un archivo compuesto está formado por uno o más flujos de datos que pueden estar organizados en una jerarquía de contenedores. En cierto modo se comporta como un sistema de archivos virtual. Las API de almacenamiento estructurado de Windows nos permiten trabajar con ellos.

Las especificaciones sólo están disponibles en inglés, naturalmente, y se pueden descargar en formato PDF o XPS desde las siguientes páginas:

Aparte de esto, se ha creado un proyecto en SourceForge con licencia de código abierto similar a la licencia BSD, para la transformación de documentos en formatos antiguos a documentos basados en Office Open XML: Office Binary (doc, xls, ppt) Translator to Open XML. Aún no hay código fuente ni ejecutable, tan solo documentación básica. La primera meta importante del proyecto será la conversión de documentos de Word.

Published 16/2/2008 8:14 por Ramón Sola

Comparte este post:

Comentarios

# Microsoft publica las especificaciones de formatos binarios de Office (DOC, XLS, PPT, XLSB, Office Drawing)@ Sunday, February 17, 2008 8:23 PM

Visto que el peor aspecto que consideran los detractores de OOXML es que incluya en un XML archivos binarios, Microsoft publica las especificaciones de sus binarios DOC, XLS, PPT, XLSB y Office Drawing. ¿Buena jugada por parte de Microsoft?

meneame.net

#   Microsoft publica las especificaciones de formatos binarios de Office  by Tecnorantes@ Monday, February 18, 2008 12:17 AM

PingBack desde    Microsoft publica las especificaciones de formatos binarios de Office  by Tecnorantes

  Microsoft publica las especificaciones de formatos binarios de Office  by Tecnorantes

# re: Microsoft publica las especificaciones de formatos binarios de Office (DOC, XLS, PPT, XLSB, Office Drawing)@ Monday, February 18, 2008 2:37 PM

Para mi es una buena noticia, que microsoft publique las especificaciones, pero para nosotros los Spanos le es dificil por que bienen en ingles, que bueno seria que llegaran en español.

absalon

# re: Microsoft publica las especificaciones de formatos binarios de Office (DOC, XLS, PPT, XLSB, Office Drawing)@ Monday, February 18, 2008 9:37 PM

Primero lo de Yahoo y ahora esto. Parece que Microsoft ha decidido mirar hacia el futuro y unirse al "enemigo".

Me alucina la capacidad de una empresa de este tamaño para reinventarse.

Jaime Cuesta

# AmarellOcio » Blog Archive » Una raz??n m??s para usar Linux y OpenOffice.org@ Tuesday, February 19, 2008 1:44 AM

PingBack desde  AmarellOcio  » Blog Archive   » Una raz??n m??s para usar Linux y OpenOffice.org

AmarellOcio » Blog Archive » Una raz??n m??s para usar Linux y OpenOffice.org

# re: Microsoft publica las especificaciones de formatos binarios de Office (DOC, XLS, PPT, XLSB, Office Drawing)@ Tuesday, February 19, 2008 4:40 PM

Espero que sea de gran ayuda para lograr la interoperabilidad entre aplicaciones, de esta forma el usuario quedará en libertad de decidir que usar

Destructor

# re: Microsoft publica las especificaciones de formatos binarios de Office (DOC, XLS, PPT, XLSB, Office Drawing)@ Wednesday, September 17, 2008 1:42 PM

Very nice post... thanks for sharing...

Edited: link removed.

NET Web Services

# Microsoft publica las especificaciones de los formatos binarios de su Office » Actualidad - Espacio Linux Portal GNU/Linux en espa??ol@ Thursday, December 18, 2008 11:54 PM

PingBack desde  Microsoft publica las especificaciones de los formatos binarios de su Office » Actualidad - Espacio Linux Portal GNU/Linux en espa??ol

Microsoft publica las especificaciones de los formatos binarios de su Office » Actualidad - Espacio Linux Portal GNU/Linux en espa??ol