Las bases de XML

XML es un lenguaje de marcación (markup) para documentación estructurada. Por documentación estructurada se entiende documentos que, además del propio contenido, presentan información acerca de la forma y/o el papel que desempeña dicho contenido. Así, valga el sencillo ejemplo de que en una noticia se informaría de que el titular es diferente del contenido de la propia noticia.


Los documentos XML están constituidos por las llamadas entidades u objetos, que son unidades de almacenamiento que contienen datos tanto parsed como no parsed. Estos datos parsed (analizados) están formados por caracteres, unos forman el llamado carácter data en el documento y otros forman el markup. El markup codifica la descripción del documento en términos de estructura lógica y forma de almacenamiento. Para leer los documentos XML y acceder a su contenido y estructura se utiliza un software denominado procesador XML.

En realidad, XML es un metalenguaje, es decir, un lenguaje para describir otros lenguajes, en este caso de marcación. Está basado en Unicode, que tiene un conjunto de caracteres de 16 bits, 8 más que el ASCII, lo que le proporciona más potencia. Todos los lenguajes XML pueden procesarse mediante un simple parser, y prácticamente no existen límites en espacios de nombres o profundidad estructural, lo que lo hace especialmente atractivo para modelización de datos.

Etiquetas, estructura y esquema. XML se puede describir también como un lenguaje de marcación para representar datos estructurados en un documento de texto. Permite crear etiquetas (tags) específicas para las aplicaciones como, por ejemplo, el número de identificación de un paciente. El DTD (Document Type Description) y el esquema (conocidos también como vocabularios) son también elementos fundamentales, ya que son los mecanismos utilizados para la validación, una característica única de XML. La validación consiste en enviar un documento a un destinatario junto con las condiciones que deben cumplir esos documentos.

DTD especifica la estructura de un fichero XML. Para ello, proporciona los nombres de los elementos, atributos y entidades que utilizables, además de información acerca de la forma en que se pueden usar conjuntamente. Pero la potencia de los DTD es más bien limitada debido a que están orientados a trabajar en entornos de texto/documentales, con lo cual no soportan adecuadamente otros tipos de datos más complejos.

El esquema, una estructura más potente y expresiva, permite especificar el contenido de los elementos en función de los tipos de datos. Como existen multitud de esquemas actualmente, a principios del pasado año 2001, W3C lanzó Schema Specification a fin de promover la armonización entre ellos. Por otra parte, el XML Schema Working Group del W3C trabaja activamente en la especificación de formas para definir la estructura, contenidos y semántica de los documentos XML.


Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital