XML: Uma solução para interoperabilidade

Introdução

Um grande problema encontrado nos dias atuais é a necessidade da interoperabilidade, em outras palavras, a necessidade de comunicação existente entre sistemas heterogênicos. Um exemplo muito utilizado e conhecido é a NF-e (Nota Fiscal Eletrônica), onde o sistema emissor deve trocar informações com um webservice através de arquivos XML (EXtensible Markup Language - Linguagem de Marcação Extensível). Este primeiro artigo abordará XML, dando uma base para os leitores que desejam iniciar o estudo nesta tecnologia.

Era uma vez...

Na década de 1990 a W3C (World Wide Web Consortium - Consórcio da Rede Mundial de Computadores) iniciou estudos com intuito de combinar a flexibilidade da SGML (Standard Generalized Markup Language - Linguagem Padronizada de Marcação Genérica) com a simplicidade da HTML (Hypertext Markup Language - Linguagem de Marcação de Hipertexto). Esses estudos tinham o intuito de criar uma linguagem que pudesse lida por qualquer aplicativo que estivesse sendo executado em qualquer SO (Sistema Operacional) de uma forma eficaz e eficiente.

Com a combinação entre SGML e HTML pretendia-se criar uma linguagem que oferecesse a capacidade de leitura via software, e fosse facilmente integrada com outras linguagens. Para atender essas exigências, a XML deveria deveria apresentar as seguintes características:

  • Possibilitar criar TAGs descritivas.
  • Possibilitar tipar as TAGs.
  • Possibilitar criar TAGs próprias.
  • Possibilitar criar arquivos para validar a estrutura.
  • Possibilitar separar os dados da formatação.
  • Independência de hardware.
  • Independência de software.
  • Simplicidade e legibilidade para computadores e humanos.
  • Concentração na estrutura da informação.

Com os estudos concluído, a XML passou a ser recomendada pelo W3C. Essa padronização recomendada pelo W3C virou um padrão para resolver o quebra-cabeça da interoperabilidade entre sistemas.

Entendendo a XML

A XML é usada para representar dados e não descrever aparência como é feito pela HTML. Para [ELMASRI] A XML "usa um modelo hierárquico (árvore) para representar documentos". Os dados armazenados num arquivo XML são chamados de documento XML. A descrição dada por [DATE] para documento XML é "um documento criado usando recursos da XML".

Um documento XML usa dois conceitos principais:

  • Elemento: Contém dados de caracteres ou outros elementos ou ambos.
  • Atributo: É usado para fornecer informações adicionais aos elementos.

No documento XML o elemento é identificado por uma tag de início e tag de fim. O nome da tag de início fica entre os sinais "<" (menor quê) e ">" (maior quê); a tag de fim tem o mesmo nome da tag de início e, assim como ela, está entre os mesmos sinais, mas neste caso o sinal de ">" (maior quê) é precedido pela "/" (barra). Os atributos do elemento devem ficar dentro da tag de início.

Obs.: Embora os conceitos apresentados anteriormente sejam os principais, [ELMASRI] apresenta "conceitos adicionais em XML, como entidades, identificadores e referências".

Tendo como base os conceitos de elementos e atributos, é possível apresentar e explicar o seguinte exemplo:

<?xml version="1.0" encoding="UTF-8"?>
<aluno situacao="Não Matriculado">
    <nome>Tadeu</nome>
    <idade>42</idade>
</aluno>

Explicando o código

A primeira linha é uma declaração XML, na segunda linha é apresentado o elemento XML aluno, esse elemento tem o atributo situação com o valor Não Matriculado. Aninhado dentro desse elemento existem outros dois elementos(nome e idade).

Os elementos nome e idade são classificados como elementos simples, pois eles contêm um valor de dados. O elemento aluno é classificado como elemento complexo, uma vez que ele é construído a partir de outros elementos.

Documento XML bem formatado

Quando um documento XML é criado, o primeiro critério que deve ser levantado é se o mesmo está ou não bem formatado. Um documento XML está bem formatado quando ele respeita algumas condições, parte dessas condições é apresentado na sequência:

  • Deve iniciar indicando a versão da XML.
  • Deve ter apenas um único elemento raiz.
  • Cada elemento precisa ter um par correspondente de tag de início e tag de fim.
  • Os elementos devem está aninhados corretamente.
  • etc.

O exemplo apresentado anteriormente está bem formatado, pois está sintaticamente correto, embora verificar se o documento XML está bem formatado seja o primeiro critério a ser avaliado, ele não é o único. Outro critério importante a ser avaliado é se o documento XML é válido, mas esse é assunto para o próximo artigo.

Conclusão

Neste artigo o leitor foi apresentado a história e os conceitos iniciais da XML, sendo mostrado as principais características que um documento XML deve ter, além de apresentar e explicar um exemplo básico, mostrando o que vem a ser um documento XML bem formatado. No próximo artigo serão apresentadas novas informações sobre XML, principalmente explicando o que vem a ser um documento XML válido.

Até o próximo artigo.

Bibliografias Citadas

[DATE] DATE, C.J. Introdução a Sistemas de Banco de Dados. 8 ed. Rio de Janeiro: Elsevier, 2003.

[ELMASRI] ELMASRI, Ramez; NAVATHE, Shamkant B. Sistemas de Banco de Dados. 4 ed. São Paulo: Pearson Addison Wesley, 2005.