Introdução
Um grande problema encontrado nos dias atuais é a necessidade da interoperabilidade, em outras palavras, a necessidade de comunicação existente entre sistemas heterogênicos. Um exemplo muito utilizado e conhecido é a NF-e (Nota Fiscal Eletrônica), onde o sistema emissor deve trocar informações com um webservice através de arquivos XML (EXtensible Markup Language - Linguagem de Marcação Extensível). Este primeiro artigo abordará XML, dando uma base para os leitores que desejam iniciar o estudo nesta tecnologia.
Era uma vez...
Na década de 1990 a W3C (World Wide Web Consortium - Consórcio da Rede Mundial de Computadores) iniciou estudos com intuito de combinar a flexibilidade da SGML (Standard Generalized Markup Language - Linguagem Padronizada de Marcação Genérica) com a simplicidade da HTML (Hypertext Markup Language - Linguagem de Marcação de Hipertexto). Esses estudos tinham o intuito de criar uma linguagem que pudesse lida por qualquer aplicativo que estivesse sendo executado em qualquer SO (Sistema Operacional) de uma forma eficaz e eficiente.
Com a combinação entre SGML e HTML pretendia-se criar uma linguagem que oferecesse a capacidade de leitura via software, e fosse facilmente integrada com outras linguagens. Para atender essas exigências, a XML deveria deveria apresentar as seguintes características:
- Possibilitar criar TAGs descritivas.
- Possibilitar tipar as TAGs.
- Possibilitar criar TAGs próprias.
- Possibilitar criar arquivos para validar a estrutura.
- Possibilitar separar os dados da formatação.
- Independência de hardware.
- Independência de software.
- Simplicidade e legibilidade para computadores e humanos.
- Concentração na estrutura da informação.
Com os estudos concluído, a XML passou a ser recomendada pelo W3C. Essa padronização recomendada pelo W3C virou um padrão para resolver o quebra-cabeça da interoperabilidade entre sistemas.
Entendendo a XML
A XML é usada para representar dados e não descrever aparência como é feito pela HTML. Para [ELMASRI] A XML "usa um modelo hierárquico (árvore) para representar documentos". Os dados armazenados num arquivo XML são chamados de documento XML. A descrição dada por [DATE] para documento XML é "um documento criado usando recursos da XML".
Um documento XML usa dois conceitos principais:
- Elemento: Contém dados de caracteres ou outros elementos ou ambos.
- Atributo: É usado para fornecer informações adicionais aos elementos.
No documento XML o elemento é identificado por uma tag de início e tag de fim. O nome da tag de início fica entre os sinais "<" (menor quê) e ">" (maior quê); a tag de fim tem o mesmo nome da tag de início e, assim como ela, está entre os mesmos sinais, mas neste caso o sinal de ">" (maior quê) é precedido pela "/" (barra). Os atributos do elemento devem ficar dentro da tag de início.
Obs.: Embora os conceitos apresentados anteriormente sejam os principais, [ELMASRI] apresenta "conceitos adicionais em XML, como entidades, identificadores e referências".
Tendo como base os conceitos de elementos e atributos, é possível apresentar e explicar o seguinte exemplo:
<?xml version="1.0" encoding="UTF-8"?>
<aluno situacao="Não Matriculado">
<nome>Tadeu</nome>
<idade>42</idade>
</aluno>
Explicando o código
A primeira linha é uma declaração XML, na segunda linha é apresentado o elemento XML aluno, esse elemento tem o atributo situação com o valor Não Matriculado. Aninhado dentro desse elemento existem outros dois elementos(nome e idade).
Os elementos nome e idade são classificados como elementos simples, pois eles contêm um valor de dados. O elemento aluno é classificado como elemento complexo, uma vez que ele é construído a partir de outros elementos.
Documento XML bem formatado
Quando um documento XML é criado, o primeiro critério que deve ser levantado é se o mesmo está ou não bem formatado. Um documento XML está bem formatado quando ele respeita algumas condições, parte dessas condições é apresentado na sequência:
- Deve iniciar indicando a versão da XML.
- Deve ter apenas um único elemento raiz.
- Cada elemento precisa ter um par correspondente de tag de início e tag de fim.
- Os elementos devem está aninhados corretamente.
- etc.
O exemplo apresentado anteriormente está bem formatado, pois está sintaticamente correto, embora verificar se o documento XML está bem formatado seja o primeiro critério a ser avaliado, ele não é o único. Outro critério importante a ser avaliado é se o documento XML é válido, mas esse é assunto para o próximo artigo.
Conclusão
Neste artigo o leitor foi apresentado a história e os conceitos iniciais da XML, sendo mostrado as principais características que um documento XML deve ter, além de apresentar e explicar um exemplo básico, mostrando o que vem a ser um documento XML bem formatado. No próximo artigo serão apresentadas novas informações sobre XML, principalmente explicando o que vem a ser um documento XML válido.
Até o próximo artigo.
Bibliografias Citadas
[DATE] DATE, C.J. Introdução a Sistemas de Banco de Dados. 8 ed. Rio de Janeiro: Elsevier, 2003.
[ELMASRI] ELMASRI, Ramez; NAVATHE, Shamkant B. Sistemas de Banco de Dados. 4 ed. São Paulo: Pearson Addison Wesley, 2005.