4 - BD XML: eXist-db
L’XML és, segons la definició feta pel World Wide Web Consortium (W3C), un format simple basat en text per a representar informació estructurada: documents, dades, configuracions, llibres, transaccions, factures i molt més. Va ser derivat d’un format estàndard més antic, anomenat SGML, amb la finalitat de ser més adequat per a la seua utilització en la web.
L’XML, avui en dia, és un dels formats més utilitzats per a l’intercanvi d’informació estructurada: entre els programes, entre les persones, entre ordinadors i persones, tant a nivell local com a través de les xarxes. El fet que la informació s’intercanvie en format XML ha implicat l’aparició de mecanismes que permeten enregistrar aquesta informació en format XML, de manera que no siga necessari efectuar traduccions a altres formats.
Les Bases de Dades XML natives, o senzillament Bases de Dades XML ens permetran guardar documents XML i són Bases de Dades centrades en els documents. La unitat mínima d'emmagatzematge és el document XML.
Podríem definir SGBD-XML natives com un sistema de gestió de la informació que ha de:
- Definir un model lògic per a un document XML (en contraposició als SGBD habilitats que defineixen el model per les dades) i enregistrar i recuperar els documents segons aquest model. Com a mínim, el model ha d’incloure elements, atributs, PCDATA i l’ordre del document.
- Mantenir una relació transparent amb el mecanisme subjacent d’emmagatzematge, incorporant les característiques ACID de qualsevol SGBD (Atomicity, Consistency, Isolation and Durability).
- Incloure un nombre arbitrari de nivells de dades i complexitat.
- Permetre les tecnologies de consulta i transformació pròpies d’XML: XPath, XSLT, XQL, XQuery, etc.
Avantatges de les BD-XML, en comparació a les BD no XML:
-
Faciliten accés i emmagatzematge d’informació en format XML sense necessitat de codi addicional ni cap tipus de mapatge.
-
La majoria d’SGBD-XML natives incorporen un motor de recerca d’alt rendiment.
-
És molt senzill afegir nous documents XML.
-
Permeten emmagatzemar dades heterogènies.
-
Conserven la integritat dels documents (es poden recuperar en el seu estat inicial).
Per contra, els inconvenients que tenen normalment els SGBD-XML natives són aquestos:
-
La gran quantitat d’espai necessari per emmagatzemar el mateix document XML com a format de representació de la informació, a causa del fet que les etiquetes poden suposar el 75% de la informació d’un document XML. I això és, sense cap mena de dubte, innecessari en guardar molts documents validats per un mateix XSD o DTD.
-
El fet que les BD-XML natives només puguen guardar i retornar dades en format XML.
-
En emmagatzemar la informació en format XML es fa molt complicat poder generar noves estructures a partir de la informació existent com, per exemple, aconseguir càlculs estadístics.
-
Les dificultats d’indexació del contingut d’una base de dades, que ha de permetre la reducció dràstica del temps necessari per trobar certs elements clau.
-
Les pobres facilitats per modificar el contingut dels documents XML emmagatzemats sense haver de substituir tot el document.
Els dos darrers inconvenients (indexació-actualització) són cavalls de batalla dels SGBD i de ben segur que s’anirà avançant en aquest camp fins que deixen de ser inconvenients.
Llicenciat sota la Llicència Creative Commons Reconeixement SenseObraDerivada 4.0