Signup for GEOCEN Newsletter here...Print?Tell a friend about this page...

Introduktion til

Geografiske Informations Systemer

(GIS)

- Hvad er XML for en størrelse?


Hvad er XML?

XML står for eXtensible Markup Language, og standarden kan betegnes som en universel ramme til formidling af information via Internettet.
XML blev i 1998 udviklet af The World Wide Web Consortium (W3C), fordi man ønskede at skabe en fælles standard til brug for dataudveksling.

En fælles standard for dataudveksling bruges når man skal have maskiner til at kommunikere med maskiner, dvs. applikationer/programmer til at tale med andre applikationer. XML-sproget er således uafhængigt af platform, hvilket betyder at en Apple Mac computer med MacOS kan tale sammen med en PC med Windows eller en "mainframe" computer med Unix/Linux - det er næsten kun fantasien, som sætter grænser for mulighederne for dataudveksling med XML.  

Navnet eXtensible Markup Language dækker over, at XML er et opmærkningssprog, hvor man kan definere elementer via tags, ligesom i HTML. Til forskel fra HTML har XML dog ikke nogle fast definerede tags. I stedet for kan sproget bruges som ramme for udvikling af tags. I XML skal man altså selv opfinde elementer og tag-navne, deres betydning, og hvordan de skal struktureres i forhold til hinanden. Men til forskel fra HTML er XML designet med det formål at beskrive data og hvad data er, mens HTML blev designet med det formål at formatere og visualisere data.
HTML = Vise data!
XML = Beskrive data!

Strukturen i et XML dokument er opbygget som et datatræ.
Datatræet indeholder logiske enheder, der har en specifik relation i forhold til hinanden.
Relationen definerer man selv alt efter hvilken sammenhæng, XML-dokumentet skal beskrive.
Man kan populært sige at et XML-dokument er en slags database, dvs. XML-dokumentet indeholder noget der svarer til tabeldefinitioner/kolonnenavne og attributværdier.  

Rå XML-kode kan læses i en almindelig teksteditor, som f.eks. MS NotePad, UNIX VI-editor eller LaTex til Linux. Men du kan også læse den rå XML-kode i din Internet browser, men selv om det måtte give mening (hvis man kan gennemskue sammenhængene) vil det ikke se pænt ud. For at skabe et læsevenligt/forståeligt layout kan man anvende et almindeligt Style Sheet (en css-fil) til at formatere XML-indholdet.

En anden måde at gøre det på er ved at anvende en XSL-teknologien. (XSL står for EXtensible Stylesheet Language)

  1. XSLT - et sprog beregnet til transformering af XML-dokumenter,
  2. XPath - et sprog til navigering i XML-dokumenter,
  3. XSL-FO - et sprog til formatering af XML-dokumenter.

Men XML i sig selv gør ikke noget: XML er simpelthen en indpakning af data - dvs. nogen må formatere data eller skrive et stykke software for at sende, modtage eller vise informationen.

XML er kendetegnet ved en række egenskaber, som har været årsag til, at netop XML er valgt til fælles offentlig standard. Vigtigst har det været, at XML understøttes af markedet, og at XML fungerer uafhængigt af den tekniske platform, og derfor kan læses og forstås uanset hvilken teknologi, man har til rådighed. Dermed risikerer man ikke, at informationen går tabt pga. den teknologiske udvikling i fremtiden.

XML er endvidere forholdsvis let at arbejde med, og endelig er XML et internationalt format, hvor der allerede i dag findes flere internationale standarder til håndtering af XML. Dermed er man sikret, at det vil være muligt at udveksle data mellem bl.a. europæiske myndigheder, hvis der med tiden bliver behov for det.


Denne intro er sidst opdateret 15. januar 2012

af Anders T. Nielsen