Signup for GEOCEN Newsletter here...Print?Tell a friend about this page...

Hvad er en Shape Fil?

Blandt "geo-nørder" er der en teknisk jargon, som for den uindviede kan være svær at decifrere. Men et af de begreber, som ofte går igen, er "Shape File". Der findes ikke rigtig nogen god dansk oversættelse, og hvis du blandt geo-nørder forsøger dig "Form-fil" eller "udformningsfil" vil du næppe blive forstået - men helt sikkert bemærket!
;-)
Et andet meget brugt udtryk er "Feature". Ordet feature bruges i geospatiale sammenhænge ofte helt synonymt med en database tabelpost - på dansk blot post, på engelsk kaldes en post for en "Record". En shape-fil kan indeholde et særdeles stort antal features - millionvis! 

Shape-filformatet (*.shp) er geospatialt vektordataformat. Det er faktisk lidt forkert at tale om én shp-fil, for i praksis er der tale om et antal filer, som tilsammen benævnes shape-fil. Antallet af filer, som tilsammen udgør shp-filen varierer, men der vil altid være mindst tre filer:
1. *.shp - filen, som indeholder featurens ("postens") geometri: Koordinater på featurens "boundingbox" ("dækningsområde") samt hvor vidt der er tale om et punkt, en linie eller et polygon,
2. *.shx - filen, som indeholder index af featurens geometri,
3. *.dbf - filen, som indeholder featurens attributværdier.
Hertil kommer en række filer, som kan være en del af shapefilkomplekset:

Mest almindelig er *.prj - og .xml - filerne, som indeholder oplysninger om hhv. projektion, koordinatsystem, etc. (denne fil er en alm. ASCII-fil (tekst), som kan læses i MS NotePad ell. lign.) og metadata, dvs. beskrivende data eller "data-om-data". *.xml - filen kan læses i MS NotePad eller en Internet Browser,

*.sbn, *.sbx / *.fbn og *.fbx - filerne er spatiale (rumlige) index - filer, der har til opgave at øge performance (disse filer er binære),

*.ain
, *.aih og *.atx - filer er attribut-index filer. De er binære og mindre almindelige. De er med til at øge performance.

Lidt populært sagt kan du betragte en shape-fil som et MS Excel regneark: Kolonneoverskrifterne er shp-filens attributter. Hver række i dit ark svarer til en feature ( post,   record).
Hver celle er således en attributværdi, som svarer til det geografiske objekts ( featurens) attributter.
Herudover er der en slags "usynlig" kolonne, som indeholder objektets shape-værdier, som er det enkelte objekts geometriske værdier, bl.a. X, Y og Z koordinater.
Da mange af shape-filens værdier lagres binært, kan de ikke læses af et hvilket som helst program; det kræver et eller andet shape-kompatibelt GIS-program, for at give nogen reel mening.
Shape-formatet er et åbent format - en DeFacto standard oprindeligt udviklet af ESRI helt tilbage i 1988 - men i dag er formatet så udbredt, at OGC (Open GIS Consortium) har accepteret det som en gængs standard.

En anden vigtig information om shape-formatet er, at den bruges til at lagre de rå informationer, dvs. en *.shp-fil indeholder ingen symbolisering. Så når du åbner en *.shp fil i et GIS, så får du blot en sort linie, uanset om der er tale om en vej, en å, en jernbane eller højspændingsledning. Tilsvarende for punkter og polygoner: 2 cm kortets symbol for en kirke ser ud på samme måde som en vindmølle og polygonerne er sorte omrids med hvidt fyld - uanset om der er tale om en by, en skov eller en sø! Derfor skal shape-filer altid ledsages af en symboliserings-/renderings-fil (ESRI: *.mxd/*.lyr, MapInfo: *.gst, Carmenta: *.p, etc.) før de giver nogen mening - ud over den geometriske, altså...  
:-)