Bijlage 1: Het verschil
tussen data en informatie
Het aangeven van het verschil tussen ‘data’ en ‘informatie’ wordt vaak nagelaten, omdat deze begrippen (letterlijk) een basisgegeven lijken te zijn. Vaak is het in het normale spraakgebruik niet nodig om het verschil aan te geven. De begrippen worden dientengevolge regelmatig door elkaar gebruikt. Ook in deze scriptie is dat het geval. Dat is niet erg, omdat het onderscheid er niet altijd toe doet, maar het is in deze context wel belangrijk om het verschil tussen de twee begrippen in het achterhoofd te houden. Hieronder zullen de begrippen dan ook nader worden toegelicht.
Het woord ‘data’ komt uit het Latijn en is het meervoud van ‘datum’, dat gegeven betekent.
Clarke geeft de volgende definitie van data, die aangepast is voor gebruik binnen de context van de informatiewetenschappen (definities uit woordenboeken zijn hier vaak minder bruikbaar):
'Data'
is any symbol, sign or measure which is in a form which can be directly
captured by a person or a machine.
Informatie definieert hij als volgt:
'Information'
is data that has value. Informational value depends upon context. Until it is placed
in an appropriate context, data is not information, and once it ceases to be in
that context it ceases to be information.
Informatie is dus data met een bepaalde waarde. Een astronomisch voorbeeld zal het bovenstaande verduidelijken. Achtergrondstraling uit het heelal is er altijd geweest en zal er altijd zijn. Dat is een feit. Zodra deze straling wordt opgevangen en vastgelegd door computers is het data. Deze data kan onderzocht en bewerkt worden. Voor meer dan 99% is deze achtergrondstraling nietszeggend en van geen enkele waarde. De rest kan echter wel van enigerlei waarde zijn. Er kan een bepaald patroon in zitten dat iets zegt over bepaalde gebeurtenissen in het heelal. Deze data is informatie geworden, omdat het waarde heeft en er iets mee gedaan kan worden. Bijvoorbeeld de locatie van zwarte gaten achterhalen, supernovae ontdekken, of zelfs het bestaan van intelligent leven elders in het heelal aantonen (zie SETI, http://setiathome.ssl.berkeley.edu/ ).
Wat de informatiedefinie van Clarke bijzonder en tegelijkertijd onbevredigend maakt is het relatieve aspect ervan. Hij zegt dat de waarde van de informatie afhangt van de context. Wat voor de één informatie is, is voor de ander gewoon data. Patronen in de achtergrondstraling van het heelal kunnen bijvoorbeeld erg bijzonder zijn voor een astronoom, voor de ander is het een reeks van nullen en enen waar niks mee te beginnen valt. Het is dus moeilijk om voor sommige gegevens aan te geven of het als data of als informatie kan worden beschouwd, aangezien dat afhangt van de persoon die er naar kijkt.
Zowel data als informatie kunnen worden
gevisualiseerd. Het doel van een datavisualisatie is het geven van meer
betekenis aan de data voor het menselijke oog en brein. Zo wordt de data
omgezet in informatie. Het doel van een informatievisualisatie is in feite
hetzelfde, de informatie wordt echter op zo’n manier weergegeven dat er nog
meer informatie uit te halen is.
Bijlage 2:
De selectie van de conferentiepapers
In onderstaande tabel is te
zien dat de ICA conferentie in Beijing is onderverdeeld in 28 onderwerpen (plus
2 plenaire sessies, onderwerp 0), waarover in totaal 586 papers en posters zijn
geschreven. Bij een blik op de kolom ‘aantal’ in de tabel zal al snel duidelijk
worden dat het aantal papers per onderwerp nogal kan verschillen. Over
onderwerp 7, ‘military cartography’, zijn slechts 2 papers geschreven,
terwijl over onderwerp 11, ‘GIS and digital mapping’, maar liefst 98
papers en of posters zijn opgenomen.
De hoeveelheid papers per
onderwerp zegt natuurlijk iets over het belang van dat onderwerp in de
kartografie op dit moment. Om te proberen de kwantitatieve verhoudingen tussen
de verschillende onderwerpen zoveel mogelijk in stand te houden, is het de
bedoeling om in de uiteindelijke spatialisatie van elk onderwerp relatief
evenveel papers op te nemen.
Niet alle 586 papers kunnen
namelijk worden gespatialiseerd, omdat van lang niet alle papers op de CD-ROM
van de conferentie een volledige versie staat. Er zit namelijk een groot aantal
artikelen bij die alleen bestaan uit een korte samenvatting van de presentatie
die op het congres gegeven is. Meestal bestaan die samenvattingen uit minder
dan één A4-tje. Deze artikelen zullen niet worden meegenomen in de analyse
omdat ze nauwelijks inhoud hebben en daarom niet goed met de andere artikelen
kunnen worden vergeleken.
Om de papers die alleen
bestaan uit samenvattingen er uit te filteren, is er voor gekozen om een
minimum tekstgrootte van ongeveer 2000 woorden aan te houden. Dit is ongeveer 6
pagina’s. Het aantal papers per onderwerp dat na deze filtering nog overblijft
is te zien in de kolom ‘mogelijk’ in de
tabel. Te zien is dat het aantal mogelijke papers in veel gevallen slechts de
helft is van het oorspronkelijke aantal papers. Het totale aantal papers dat
mogelijk gespatialiseerd kan worden is 350.
Ten slotte is er voor
gekozen om onderwerpen waar oorspronkelijk minder dan 10 papers of posters over
waren geschreven (de minder belangrijke onderwerpen 7,9,10,17,18,21,23,25),
niet op te nemen in de uiteindelijke spatialisatie. Dit is gedaan om het aantal
onderwerpen op de spatialisatie iets overzichtelijker te houden. Ook is
besloten om per onderwerp minstens 5 papers op te nemen in de spatialisatie.
Hierdoor is onderwerp 19, waarvan nog slechts 4 papers konden worden
gespatialiseerd, komen te vervallen.
Verder is, om de
verhoudingen per onderwerp niet aan te tasten, bij sommige onderwerpen, waarvan
meer dan de helft van de papers mogelijk gespatialiseerd kan worden, het aantal
opgenomen papers gereduceerd tot de helft van het oorspronkelijke aantal. Van
alle overgebleven onderwerpen wordt dus de helft van de papers gespatialiseerd.
Bij onderwerp 2 bijvoorbeeld zijn van de mogelijke 17 papers, 4 willekeurig
verwijderd, om te komen tot het aantal van 13 papers. Dit getal is de helft
(naar boven afgerond) van de 25 oorspronkelijke papers in dit onderwerp.
Uiteindelijk zouden er,
volgens deze berekening 270 papers op de spatialisatie komen te staan, verdeeld
over 19 onderwerpen en de plenaire sessie (onderwerp 0, zie tabel). Het
programma Excel echter kan maar 260 variabelen tegelijk aan op één zogenaamd
werkblad en omdat er een aantal bewerkingen met dit programma moeten worden
uitgevoerd (bijvoorbeeld het ‘filteren’ van de woordenlijst), waarbij het
moeilijk is om met meerdere werkbladen te werken, is besloten om nog een aantal
papers te schrappen. Het gevolg is dat er van onderwerp 27 en 28 geen documenten op de spatialisatie
zijn opgenomen. Het totale aantal papers komt nu op 259.





