Bijlagen

 

Bijlage 1: Het verschil tussen data en informatie

 

Het aangeven van het verschil tussen ‘data’ en ‘informatie’ wordt vaak nagelaten, omdat deze begrippen (letterlijk) een basisgegeven lijken te zijn. Vaak is het in het normale spraakgebruik niet nodig om het verschil aan te geven. De begrippen worden dientengevolge regelmatig door elkaar gebruikt. Ook in deze scriptie is dat het geval. Dat is niet erg, omdat het onderscheid er niet altijd toe doet, maar het is in deze context wel belangrijk om het verschil tussen de twee begrippen in het achterhoofd te houden. Hieronder zullen de begrippen dan ook nader worden toegelicht.

 

Het woord ‘data’ komt uit het Latijn en is het meervoud van ‘datum’, dat gegeven betekent.

Clarke geeft de volgende definitie van data, die aangepast is voor gebruik binnen de context van de informatiewetenschappen (definities uit woordenboeken zijn hier vaak minder bruikbaar):

'Data' is any symbol, sign or measure which is in a form which can be directly captured by a person or a machine.

Informatie definieert hij als volgt:

'Information' is data that has value. Informational value depends upon context. Until it is placed in an appropriate context, data is not information, and once it ceases to be in that context it ceases to be information.

Informatie is dus data met een bepaalde waarde. Een astronomisch voorbeeld zal het bovenstaande verduidelijken. Achtergrondstraling uit het heelal is er altijd geweest en zal er altijd zijn. Dat is een feit. Zodra deze straling wordt opgevangen en vastgelegd door computers is het data. Deze data kan onderzocht en bewerkt worden. Voor meer dan 99% is deze achtergrondstraling nietszeggend en van geen enkele waarde. De rest kan echter wel van enigerlei waarde zijn. Er kan een bepaald patroon in zitten dat iets zegt over bepaalde gebeurtenissen in het heelal. Deze data is informatie geworden, omdat het waarde heeft en er iets mee gedaan kan worden. Bijvoorbeeld de locatie van zwarte gaten achterhalen, supernovae ontdekken, of zelfs het bestaan van intelligent leven elders in het heelal aantonen (zie SETI, http://setiathome.ssl.berkeley.edu/ ).

Wat de informatiedefinie van Clarke bijzonder en tegelijkertijd onbevredigend maakt is het relatieve  aspect ervan. Hij zegt dat de waarde van de informatie afhangt van de context. Wat voor de één informatie is, is voor de ander gewoon data. Patronen in de achtergrondstraling van het heelal kunnen bijvoorbeeld erg bijzonder zijn voor een astronoom, voor de ander is het een reeks van nullen en enen waar niks mee te beginnen valt. Het is dus moeilijk om voor sommige gegevens aan te geven of het als data of als informatie kan worden beschouwd, aangezien dat afhangt van de persoon die er naar kijkt.

Zowel data als informatie kunnen worden gevisualiseerd. Het doel van een datavisualisatie is het geven van meer betekenis aan de data voor het menselijke oog en brein. Zo wordt de data omgezet in informatie. Het doel van een informatievisualisatie is in feite hetzelfde, de informatie wordt echter op zo’n manier weergegeven dat er nog meer informatie uit te halen is.

 

 

 


 

Bijlage 2: De selectie van de conferentiepapers

 

In onderstaande tabel is te zien dat de ICA conferentie in Beijing is onderverdeeld in 28 onderwerpen (plus 2 plenaire sessies, onderwerp 0), waarover in totaal 586 papers en posters zijn geschreven. Bij een blik op de kolom ‘aantal’ in de tabel zal al snel duidelijk worden dat het aantal papers per onderwerp nogal kan verschillen. Over onderwerp 7, ‘military cartography’, zijn slechts 2 papers geschreven, terwijl over onderwerp 11, ‘GIS and digital mapping’, maar liefst 98 papers en of posters zijn opgenomen.

 

De hoeveelheid papers per onderwerp zegt natuurlijk iets over het belang van dat onderwerp in de kartografie op dit moment. Om te proberen de kwantitatieve verhoudingen tussen de verschillende onderwerpen zoveel mogelijk in stand te houden, is het de bedoeling om in de uiteindelijke spatialisatie van elk onderwerp relatief evenveel papers op te nemen.

 

Niet alle 586 papers kunnen namelijk worden gespatialiseerd, omdat van lang niet alle papers op de CD-ROM van de conferentie een volledige versie staat. Er zit namelijk een groot aantal artikelen bij die alleen bestaan uit een korte samenvatting van de presentatie die op het congres gegeven is. Meestal bestaan die samenvattingen uit minder dan één A4-tje. Deze artikelen zullen niet worden meegenomen in de analyse omdat ze nauwelijks inhoud hebben en daarom niet goed met de andere artikelen kunnen worden vergeleken.

 

Om de papers die alleen bestaan uit samenvattingen er uit te filteren, is er voor gekozen om een minimum tekstgrootte van ongeveer 2000 woorden aan te houden. Dit is ongeveer 6 pagina’s. Het aantal papers per onderwerp dat na deze filtering nog overblijft is te zien in de kolom ‘mogelijk’  in de tabel. Te zien is dat het aantal mogelijke papers in veel gevallen slechts de helft is van het oorspronkelijke aantal papers. Het totale aantal papers dat mogelijk gespatialiseerd kan worden is 350.

 

Ten slotte is er voor gekozen om onderwerpen waar oorspronkelijk minder dan 10 papers of posters over waren geschreven (de minder belangrijke onderwerpen 7,9,10,17,18,21,23,25), niet op te nemen in de uiteindelijke spatialisatie. Dit is gedaan om het aantal onderwerpen op de spatialisatie iets overzichtelijker te houden. Ook is besloten om per onderwerp minstens 5 papers op te nemen in de spatialisatie. Hierdoor is onderwerp 19, waarvan nog slechts 4 papers konden worden gespatialiseerd, komen te vervallen.

 

Verder is, om de verhoudingen per onderwerp niet aan te tasten, bij sommige onderwerpen, waarvan meer dan de helft van de papers mogelijk gespatialiseerd kan worden, het aantal opgenomen papers gereduceerd tot de helft van het oorspronkelijke aantal. Van alle overgebleven onderwerpen wordt dus de helft van de papers gespatialiseerd. Bij onderwerp 2 bijvoorbeeld zijn van de mogelijke 17 papers, 4 willekeurig verwijderd, om te komen tot het aantal van 13 papers. Dit getal is de helft (naar boven afgerond) van de 25 oorspronkelijke papers in dit onderwerp.

 

Uiteindelijk zouden er, volgens deze berekening 270 papers op de spatialisatie komen te staan, verdeeld over 19 onderwerpen en de plenaire sessie (onderwerp 0, zie tabel). Het programma Excel echter kan maar 260 variabelen tegelijk aan op één zogenaamd werkblad en omdat er een aantal bewerkingen met dit programma moeten worden uitgevoerd (bijvoorbeeld het ‘filteren’ van de woordenlijst), waarbij het moeilijk is om met meerdere werkbladen te werken, is besloten om nog een aantal papers te schrappen. Het gevolg is dat er van onderwerp  27 en 28 geen documenten op de spatialisatie zijn opgenomen. Het totale aantal papers komt nu op 259.

 

 

 

 


Bijlage 3:Van conferentiepaper tot punt op een spatialisatie