Omdat er de
laatste jaren, bijvoorbeeld door de komst van het Internet, wereldwijd een
gigantische toename aan informatie is waar te nemen, is er ook een groeiende
behoefte aan overzicht over en inzicht in die informatie. Volgens het adagium
dat een plaatje meer zegt dan duizend woorden, is de visualisatie van
informatie een goede manier om aan die groeiende behoefte te voldoen. Er zijn
dan ook steeds meer wetenschappers die zich, binnen de opkomende discipline van
de informatievisualisatie, bezig houden met het zoeken naar goede methoden om
dit te doen.
Eén manier om
een snel overzicht over en inzicht in grote hoeveelheden informatie te krijgen
is het zogenaamde spatialiseren van die informatie, met als resultaat een
spatialisatie. Veel informatie kan in principe gespatialiseerd worden: het
Internet, bibliotheekcatalogi, grote databases van bedrijven, sociale
netwerken, etc.. In het eerste hoofdstuk van deze scriptie is een spatialisatie
gedefinieerd als een visualisatie
van niet-ruimtelijke informatie in een twee- of driedimensionale ruimte. Omdat bij een spatialisatie, van oorsprong
niet-ruimtelijke informatie, aan de hand van die informatie een locatie krijgt in
een conceptuele ruimte, krijgt die informatie opeens een ruimtelijke component.
Daarom hebben spatialisaties, qua uiterlijk, erg veel weg van ‘gewone’ kaarten.
Te meer daar er vaak ruimtelijke concepten als afstand, grootte en schaal, op
spatialisaties worden gebruikt als metafoor. Het gebruik van die metaforen
dient om de, vaak abstracte, informatie op spatialisaties beter te kunnen
begrijpen en doorgronden.
Omdat spatialisaties veel weg hebben van kaarten is het idee om
kartografische kennis en expertise in te zetten bij het maken van
spatialisaties vrij voor de hand liggend. Kartografen hebben de afgelopen
eeuwen immers veel ervaring opgebouwd met het zoeken naar goede methoden en
technieken voor het in kaart brengen van ruimtelijke informatie. Tot op heden
is er vanuit de hoek van de informatievisualisatie echter, op enkele
uitzonderingen na, niet heel veel aandacht geweest voor kartografische kennis.
In veel spatialisaties wordt bijvoorbeeld weinig rekening gehouden met de
regels van de grafische grammatica van Bertin.
Ook al is het idee om kartografen in te zetten bij het maken van
spatialisaties voor de hand liggend, het is tegelijkertijd ook vrij
revolutionair. Kartografen houden zich immers traditioneel bezig met het in
kaart brengen van ruimtelijke, aan een locatie op aarde gebonden, informatie.
Spatialisaties worden echter gemaakt van van oorsprong niet-ruimtelijke
informatie. Voor kartografen is het werken met niet-ruimtelijke informatie dus
ook nieuw. Daarom is er sprake van een situatie die voor beide partijen
voordeel kan opleveren: de informatievisualisatie kan zijn voordeel doen met
kartografische kennis en expertise, kartografen kunnen misschien nieuwe
inzichten of impulsen ontlenen aan technieken uit de informatievisualisatie en
het in kaart brengen van andersoortige informatie.
De kartografie zou gezien kunnen worden als slechts één van de
wetenschappelijke disciplines die zich met het visualiseren van informatie, van
wat voor soort dan ook, bezig houden (zoals in figuur 6 in §1.1 te zien is).
Redenerend vanuit die gedachte is verdere samenwerking en samensmelting van de
kartografie, met verschillende informatievisualistiedisciplines op bepaalde
gebieden wenselijk. Dit natuurlijk zonder de geografische wortels van de
kartografie uit het oog te verliezen. Deze scriptie hoopt een bijdrage te
leveren aan die samenwerking
Met deze
interdisciplinaire gedachte als uitgangspunt is het doel van deze scriptie geweest
om aan te tonen dat de min of meer retorische hoofdvraag van deze scriptie
positief kan worden beantwoord. Die hoofdvraag is de volgende: kunnen
kartografische methoden en technieken bijdragen aan het verbeteren van de
visualisatie van niet-ruimtelijke informatie?
Voor het
beantwoorden van die vraag is gebruik gemaakt van drie hoofdstukken. De
scriptie begint met een theoretisch hoofdstuk over spatialisaties en gaat, aan
de hand van een case study, in hoofdstuk twee gaandeweg over in een meer
praktisch gedeelte waarin het hele spatialisatieproces wordt doorlopen. Het
resultaat hiervan in hoofdstuk drie is een aantal spatialisaties, gemaakt met
behulp van kartografische methoden en technieken.. Deze spatialisaties zijn
bedoeld als ‘bewijs’ voor de lezer, dat de hoofdvraag ook daadwerkelijk
positief kan worden beantwoord.
Het eerste
theoretische hoofdstuk is vooral geschreven om duidelijk te maken wat spatialisaties precies zijn, wat de
verhouding van spatialisaties tot kaarten is en wat de relatie van
spatialisaties tot de informatievisualisatie is. Ook het nut van spatialisaties
wordt besproken, onder andere door een aantal mogelijke toepassingen te noemen.
In dit hoofdstuk is tenslotte het belang dat de kartografie kan hebben bij het
maken van spatialisaties duidelijk gemaakt.
Hoofdstuk twee gaat over het proces dat doorlopen moet worden om
informatie een plaats op een spatialisatie te kunnen geven. De informatie die
gespatialiseerd moet worden, moet namelijk eerst op allerlei manieren worden
geanalyseerd en bewerkt, voordat het kan worden weergegeven in een conceptuele
ruimte. In bijlage 3 van deze scriptie is de grote hoeveelheid bewerkingen te
zien die een conferentiepaper uit de case study moet ondergaan om die
paper een plek op de spatialisatie te kunnen geven. Het uitzoeken welke
bewerkingen dit zijn en welke software daarvoor op welke manier moest worden
gebruikt is erg veel werk geweest, waarbij vanzelfsprekend veel mis is gegaan,
voordat er goede resultaten konden worden geboekt.
Het risico dat er in dit proces uiteindelijk nog een aantal fouten zijn
geslopen is niet gering, aangezien het gepaard ging met veel handwerk en er
veel bewerkingen op de data moesten worden uitgevoerd. Bij elke bewerking die
de data ondergaat kan bijvoorbeeld informatie verloren gaan of verkeerd
geïnterpreteerd worden. Ook zijn sommige keuzen die gemaakt zijn vrij
arbitrair, zoals bijvoorbeeld welke woorden er bij de tekstanalyse wel of niet
worden meegenomen of het aantal sleutelwoorden dat per tekst wordt gebruikt. In
de tekst is dan ook al aangegeven dat de tekstanalysemethode niet perfect is.
Er zijn twee redenen waarom dit echter niet als onoverkomelijk wordt
gezien. Ten eerste om het simpele feit dat elke tekstanalysemethode een
bepaalde foutenmarge in zich heeft en ook altijd een mate van subjectiviteit.
De tweede reden is dat het nog meer tijd besteden aan het vinden van een goede
tekstanalysemethode buiten de mogelijkheden en doelstellingen van deze
kartografische scriptie ligt. Voor deze scriptie is de methode goed genoeg,
ondanks de tekortkomingen.
Om de geanalyseerde en bewerkte (meerdimensionale) data vervolgens in een
tweedimensionale conceptuele ruimte weer te geven, moet het aantal dimensies
worden gereduceerd. Hiervoor zijn meerdere methoden bekend, waarvan er twee bij
uitstek geschikt zijn om spatialisaties te maken. Dat zijn meerdimensionale
schaalanalyse (MDS) en de Kohonen Self-Organising Map (SOM). In de tekst zijn
beide methoden uitgebreid besproken. De manier waarop MDS meerdimensionale data
terugbrengt tot twee dimensie is heel anders dan de manier waarop de
SOM-methode dat doet. Bij de
SOM-methode is sprake van een ruimtelijk raster met punten, waarop de
data-eenheden een plaats toegewezen krijgen. Bij MDS kunnen data elke
willekeurige plaats innemen in een ruimte die aan de hand van de data wordt
geschapen.
Overeenkomst tussen beide methoden, is dat het terugbrengen van het
aantal dimensies per definitie leidt tot een bepaald informatieverlies. De plek
die bepaalde informatie namelijk in een meerdimensionale ruimte heeft, kan
nooit precies worden gerepresenteerd in een tweedimensionale ruimte. Omdat bij
MDS deze afwijking steeds groter wordt naarmate de hoeveelheid te spatialiseren
informatie groeit en dit bij SOM niet per se het geval is, is het gebruik van
SOM vooral bij (hele) grote databestanden aan te raden. Toch is bij de case
study in deze scriptie gekozen voor het gebruik van MDS, omdat software om
een SOM-spatialisatie mee te maken niet voorhanden was.
Dit heeft
helaas wel tot gevolg gehad dat de gemiddelde afwijking die documenten uit de case
study op de spatialisatie hebben, ten opzichte van hun locatie in een
meerdimensionale ruimte, erg groot is. Zo groot zelfs dat over de betekenis van
de afstand die individuele documenten tot elkaar hebben op de spatialisatie,
geen concrete uitspraken meer kunnen worden gedaan. Het is dus niet per se
zo dat als document A op de spatialisatie dichter in de buurt van document B
ligt, dan bij document C, dat document A en B dan ook meer op elkaar lijken.
Het gevolg is dat er bij de kartografische bewerking van de spatialisatie geen
aandacht kon worden besteed aan de positie van individuele documenten. Over de
spatialisatie als geheel en over de locatie van individuele documenten ten
opzichte van de rest zijn overigens wel relevante uitspraken te doen.
Maar omdat
hier één van de fundamenten van het idee achter spatialisaties, dat afstand
iets zegt over similariteit, niet meer volledig opgaat, wordt het gebruik van
MDS als spatialisatiemethode, bij een reductie van meer dan een bepaald aantal
dimensies afgeraden. Er wordt hier gesproken van ‘een bepaald aantal’ omdat er
geen exacte cijfers kunnen worden gegeven. Waarschijnlijk is bij een klein
aantal te reduceren dimensies de afwijking bij MDS relatief kleiner en bij een
groot aantal de afwijking bij SOM. Maar waar precies het break-even point ligt
zal afhangen van de data.
Het is
belangrijk dat gebruikers van spatialisaties zich bewust zijn van het feit dat
er een bepaalde afwijking in de data zit (Skupin,
2000). Net als het belang van het feit dat kaartgebruikers weten dat er bij
kaartprojecties een afwijking zit in bijvoorbeeld afstand, grootte of hoek, ten
opzichte van de oorspronkelijke informatie. Om gebruikers die bewustwording te
geven is het aan te bevelen om als een soort ‘meta-meta-informatie’, de
nauwkeurigheid van de informatie op de spatialisatie aan te geven. Dit kan
bijvoorbeeld gedaan worden door een gemiddelde afwijking van de data aan te geven
(de zogenaamde stress die in §2.2.1 is besproken zou een goede maat
hiervoor zijn). Een preciezere methode zou zijn om een kaart naast de
spatialisatie te maken die de afwijking op elk punt van de spatialisatie
aangeeft. De mogelijkheden en moeilijkheden hiervan zijn in deze scriptie niet
aan de orde gekomen en dus niet verder onderzocht. Voor toekomstig onderzoek
kan dit echter wel van belang zijn, omdat het hebben van een zo klein mogelijke
afwijking ten opzichte van de oorspronkelijke data te prefereren is.
Nadat het
volledige spatialisatieproces in hoofdstuk 2 is besproken, is in hoofdstuk 3
aandacht besteed aan de toepassing van kartografische methoden en technieken op
de spatialisatie van de conferentiepapers uit de case study. Er is getracht om met behulp van deze
spatialisatie de hoofdvraag van deze scriptie te beantwoorden (kunnen
kartografische methoden en technieken bijdragen aan het verbeteren van de
visualisatie van niet-ruimtelijke informatie?).
De aanname
hierbij is dat een visualisatie verbetert als die visualisatie beter
voldoet aan de vraag naar informatie over de gevisualiseerde informatie. Als de
kartografie er dus voor kan zorgen dat er met behulp van haar methoden en
technieken meer overzicht over de structuur en de inhoud van de gevisualiseerde
informatie te krijgen is, dan is de hoofdvraag positief beantwoord.
Om de
hoofdvraag te beantwoorden is (als voorbeeld) een vraag gesteld over de
conferentiepapers in de case study: of de indeling van de papers in een ‘analoge’
en een ‘digitale’ groep, een terechte indeling is. Er zijn kartografische
methoden en technieken gebruikt om die vraag te beantwoorden. Ten eerste zijn
de verschillende groepen papers geselecteerd en vervolgens gegeneraliseerd tot
twee groepen. Uit deze bewerkingen bleek dat de indeling van de papers in twee
groepen op de spatialisatie, ook duidelijk twee afzonderlijke gebieden te zien
gaf en dus terecht was. Om de spatialisatie verder kartografisch te verbeteren,
om er nog meer informatie uit te halen, zijn duidelijke legendaklassen gemaakt,
sleutelwoorden toegevoegd en is er een driedimensionale spatialisatie gemaakt
die een nog beter overzicht van de twee groepen te zien gaf. Al deze
bewerkingen hebben laten zien dat kartografische methoden en technieken wel
degelijk een bijdrage kunnen leveren aan het visualiseren van
niet-ruimtelijke informatie.
Al deze
spatialisaties zijn gemaakt met behulp van ArcView (inclusief extensies als de
Spatial Analyst en de 3D Analyst), een bekend GIS-softwarepakket. Het gebruik
van geografische informatiesystemen om ruimtelijke vragen en problemen te
analyseren en op te lossen, is voor geografen en kartografen bijna een
vanzelfsprekendheid geworden. Ook voor het presenteren van ruimtelijke gegevens
op een (in de loop der jaren steeds meer) kartografisch verantwoorde manier,
kunnen GISsen tot op zekere hoogte een uitkomst bieden. Vandaar dat ArcView in
deze scriptie is gebruikt om de spatialisaties kartografisch te bewerken en te
presenteren. Het nadeel hiervan is tegelijkertijd wel de gebondenheid aan de
mogelijkheden en onmogelijkheden van de software. Bij het maken van een
driedimensionale spatialisatie bleek bijvoorbeeld dat het maken van een
kartografisch verantwoorde representatie heel moeilijk was, vooral zonder het
downloaden van extra componenten om bijvoorbeeld sleutelwoorden en een
assenstelsel toe te kunnen voegen.
Het gebruik
van GIS, dat voor kartografen tegenwoordig dus erg voor de hand ligt, is voor
wetenschappers uit andere hoeken van de informatievisualisatie helemaal niet zo
vanzelfsprekend. Maar uit deze scriptie is toch wel gebleken dat het gebruik
van GIS-software óók voor de analyse en bewerking van niet-ruimtelijke
gegevens, in de vorm van spatialisaties, een goed hulpmiddel kan zijn. Er wordt
op deze plaats dan ook gepleit om, daar waar de kartografie kan worden ingezet
bij het visualiseren van bepaalde niet-ruimtelijke informatie, GIS in te zetten
bij het analyseren en bewerken van die informatie.
In de laatste
paragraaf van het derde hoofdstuk is (§3.6)
is aandacht besteed aan de interactieve mogelijkheden die spatialisaties (in de
toekomst) zouden kunnen hebben. Er wordt tegenwoordig, zowel binnen als buiten
de kartografie, steeds meer gewerkt met digitale, interactieve, dynamische
kaarten. Op een groot aantal Internetsites kunnen gebruikers zelf kaarten
samenstellen en zo kunnen ‘maps-on-demand’ worden gegenereerd. Dat
spatialisaties in de toekomst dezelfde mogelijkheden kunnen bieden, is de
gedachte die hier uit voortvloeit. Er is een voorbeeld gegeven, dat laat zien
hoe een applicatie er uit zou kunnen zien die ‘spatialisaties-on-demand’
zou kunnen maken van de conferentiepapers uit de case study van deze
scriptie. Ook is in deze paragraaf laten zien hoe spatialisaties van nut kunnen
zijn bij het zoeken van informatie op Internet. Door een spatialisatie toe te
voegen aan zoekbewerkingen die gedaan worden met een zoekmachine, kunnen
gebruikers de structuur van de informatie beter overzien en meer relevante
documenten vinden.
Behalve de
voorbeelden die in deze paragraaf zijn gegeven, zijn er nog legio toepassingen
te bedenken waarbij spatialisaties van groot nut kunnen zijn voor het geven van
een overzicht over en inzicht in grote hoeveelheden informatie. Aangezien hier
een groeiende behoefte aan is, zou het best kunnen dat het onderzoek naar het
maken van spatialisaties en de toepassingsmogelijkheden ervan, pas in de kinderschoenen
staat. Als dat zo is dan is hier nog een belangrijke taak weggelegd voor
wetenschappers die zich bezighouden met de visualisatie van informatie,
waaronder kartografen.