Conclusie en Discussie

 

Omdat er de laatste jaren, bijvoorbeeld door de komst van het Internet, wereldwijd een gigantische toename aan informatie is waar te nemen, is er ook een groeiende behoefte aan overzicht over en inzicht in die informatie. Volgens het adagium dat een plaatje meer zegt dan duizend woorden, is de visualisatie van informatie een goede manier om aan die groeiende behoefte te voldoen. Er zijn dan ook steeds meer wetenschappers die zich, binnen de opkomende discipline van de informatievisualisatie, bezig houden met het zoeken naar goede methoden om dit te doen.

 

Eén manier om een snel overzicht over en inzicht in grote hoeveelheden informatie te krijgen is het zogenaamde spatialiseren van die informatie, met als resultaat een spatialisatie. Veel informatie kan in principe gespatialiseerd worden: het Internet, bibliotheekcatalogi, grote databases van bedrijven, sociale netwerken, etc.. In het eerste hoofdstuk van deze scriptie is een spatialisatie gedefinieerd als een visualisatie van niet-ruimtelijke informatie in een twee- of driedimensionale ruimte. Omdat bij een spatialisatie, van oorsprong niet-ruimtelijke informatie, aan de hand van die informatie een locatie krijgt in een conceptuele ruimte, krijgt die informatie opeens een ruimtelijke component. Daarom hebben spatialisaties, qua uiterlijk, erg veel weg van ‘gewone’ kaarten. Te meer daar er vaak ruimtelijke concepten als afstand, grootte en schaal, op spatialisaties worden gebruikt als metafoor. Het gebruik van die metaforen dient om de, vaak abstracte, informatie op spatialisaties beter te kunnen begrijpen en doorgronden.

 

Omdat spatialisaties veel weg hebben van kaarten is het idee om kartografische kennis en expertise in te zetten bij het maken van spatialisaties vrij voor de hand liggend. Kartografen hebben de afgelopen eeuwen immers veel ervaring opgebouwd met het zoeken naar goede methoden en technieken voor het in kaart brengen van ruimtelijke informatie. Tot op heden is er vanuit de hoek van de informatievisualisatie echter, op enkele uitzonderingen na, niet heel veel aandacht geweest voor kartografische kennis. In veel spatialisaties wordt bijvoorbeeld weinig rekening gehouden met de regels van de grafische grammatica van Bertin.

 

Ook al is het idee om kartografen in te zetten bij het maken van spatialisaties voor de hand liggend, het is tegelijkertijd ook vrij revolutionair. Kartografen houden zich immers traditioneel bezig met het in kaart brengen van ruimtelijke, aan een locatie op aarde gebonden, informatie. Spatialisaties worden echter gemaakt van van oorsprong niet-ruimtelijke informatie. Voor kartografen is het werken met niet-ruimtelijke informatie dus ook nieuw. Daarom is er sprake van een situatie die voor beide partijen voordeel kan opleveren: de informatievisualisatie kan zijn voordeel doen met kartografische kennis en expertise, kartografen kunnen misschien nieuwe inzichten of impulsen ontlenen aan technieken uit de informatievisualisatie en het in kaart brengen van andersoortige informatie.

 

De kartografie zou gezien kunnen worden als slechts één van de wetenschappelijke disciplines die zich met het visualiseren van informatie, van wat voor soort dan ook, bezig houden (zoals in figuur 6 in §1.1 te zien is). Redenerend vanuit die gedachte is verdere samenwerking en samensmelting van de kartografie, met verschillende informatievisualistiedisciplines op bepaalde gebieden wenselijk. Dit natuurlijk zonder de geografische wortels van de kartografie uit het oog te verliezen. Deze scriptie hoopt een bijdrage te leveren aan die samenwerking

 

Met deze interdisciplinaire gedachte als uitgangspunt is het doel van deze scriptie geweest om aan te tonen dat de min of meer retorische hoofdvraag van deze scriptie positief kan worden beantwoord. Die hoofdvraag is de volgende: kunnen kartografische methoden en technieken bijdragen aan het verbeteren van de visualisatie van niet-ruimtelijke informatie?

 

Voor het beantwoorden van die vraag is gebruik gemaakt van drie hoofdstukken. De scriptie begint met een theoretisch hoofdstuk over spatialisaties en gaat, aan de hand van een case study, in hoofdstuk twee gaandeweg over in een meer praktisch gedeelte waarin het hele spatialisatieproces wordt doorlopen. Het resultaat hiervan in hoofdstuk drie is een aantal spatialisaties, gemaakt met behulp van kartografische methoden en technieken.. Deze spatialisaties zijn bedoeld als ‘bewijs’ voor de lezer, dat de hoofdvraag ook daadwerkelijk positief kan worden beantwoord.

 

Het eerste theoretische hoofdstuk is vooral geschreven om duidelijk te maken wat spatialisaties precies zijn, wat de verhouding van spatialisaties tot kaarten is en wat de relatie van spatialisaties tot de informatievisualisatie is. Ook het nut van spatialisaties wordt besproken, onder andere door een aantal mogelijke toepassingen te noemen. In dit hoofdstuk is tenslotte het belang dat de kartografie kan hebben bij het maken van spatialisaties duidelijk gemaakt.

 

Hoofdstuk twee gaat over het proces dat doorlopen moet worden om informatie een plaats op een spatialisatie te kunnen geven. De informatie die gespatialiseerd moet worden, moet namelijk eerst op allerlei manieren worden geanalyseerd en bewerkt, voordat het kan worden weergegeven in een conceptuele ruimte. In bijlage 3 van deze scriptie is de grote hoeveelheid bewerkingen te zien die een conferentiepaper uit de case study moet ondergaan om die paper een plek op de spatialisatie te kunnen geven. Het uitzoeken welke bewerkingen dit zijn en welke software daarvoor op welke manier moest worden gebruikt is erg veel werk geweest, waarbij vanzelfsprekend veel mis is gegaan, voordat er goede resultaten konden worden geboekt.

 

Het risico dat er in dit proces uiteindelijk nog een aantal fouten zijn geslopen is niet gering, aangezien het gepaard ging met veel handwerk en er veel bewerkingen op de data moesten worden uitgevoerd. Bij elke bewerking die de data ondergaat kan bijvoorbeeld informatie verloren gaan of verkeerd geïnterpreteerd worden. Ook zijn sommige keuzen die gemaakt zijn vrij arbitrair, zoals bijvoorbeeld welke woorden er bij de tekstanalyse wel of niet worden meegenomen of het aantal sleutelwoorden dat per tekst wordt gebruikt. In de tekst is dan ook al aangegeven dat de tekstanalysemethode niet perfect is.

 

Er zijn twee redenen waarom dit echter niet als onoverkomelijk wordt gezien. Ten eerste om het simpele feit dat elke tekstanalysemethode een bepaalde foutenmarge in zich heeft en ook altijd een mate van subjectiviteit. De tweede reden is dat het nog meer tijd besteden aan het vinden van een goede tekstanalysemethode buiten de mogelijkheden en doelstellingen van deze kartografische scriptie ligt. Voor deze scriptie is de methode goed genoeg, ondanks de tekortkomingen.

 

Om de geanalyseerde en bewerkte (meerdimensionale) data vervolgens in een tweedimensionale conceptuele ruimte weer te geven, moet het aantal dimensies worden gereduceerd. Hiervoor zijn meerdere methoden bekend, waarvan er twee bij uitstek geschikt zijn om spatialisaties te maken. Dat zijn meerdimensionale schaalanalyse (MDS) en de Kohonen Self-Organising Map (SOM). In de tekst zijn beide methoden uitgebreid besproken. De manier waarop MDS meerdimensionale data terugbrengt tot twee dimensie is heel anders dan de manier waarop de SOM-methode dat doet. Bij de SOM-methode is sprake van een ruimtelijk raster met punten, waarop de data-eenheden een plaats toegewezen krijgen. Bij MDS kunnen data elke willekeurige plaats innemen in een ruimte die aan de hand van de data wordt geschapen.

 

Overeenkomst tussen beide methoden, is dat het terugbrengen van het aantal dimensies per definitie leidt tot een bepaald informatieverlies. De plek die bepaalde informatie namelijk in een meerdimensionale ruimte heeft, kan nooit precies worden gerepresenteerd in een tweedimensionale ruimte. Omdat bij MDS deze afwijking steeds groter wordt naarmate de hoeveelheid te spatialiseren informatie groeit en dit bij SOM niet per se het geval is, is het gebruik van SOM vooral bij (hele) grote databestanden aan te raden. Toch is bij de case study in deze scriptie gekozen voor het gebruik van MDS, omdat software om een SOM-spatialisatie mee te maken niet voorhanden was.

 

Dit heeft helaas wel tot gevolg gehad dat de gemiddelde afwijking die documenten uit de case study op de spatialisatie hebben, ten opzichte van hun locatie in een meerdimensionale ruimte, erg groot is. Zo groot zelfs dat over de betekenis van de afstand die individuele documenten tot elkaar hebben op de spatialisatie, geen concrete uitspraken meer kunnen worden gedaan. Het is dus niet per se zo dat als document A op de spatialisatie dichter in de buurt van document B ligt, dan bij document C, dat document A en B dan ook meer op elkaar lijken. Het gevolg is dat er bij de kartografische bewerking van de spatialisatie geen aandacht kon worden besteed aan de positie van individuele documenten. Over de spatialisatie als geheel en over de locatie van individuele documenten ten opzichte van de rest zijn overigens wel relevante uitspraken te doen.

 

Maar omdat hier één van de fundamenten van het idee achter spatialisaties, dat afstand iets zegt over similariteit, niet meer volledig opgaat, wordt het gebruik van MDS als spatialisatiemethode, bij een reductie van meer dan een bepaald aantal dimensies afgeraden. Er wordt hier gesproken van ‘een bepaald aantal’ omdat er geen exacte cijfers kunnen worden gegeven. Waarschijnlijk is bij een klein aantal te reduceren dimensies de afwijking bij MDS relatief kleiner en bij een groot aantal de afwijking bij SOM. Maar waar precies het break-even point ligt zal afhangen van de data.

 

Het is belangrijk dat gebruikers van spatialisaties zich bewust zijn van het feit dat er een bepaalde afwijking in de data zit (Skupin, 2000). Net als het belang van het feit dat kaartgebruikers weten dat er bij kaartprojecties een afwijking zit in bijvoorbeeld afstand, grootte of hoek, ten opzichte van de oorspronkelijke informatie. Om gebruikers die bewustwording te geven is het aan te bevelen om als een soort ‘meta-meta-informatie’, de nauwkeurigheid van de informatie op de spatialisatie aan te geven. Dit kan bijvoorbeeld gedaan worden door een gemiddelde afwijking van de data aan te geven (de zogenaamde stress die in §2.2.1 is besproken zou een goede maat hiervoor zijn). Een preciezere methode zou zijn om een kaart naast de spatialisatie te maken die de afwijking op elk punt van de spatialisatie aangeeft. De mogelijkheden en moeilijkheden hiervan zijn in deze scriptie niet aan de orde gekomen en dus niet verder onderzocht. Voor toekomstig onderzoek kan dit echter wel van belang zijn, omdat het hebben van een zo klein mogelijke afwijking ten opzichte van de oorspronkelijke data te prefereren is.

 

Nadat het volledige spatialisatieproces in hoofdstuk 2 is besproken, is in hoofdstuk 3 aandacht besteed aan de toepassing van kartografische methoden en technieken op de spatialisatie van de conferentiepapers uit de case study.  Er is getracht om met behulp van deze spatialisatie de hoofdvraag van deze scriptie te beantwoorden (kunnen kartografische methoden en technieken bijdragen aan het verbeteren van de visualisatie van niet-ruimtelijke informatie?).

De aanname hierbij is dat een visualisatie verbetert als die visualisatie beter voldoet aan de vraag naar informatie over de gevisualiseerde informatie. Als de kartografie er dus voor kan zorgen dat er met behulp van haar methoden en technieken meer overzicht over de structuur en de inhoud van de gevisualiseerde informatie te krijgen is, dan is de hoofdvraag positief beantwoord.

 

Om de hoofdvraag te beantwoorden is (als voorbeeld) een vraag gesteld over de conferentiepapers in de case study: of de indeling van de papers in een ‘analoge’ en een ‘digitale’ groep, een terechte indeling is. Er zijn kartografische methoden en technieken gebruikt om die vraag te beantwoorden. Ten eerste zijn de verschillende groepen papers geselecteerd en vervolgens gegeneraliseerd tot twee groepen. Uit deze bewerkingen bleek dat de indeling van de papers in twee groepen op de spatialisatie, ook duidelijk twee afzonderlijke gebieden te zien gaf en dus terecht was. Om de spatialisatie verder kartografisch te verbeteren, om er nog meer informatie uit te halen, zijn duidelijke legendaklassen gemaakt, sleutelwoorden toegevoegd en is er een driedimensionale spatialisatie gemaakt die een nog beter overzicht van de twee groepen te zien gaf. Al deze bewerkingen hebben laten zien dat kartografische methoden en technieken wel degelijk een bijdrage kunnen leveren aan het visualiseren van niet-ruimtelijke informatie.

 

Al deze spatialisaties zijn gemaakt met behulp van ArcView (inclusief extensies als de Spatial Analyst en de 3D Analyst), een bekend GIS-softwarepakket. Het gebruik van geografische informatiesystemen om ruimtelijke vragen en problemen te analyseren en op te lossen, is voor geografen en kartografen bijna een vanzelfsprekendheid geworden. Ook voor het presenteren van ruimtelijke gegevens op een (in de loop der jaren steeds meer) kartografisch verantwoorde manier, kunnen GISsen tot op zekere hoogte een uitkomst bieden. Vandaar dat ArcView in deze scriptie is gebruikt om de spatialisaties kartografisch te bewerken en te presenteren. Het nadeel hiervan is tegelijkertijd wel de gebondenheid aan de mogelijkheden en onmogelijkheden van de software. Bij het maken van een driedimensionale spatialisatie bleek bijvoorbeeld dat het maken van een kartografisch verantwoorde representatie heel moeilijk was, vooral zonder het downloaden van extra componenten om bijvoorbeeld sleutelwoorden en een assenstelsel toe te kunnen voegen.  

 

Het gebruik van GIS, dat voor kartografen tegenwoordig dus erg voor de hand ligt, is voor wetenschappers uit andere hoeken van de informatievisualisatie helemaal niet zo vanzelfsprekend. Maar uit deze scriptie is toch wel gebleken dat het gebruik van GIS-software óók voor de analyse en bewerking van niet-ruimtelijke gegevens, in de vorm van spatialisaties, een goed hulpmiddel kan zijn. Er wordt op deze plaats dan ook gepleit om, daar waar de kartografie kan worden ingezet bij het visualiseren van bepaalde niet-ruimtelijke informatie, GIS in te zetten bij het analyseren en bewerken van die informatie.

 

In de laatste paragraaf van het derde hoofdstuk is (§3.6) is aandacht besteed aan de interactieve mogelijkheden die spatialisaties (in de toekomst) zouden kunnen hebben. Er wordt tegenwoordig, zowel binnen als buiten de kartografie, steeds meer gewerkt met digitale, interactieve, dynamische kaarten. Op een groot aantal Internetsites kunnen gebruikers zelf kaarten samenstellen en zo kunnen ‘maps-on-demand’ worden gegenereerd. Dat spatialisaties in de toekomst dezelfde mogelijkheden kunnen bieden, is de gedachte die hier uit voortvloeit. Er is een voorbeeld gegeven, dat laat zien hoe een applicatie er uit zou kunnen zien die ‘spatialisaties-on-demand’ zou kunnen maken van de conferentiepapers uit de case study van deze scriptie. Ook is in deze paragraaf laten zien hoe spatialisaties van nut kunnen zijn bij het zoeken van informatie op Internet. Door een spatialisatie toe te voegen aan zoekbewerkingen die gedaan worden met een zoekmachine, kunnen gebruikers de structuur van de informatie beter overzien en meer relevante documenten vinden.

 

Behalve de voorbeelden die in deze paragraaf zijn gegeven, zijn er nog legio toepassingen te bedenken waarbij spatialisaties van groot nut kunnen zijn voor het geven van een overzicht over en inzicht in grote hoeveelheden informatie. Aangezien hier een groeiende behoefte aan is, zou het best kunnen dat het onderzoek naar het maken van spatialisaties en de toepassingsmogelijkheden ervan, pas in de kinderschoenen staat. Als dat zo is dan is hier nog een belangrijke taak weggelegd voor wetenschappers die zich bezighouden met de visualisatie van informatie, waaronder kartografen.