3 Het toepassen van kartografische methoden en technieken

 

Waar het eerste hoofdstuk van deze scriptie grotendeels theoretisch was en het tweede hoofdstuk bestond uit zowel theoretische als praktische gedeeltes, zal dit derde hoofdstuk bijna geheel gevormd worden door een praktisch stuk. In dit laatste hoofdstuk zal namelijk aan de hand van spatialisaties, gemaakt met gegevens uit  de case study, geprobeerd worden om de in de inleiding gestelde hoofdvraag van deze scriptie te beantwoorden: Kunnen kartografische methoden en technieken bijdragen aan het verbeteren van de visualisatie van niet-ruimtelijke informatie?

 

De aanname hierbij is dat een visualisatie verbetert als die visualisatie beter voldoet aan de vraag naar informatie over de gevisualiseerde informatie. Als de kartografie er dus voor kan zorgen dat er met behulp van haar methoden en technieken meer overzicht over de structuur en de inhoud van de gevisualiseerde informatie te krijgen is, dan is de hoofdvraag positief beantwoord.

 

Dit hoofdstuk pretendeert niet om alle mogelijke kartografische methoden en technieken uitputtend te behandelen, maar wel om de lezer een indruk te geven van de mogelijkheden die de kartografie biedt bij het werken met spatialisaties. De bedoeling is dat de lezer overtuigd wordt van het instemmende antwoord op de retorische hoofdvraag. Om deze vraag te beantwoorden zal de spatialisatie van de conferentiepapers, zoals die in figuur 27 te zien is, op verschillende manieren kartografisch worden geanalyseerd, bewerkt en gepresenteerd. De ‘rauwe’ spatialisatie zal metamorfoseren en verandert gaandeweg het hoofdstuk in een kartografische verantwoorde spatialisatie.

 

De metamorfose van de spatialisatie begint met een aantal kartografische basisbewerkingen, zoals het toevoegen van een coördinatenstelsel (§3.1). Naar aanleiding van een mogelijke vraag die gebruikers over deze spatialisatie zouden kunnen stellen, zullen de documenten op de spatialisatie worden gegeneraliseerd tot twee verschillende groepen (§3.2). De locatie van die twee groepen zal vervolgens op een afgeleide spatialisatie worden afgebeeld (§3.3). Tenslotte zal er tekst, in de vorm van sleutelwoorden, worden toegevoegd aan deze spatialisatie (§3.4) en zal er een driedimensionale versie van worden gemaakt (§3.5). Dit alles om te laten zien wat kartografische methoden en technieken aan informatie kunnen toevoegen aan een ‘rauwe’  spatialisatie.

 

In de laatste paragraaf van dit hoofdstuk (§3.6) zal gekeken worden naar mogelijke interactieve toepassingen bij het werken met spatialisaties. Hier zal worden ingegaan op applicaties die ‘spatialisaties-on-demand’ kunnen maken en op spatialisaties die kunnen worden toegevoegd aan internetzoekmachines.

 

3.1 Basisbewerkingen

 

De eerste kartografische bewerking die de spatialisatie van alle conferentiepapers in figuur 27 zal ondergaan is het toevoegen van de assen van het coördinatenstelsel, zodat de positie van alle documenten in een perspectief wordt gezet. Figuur 28 laat dit coördinatenstelsel zien[25]. Wat al snel duidelijk wordt is dat vrijwel alle documenten minder dan een afstand van 1 van het centrum verwijderd zijn en dat alle documenten (op 2 na) liggen in een vierkant van 2x2. Zoals eerder opgemerkt hebben de waarden van dit coördinatenstelsel alleen een betekenis voor deze spatialisatie. Er is geen eenheid die de afstand tussen twee punten uitdrukt, zoals bijvoorbeeld de meter, daarom wordt er gezegd dat de afstand tussen twee punten bijvoorbeeld 0,3 is.

 

De documenten zijn redelijk gespreid over de spatialisatie, er zijn op het eerste gezicht geen duidelijke clusters te ontdekken. Wat er nu al wel te zeggen valt over de spatialisatie is dat de documenten die zich het dichtst bij het centrum bevinden, het beste reflecteren wat de belangrijkste onderwerpen van het congres zijn geweest. Zij hebben namelijk gemiddeld de meeste woorden gemeen met andere documenten. De documenten die zich daarentegen aan de rand van de spatialisatie bevinden, zijn de buitenbeentjes en zullen relatief minder met andere documenten te maken hebben. Figuur 29 is een spatialisatie met daarop de nummers van een aantal van de meest centrale en de meest perifere conferentiepapers. De titels van de verschillende papers zijn rechts afgebeeld. Kijkend naar de titels van de papers is de al dan niet centrale positie van de papers wel te verklaren, redenerend vanuit het onderwerp van de conferentie.

Figuur 28: Spatialisatie van de conferentiepapers met coördinatenstelsel

 

 

Meest centraal:

1210 Applications of Dynamic Representation   Technologies in Multimedia Electronic Maps

1322 The Development of Research on Automated Geographical Informational Generalization in China

1614 A New Cartographic Geometry

2415 The Map in the Twenty First Century

2436 Study on the Data Model of Digital Map Product

 

Meest perifeer:

1325 A Hybrid Approach for Automated Area Aggregation

1541 Towards Chaining Geo-Computational Web Applications Across Multiple Sites

2204 A Study of Children’s Cognitive Ability on Maps

2215 When Boy Scouts Go to Camp:  Experiencing and Learning - Mapping - the Environment

Figuur 29: Een aantal van de meest centrale en de meest perifere papers

 

Het grote voordeel van het gebruik van een GIS zoals ArcView bij het maken van spatialisaties is dat er interactief en visueel kan worden gewerkt met de tabellen die aan de spatialisatie zijn gekoppeld. Zowel individuele als groepen documenten kunnen eenvoudig geselecteerd worden in de tabel, waarna de selectie op de spatialisatie kan worden bekeken. Door bijvoorbeeld de documenten per onderwerp te selecteren is uit te vinden hoe verschillende onderwerpen over de spatialisatie gespreid zijn.

 

Op figuur 30, 31 en 32 is bijvoorbeeld de selectie van drie verschillende onderwerpen te zien: onderwerp 2, history of cartography and historical maps,  onderwerp 8, map design and production en onderwerp 11 GIS and digital mapping. Onderwerp 2 blijkt veel meer geclusterd te zijn dan onderwerp 8, dat zich over de hele spatialisatie verspreidt. Dat betekent dat de verschillende papers die behoren tot onderwerp 2 gemiddeld meer op elkaar lijken dan de papers over onderwerp 8. Er zijn bij onderwerp 2 echter twee papers die duidelijk een andere positie op de spatialisatie hebben dan de rest van de groep (210 en 221), dit is te verklaren uit het feit dat beide papers, in tegenstelling tot de anderen, gaan over digitale historische kaarten. Kijkend naar figuur 32, waarop de spreiding van onderwerp 11 is afgebeeld, valt meteen op dat de papers over dit onderwerp zich meer aan de rechterkant van de spatialisatie concentreren. 

 

Het selecteren per congresonderwerp geeft dus een snel overzicht van de mate van spreiding en clustering van een onderwerp. Natuurlijk kunnen er ook meerdere onderwerpen tegelijk worden geselecteerd, wat nuttig kan zijn bij het bepalen in hoeverre verschillende onderwerpen op elkaar lijken.

 

In de volgende paragraaf zullen de congresonderwerpen worden onderverdeeld in twee subgroepen. Dit wordt vooral gedaan als voorbeeld, om vervolgens te kunnen laten zien hoe het gebruik van kartografische methoden en technieken kan helpen bij het beantwoorden van vragen, die gebruikers mogelijk over de spatialisatie kunnen stellen. Met andere woorden: hoe kan de kartografie helpen om de juiste informatie uit de spatialisatie halen. Het gaat hier dus niet in eerste instantie om het beantwoorden van informatievragen, maar meer om de toepassing het gebruik van kartografische methoden en technieken.

 

Figuur 30: De plek van papers behorende tot onderwerp 2 op de spatialisatie

Figuur 31: De plek van papers behorende tot onderwerp 8 op de spatialisatie

Figuur 32: De plek van papers behorende tot onderwerp 11 op de spatialisatie

 

 3.2 Het verdelen van de congresonderwerpen in twee subgroepen

 

Bij het analyseren van de congresonderwerpen die op de spatialisatie staan, valt op dat de onderwerpen grofweg in twee belangrijke clusters zijn op te delen. Het ene cluster bestaat uit alle onderwerpen die veel met computers en het werken met computers te maken hebben: onderwerpen over GIS, het Internet en het werken met ruimtelijke data bijvoorbeeld. ‘Moderne’ onderwerpen dus, die eigenlijk pas de laatste 10 à 20 jaar een bestaansrecht hebben. Het andere cluster daarentegen bestaat vooral uit ‘klassiekere’ onderwerpen, onderwerpen die ook al bestonden voor de digitale revolutie. Hier zijn bijvoorbeeld onderwerpen te vinden over educatie en training in de kartografie, kartografische theorieën en modellen, nationale atlassen, historische kartografie, maar ook planeetkartografie is bijvoorbeeld een onderwerp in dit cluster.

 

In onderstaande figuur 33 is de tweedeling in onderwerpen weergegeven. Voor het gemak hebben de onderwerpen in het linkerrijtje de titel ‘analoog’ meegekregen, omdat de meeste van deze onderwerpen in principe niet veel met computers te maken hebben. De onderwerpen die in de rechter rij van figuur 33 staan zijn de ‘digitale’ onderwerpen. Deze indeling is echter tot op zekere hoogte artificieel. Als bijvoorbeeld gekeken wordt naar de titels van de verschillende papers wordt al snel duidelijk dat ook een groot aantal ‘analoge’ papers veel te maken hebben met GIS of multimedia. De digitale revolutie heeft dan ook een gigantische invloed gehad op de kartografie. Het grote verschil tussen de twee groepen in figuur 33 is wel dat bij de digitale onderwerpen het gebruik van computers en software hoofdzaak is en dat het bij de analoge onderwerpen slechts een hulpmiddel is om het doel te bereiken.

 

Analoog

Digitaal

0. Global Issues/Cartographic Research Agenda

5. Satellite Mapping

1. Education and Training in Cartography

11.GIS and Digital Mapping

2. History of Cartography and Historical Maps

12.Multimedia Cartography and Electronic Maps

3. Cartography and the Environment

13.Computer Generalization of Spatial Data

4. Marine Cartography

14.Spatial Data Infrastructure Policies

6. National and Regional Atlases

15.Mapping on the Internet and the World Wide Web

8. Map Design and Production

16.Spatial Data Visualization

22.Cartography and Children

20.Geo-Spatial Data Quality and Evaluation

24.Cartographic Theory and Methods

 

26.Planet Cartography

 

Figuur 33: De indeling van de conferentiepapers in een analoge en een digitale groep

 

De vraag is nu of er op een spatialisatie ook écht een verschil valt te ontdekken tussen deze twee groepen onderwerpen. De manier waarop de spatialisatie van de congrespapers in figuur 28 bewerkt zal worden, om een kartografisch antwoord te kunnen geven op deze vraag, wordt in de volgende paragraaf, met behulp van figuren, beschreven.

 


3.3 Het maken van de spatialisatie en het berekenen van de documentdichtheid

                   

Om te beginnen wordt er een selectie gemaakt van alle analoge onderwerpen en een selectie van alle digitale onderwerpen (figuur 34, links- en rechtsboven). Het resultaat is 113 analoge en 146 digitale papers. Met behulp van de Spatial Analyst-extensie in ArcView kan vanuit deze selecties de ‘documentdichtheid’ voor beide groepen worden berekend. De documentdichtheid van een groep onderwerpen op een plek op de spatialisatie is een indicatie voor de importantie van die groep documenten op die plek. Door van elke plek op de spatialisatie de documentdichtheid voor elk van beide groepen onderwerpen te berekenen, kan bepaald worden waar op de spatialisatie welke groep het belangrijkst is. Op die manier wordt snel visueel duidelijk waar clusters van bepaalde groepen documenten zich bevinden. 

 

De documentdichtheid wordt berekend door een raster over de spatialisatie van de documenten heen te leggen. Er is gekozen voor een (fijnmazig) raster met rasterpunten met een diameter van 0,0025. Dat betekent dat het totale raster bestaat uit meer dan 640.000 rasterpunten (de spatialisatie is ongeveer 2x2), die ieder een eigen waarde krijgen.

 

Als een rasterpunt dichtbij een document ligt krijgt dat punt een hoge waarde toegekend. Hoe verder dat rasterpunt van een document af ligt, hoe lager de waarde wordt. Als een rasterpunt verder dan een afstand van 0,25 van een document afligt is de toegewezen waarde tot 0 gereduceerd[26]. Als er bij een rasterpunt binnen een straal van 0,25 twee of meer documenten liggen worden de individuele waarden bij elkaar opgeteld tot een totaalwaarde. Zo heeft een rasterpunt dat in de buurt van 4 documenten ligt een grotere waarde, dan een punt dat maar bij 1 document in de buurt ligt.

 

Het resultaat van deze analyse is te zien in de onderste twee figuren van figuur 34. De spreiding van de analoge documenten is met rood aangegeven, de spreiding van de digitale documenten met blauw. Hoe donkerder de kleur is, hoe hoger de documentdichtheid. Wat nu al opvalt is dat er wel degelijk een groot verschil zichtbaar is tussen de analoge en de digitale onderwerpen. Waar de analoge documenten een hoge dichtheid hebben, is meestal een lage concentratie van digitale documenten aanwezig en omgekeerd.

 

Bovenstaande vraag is hiermee in principe al beantwoord, maar het verschil tussen de twee groepen onderwerpen kan nog beter worden weergegeven. Om dit te doen zullen de twee spatialisaties in figuur 34 worden samengevoegd tot één kaart. Hiervoor moeten echter eerst in beide spatialisaties de klassen met de lage dichtheden worden uitgeschakeld. Anders kunnen de twee spatialisaties in ArcView  niet over elkaar worden gelegd, zonder dat de één de ander helemaal onzichtbaar maakt.

 

Figuur 34: Selectie, dichtheidsanalyse en klassenindeling

 van de analoge en de digitale groep onderwerpen 

 

 Rasterpunten die minder dan ongeveer de helft van de maximale waarde hebben worden daarom uitgeschakeld. De gedachte hierachter is dat zo alleen de gebieden op de spatialisatie waar zich echt een concentratie aan analoge of digitale documenten bevindt nog respectievelijk rood of blauw gekleurd zijn. Het effect hiervan is te zien in de onderste twee figuren van figuur 34. 

 

Figuur 35: Spatialisatie die het verschil laat zien tussen de analoge en de digitale groep onderwerpen

 

Figuur 35 laat het resultaat zien van de overlay van de onderste twee spatialisaties in figuur 34. De spatialisatie geeft nu een duidelijk beeld van het verschil tussen de analoge en de digitale onderwerpen. Omdat de spatialisatie van de blauwe, digitale, onderwerpen over die van de rode, analoge, onderwerpen is gelegd, is er sprake van een kleine overlap. Maar omdat de twee groepen onderwerpen niet veel met elkaar gemeen hebben is deze overlap minimaal. 

 

De waarden die in de legenda staan zijn per rasterpunt berekend, door de cumulatieve toegekende waarden, afhankelijk van de afstand tot een of meerdere documenten, te delen door de oppervlakte van de meetcirkel. De precieze betekenis van de getallen zelf is voor een goed begrip niet noodzakelijk. Het gaat meer om de globale betekenis: hoe donkerder rood of blauw de kleur op de spatialisatie, hoe groter de kans dat er veel respectievelijk analoge of digitale papers in de buurt liggen.

 

3.4 Het toevoegen van sleutelwoorden aan de spatialisatie

 

Een manier om nog meer informatie uit de data te halen is het toevoegen van een aantal belangrijke sleutelwoorden aan de spatialisatie. Door aan bepaalde gebieden bepaalde woorden toe te wijzen, wordt duidelijk wat voor soort documenten zich in dat gebied van de spatialisatie bevinden.

 

Hiervoor zijn uit de Woord*Documentmatrix (figuur 13, 3e matrix) de 100 meest voorkomende sleutelwoorden geselecteerd. Deze woorden zijn vervolgens in Excel toegevoegd aan de tabel met coördinaten. Een deel van deze tabel is te zien in figuur 36. Deze tabel kan worden ingevoerd in ArcView, wat het mogelijk maakt om visueel te analyseren waar op de spatialisatie bepaalde woorden vaak voorkomen.

 

Door een query (zoekopdracht) op de tabel uit te voeren, kunnen bijvoorbeeld alle documenten waar het woord ‘GIS’ in voorkomt worden geselecteerd. Aangezien bij alle documenten waar het woord ‘GIS’ in voor komt een ‘1’ staat bij de kolom van het woord ‘GIS’, hoeft de query alleen te bestaan uit de opdracht ‘selecteer alle documenten waar GIS=1’.

 

Vervolgens wordt, met dezelfde methode als in de vorige paragraaf, de ‘dichtheid’ van het woord ‘GIS’ berekend. Het enige verschil is dat de straal van de meetcirkel  deze keer 0,5 is in plaats van 0,25. Dit geeft een wat grover beeld, wat ook de bedoeling is. Het gaat er hier namelijk om de spreiding van het bewuste woord over de hele spatialisatie weer te geven. De plek met de hoogste celwaarde kan gezien worden als het zwaartepunt van het woord. Op de spatialisatie zal het woord bij dat punt geplaatst worden. In figuur 37 is het resultaat te zien voor het woord ‘GIS’: hoe donkerder blauw, hoe groter de ‘woorddichtheid’.

 

Figuur 36: De woord*documentmatrix en de coördinaten per document samengevoegd.

 

Figuur 37: De plaatsing van het woord ‘GIS’ op de spatialisatie

 

Het probleem met het zwaartepunt van een woord is echter dat dat punt niet alles zegt over een woord. De woorden die het meeste voorkomen, zoals bijvoorbeeld het

woord ‘map’ of ‘cartography’, zijn vaak verspreid over de hele spatialisatie. Als hier de dichtheid van wordt uitgerekend, dan komt het zwaartepunt in het midden van de spatialisatie te liggen. Als op die plaats ook het bijbehorende woord zou worden geplaatst geeft dit geen goede afspiegeling van de verdeling van dat woord over de spatialisatie. Dit geldt ook voor woorden die relatief niet zo vaak voorkomen, maar wel over de hele spatialisatie gespreid zijn. Alleen woorden die behoorlijk geclusterd zijn op een bepaalde plaats kunnen dus gebruikt worden. Een heleboel sleutelwoorden vallen hierdoor af.

 

Verder zijn er veel sleutelwoorden die wel vaak voorkomen, maar niet zo veelzeggend zijn, zoals ‘text’, ‘print’, ‘unit’ of ‘index’. Dit zijn woorden die in een tekst misschien wel belangrijk zijn, maar niet goed op een spatialisatie kunnen worden gebruikt om aan te geven wat voor documenten er zich op die plaats bevinden. Het zijn sleutelwoorden die niets zeggen over de soort tekst. Dit sluit ook een heleboel woorden uit.

 

Uiteindelijk zijn er een aantal sleutelwoorden die wél geschikt zijn om op de spatialisatie te zetten. De plek van de woorden in figuur 38 is op dezelfde manier verkregen als het woord GIS in figuur 37. De woorden zijn vervolgens op de spatialisatie van figuur 35 geplaatst. De lettergrootte van de woorden is verschillend, afhankelijk van het aantal keer dat een bepaald sleutelwoord voorkomt in de conferentiepapers. Dit is te zien in de tabel naast de spatialisatie in figuur 38.

 

Het woord ‘technology’, dat van alle sleutelwoorden die op de spatialisatie geplaatst zijn, het meeste voorkomt als sleutelwoord in de conferentiepapers, is dan ook het grootst afgebeelde woord in figuur 38. Het woord ‘history’ daarentegen, dat minder dan 24 keer voorkomt als sleutelwoord, is een stuk kleiner afgebeeld.

 

Een laatste probleem met het gebruik van sleutelwoorden is dat de plek van de begin- en eindletters van de langere woorden niet goed meer overeenkomt met het zwaartepunt van dat woord. Langere woorden lijken ook relatief belangrijker dan kleinere woorden, puur omdat ze groter zijn.

 

Het plaatsen van tekst op een kaart is een probleem waar kartografen al jaren mee worstelen (Skupin, 2000). Als de kaart teveel tekst bevat, wordt ze onoverzichtelijk, als er echter te weinig informatie op de kaart staat is de betekenis weer niet duidelijk. Het vinden van de juiste balans is een vrij subjectieve aangelegenheid die moeilijk geautomatiseerd kan worden. Bij digitale atlassen bijvoorbeeld, waar de label placement met behulp van bepaalde optimalisatiealgoritmes automatisch gaat, zijn de resultaten vaak verre van goed. Toch kan kartografische expertise op dit gebied erg nuttig zijn voor de visualisatiewetenschappen (Wu & Buttenfield, 1991).

 

Ondanks al deze moeilijkheden en onnauwkeurigheden bij de plaatsing van de sleutelwoorden op de spatialisatie, geven deze woorden toch een globaal beeld van het soort documenten dat men op een bepaalde plek op de spatialisatie kan aantreffen.

 

De plaats van de sleutelwoorden in figuur 38 is statisch. Het is echter goed voor te stellen dat er steeds meer sleutelwoorden verschijnen als er meer wordt ingezoomd op de spatialisatie (als de spatialisatie grootschaliger wordt dus). Op een kaart van de wereld is hoogstens de naam Amsterdam te zien bij Nederland. Op een kaart van Europa echter komen, behalve Amsterdam, ook namen als Utrecht en Enschede tevoorschijn. Analoog hieraan staan op de totale spatialisatie dan ook alleen de belangrijkste sleutelwoorden, maar zodra er wordt ingezoomd zouden ook steeds meer sleutelwoorden op de spatialisatie te zien kunnen zijn die minder belangrijk zijn.

 

Figuur 38: Spatialisatie van het verschil tussen de groep digitale en de groep analoge papers, inclusief sleutelwoorden.

 

3.5 Het maken van een driedimensionale Spatialisatie

 

Om een nog duidelijker beeld te krijgen van de in de vorige paragraaf gemaakte spatialisatie is een 3-dimensionale afbeelding erg geschikt. De 3D-analyst-extensie in ArcView maakt het mogelijk om afbeeldingen in drie dimensies te bekijken. Om dit te kunnen doen moet er echter wel eerst een derde dimensie aan de data worden toegevoegd.

 

Op de spatialisatie in figuur 38 heeft elk rasterpunt een tweedimensionale ruimtelijke locatie en twee waarden, één voor het aantal analoge en één voor het aantal digitale documenten dat in de buurt ligt. Die waarden kunnen worden gebruikt als derde dimensie: hoe hoger de waarde, hoe hoger het rasterpunt komt te liggen op een driedimensionale spatialisatie. Om dit te kunnen doen moet het rastergrid worden omgezet in een TIN (Triangulated Irregular Network, figuur 39). Een TIN verdeelt het rasteroppervlak in aansluitende driehoeken. Elke hoek van een driehoek krijgt een hoogtewaarde, gebaseerd op de waarde van het onderliggende rasterpunt. De verschillende driehoeken zijn niet gelijkvormig, maar worden kleiner wanneer de hoogte tussen hoekpunten meer verschilt. Met andere woorden: hoe groter de hoogteverschillen worden, hoe kleiner de driehoeken. De TIN geeft dus alleen de precieze hoogte van de hoekpunten weer en niet van alle rasterpunten. Voor die rasterpunten wordt een hoogtewaarde genomen die tussen de hoekpunten in zit.

 

Figuur 39: De structuur van een TIN.

 

In twee dimensies ziet het TIN-model er ongeveer hetzelfde uit als het rastermodel (figuur 40, bovenste figuren). Als de spatialisatie echter in drie dimensies wordt bekeken, dan zijn de hoogteverschillen duidelijk te zien (figuur 40, middelste figuren). Bij de weergave in drie dimensies moet een achtergrondkleur worden ingesteld. Hiervoor is lichtblauw genomen, de kleur van een onbewolkte hemel. De kleur van de ondergrond van de spatialisatie is ingesteld op grasgroen. Op deze manier lijkt het net of de driedimensionale spatialisatie een stuk grasland met bergen is, dat in de lucht zweeft.

 

Een manier om die hoogteverschillen te accentueren is door schaduwen aan de spatialisatie toe te voegen (figuur 40, onderste figuren). Daarbij kan ingesteld worden waarvandaan de ‘zon’ schijnt en hoe hoog zij aan de hemel staat. Hoe lager de zon staat, hoe meer schaduw er is en hoe donkerder de spatialisatie wordt. In figuur 39 (onderste figuren) bijvoorbeeld is de zon ingesteld op zuid (180°) en op ‘high’ (50°). Dit betekent dat zij vanuit het zuiden van het plaatje schijnt vanaf een hoogte van 50°.

 

Door de driedimensionale spatialisaties van de analoge en de digitale onderwerpen in figuur 40 samen te voegen, kan het totaalbeeld van figuur 41 worden verkregen. Het is met de 3D-Analyst van ArcView mogelijk om dit beeld te roteren. Zo kan de afbeelding van alle kanten worden bekeken. Figuur 42 bijvoorbeeld bekijkt de spatialisatie vanuit een noord-noordoostpositie. De zon schijnt in dit figuur vanuit het oosten. De pijlen in figuur 41 en 42 zijn toegevoegd als oriëntatie en wijzen naar het ‘noorden’.

 

Het voordeel van een 3-dimensionale ten opzichte van een 2-dimensionale spatialisatie in ArcView is, behalve het overzicht, dat de twee groepen onderwerpen over elkaar heen kunnen worden geprojecteerd, zonder dat de ene groep de andere onzichtbaar maakt. Doordat de waarden van de rasterpunten nu een betekenis hebben als hoogtewaarden in de derde dimensie, wordt het rasterpunt van de groep met de hoogste waarde afgebeeld. Er kunnen nu dan ook meerdere legendaklassen worden afgebeeld (zie de legenda in figuur 41).

Figuur 40: TIN (bovenste figuren) wordt omgezet in 3-D plaatje (middelste figuren)

waaraan vervolgens schaduwen worden toegevoegd (onderste figuren)

Figuur 41: 3D-Spatialisatie van het verschil tussen de groep digitale en de groep analoge papers (gezien vanuit het ‘zuiden’).

 

 

 

Helaas kan de 3D-Analyst het coördinatenstelsel en de sleutelwoorden, die in de vorige paragrafen aan de spatialisatie zijn toegevoegd, niet weergeven. Om dit toch te kunnen doen is met twee extra extensies[27] gewerkt. De ene extensie maakt het mogelijk om assen te tekenen in een driedimensionale ruimte en de andere kan tekst op elke plek in die ruimte plaatsen.

 

In figuur 43 zijn alle drie de assen aangegeven door een soort kubus die grotendeels om de spatialisatie heen valt. De X-as en de Y-as lopen, net als bij de tweedimensionale spatialisatie van –1 tot 1. De Z-as (hoogte) loopt van 0 tot een waarde van 110 000 000. Deze assen zijn getekend om te dienen als referentiekader en oriëntatie bij interactief gebruik.

Figuur 42: De spatialisatie van figuur 41, gezien vanuit een ‘noord-noordoost-positie’.

 

Figuur 43: De spatialisatie met coördinatenstelsel

 

In figuur 44 zijn ook alle sleutelwoorden toegevoegd. Omdat er alleen zwarte tekst kon worden gebruikt, is de spatialisatie zelf lichter gemaakt. Dit is te zien aan de lichtere kleuren bij de legenda. Het verschil tussen de analoge en de digitale onderwerpen is nu helaas minder duidelijk, maar de sleutelwoorden zijn nu wel te zien zijn. De sleutelwoorden zijn op een hoogte van 110 000 000 geplaatst en liggen dus als het ware boven op de spatialisatie. Dit is waarschijnlijk de beste plek om de sleutelwoorden te plaatsen, omdat ze, als ze lager geplaatst zouden worden, op sommige plekken in de spatialisatie zouden verdwijnen. Een nadeel van de positie van de sleutelwoorden is dat ze, als de spatialisatie gedraaid wordt, op dezelfde plek blijven staan (zie figuur 45). Vooral als de spatialisatie vanaf de zijkant wordt bekeken zijn de sleutelwoorden niet tot nauwelijks te zien. Idealiter zou de positie van de sleutelwoorden meebewegen met het draaien van de spatialisatie.

 

De originele verhoudingen in tekstgrootte van de sleutelwoorden zijn behouden (zie figuur 38). De zon schijnt in figuur 44 vanuit het ‘zuiden’. In figuur 45 is dezelfde spatialisatie afgebeeld, maar dan gezien vanuit het ‘noordoosten’. De zon staat hoog en schijnt vanuit het ‘noordwesten’.

 

Figuur 44: Driedimensionale spatialisatie van de groep analoge conferentiepapers (rood) en de groep digitale conferentiepapers (blauw).

Figuur 45: Spatialisatie van figuur 43 vanuit het ‘noordoosten’ gezien.

 

 

3.6 Interactieve mogelijkheden

 

De afbeeldingen van spatialisaties die in dit hoofdstuk geplaatst zijn, zijn allemaal statische kaarten. Een aantal van die kaarten kan echter worden gezien als slechts een momentopname van een interactieve, dynamische spatialisatie. Er wordt tegenwoordig, zowel binnen als buiten de kartografie, steeds meer gewerkt met digitale, interactieve, dynamische kaarten. Op Internet zijn vele sites te vinden[28] die aan gebruikers de mogelijkheid geven om hun eigen kaarten samen te stellen, door bijvoorbeeld data te selecteren, in- en uit te zoomen en legendaklassen wel of niet op te nemen. Dit soort applicaties maken het maken van kaarten, zelfs voor leken, erg eenvoudig. Over de kwaliteit van dit soort kaarten valt vaak te twisten, maar er wordt wel gesproken van een democratisering van de kartografie.

 

Voor het, op een interactieve manier, werken met spatialisaties zouden applicaties die ‘spatialisaties-on-demand’ kunnen maken, dezelfde mogelijkheden kunnen bieden. Het ontwikkelen hiervan ligt buiten het terrein van deze scriptie, maar er kunnen in deze paragraaf wel een aantal voorbeelden worden gegeven van interactieve toepassingen die met spatialisaties mogelijk zijn.  

 

Bij het maken van de spatialisaties in dit hoofdstuk is er al constant op een interactieve manier gewerkt met de informatie. Het selecteren van groepen documenten, zoekopdrachten uitvoeren met sleutelwoorden en het van alle kanten bekijken van de driedimensionale spatialisatie zijn allemaal interactieve bewerkingen binnen ArcView, die hebben geleid tot de uiteindelijke spatialisaties in dit hoofdstuk.

 

De kartograaf is in dit geval degene die op een interactieve manier met de data werkt om uiteindelijk de juiste informatie, in de vorm van een spatialisatie, bij de gebruiker af te leveren. Het is voor de gebruiker van de informatie niet meer mogelijk om nog iets aan de vorm van de informatie te veranderen. Voor de gebruiker zou dat echter wel makkelijk kunnen zijn en dit is dan ook wat op Internet gebeurt bij sites, die gebruikers tot op zekere hoogte zelf kaarten laten samenstellen. Het gevaar hierbij is echter dat de kans bestaat dat er niet tot nauwelijks rekening wordt gehouden met kartografische theorieën en ideeën over bijvoorbeeld de zogenaamde grafische grammatica (Bertin, 1983), klassegrenzen, generalisatie en tekstplaatsing.

 

Zolang er echter wel rekening wordt gehouden met de kartografie, kan het een groot voordeel zijn om op een interactieve manier met de data te werken. Gebruikers kunnen dan zelf, aan de hand van de data, bepalen welke data ze op wat voor manier in kaart willen brengen. Zo kan er een applicatie worden bedacht voor het spatialiseren van de conferentiepapers, die de gebruiker bijvoorbeeld kan laten kiezen om alleen bepaalde onderwerpen te spatialiseren of alleen teksten met bepaalde woorden erin. Een voorbeeld van hoe zo’n applicatie er uit zou kunnen zien is te zien in onderstaande figuur 46.

 

Figuur 46: Voorbeeld van een applicatie die het voor gebruikers zelf mogelijk maakt om een spatialisatie

van de conferentiepapers samen te stellen (gemaakt met Microsoft Visual Basic Editor).

 

Er zijn in figuur 46 verschillende selectieopties: er kan een selectie gemaakt worden van de conferentiepapers op onderwerp, op document, op woord, of op een combinatie van die drie elementen. Bij de selectie van onderwerpen in de figuur zijn alle onderwerpen geselecteerd, met uitzondering van onderwerp 8 en 11. Door gebruik te maken van zogenaamde booleaanse operatoren (bijvoorbeeld: AND, OR, NOT) kan deze selectie worden bereikt. Met behulp van de ‘+’ en ‘-‘ knoppen kunnen eventueel nog meer selectiecriteria worden toegevoegd of weer worden weggehaald. De selectie van losse documenten en woorden werkt op dezelfde manier. Omdat de verschillende selectieopties aan elkaar gekoppeld zijn, kan op deze manier elke mogelijke combinatie van onderwerpen, woorden en documenten worden geselecteerd. Uiteindelijk worden bij de selectie in figuur 46 alle documenten geselecteerd, met uitzondering van onderwerp 8 en 11 en document 309 en 605, waarin de sleutelwoorden ‘GIS’ and ‘Digital’ voorkomen, maar niet het woord ‘Map’.

 

Nadat de gebruiker heeft bepaald welke documenten hij in zijn spatialisatie wil opnemen, zijn er nog een aantal (kartografische) opties die ingevuld moeten worden. Ten eerste moet de gebruiker bepalen of hij een spatialisatie wil maken van alleen de geselecteerde documenten, of een spatialisatie van alle documenten met daarin de geselecteerde documenten. Dat is een groot verschil, de eerste optie laat namelijk de verhouding zien van de verschillende documenten tot elkaar, terwijl de tweede optie een beeld geeft van de positie van de verschillende geselecteerde documenten ten opzichte van de rest van de gespatialiseerde documenten.

 

De andere opties die ingesteld kunnen worden zijn vooral kartografisch en stellen bijvoorbeeld de achtergrondkleur in of het aantal dimensies (2 of 3) waarin de spatialisatie moet worden weergegeven. Soms sluit een bepaalde selectie een bepaalde optie uit (als er bijvoorbeeld geen aparte woorden zijn geselecteerd, dan kan de woorddichtheid niet berekend worden). Het aanvinken van andere opties zou weer kunnen leiden tot nieuwe subopties. Aangezien dit slechts een voorbeeld is van hoe een ‘spatialisatie-on-demand-applicatie’ er uit zou kunnen zien, is dit niet verder uitgewerkt.

 

Wel is er nog een kleine case studies uitgewerkt die laat zien wat het resultaat kan zijn van een bepaalde ‘spatialisatie-on-demand’. Deze case study gaat uit van een gebruiker die meer wil weten over de  onderlinge verhoudingen van de documenten die behoren tot de congresonderwerpen 2 en 12. Hij selecteert daartoe alle documenten van beide onderwerpen en maakt een spatialisatie van de geselecteerde documenten. Hij vinkt de optie ‘bereken documentdichtheid’ aan evenals de optie ‘documentlabels’. De achtergrondkleur stelt hij in op grijs, de documentkleur op zwart, het aantal legendaklassen op 4 en het aantal dimensies op 2. 

 

Voor het maken van deze spatialisatie is een nieuwe MDS-analyse uitgevoerd, die aan de hand van de onderlinge similariteitswaarden van de geselecteerde documenten, de positie van die documenten op een spatialisatie heeft berekend. De spatialisatie is gemaakt met behulp van dezelfde methoden en technieken die ook bij de andere spatialisaties in dit hoofdstuk zijn gebruikt.

 

Het resultaat is de spatialisatie in figuur 47 en een lijst met de namen van de afgebeelde conferentiepapers. Op de spatialisatie is een duidelijk verschil waar te nemen tussen de positie van onderwerp 2 en onderwerp 12, wat geaccentueerd is door de documentdichtheid van beide onderwerpen af te beelden (zie §3.2). De gebruiker kan de positie van de verschillende documenten zowel op de spatialisatie, als in de onderstaande lijst met documenttitels, met elkaar vergelijken en vervolgens de, voor zijn gebruiksdoeleinden, geschikte documenten aanklikken om te lezen. 

 

Figuur 47: Een ‘spatialisatie-on-demand’. Deze figuur geeft een spatialisatie van onderwerp 2 & 12

van het ICA congres en is het resultaat van een aantal ingevulde opties in figuur 46

 

In de praktijk zal het maken van een aparte applicatie, voor het maken van spatialisaties van de conferentiepapers van het ICA congres in Beijing, veel te veel tijd kosten in verhouding tot de hoeveelheid extra verkregen informatie. In feite zijn de conferentiepapers al netjes ingedeeld naar onderwerp en is het aantal documenten (circa 500) ook nog wel te overzien. Dit geldt echter niet voor grote dynamische (tekst)databases, die door de grote hoeveelheid informatie die ze bevatten erg onoverzichtelijk kunnen zijn.

 

Het Internet, dat uit meer dan een miljard webpagina’s bestaat, kan gezien worden als zo’n dynamische database. Om een overzicht te krijgen van de structuur (van delen) hiervan zou een applicatie die spatialisaties maakt een handig hulpmiddel kunnen zijn. Zoals ook al in §1.2.1 is aangegeven zou zo’n applicatie bijvoorbeeld een aanvulling op Internetzoekmachines kunnen zijn. Een spatialisatie kan niet alleen de structuur van de informatie, maar ook de context van die informatie goed in beeld brengen. Naast de bekende lijst met zoekresultaten zou een spatialisatie kunnen staan die aangeeft ‘waar’ de verschillende relevante webpagina’s zich bevinden op het Internet en welke pagina’s er zich in de buurt bevinden.

 

Figuur 48 laat zien hoe dit er uit zou kunnen zien. Een gebruiker die op zoek is naar informatie over de Universiteit Utrecht vult zijn zoekopdracht in en krijgt als resultaat een lijst met relevante documenten (te zien aan de linkerkant van figuur 48). Aan de rechterkant verschijnt een spatialisatie van (een deel van) het Internet, met daarop de relevante zoekresultaten aangegeven. Er bestaat de mogelijkheid om in- en uit te zoomen tot het gewenste niveau (met de knoppen rechts van de spatialisatie), van een spatialisatie van het hele Internet, tot een spatialisatie die op documentniveau de relevante resultaten aangeeft.

 

Figuur 48: Een Internetapplicatie die de plek van documenten op het Internet op een spatialisatie weergeeft.

Bron: Er is gebruik gemaakt van de lay-out van de zoekmachine Google (www.google.com). De spatialisatie, de schaalstok en de knoppen komen uit ArcView.

 

Een spatialisatie op documentniveau is rechts in figuur 48 te zien. De kleuren op de spatialisatie zeggen iets over de documentdichtheid op die plek. De betekenis van de verschillende kleuren is aangegeven in een legenda naast de spatialisatie (donkergroen is het laagst, wit is het hoogst). Hierbij is gebruik gemaakt van dezelfde kleuren die op kaarten vaak de hoogte aangeven. Mensen zijn gewend om met deze kleuren te werken en zullen dan ook al snel intuïtief aanvoelen waar zich een hoge documentdichtheid bevindt. De blauwe stippen op de spatialisatie stellen de relevante documenten voor[29]. Een lijst van de relevante documenten die op dat moment op de spatialisatie te zien is, kan onder de spatialisatie worden gezet, wat in figuur 48 is gedaan (rechtsonder).

 

De documenten op de spatialisatie kunnen apart geselecteerd worden. De documenten die op de spatialisatie worden geselecteerd kunnen tegelijkertijd ook in de documentlijsten worden geselecteerd. In figuur 48 zijn bijvoorbeeld twee documenten op de spatialisatie geselecteerd (de twee geel gekleurde stippen), die vervolgens ook in de lijst met relevante zoekresultaten geselecteerd zijn. Het omgekeerde proces is ook denkbaar, namelijk dat er een document uit de lijst met zoekresultaten wordt geselecteerd, waardoor de plek van dat document op de spatialisatie ook geselecteerd wordt.  

 

Onder de spatialisatie staat een schaalstok. De afstand kan niet in bijvoorbeeld meters worden uitgedrukt, maar er kan wel een indicatie worden gegeven welk deel van het Internet op de spatialisatie wordt afgebeeld. Als de lengte van een doorsnede van een spatialisatie van het hele Internet op 1 wordt gesteld, dan kan er een schaal worden berekend. Bijvoorbeeld één cm op de spatialisatie is één duizendste van de totale doorsnede van het Internet. De schaal is dan dus 1:1000. Zodra er wordt in- of uitgezoomd verandert de schaal van de spatialisatie en zou dus ook de schaal op de schaalstok moeten mee veranderen.

 

Ook figuur 48 is slechts bedoeld om aan te geven hoe een applicatie op Internet er uit zou kunnen zien. Het voorbeeld is dan ook niet helemaal uitgewerkt[30], maar vooral bedoeld om te laten zien op wat voor (interactieve) manier spatialisaties nuttig kunnen zijn bij het vinden van de juiste informatie. Zoals in dit hoofdstuk duidelijk is geworden kunnen kartografische methoden en technieken een belangrijke rol spelen bij het visualiseren van die informatie, ook al is het van oorsprong geen ruimtelijke informatie.

 

Pijl rechts: Conclusie & Discussie                                                                                                                                          

 

 



Noten

 

[25] Dit coördinatenstelsel is gemaakt met behulp van een Avenue-script. Avenue is de programmeertaal van ArcView. Het programmaatje vraagt om het definiëren van een coördinatenstelsel (grid), wat vervolgens wordt omgezet in een shapefile, dat de locaties van het coördinatenstelsel kan opslaan. Het programma heet Grid Maker to Shape en kan worden gedownload van de volgende pagina:  http://gis.esri.com/arcscripts/index.cfm?action=details&CFGRIDKEY=A614F692-77A4-11D5-944400508B0CB419

 

[26] Er is bewust voor een ‘meetstraal’ van 0,25 gekozen, uit tests blijkt namelijk dat bij een grotere of kleinere afstand het verkregen beeld minder goed overeen komt met de structuur van de data. Het beeld wordt dan te grof of juist te precies voor het doel van deze bewerking.

Om overigens te zorgen dat de toegekende waarde van een rasterpunt afneemt naarmate dat punt zich verder van een document bevindt, moet het ‘density type’ in ArcView worden ingesteld op ‘kernel’. Als het ‘density type’ namelijk wordt ingesteld op ‘simple’ krijgt elke rastercel, die zich binnen een straal van 0,25 van een document bevindt, dezelfde waarde.

 

[27] De extra extensies zijn ArcScripts die kunnen worden gedownload bij ESRI: 3D Scene Axes (1.0b) (http://gis.esri.com/arcscripts/index.cfm?action=details&CFGRIDKEY=149431604) en 3D Scene Text (http://gis.esri.com/arcscripts/index.cfm?action=details&CFGRIDKEY=1735716881).

 

[28] Voor links naar Internetsites die het mogelijk maken om on-line kaarten te maken wordt verwezen naar Oddens Bookmarks’, een Internetsite met duizenden links naar kartografische documenten op Internet. Binnen de categorie maps and atlases is een aparte subgroep die gewijd is aan on-line map creating.

 

[29] De overige documenten op de spatialisatie zijn niet individueel aangegeven, omdat ze niet relevant zijn voor de zoekopdracht, optioneel zouden echter ook de niet relevante documenten te zien moeten kunnen zijn

 

[30] Een spatialisatie van het Internet, waarvan in figuur 48 een voorbeeld is gegeven, zou veel beter gemaakt kunnen worden met behulp van de Kohonen SOM-techniek, dan met MDS. Zoals al in §2.2.3 is aangegeven is de SOM-techniek namelijk veel beter geschikt voor het spatialiseren van hele grote dynamische databases. Dit om meerdere redenen, waarvan de kleinere foutenmarge van de SOM-techniek en de kortere rekentijden de belangrijkste zijn.