3 Het toepassen van
kartografische methoden en technieken
Waar het eerste hoofdstuk van deze scriptie
grotendeels theoretisch was en het tweede hoofdstuk bestond uit zowel
theoretische als praktische gedeeltes, zal dit derde hoofdstuk bijna geheel
gevormd worden door een praktisch stuk. In dit laatste hoofdstuk zal namelijk
aan de hand van spatialisaties, gemaakt met gegevens uit de case study, geprobeerd worden om
de in de inleiding gestelde hoofdvraag van deze scriptie te beantwoorden: Kunnen
kartografische methoden en technieken bijdragen aan het verbeteren van de
visualisatie van niet-ruimtelijke informatie?
De aanname hierbij is dat een visualisatie verbetert
als die visualisatie beter voldoet aan de vraag naar informatie over de gevisualiseerde
informatie. Als de kartografie er dus voor kan zorgen dat er met behulp van
haar methoden en technieken meer overzicht over de structuur en de inhoud van
de gevisualiseerde informatie te krijgen is, dan is de hoofdvraag positief
beantwoord.
Dit hoofdstuk pretendeert niet om alle
mogelijke kartografische methoden en technieken uitputtend te behandelen, maar
wel om de lezer een indruk te geven van de mogelijkheden die de kartografie
biedt bij het werken met spatialisaties. De bedoeling is dat de lezer overtuigd
wordt van het instemmende antwoord op de retorische hoofdvraag. Om deze vraag
te beantwoorden zal de spatialisatie van de conferentiepapers, zoals die in
figuur 27 te zien is, op verschillende manieren kartografisch worden
geanalyseerd, bewerkt en gepresenteerd. De ‘rauwe’ spatialisatie zal
metamorfoseren en verandert gaandeweg het hoofdstuk in een kartografische
verantwoorde spatialisatie.
De metamorfose van de spatialisatie begint
met een aantal kartografische basisbewerkingen, zoals het toevoegen van een
coördinatenstelsel (§3.1). Naar aanleiding van
een mogelijke vraag die gebruikers over deze spatialisatie zouden kunnen stellen,
zullen de documenten op de spatialisatie worden gegeneraliseerd tot twee
verschillende groepen (§3.2). De
locatie van die twee groepen zal vervolgens op een afgeleide spatialisatie
worden afgebeeld (§3.3). Tenslotte
zal er tekst, in de vorm van sleutelwoorden, worden toegevoegd aan deze
spatialisatie (§3.4) en zal er een
driedimensionale versie van worden gemaakt (§3.5). Dit alles om te laten zien
wat kartografische methoden en technieken aan informatie kunnen toevoegen aan
een ‘rauwe’ spatialisatie.
In de laatste paragraaf van dit hoofdstuk (§3.6) zal gekeken worden naar mogelijke
interactieve toepassingen bij het werken met spatialisaties. Hier zal worden
ingegaan op applicaties die ‘spatialisaties-on-demand’ kunnen maken en
op spatialisaties die kunnen worden toegevoegd aan internetzoekmachines.
De eerste kartografische
bewerking die de spatialisatie van alle conferentiepapers in figuur 27 zal
ondergaan is het toevoegen van de assen van het coördinatenstelsel, zodat de
positie van alle documenten in een perspectief wordt gezet. Figuur 28 laat dit
coördinatenstelsel zien[25].
Wat al snel duidelijk wordt is dat vrijwel alle documenten minder dan een
afstand van 1 van het centrum verwijderd zijn en dat alle documenten (op 2 na)
liggen in een vierkant van 2x2. Zoals eerder opgemerkt hebben de waarden van
dit coördinatenstelsel alleen een betekenis voor deze spatialisatie. Er is geen
eenheid die de afstand tussen twee punten uitdrukt, zoals bijvoorbeeld de
meter, daarom wordt er gezegd dat de afstand tussen twee punten bijvoorbeeld
0,3 is.
De documenten zijn redelijk
gespreid over de spatialisatie, er zijn op het eerste gezicht geen duidelijke
clusters te ontdekken. Wat er nu al wel te zeggen valt over de spatialisatie is
dat de documenten die zich het dichtst bij het centrum bevinden, het beste
reflecteren wat de belangrijkste onderwerpen van het congres zijn geweest. Zij
hebben namelijk gemiddeld de meeste woorden gemeen met andere documenten. De
documenten die zich daarentegen aan de rand van de spatialisatie bevinden, zijn
de buitenbeentjes en zullen relatief minder met andere documenten te maken
hebben. Figuur 29 is een spatialisatie met daarop de nummers van een aantal van
de meest centrale en de meest perifere conferentiepapers. De titels van de
verschillende papers zijn rechts afgebeeld. Kijkend naar de titels van de
papers is de al dan niet centrale positie van de papers wel te verklaren,
redenerend vanuit het onderwerp van de conferentie.

Figuur 28: Spatialisatie van de
conferentiepapers met coördinatenstelsel
|
1210 Applications of Dynamic Representation Technologies in Multimedia Electronic
Maps 1322
The Development of Research on
Automated Geographical Informational Generalization in China 1614 A New Cartographic Geometry 2415
The Map in the Twenty First
Century 2436
Study on the Data Model of Digital
Map Product Meest
perifeer: 1325
A Hybrid Approach for Automated
Area Aggregation 1541 Towards Chaining Geo-Computational Web Applications
Across Multiple Sites 2204
A Study of Children’s Cognitive
Ability on Maps 2215
When Boy Scouts Go to Camp: Experiencing and Learning - Mapping - the
Environment |
Figuur 29:
Een aantal van de meest centrale en de meest perifere papers
Het grote voordeel van het
gebruik van een GIS zoals ArcView bij het maken van spatialisaties is dat er
interactief en visueel kan worden gewerkt met de tabellen die aan de
spatialisatie zijn gekoppeld. Zowel individuele als groepen documenten kunnen
eenvoudig geselecteerd worden in de tabel, waarna de selectie op de
spatialisatie kan worden bekeken. Door bijvoorbeeld de documenten per onderwerp
te selecteren is uit te vinden hoe verschillende onderwerpen over de
spatialisatie gespreid zijn.
Op figuur 30, 31 en 32 is
bijvoorbeeld de selectie van drie verschillende onderwerpen te zien: onderwerp
2, history of cartography and historical maps, onderwerp 8, map design and production en
onderwerp 11 GIS and digital mapping. Onderwerp 2 blijkt veel meer
geclusterd te zijn dan onderwerp 8, dat zich over de hele spatialisatie
verspreidt. Dat betekent dat de verschillende papers die behoren tot onderwerp
2 gemiddeld meer op elkaar lijken dan de papers over onderwerp 8. Er zijn bij
onderwerp 2 echter twee papers die duidelijk een andere positie op de
spatialisatie hebben dan de rest van de groep (210 en 221), dit is te verklaren
uit het feit dat beide papers, in tegenstelling tot de anderen, gaan over digitale
historische kaarten. Kijkend naar figuur 32, waarop de spreiding van onderwerp
11 is afgebeeld, valt meteen op dat de papers over dit onderwerp zich meer aan
de rechterkant van de spatialisatie concentreren.
Het selecteren per
congresonderwerp geeft dus een snel overzicht van de mate van spreiding en
clustering van een onderwerp. Natuurlijk kunnen er ook meerdere onderwerpen
tegelijk worden geselecteerd, wat nuttig kan zijn bij het bepalen in hoeverre
verschillende onderwerpen op elkaar lijken.
In de volgende paragraaf
zullen de congresonderwerpen worden onderverdeeld in twee subgroepen. Dit wordt
vooral gedaan als voorbeeld, om vervolgens te kunnen laten zien hoe het gebruik
van kartografische methoden en technieken kan helpen bij het beantwoorden van
vragen, die gebruikers mogelijk over de spatialisatie kunnen stellen. Met
andere woorden: hoe kan de kartografie helpen om de juiste informatie uit de
spatialisatie halen. Het gaat hier dus niet in eerste instantie om het
beantwoorden van informatievragen, maar meer om de toepassing het gebruik van
kartografische methoden en technieken.

Figuur
30: De plek van papers behorende tot onderwerp 2 op de spatialisatie

Figuur
31: De plek van papers behorende tot onderwerp 8 op de spatialisatie

Figuur
32: De plek van papers behorende tot onderwerp 11 op de spatialisatie
3.2 Het
verdelen van de congresonderwerpen in twee subgroepen
Bij het analyseren van de
congresonderwerpen die op de spatialisatie staan, valt op dat de onderwerpen
grofweg in twee belangrijke clusters zijn op te delen. Het ene cluster bestaat
uit alle onderwerpen die veel met computers en het werken met computers te
maken hebben: onderwerpen over GIS, het Internet en het werken met ruimtelijke
data bijvoorbeeld. ‘Moderne’ onderwerpen dus, die eigenlijk pas de laatste 10 à
20 jaar een bestaansrecht hebben. Het andere cluster daarentegen bestaat vooral
uit ‘klassiekere’ onderwerpen, onderwerpen die ook al bestonden voor de
digitale revolutie. Hier zijn bijvoorbeeld onderwerpen te vinden over educatie
en training in de kartografie, kartografische theorieën en modellen, nationale
atlassen, historische kartografie, maar ook planeetkartografie is bijvoorbeeld
een onderwerp in dit cluster.
In onderstaande figuur 33
is de tweedeling in onderwerpen weergegeven. Voor het gemak hebben de
onderwerpen in het linkerrijtje de titel ‘analoog’ meegekregen, omdat de meeste
van deze onderwerpen in principe niet veel met computers te maken hebben. De
onderwerpen die in de rechter rij van figuur 33 staan zijn de ‘digitale’
onderwerpen. Deze indeling is echter tot op zekere hoogte artificieel. Als
bijvoorbeeld gekeken wordt naar de titels van de verschillende papers wordt al
snel duidelijk dat ook een groot aantal ‘analoge’ papers veel te maken hebben
met GIS of multimedia. De digitale revolutie heeft dan ook een gigantische invloed
gehad op de kartografie. Het grote verschil tussen de twee groepen in figuur 33
is wel dat bij de digitale onderwerpen het gebruik van computers en software hoofdzaak
is en dat het bij de analoge onderwerpen slechts een hulpmiddel is om
het doel te bereiken.
|
Analoog |
Digitaal |
|
0. Global
Issues/Cartographic Research Agenda |
5.
Satellite Mapping |
|
1.
Education and Training in Cartography |
11.GIS and
Digital Mapping |
|
2.
History of Cartography and Historical Maps |
12.Multimedia
Cartography and Electronic Maps |
|
3.
Cartography and the Environment |
13.Computer
Generalization of Spatial Data |
|
4. Marine
Cartography |
14.Spatial
Data Infrastructure Policies |
|
6.
National and Regional Atlases |
15.Mapping
on the Internet and the World Wide Web |
|
8. Map
Design and Production |
16.Spatial
Data Visualization |
|
22.Cartography
and Children |
20.Geo-Spatial
Data Quality and Evaluation |
|
24.Cartographic
Theory and Methods |
|
|
26.Planet Cartography |
|
Figuur 33: De indeling van de
conferentiepapers in een analoge en een digitale groep
De vraag is nu of er op een
spatialisatie ook écht een verschil valt te ontdekken tussen deze twee groepen
onderwerpen.
De manier waarop de spatialisatie van de congrespapers in figuur 28 bewerkt zal
worden, om een kartografisch antwoord te kunnen geven op deze vraag, wordt in
de volgende paragraaf, met behulp van figuren, beschreven.
3.3 Het maken van de spatialisatie en het berekenen
van de documentdichtheid
Om te beginnen wordt er een
selectie gemaakt van alle analoge onderwerpen en een selectie van alle digitale
onderwerpen (figuur 34, links- en rechtsboven). Het resultaat is 113 analoge en
146 digitale papers. Met behulp van de Spatial Analyst-extensie in ArcView kan
vanuit deze selecties de ‘documentdichtheid’ voor beide groepen worden
berekend. De documentdichtheid van een groep onderwerpen op een plek op de
spatialisatie is een indicatie voor de importantie van die groep documenten op
die plek. Door van elke plek op de spatialisatie de documentdichtheid voor elk
van beide groepen onderwerpen te berekenen, kan bepaald worden waar op de
spatialisatie welke groep het belangrijkst is. Op die manier wordt snel visueel
duidelijk waar clusters van bepaalde groepen documenten zich bevinden.
De documentdichtheid wordt
berekend door een raster over de spatialisatie van de documenten heen te
leggen. Er is gekozen voor een (fijnmazig) raster met rasterpunten met een diameter
van 0,0025. Dat betekent dat het totale raster bestaat uit meer dan 640.000
rasterpunten (de spatialisatie is ongeveer 2x2), die ieder een eigen waarde
krijgen.
Als een rasterpunt dichtbij
een document ligt krijgt dat punt een hoge waarde toegekend. Hoe verder dat
rasterpunt van een document af ligt, hoe lager de waarde wordt. Als een
rasterpunt verder dan een afstand van 0,25 van een document afligt is de
toegewezen waarde tot 0 gereduceerd[26].
Als er bij een rasterpunt binnen een straal van 0,25 twee of meer documenten
liggen worden de individuele waarden bij elkaar opgeteld tot een totaalwaarde.
Zo heeft een rasterpunt dat in de buurt van 4 documenten ligt een grotere
waarde, dan een punt dat maar bij 1 document in de buurt ligt.
Het resultaat van deze
analyse is te zien in de onderste twee figuren van figuur 34. De spreiding van
de analoge documenten is met rood aangegeven, de spreiding van de digitale
documenten met blauw. Hoe donkerder de kleur is, hoe hoger de
documentdichtheid. Wat nu al opvalt is dat er wel degelijk een groot
verschil zichtbaar is tussen de analoge en de digitale onderwerpen. Waar de
analoge documenten een hoge dichtheid hebben, is meestal een lage concentratie
van digitale documenten aanwezig en omgekeerd.
Bovenstaande vraag is
hiermee in principe al beantwoord, maar het verschil tussen de twee groepen
onderwerpen kan nog beter worden weergegeven. Om dit te doen zullen de twee
spatialisaties in figuur 34 worden samengevoegd tot één kaart. Hiervoor moeten
echter eerst in beide spatialisaties de klassen met de lage dichtheden worden
uitgeschakeld. Anders kunnen de twee spatialisaties in ArcView niet over elkaar worden gelegd, zonder dat
de één de ander helemaal onzichtbaar maakt.

Figuur
34: Selectie, dichtheidsanalyse en klassenindeling
van de analoge en de digitale groep
onderwerpen
Rasterpunten die minder dan ongeveer de helft van de maximale waarde
hebben worden daarom uitgeschakeld. De gedachte hierachter is dat zo alleen de
gebieden op de spatialisatie waar zich echt een concentratie aan analoge of
digitale documenten bevindt nog respectievelijk rood of blauw gekleurd zijn.
Het effect hiervan is te zien in de onderste twee figuren van figuur 34.

Figuur
35: Spatialisatie die het verschil laat zien tussen de analoge en de digitale
groep onderwerpen
Figuur 35 laat het
resultaat zien van de overlay van de onderste twee spatialisaties in figuur
34. De spatialisatie geeft nu een duidelijk beeld van het verschil tussen de
analoge en de digitale onderwerpen. Omdat de spatialisatie van de blauwe,
digitale, onderwerpen over die van de rode, analoge, onderwerpen is gelegd, is
er sprake van een kleine overlap. Maar omdat de twee groepen onderwerpen niet
veel met elkaar gemeen hebben is deze overlap minimaal.
De waarden die in de
legenda staan zijn per rasterpunt berekend, door de cumulatieve toegekende
waarden, afhankelijk van de afstand tot een of meerdere documenten, te delen
door de oppervlakte van de meetcirkel. De precieze betekenis van de getallen
zelf is voor een goed begrip niet noodzakelijk. Het gaat meer om de globale
betekenis: hoe donkerder rood of blauw de kleur op de spatialisatie, hoe groter
de kans dat er veel respectievelijk analoge of digitale papers in de buurt
liggen.
3.4 Het toevoegen van sleutelwoorden aan de
spatialisatie
Een manier om nog meer
informatie uit de data te halen is het toevoegen van een aantal belangrijke sleutelwoorden
aan de spatialisatie. Door aan bepaalde gebieden bepaalde woorden toe te
wijzen, wordt duidelijk wat voor soort documenten zich in dat gebied van de
spatialisatie bevinden.
Hiervoor zijn uit de
Woord*Documentmatrix (figuur 13, 3e matrix) de 100 meest voorkomende
sleutelwoorden geselecteerd. Deze woorden zijn vervolgens in Excel toegevoegd
aan de tabel met coördinaten. Een deel van deze tabel is te zien in figuur 36.
Deze tabel kan worden ingevoerd in ArcView, wat het mogelijk maakt om visueel
te analyseren waar op de spatialisatie bepaalde woorden vaak voorkomen.
Door een query (zoekopdracht)
op de tabel uit te voeren, kunnen bijvoorbeeld alle documenten waar het woord
‘GIS’ in voorkomt worden geselecteerd. Aangezien bij alle documenten waar het
woord ‘GIS’ in voor komt een ‘1’ staat bij de kolom van het woord ‘GIS’, hoeft
de query alleen te bestaan uit de opdracht ‘selecteer alle documenten
waar GIS=1’.
Vervolgens wordt, met
dezelfde methode als in de vorige paragraaf, de ‘dichtheid’ van het woord ‘GIS’
berekend. Het enige verschil is dat de straal van de meetcirkel deze keer 0,5 is in plaats van 0,25. Dit
geeft een wat grover beeld, wat ook de bedoeling is. Het gaat er hier namelijk
om de spreiding van het bewuste woord over de hele spatialisatie weer te geven.
De plek met de hoogste celwaarde kan gezien worden als het zwaartepunt van het
woord. Op de spatialisatie zal het woord bij dat punt geplaatst worden. In
figuur 37 is het resultaat te zien voor het woord ‘GIS’: hoe donkerder blauw, hoe
groter de ‘woorddichtheid’.

Figuur
36: De woord*documentmatrix en de coördinaten per document samengevoegd.

Figuur
37: De plaatsing van het woord ‘GIS’ op de spatialisatie
Het probleem met het
zwaartepunt van een woord is echter dat dat punt niet alles zegt over een
woord. De woorden die het meeste voorkomen, zoals bijvoorbeeld het
woord ‘map’ of ‘cartography’,
zijn vaak verspreid over de hele spatialisatie. Als hier de dichtheid van wordt
uitgerekend, dan komt het zwaartepunt in het midden van de spatialisatie te
liggen. Als op die plaats ook het bijbehorende woord zou worden geplaatst geeft
dit geen goede afspiegeling van de verdeling van dat woord over de
spatialisatie. Dit geldt ook voor woorden die relatief niet zo vaak voorkomen,
maar wel over de hele spatialisatie gespreid zijn. Alleen woorden die
behoorlijk geclusterd zijn op een bepaalde plaats kunnen dus gebruikt worden.
Een heleboel sleutelwoorden vallen hierdoor af.
Verder zijn er veel
sleutelwoorden die wel vaak voorkomen, maar niet zo veelzeggend zijn, zoals ‘text’,
‘print’, ‘unit’ of ‘index’. Dit zijn woorden die in een
tekst misschien wel belangrijk zijn, maar niet goed op een spatialisatie kunnen
worden gebruikt om aan te geven wat voor documenten er zich op die plaats
bevinden. Het zijn sleutelwoorden die niets zeggen over de soort tekst. Dit
sluit ook een heleboel woorden uit.
Uiteindelijk zijn er een
aantal sleutelwoorden die wél geschikt zijn om op de spatialisatie te zetten.
De plek van de woorden in figuur 38 is op dezelfde manier verkregen als het
woord GIS in figuur 37. De woorden zijn vervolgens op de spatialisatie van
figuur 35 geplaatst. De lettergrootte van de woorden is verschillend,
afhankelijk van het aantal keer dat een bepaald sleutelwoord voorkomt in de
conferentiepapers. Dit is te zien in de tabel naast de spatialisatie in figuur
38.
Het woord ‘technology’,
dat van alle sleutelwoorden die op de spatialisatie geplaatst zijn, het meeste
voorkomt als sleutelwoord in de conferentiepapers, is dan ook het grootst
afgebeelde woord in figuur 38. Het woord ‘history’ daarentegen, dat
minder dan 24 keer voorkomt als sleutelwoord, is een stuk kleiner afgebeeld.
Een laatste probleem met
het gebruik van sleutelwoorden is dat de plek van de begin- en eindletters van
de langere woorden niet goed meer overeenkomt met het zwaartepunt van dat
woord. Langere woorden lijken ook relatief belangrijker dan kleinere woorden,
puur omdat ze groter zijn.
Het plaatsen van tekst op
een kaart is een probleem waar kartografen al jaren mee worstelen (Skupin, 2000). Als de kaart teveel tekst
bevat, wordt ze onoverzichtelijk, als er echter te weinig informatie op de
kaart staat is de betekenis weer niet duidelijk. Het vinden van de juiste
balans is een vrij subjectieve aangelegenheid die moeilijk geautomatiseerd kan
worden. Bij digitale atlassen bijvoorbeeld, waar de label placement met
behulp van bepaalde optimalisatiealgoritmes automatisch gaat, zijn de
resultaten vaak verre van goed. Toch kan kartografische expertise op dit gebied
erg nuttig zijn voor de visualisatiewetenschappen (Wu
& Buttenfield, 1991).
Ondanks al deze
moeilijkheden en onnauwkeurigheden bij de plaatsing van de sleutelwoorden op de
spatialisatie, geven deze woorden toch een globaal beeld van het soort
documenten dat men op een bepaalde plek op de spatialisatie kan aantreffen.
De plaats van de
sleutelwoorden in figuur 38 is statisch. Het is echter goed voor te stellen dat
er steeds meer sleutelwoorden verschijnen als er meer wordt ingezoomd op
de spatialisatie (als de spatialisatie grootschaliger wordt dus). Op een kaart
van de wereld is hoogstens de naam Amsterdam te zien bij Nederland. Op een
kaart van Europa echter komen, behalve Amsterdam, ook namen als Utrecht en
Enschede tevoorschijn. Analoog hieraan staan op de totale spatialisatie dan ook
alleen de belangrijkste sleutelwoorden, maar zodra er wordt ingezoomd
zouden ook steeds meer sleutelwoorden op de spatialisatie te zien kunnen zijn
die minder belangrijk zijn.

Figuur
38: Spatialisatie van het verschil tussen de groep digitale en de groep analoge
papers, inclusief sleutelwoorden.
3.5 Het maken van een
driedimensionale Spatialisatie
Om een nog duidelijker
beeld te krijgen van de in de vorige paragraaf gemaakte spatialisatie is een
3-dimensionale afbeelding erg geschikt. De 3D-analyst-extensie in ArcView maakt
het mogelijk om afbeeldingen in drie dimensies te bekijken. Om dit te kunnen
doen moet er echter wel eerst een derde dimensie aan de data worden toegevoegd.
Op de spatialisatie in
figuur 38 heeft elk rasterpunt een tweedimensionale ruimtelijke locatie en twee
waarden, één voor het aantal analoge en één voor het aantal digitale documenten
dat in de buurt ligt. Die waarden kunnen worden gebruikt als derde dimensie:
hoe hoger de waarde, hoe hoger het rasterpunt komt te liggen op een
driedimensionale spatialisatie. Om dit te kunnen doen moet het rastergrid
worden omgezet in een TIN (Triangulated Irregular Network, figuur 39).
Een TIN verdeelt het rasteroppervlak in aansluitende driehoeken. Elke hoek van
een driehoek krijgt een hoogtewaarde, gebaseerd op de waarde van het
onderliggende rasterpunt. De verschillende driehoeken zijn niet gelijkvormig,
maar worden kleiner wanneer de hoogte tussen hoekpunten meer verschilt. Met
andere woorden: hoe groter de hoogteverschillen worden, hoe kleiner de
driehoeken. De TIN geeft dus alleen de precieze hoogte van de hoekpunten weer
en niet van alle rasterpunten. Voor die rasterpunten wordt een hoogtewaarde
genomen die tussen de hoekpunten in zit.

Figuur 39: De structuur van een TIN.
In twee dimensies ziet het
TIN-model er ongeveer hetzelfde uit als het rastermodel (figuur 40, bovenste
figuren). Als de spatialisatie echter in drie dimensies wordt bekeken, dan zijn
de hoogteverschillen duidelijk te zien (figuur 40, middelste figuren). Bij de
weergave in drie dimensies moet een achtergrondkleur worden ingesteld. Hiervoor
is lichtblauw genomen, de kleur van een onbewolkte hemel. De kleur van de
ondergrond van de spatialisatie is ingesteld op grasgroen. Op deze manier lijkt
het net of de driedimensionale spatialisatie een stuk grasland met bergen is,
dat in de lucht zweeft.
Een manier om die
hoogteverschillen te accentueren is door schaduwen aan de spatialisatie toe te
voegen (figuur 40, onderste figuren). Daarbij kan ingesteld worden waarvandaan
de ‘zon’ schijnt en hoe hoog zij aan de hemel staat. Hoe lager de zon staat,
hoe meer schaduw er is en hoe donkerder de spatialisatie wordt. In figuur 39
(onderste figuren) bijvoorbeeld is de zon ingesteld op zuid (180°) en op ‘high’
(50°). Dit betekent dat zij vanuit het zuiden van het plaatje schijnt vanaf een
hoogte van 50°.
Door de driedimensionale
spatialisaties van de analoge en de digitale onderwerpen in figuur 40 samen te voegen,
kan het totaalbeeld van figuur 41 worden verkregen. Het is met de 3D-Analyst
van ArcView mogelijk om dit beeld te roteren. Zo kan de afbeelding van alle
kanten worden bekeken. Figuur 42 bijvoorbeeld bekijkt de spatialisatie vanuit
een noord-noordoostpositie. De zon schijnt in dit figuur vanuit het oosten. De
pijlen in figuur 41 en 42 zijn toegevoegd als oriëntatie en wijzen naar het
‘noorden’.
Het voordeel van een
3-dimensionale ten opzichte van een 2-dimensionale spatialisatie in ArcView is,
behalve het overzicht, dat de twee groepen onderwerpen over elkaar heen kunnen
worden geprojecteerd, zonder dat de ene groep de andere onzichtbaar maakt.
Doordat de waarden van de rasterpunten nu een betekenis hebben als
hoogtewaarden in de derde dimensie, wordt het rasterpunt van de groep met de
hoogste waarde afgebeeld. Er kunnen nu dan ook meerdere legendaklassen worden
afgebeeld (zie de legenda in figuur 41).



Figuur
40: TIN (bovenste figuren) wordt omgezet in 3-D plaatje (middelste figuren)
waaraan
vervolgens schaduwen worden toegevoegd (onderste figuren)
![]()

Figuur
41: 3D-Spatialisatie van het verschil tussen de groep digitale en de groep
analoge papers (gezien vanuit het ‘zuiden’).
Helaas kan de 3D-Analyst het
coördinatenstelsel en de sleutelwoorden, die in de vorige paragrafen aan de
spatialisatie zijn toegevoegd, niet weergeven. Om dit toch te kunnen doen is
met twee extra extensies[27]
gewerkt. De ene extensie maakt het mogelijk om assen te tekenen in een driedimensionale
ruimte en de andere kan tekst op elke plek in die ruimte plaatsen.
In figuur 43 zijn alle drie
de assen aangegeven door een soort kubus die grotendeels om de spatialisatie
heen valt. De X-as en de Y-as lopen, net als bij de tweedimensionale
spatialisatie van –1 tot 1. De Z-as (hoogte) loopt van 0 tot een waarde van 110
000 000. Deze assen zijn getekend om te dienen als referentiekader en
oriëntatie bij interactief gebruik.

Figuur
42: De spatialisatie van figuur 41, gezien vanuit een ‘noord-noordoost-positie’.
![]()

Figuur
43: De spatialisatie met coördinatenstelsel
In figuur 44 zijn ook alle
sleutelwoorden toegevoegd. Omdat er alleen zwarte tekst kon worden gebruikt, is
de spatialisatie zelf lichter gemaakt. Dit is te zien aan de lichtere kleuren
bij de legenda. Het verschil tussen de analoge en de digitale onderwerpen is nu
helaas minder duidelijk, maar de sleutelwoorden zijn nu wel te zien zijn. De
sleutelwoorden zijn op een hoogte van 110 000 000 geplaatst en liggen dus als
het ware boven op de spatialisatie. Dit is waarschijnlijk de beste plek om de
sleutelwoorden te plaatsen, omdat ze, als ze lager geplaatst zouden worden, op
sommige plekken in de spatialisatie zouden verdwijnen. Een nadeel van de
positie van de sleutelwoorden is dat ze, als de spatialisatie gedraaid wordt,
op dezelfde plek blijven staan (zie figuur 45). Vooral als de spatialisatie
vanaf de zijkant wordt bekeken zijn de sleutelwoorden niet tot nauwelijks te
zien. Idealiter zou de positie van de sleutelwoorden meebewegen met het draaien
van de spatialisatie.
De originele verhoudingen
in tekstgrootte van de sleutelwoorden zijn behouden (zie figuur 38). De zon
schijnt in figuur 44 vanuit het ‘zuiden’. In figuur 45 is dezelfde
spatialisatie afgebeeld, maar dan gezien vanuit het ‘noordoosten’. De zon staat
hoog en schijnt vanuit het ‘noordwesten’.
![]()

Figuur
44: Driedimensionale spatialisatie van de groep analoge conferentiepapers
(rood) en de groep digitale conferentiepapers (blauw).
![]()

Figuur
45: Spatialisatie van figuur 43 vanuit het ‘noordoosten’ gezien.
3.6 Interactieve mogelijkheden
De afbeeldingen van
spatialisaties die in dit hoofdstuk geplaatst zijn, zijn allemaal statische
kaarten. Een aantal van die kaarten kan echter worden gezien als slechts een
momentopname van een interactieve, dynamische spatialisatie. Er wordt
tegenwoordig, zowel binnen als buiten de kartografie, steeds meer gewerkt met
digitale, interactieve, dynamische kaarten. Op Internet zijn vele sites te
vinden[28]
die aan gebruikers de mogelijkheid geven om hun eigen kaarten samen te stellen,
door bijvoorbeeld data te selecteren, in- en uit te zoomen en legendaklassen
wel of niet op te nemen. Dit soort applicaties maken het maken van kaarten,
zelfs voor leken, erg eenvoudig. Over de kwaliteit van dit soort kaarten valt
vaak te twisten, maar er wordt wel gesproken van een democratisering van de
kartografie.
Voor het, op een
interactieve manier, werken met spatialisaties zouden applicaties die
‘spatialisaties-on-demand’ kunnen maken, dezelfde mogelijkheden kunnen
bieden. Het ontwikkelen hiervan ligt buiten het terrein van deze scriptie, maar
er kunnen in deze paragraaf wel een aantal voorbeelden worden gegeven van
interactieve toepassingen die met spatialisaties mogelijk zijn.
Bij het maken van de
spatialisaties in dit hoofdstuk is er al constant op een interactieve manier
gewerkt met de informatie. Het selecteren van groepen documenten,
zoekopdrachten uitvoeren met sleutelwoorden en het van alle kanten bekijken van
de driedimensionale spatialisatie zijn allemaal interactieve bewerkingen binnen
ArcView, die hebben geleid tot de uiteindelijke spatialisaties in dit
hoofdstuk.
De kartograaf is in dit
geval degene die op een interactieve manier met de data werkt om uiteindelijk
de juiste informatie, in de vorm van een spatialisatie, bij de gebruiker af te
leveren. Het is voor de gebruiker van de informatie niet meer mogelijk om nog
iets aan de vorm van de informatie te veranderen. Voor de gebruiker zou dat
echter wel makkelijk kunnen zijn en dit is dan ook wat op Internet gebeurt bij
sites, die gebruikers tot op zekere hoogte zelf kaarten laten samenstellen. Het
gevaar hierbij is echter dat de kans bestaat dat er niet tot nauwelijks rekening
wordt gehouden met kartografische theorieën en ideeën over bijvoorbeeld de
zogenaamde grafische grammatica (Bertin, 1983),
klassegrenzen, generalisatie en tekstplaatsing.
Zolang er echter wel
rekening wordt gehouden met de kartografie, kan het een groot voordeel zijn om
op een interactieve manier met de data te werken. Gebruikers kunnen dan zelf,
aan de hand van de data, bepalen welke data ze op wat voor manier in kaart
willen brengen. Zo kan er een applicatie worden bedacht voor het spatialiseren
van de conferentiepapers, die de gebruiker bijvoorbeeld kan laten kiezen om
alleen bepaalde onderwerpen te spatialiseren of alleen teksten met bepaalde
woorden erin. Een voorbeeld van hoe zo’n applicatie er uit zou kunnen zien is
te zien in onderstaande figuur 46.

Figuur
46: Voorbeeld van een applicatie die het voor gebruikers zelf mogelijk maakt om
een spatialisatie
van de
conferentiepapers samen te stellen (gemaakt met Microsoft Visual Basic Editor).
Er zijn in figuur 46
verschillende selectieopties: er kan een selectie gemaakt worden van de
conferentiepapers op onderwerp, op document, op woord, of op een combinatie van
die drie elementen. Bij de selectie van onderwerpen in de figuur zijn alle
onderwerpen geselecteerd, met uitzondering van onderwerp 8 en 11. Door gebruik
te maken van zogenaamde booleaanse operatoren (bijvoorbeeld: AND, OR, NOT) kan
deze selectie worden bereikt. Met behulp van de ‘+’ en ‘-‘ knoppen kunnen
eventueel nog meer selectiecriteria worden toegevoegd of weer worden
weggehaald. De selectie van losse documenten en woorden werkt op dezelfde
manier. Omdat de verschillende selectieopties aan elkaar gekoppeld zijn, kan op
deze manier elke mogelijke combinatie van onderwerpen, woorden en documenten
worden geselecteerd. Uiteindelijk worden bij de selectie in figuur 46 alle
documenten geselecteerd, met uitzondering van onderwerp 8 en 11 en document 309
en 605, waarin de sleutelwoorden ‘GIS’ and ‘Digital’ voorkomen,
maar niet het woord ‘Map’.
Nadat de gebruiker heeft
bepaald welke documenten hij in zijn spatialisatie wil opnemen, zijn er nog een
aantal (kartografische) opties die ingevuld moeten worden. Ten eerste moet de
gebruiker bepalen of hij een spatialisatie wil maken van alleen de geselecteerde
documenten, of een spatialisatie van alle documenten met daarin de
geselecteerde documenten. Dat is een groot verschil, de eerste optie laat
namelijk de verhouding zien van de verschillende documenten tot elkaar, terwijl
de tweede optie een beeld geeft van de positie van de verschillende
geselecteerde documenten ten opzichte van de rest van de gespatialiseerde
documenten.
De andere opties die
ingesteld kunnen worden zijn vooral kartografisch en stellen bijvoorbeeld de
achtergrondkleur in of het aantal dimensies (2 of 3) waarin de spatialisatie
moet worden weergegeven. Soms sluit een bepaalde selectie een bepaalde optie
uit (als er bijvoorbeeld geen aparte woorden zijn geselecteerd, dan kan de
woorddichtheid niet berekend worden). Het aanvinken van andere opties zou weer
kunnen leiden tot nieuwe subopties. Aangezien dit slechts een voorbeeld is van
hoe een ‘spatialisatie-on-demand-applicatie’ er uit zou kunnen zien, is
dit niet verder uitgewerkt.
Wel is er nog een kleine case
studies uitgewerkt die laat zien wat het resultaat kan zijn van een
bepaalde ‘spatialisatie-on-demand’. Deze case study gaat uit van
een gebruiker die meer wil weten over de
onderlinge verhoudingen van de documenten die behoren tot de
congresonderwerpen 2 en 12. Hij selecteert daartoe alle documenten van beide
onderwerpen en maakt een spatialisatie van de geselecteerde documenten. Hij
vinkt de optie ‘bereken documentdichtheid’ aan evenals de optie
‘documentlabels’. De achtergrondkleur stelt hij in op grijs, de documentkleur
op zwart, het aantal legendaklassen op 4 en het aantal dimensies op 2.
Voor het maken van deze
spatialisatie is een nieuwe MDS-analyse uitgevoerd, die aan de hand van de
onderlinge similariteitswaarden van de geselecteerde documenten, de positie van
die documenten op een spatialisatie heeft berekend. De spatialisatie is gemaakt
met behulp van dezelfde methoden en technieken die ook bij de andere
spatialisaties in dit hoofdstuk zijn gebruikt.
Het resultaat is de
spatialisatie in figuur 47 en een lijst met de namen van de afgebeelde
conferentiepapers. Op de spatialisatie is een duidelijk verschil waar te nemen
tussen de positie van onderwerp 2 en onderwerp 12, wat geaccentueerd is door de
documentdichtheid van beide onderwerpen af te beelden (zie §3.2). De gebruiker kan de positie
van de verschillende documenten zowel op de spatialisatie, als in de
onderstaande lijst met documenttitels, met elkaar vergelijken en vervolgens de,
voor zijn gebruiksdoeleinden, geschikte documenten aanklikken om te lezen.
|
|
Figuur
47: Een ‘spatialisatie-on-demand’. Deze figuur geeft een spatialisatie van
onderwerp 2 & 12
van het ICA
congres en is het resultaat van een aantal ingevulde opties in figuur 46
In de praktijk zal het
maken van een aparte applicatie, voor het maken van spatialisaties van de
conferentiepapers van het ICA congres in Beijing, veel te veel tijd kosten in
verhouding tot de hoeveelheid extra verkregen informatie. In feite zijn de
conferentiepapers al netjes ingedeeld naar onderwerp en is het aantal
documenten (circa 500) ook nog wel te overzien. Dit geldt echter niet voor
grote dynamische (tekst)databases, die door de grote hoeveelheid informatie die
ze bevatten erg onoverzichtelijk kunnen zijn.
Het Internet, dat uit meer
dan een miljard webpagina’s bestaat, kan gezien worden als zo’n dynamische
database. Om een overzicht te krijgen van de structuur (van delen) hiervan zou
een applicatie die spatialisaties maakt een handig hulpmiddel kunnen zijn.
Zoals ook al in §1.2.1
is aangegeven zou zo’n applicatie bijvoorbeeld een aanvulling op
Internetzoekmachines kunnen zijn. Een spatialisatie kan niet alleen de
structuur van de informatie, maar ook de context van die informatie goed in
beeld brengen. Naast de bekende lijst met zoekresultaten zou een spatialisatie
kunnen staan die aangeeft ‘waar’ de verschillende relevante webpagina’s zich
bevinden op het Internet en welke pagina’s er zich in de buurt bevinden.
Figuur 48 laat zien hoe dit
er uit zou kunnen zien. Een gebruiker die op zoek is naar informatie over de
Universiteit Utrecht vult zijn zoekopdracht in en krijgt als resultaat een
lijst met relevante documenten (te zien aan de linkerkant van figuur 48). Aan
de rechterkant verschijnt een spatialisatie van (een deel van) het Internet,
met daarop de relevante zoekresultaten aangegeven. Er bestaat de mogelijkheid
om in- en uit te zoomen tot het gewenste niveau (met de knoppen rechts van de
spatialisatie), van een spatialisatie van het hele Internet, tot een
spatialisatie die op documentniveau de relevante resultaten aangeeft.

Figuur
48: Een Internetapplicatie die de plek van documenten op het Internet op een
spatialisatie weergeeft.
Bron: Er
is gebruik gemaakt van de lay-out van de zoekmachine Google (www.google.com).
De spatialisatie, de schaalstok en de knoppen komen uit ArcView.
Een spatialisatie op
documentniveau is rechts in figuur 48 te zien. De kleuren op de spatialisatie
zeggen iets over de documentdichtheid op die plek. De betekenis van de
verschillende kleuren is aangegeven in een legenda naast de spatialisatie
(donkergroen is het laagst, wit is het hoogst). Hierbij is gebruik gemaakt van
dezelfde kleuren die op kaarten vaak de hoogte aangeven. Mensen zijn gewend om
met deze kleuren te werken en zullen dan ook al snel intuïtief aanvoelen waar
zich een hoge documentdichtheid bevindt. De blauwe stippen op de spatialisatie
stellen de relevante documenten voor[29].
Een lijst van de relevante documenten die op dat moment op de spatialisatie te
zien is, kan onder de spatialisatie worden gezet, wat in figuur 48 is gedaan
(rechtsonder).
De documenten op de
spatialisatie kunnen apart geselecteerd worden. De documenten die op de
spatialisatie worden geselecteerd kunnen tegelijkertijd ook in de
documentlijsten worden geselecteerd. In figuur 48 zijn bijvoorbeeld twee
documenten op de spatialisatie geselecteerd (de twee geel gekleurde stippen),
die vervolgens ook in de lijst met relevante zoekresultaten geselecteerd zijn.
Het omgekeerde proces is ook denkbaar, namelijk dat er een document uit de
lijst met zoekresultaten wordt geselecteerd, waardoor de plek van dat document
op de spatialisatie ook geselecteerd wordt.
Onder de spatialisatie
staat een schaalstok. De afstand kan niet in bijvoorbeeld meters worden
uitgedrukt, maar er kan wel een indicatie worden gegeven welk deel van het
Internet op de spatialisatie wordt afgebeeld. Als de lengte van een doorsnede
van een spatialisatie van het hele Internet op 1 wordt gesteld, dan kan er een
schaal worden berekend. Bijvoorbeeld één cm op de spatialisatie is één
duizendste van de totale doorsnede van het Internet. De schaal is dan dus
1:1000. Zodra er wordt in- of uitgezoomd verandert de schaal van
de spatialisatie en zou dus ook de schaal op de schaalstok moeten mee
veranderen.
Ook figuur 48 is slechts
bedoeld om aan te geven hoe een applicatie op Internet er uit zou kunnen
zien. Het voorbeeld is dan ook niet helemaal uitgewerkt[30],
maar vooral bedoeld om te laten zien op wat voor (interactieve) manier
spatialisaties nuttig kunnen zijn bij het vinden van de juiste informatie.
Zoals in dit hoofdstuk duidelijk is geworden kunnen kartografische methoden en
technieken een belangrijke rol spelen bij het visualiseren van die informatie,
ook al is het van oorsprong geen ruimtelijke informatie.
[25] Dit coördinatenstelsel is gemaakt met behulp van een Avenue-script. Avenue is de programmeertaal van ArcView. Het programmaatje vraagt om het definiëren van een coördinatenstelsel (grid), wat vervolgens wordt omgezet in een shapefile, dat de locaties van het coördinatenstelsel kan opslaan. Het programma heet Grid Maker to Shape en kan worden gedownload van de volgende pagina: http://gis.esri.com/arcscripts/index.cfm?action=details&CFGRIDKEY=A614F692-77A4-11D5-944400508B0CB419
[26] Er is bewust voor een ‘meetstraal’ van 0,25
gekozen, uit tests blijkt namelijk dat bij een grotere of kleinere afstand het
verkregen beeld minder goed overeen komt met de structuur van de data. Het
beeld wordt dan te grof of juist te precies voor het doel van deze bewerking.
Om overigens te zorgen dat de toegekende
waarde van een rasterpunt afneemt naarmate dat punt zich verder van een
document bevindt, moet het ‘density type’ in ArcView worden ingesteld op
‘kernel’. Als het ‘density type’ namelijk wordt ingesteld op ‘simple’
krijgt elke rastercel, die zich binnen een straal van 0,25 van een document
bevindt, dezelfde waarde.
[27] De extra extensies zijn ArcScripts die kunnen worden gedownload bij ESRI: 3D Scene Axes (1.0b) (http://gis.esri.com/arcscripts/index.cfm?action=details&CFGRIDKEY=149431604) en 3D Scene Text (http://gis.esri.com/arcscripts/index.cfm?action=details&CFGRIDKEY=1735716881).
[28] Voor links
naar Internetsites die het mogelijk maken om on-line kaarten te maken
wordt verwezen naar Oddens Bookmarks’, een Internetsite met duizenden links
naar kartografische documenten op Internet. Binnen de categorie maps and
atlases is een aparte subgroep die gewijd is aan on-line map creating.
[29] De overige documenten op de spatialisatie zijn niet individueel aangegeven, omdat ze niet relevant zijn voor de zoekopdracht, optioneel zouden echter ook de niet relevante documenten te zien moeten kunnen zijn
[30] Een spatialisatie van het Internet, waarvan in figuur 48 een voorbeeld is gegeven, zou veel beter gemaakt kunnen worden met behulp van de Kohonen SOM-techniek, dan met MDS. Zoals al in §2.2.3 is aangegeven is de SOM-techniek namelijk veel beter geschikt voor het spatialiseren van hele grote dynamische databases. Dit om meerdere redenen, waarvan de kleinere foutenmarge van de SOM-techniek en de kortere rekentijden de belangrijkste zijn.