Hoe werkt het?

In elke proefopstelling doorloop je 5 stappen:

  1. De voorbereiding
  2. De instrumenten
  3. Het experiment
  4. De lakmoesproef
  5. Het vrije experiment

Noteer je antwoorden op de vragen op papier of in een Word-bestand.

Succes!

Wat heb je nodig?

  • Pen en papier of een leeg Word-bestand
Ga naar stap 1

Stap 1: De voorbereiding

Wat betekent woordgebruik voor de literatuuronderzoeker?
In 2013 verkoos Van Dale ‘selfie’ tot woord van het jaar. De definitie luidde: ‘een gefotografeerd z
elfportret, meestal gemaakt met een digitale camera, een smartphone of webcam’. Kort voor 2013 was er een nieuwe generatie smartphones op de markt gekomen. Naast de gebruikelijke camera aan de achterkant hadden die ook een lens aan de voorkant van het toestel. Zo kon je ineens heel eenvoudig foto’s van jezelf te maken. De telefoons vlogen over de toonbank, en de sociale media vulden zich met selfies.

Van Dale verkiest niet zomaar ‘een woord van het jaar’. De nieuwe term moet een zekere sociale of culturele impact hebben. Dat wil zeggen: veel gebruikt worden, of controverse oproepen. De opkomst en populariteit van het woord selfie – in samenhang met een bepaald type teksten (sociale media in dit geval) – vormen voor onderzoekers van literatuur een interessant studieobject. Want het gebruik van dit woord vertelt iets over de actuele, hedendaagse cultuur. Binnen die cultuur spelen bepaalde teksten – waaronder literaire – mogelijk eigen rollen. Maar welke precies, wat zeggen die teksten daarmee over de culturen waarin ze gebruikt worden? 

Literatuuronderzoekers kunnen deze vraag in het geval van het woord selfie vanuit verschillende invalshoeken benaderen.

  • ze kunnen kijken naar het product dat je maakt met de selfie (een zelfportret). En naar het medium dat je daarvoor gebruikt (de smartphone). Product en media samen zorgen ervoor dat je een digitaal zelfportret kunt zien als een middel waarmee we onze identiteit snel en breed aan anderen tonen. Het zelfbeeld wordt ‘gemedieerd’ door technologie, zou onderzoeker McLuhan zeggen. McLuhan ken je misschien van zijn meest beroemde uitspraak, ‘the medium is the message’.
  • andere onderzoekers zien de populariteit van de selfie als teken dat een zekere obsessie met jezelf in de hedendaagse cultuur gefaciliteerd of zelfs aangemoedigd wordt. Een woord als selfie ontstaat als erkenning voor bepaald gedrag.
  • ook kun je de selfie analyseren als signaal dat je voor het vormen van je identiteit geen anderen meer nodig hebt. Waar je vroeger aan voorbijgangers vroeg om een foto van jou te maken, doe je het nu gewoon zelf. Nu kun je de beeldvorming – het beeld dat anderen van je hebben – zelf in handen nemen. Dankzij de smartphone met twee camera’s hebben we nu controle over hoe anderen ons te zien krijgen.

Achter het woord selfie gaan dus nieuwe ideeën schuil die in een bepaalde cultuur leven. Ideeën over identiteit en over het gebruik van media. Dit voorbeeld laat zien waarom woorden interessant zijn voor literatuuronderzoekers. Dankzij grootschalige digitalisering van teksten, kunnen literatuuronderzoekers nu meer doen dan een enkel woord bestuderen. Ze kunnen systematisch op zoek naar patronen in de samenhang tussen literatuur en de ontwikkeling van ideeën achter die woorden.

Opdrachten

  1. Je kunt zelf een onderzoek rond een ander woord dan selfie opzetten door te bedenken welke andere nieuwe woorden snel populair geworden zijn in sociale media. Zoek zo’n woord. En omschrijf hoe je zou kunnen onderzoeken welke culturele betekenis dat woord heeft.
  2. Ga naar de website van Van Dale en ontdek welke woorden in de afgelopen jaren zijn verkozen tot woord van het jaar. Zijn er woorden die nu alweer verdwenen of veranderd zijn? Met welke media en welke maatschappelijke ideeën of verschijnselen hangen die woorden samen?

In deze stap heb je geleerd dat we woorden kunnen beschouwen als sporen van nieuwe gebruiken, gedragingen of denkbeelden. In stap 2 maak je kennis met de instrumenten die je kunnen helpen bij onderzoek naar patronen in het woordgebruik in literaire en niet-literaire teksten uit het verleden.

Stap 2: De instrumenten

Een vraag, instrumentarium en een methode
Als je een antwoord wilt vinden op wetenschappelijke vragen, dan moet je weten wat precies je vraag is. Daarna heb je instrumenten nodig waarmee je precies kunt beschrijven wat je onderzoekt. In het geval van woordgebruik kun je denken aan meetinstrumenten die de frequentie van het woordgebruik in kaart brengen. Of instrumenten die zicht geven op de spreiding (de distributie) van het gebruik van woorden. Zoals je een liniaal gebruikt om de maat van een afstand of lengte te nemen, zo gebruik je frequentie- en distributiematen om vat te krijgen op teksten. Daarnaast heb je een methode nodig, een systematische manier om tot nieuwe kennis te komen. Iedereen die met die methode werkt, gebruikt dezelfde instrumenten. De kennis die je met die instrumenten opdoet, kan zo gestapeld en vermeerderd worden. Ook kun je beter met elkaar discussiëren als je dezelfde methode gebruikt hebt. Alle stappen die je als onderzoeker neemt, zijn immers voor je discussiegenoten inzichtelijk en begrijpelijk.

Wat hebben we nodig om onderzoek te doen naar de historische betekenis van (nieuwe) woorden in de Nederlandse literatuur? We komen niet ver met de verkiezing van het woord van het jaar, want die bestaat pas sinds 2007. Bovendien zijn we niet alleen in nieuwe woorden geïnteresseerd, maar ook in verschuivingen van de frequentie en distributie van bestaande woorden. Gelukkig is er tegenwoordig een schat aan historische teksten digitaal beschikbaar die we met handige zoekmiddelen kunnen doorzoeken op bepaalde woorden. In deze stap leer je hoe je daarmee moet omgaan.

Instrumentarium uitgediept: hoe onderzoek je een ijsberg?
Als (literatuur)historicus ben je altijd afhankelijk van historische bronnen en archieven. Je kunt een bepaald stukje van het verleden slechts beschrijven voor zover dat vastgelegd is in de teksten die bewaard gebleven zijn.

Met dat probleem hebben wij ook te maken in deze proef. Stel dat we op zoek zijn naar de introductie van het woord ‘macaroni’ in het Nederlands. We kunnen dan gaan zoeken in een digitale collectie, maar we weten natuurlijk niet of de beschikbare teksten een representatief beeld schetsen. Het is tenslotte mogelijk dat het woord macaroni al langer in spreektaal gebruikt werd, maar pas later opgeschreven is. Of dat het archief niet beschikt over de juiste teksten. Bovendien heeft geen enkel archief al zijn materiaal gedigitaliseerd. We onderzoeken dus een ijsberg waarvan slechts het topje zichtbaar is boven het zeeoppervlak.

De overlevering van teksten is door verschillende selectiemomenten bepaald:

  1. De schrijver besloot een bepaalde gedachte of ervaring wel of niet op te schrijven.
  2. Een uitgever heeft die tekst wel of niet verspreid.
  3. Een archivaris heeft deze tekst wel of niet opgenomen in een archief.
  4. Een conservator heeft de tekst wel of niet gedigitaliseerd.

Tot slot maak je als onderzoeker zelf nog een selectie van de beschikbare teksten. Die selectie van onderzoeksmateriaal noemen we een corpus. Al met al maakt dit het moeilijk in te schatten hoe het topje dat je wél ziet, zich verhoudt tot wat er zich onder water nog bevindt. In de volgende stap ontdek je hoe een belangrijk onderzoeksinstrument dat je voor dit onderzoek kunt gebruiken (de Ngram-viewer) dit probleem deels ondervangt.

Corpus

‘Het geheel van (primaire) teksten die de onderzoeker volgens een bepaalde methode zal analyseren.’

Digitaliseren

‘In een digitale code overbrengen. In de onderzoekspraktijk: het beschikbaar stellen van onderzoeksmateriaal in digitale vorm. ’

Woordfrequentie

‘Aantal malen dat een woord voorkomt in een tekst of corpus.’

We gaan in deze proef dus op zoek naar woordfrequenties in een gedigitaliseerd corpus. We kijken wanneer een woord opduikt in de geschiedenis. En traceren het voorkomen van dat woord. Door frequenties van verschillende woorden te vergelijken door de jaren heen, krijgen we een beeld van de historische denkbeelden die ermee samenhangen. 

Opdrachten

  1. Wat je aan onderzoeksresultaten vindt, heeft in het geval van onderzoek in grote corpora (= onderzoekscollecties) te maken met de samenstelling van die corpora. Stel je bent voor een dag de conservator van een archief en je mag 10 teksten uitkiezen die gedigitaliseerd moeten worden. Welke criteria zou jij stellen aan een tekst om voor digitalisering in aanmerking te komen? Bedenk waarom het zinvol is om een tekst digitaal beschikbaar te maken. En leid daarvan de criteria af.
  2. De dag daarna ben je conservator in een openbare bibliotheek en beslis je opnieuw over 10 teksten die je zou willen digitaliseren. Welke keuzes maak je nu, en wat zijn dan de criteria? Zie je verschillen met de criteria uit opdracht 1? 
  3. Moet een literatuuronderzoeker nu altijd teksten uit beide soorten corpora onderzoeken, of al een voorselectie maken van wat literatuur is?

Nu je de beperkingen kent van onderzoek met behulp van een digitaal corpus, ben je klaar om zelf met zo’n corpus aan de slag te gaan. In de volgende stap ga je experimenteren met corpusonderzoek: je doorzoekt een grote verzameling teksten op voorkomen van bepaalde woorden.

Stap 3: Het experiment

Tijdens het experiment kun je zelf onderzoek doen naar woordfrequenties. Zo kun je bepaalde historische gebruiken of denkbeelden op het spoor komen. Voor dit doeleinde zijn eenvoudig te gebruiken tools ontwikkeld, waaronder de zogenaamde Ngram-viewer van de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL). Die levert een grafiek die van elk jaar tussen 1500 en 2000 de frequentie van je zoekterm weergeeft in alle gedigitaliseerde teksten uit dat jaar. De tool doorzoekt daarvoor verschillende digitale collecties van de Koninklijke Bibliotheek. Je kunt kiezen of je de Ngram-viewer de relatieve , dan wel absolute frequentie van woorden wilt laten uitzoeken. De absolute frequentie verwijst naar het totale aantal ‘hits’ (treffers) van een woord in een bepaald jaar. De relatieve frequentie zet het totale aantal hits af tegen het aantal teksten dat gedigitaliseerd is in dat jaar. Zo krijg je een betere indruk van het gebruik van dat woord door de jaren heen. En dus een kans om in te schatten hoe het topje zich mogelijk verhoudt tot de rest van de ijsberg. De Ngram-viewer staat je ook toe de frequentie van verschillende woorden in een grafiek te tonen. Ook dat is een middel om in te schatten hoe de topjes van alle ijsbergen die je in kaart wil brengen zich tot elkaar verhouden.

Daarnaast, en dat is belangrijk voor de literatuuronderzoeker, kun je in de Ngram-viewer een overzicht per genre opvragen. Dat geeft de mogelijkheid te zien of woordpatronen in literaire en niet-literaire genres verschillen.

Opdrachten

  1. Ga naar de Ngram-viewer van de DBNL. Lees de toelichting en bekijk het begeleidende filmpje.
  2. De tool biedt de mogelijkheid om het corpus aan te passen. Bedenk een vraag die je kunt beantwoorden omdat je die mogelijkheid gebruikt.
  3. Een belangrijke bron van leenwoorden zijn buitenlandse gerechten. Zoek op ‘macaroni’ (Italiaans), ‘sushi’ (Japans) en ‘cheeseburger’ (Amerikaans). Het zal je opvallen dat sushi en de cheeseburger later opduiken in Nederlandse teksten dan macaroni. Hoe zou dat komen en welke culturele ontwikkeling zit hierachter?
  4. Klik op de vroegste hits van macaroni uit je vorige zoekopdracht en beschrijf om wat voor tekst het gaat. In welk type tekst kom je deze term voor het eerst tegen? Wat zegt dat over de samenhang tussen tekstsoort en woordgebruik?
  5. Verwijder je eerdere zoektermen en vergelijk de (totale) frequentie van ‘gehoorzaam’ met ‘ongehoorzaam’ en ‘braaf’ met ‘stout’. Kies voor ‘met spellingsvarianten’ en selecteer alleen ‘jeugdliteratuur’. Wat valt je op? Wat betekent het verschil volgens jou voor de functie van jeugdliteratuur ten opzichte van andere tekstsoorten?
  6. Bedenk nu zelf een aanname over het verband tussen een bepaalde tekstsoort en bepaald woordgebruik die je met de Ngram-viewer kunt toetsen. Ter inspiratie: denk aan woorden/tekstsoorten die heel uitgesproken en onderscheidend zijn, en al wat langer in gebruik. Dus bijvoorbeeld de tekstsoort ‘poëzie’ en een woord als ‘liefdesleed’. Verwacht je dat dat woord steeds vaker of minder vaak gebruikt wordt? En in poëzie vaker of minder vaak dan in proza? En waarop baseer je die verwachtingen?

In deze stap heb je gewerkt met een concreet corpus. Zo leerde je welke vragen je kunt beantwoorden door vele teksten tegelijkertijd te doorzoeken, en welke vragen misschien een andere aanpak vereisen. In de volgende stap reflecteer je op je bevindingen.

Stap 4: De lakmoesproef

Met de lakmoesproef test je wat je te weten bent gekomen tijdens het experiment. Was het nuttig om een digitaal corpus te doorzoeken op woordfrequenties? Wat zeggen deze frequenties over de betekenis van woorden in een bepaalde periode? Kun je daar wel iets over zeggen, of moet je dan nog altijd de teksten zelf lezen?

Opdrachten

Schrijf een essay van 500 woorden waarin je één van de volgende stellingen onderbouwt of weerlegt:

  1. De Ngram-viewer geeft een goede indruk van het gebruik van woorden in een bepaald jaar.
  2. Onderzoek naar woordgebruik in het verleden is onmogelijk zonder zelf de teksten te lezen.
  3. De Ngram-viewer geeft inzicht in de opvoedende functie van jeugdliteratuur door de jaren heen.

Bij de lakmoesproef heb je argumenten geformuleerd voor of tegen een van de stellingen. Dat deed je op basis van je bevindingen uit de vorige stap, het experiment. Zo trok je onderbouwde conclusies op basis van je onderzoek.

Stap 5: Het vrije experiment

In het vrije experiment is er ruimte om naar eigen inzicht verder onderzoek te doen met de instrumenten en tools die we in deze proef gebruikt hebben. Bijvoorbeeld ook als opstapje voor het schrijven van een profielwerkstuk. Daarnaast is het vrije experiment een ruimte voor creatief schrijven. We geven je richtlijnen om creatief te reflecteren op de thema’s die in deze proef aan de orde kwamen.

Opdrachten

Kies een van de opdrachten en schrijf een verslagje van 500 woorden over je ideeën.

  1. Is de opkomst van bepaalde woorden in de DBNL (waar relatief veel teksten in zitten die we als literair beschouwen) anders dan in Delpher (de collectie met met name historische kranten van de Koninklijke Bibliotheek)? Probeer een vermoeden te formuleren. Bijvoorbeeld dat er in het verleden tussen literaire teksten en kranten grote verschillen waren in het noemen van bepaalde plaatsnamen of van bepaalde beroepen. Hoe kun je een dergelijk vermoeden testen, en hoe interpreteer je de resultaten van je analyse?
  2. Probeer in de lijn van opdracht 1 een vermoeden te formuleren over het kleiner dan wel groter worden van verschillen tussen literaire en niet-literaire teksten in de loop der tijden. Kun je woorden bedenken die mogelijk met enige vertraging in de ene dan wel andere tekstsoort terecht zijn gekomen? En blijven dergelijke vertragingseffecten in de loop van de decennia gelijk?

Verder lezen:


Traceer de ontwikkeling van woorden

In de proef over woordgebruik heb je geleerd hoe je geschiedenis kunt schrijven aan de hand van de woorden die de mensen vroeger gebruikten. Nu je de basisprincipes van zulk onderzoek kent, kun je de digitale corpora induiken voor een gerichte onderzoeksvraag, bijvoorbeeld van je profielwerkstuk. Neem een voorbeeld aan de onderzoeker Jesper Verhoef. Hij deed in grotere Nederlandse krantencorpora zogenaamd ‘discoursonderzoek’: onderzoek naar de publieke opinie over een bepaald verschijnsel. Het was hem te doen om reacties op de introductie van de draagbare radio in de jaren ’60. In de publieke opinie bleek dat apparaat al snel symbool te komen staan voor verloedering: degenen die veel gebruik maakten van de draagbare radio (jongeren) werden verweten dat ze bestaande normen en waarden niet in acht namen. Verhoef maakte gebruik van de online krantendatabase Delpher van de Koninklijke Bibliotheek. We doen hieronder enkele suggesties voor vragen die je met behulp van Delpher kunt beantwoorden. 

  • Wat was de publieke opinie over de introductie van het pocketboek in de jaren vijftig en zestig?
  • Wat was de publieke opinie over de introductie van de anticonceptiepil (‘de pil’) in de jaren zestig en zeventig?
  • Wanneer werd de term ‘politionele acties’ voor het eerst gebruikt in verband met de Indonesische onafhankelijkheidsoorlog (1945 – 1949) en hoe werd er in die periode over geschreven in Nederlandse kranten?

Ga je liever een stap verder en ben je handig met programmeren? Dan kun je in je profielwerkstuk ook gaan experimenteren met digitale tekstanalyse. Behalve dat je iets te weten komt over patronen in teksten, leer je gewilde vaardigheden zoals text mining en data-analyse. Klik op de voorbeeldvraag om te zien waar je kunt beginnen.

  • Hoe kunnen we emoties of sentimenten meten in literaire teksten?
Met behulp van patroonanalyse in teksten kun je ook zogenaamde ‘sentimentsanalyeses’ doen. Daarmee kun je op het spoor komen of in teksten (uitzonderlijke) positieve dan wel negatieve gevoelens worden uitgedrukt. Aan de hand van woordgebruik zet het programma je tekst op (een willekeurige) een schaal van negatief tot positief. Lees hier analyses die taalkundige Marc van Oostendorp met deze methode maakte. Bedenk nu zelf een analyse die je uit zou willen voeren. Dit zijn de stappen die je daarvoor moet doorlopen: A) inspecteer het pakket Pattern van de Universiteit Antwerpen; B) kies en kopieer een tekst uit de DBNL die je aan analyse wilt onderwerpen. Het kan goed werken er 2 te nemen, die je gaat vergelijken in je analyses. Of een tekst te nemen waarvan je verwacht dat er veel in gebeurt op het gebied van emoties (denk bijvoorbeeld aan de Julia van Feith.; C) je moet zelf iets van computercode schrijven om de analyse ook daadwerkelijk uit te voeren. Instructies hiervoor (inclusief codeervoorbeelden) vind je in het blog van Marc van Oostendorp

Verder lezen:


Ben je benieuwd naar andere mogelijkheden voor het schrijven van een profielwerkstuk over literatuur? Klik dan eens op de ‘Profielwerkstuk’-knop en lees enkele suggesties voor grotere onderzoeksvragen die je in een profielwerkstuk kunt uitdiepen.