Analyse Tekstvragen
De opbouw van deze pagina is al volgt:
- Inleiding met algemene verwerkingswijze
- Voorbeeld
- Enkele opmerkingen over het coderen tot slot
- Een speels alternatief
Inleiding
Tekstvragen kunnen heel divers zijn. De vragen die ik zo tegenkom in vragenlijsten zijn grofweg in te delen in de een viertal categorieën. Zonder de intentie volledig te zijn bij dezen een korte opsomming:
-
Korte open vragen waarbij een kort antwoord wordt verlangd, zoals een merknaam dat spontaan genoemd moet worden, of een kenmerk van een product waarmee het product mee gekenschetst wordt. De "anders, namelijk ..... "-vragen vallen ook in deze categorie;
-
Iets langere open vragen waar een korte omschrijving gevraagd wordt;
-
Een lange open vraag waar opmerkingen in de meest ruime zin gevraagd worden. Bijvoorbeeld in een klanttevredenheidsonderzoek waar o.a. gevraagd wordt naar de tevredenheid over een bepaalde afdeling aan de hand van een Likertschaal. Aan het einde van dat stukje vragenlijst kunnen aanvullende op- en aanmerkingen worden geplaatst over die afdeling;
-
Open vragen in een kwalitatief onderzoek met een grote diversiteit aan antwoorden.
Verwerkingswijze
-
De complexiteit van het verwerken van de vragen loopt bij deze nummering met de nummers op. Vragen verwerken van kwalitatief onderzoek zoals die in het HBO uitgevoerd worden is lastig met IBM SPSS Statistics 23. Ik geef er de voorkeur aan dat in Excel te doen;
-
Vragen waar opmerkingen gevraagd worden kennen vaak een grote diversiteit aan antwoorden. Veelal is het voldoende een net overzicht te geven van die antwoorden. Dat overzicht krijgt dan een plaats in de bijlagen. Citaten kunnen in het verslag worden opgenomen;
-
Omschrijvingen en korte antwoorden worden in de regel
gecategoriseerd. Een handige codering in PASW 17 kiezen
helpt bij het formuleren van de resultaten. Afhankelijk van
aantallen antwoorden en de diversiteit ervan kan er op drie
manieren gecodeerd worden. Dat kan als:
- Meerkeuzevraag;
- Vraag waarop meerdere antwoorden mogelijk zijn (Multiple Respons Dichotomies);
- Vraag waarop meerdere antwoorden mogelijk zijn (Multiple Respons Categories).
Voorbeeld
Categoriseren van antwoorden op open vragen vergt altijd nogal wat werk. Misschien dat Text Analytics (van SPSS) werk uit handen kan nemen, maar er moet toch nog het een en ander gedaan worden. In een uitgewerkt voorbeeld zal getoond worden welke stappen gedaan (kunnen) worden genomen. Het bestand Tekstvraag1.sav zal als bron gebruikt worden.
Opmerking: de antwoorden in het databestand komen uit een online vragenlijst en zijn dus al ingevuld. Als er een schriftelijke vragenlijst moet worden ingevoerd in SPSS 23 zijn de te maken stappen natuurlijk anders, maar het idee van categoriseren blijft het zelfde. Je bladert dan van tevoren door de antwoorden en probeert een lijst te maken van antwoorden. Vanaf Aanpak stap 4 gaat het vergelijkbaar met het uitgewerkte voorbeeld.
Aanpak stap 1 Frequentieoverzicht
Als eerste is een overzicht over alle gegeven antwoorden handig, dat kan met:
Resultaat (althans een gedeelte van de antwoorden):
In totaal zijn er 49 verschillende antwoorden geven. Eigenlijk zijn deze niet echt verschillend. De volgende problemen zie je:
- Verschillende schrijfwijzen door hoofdlettergebruik en gebruik kleine letters;
- Verschillende schrijfwijzen voor hetzelfde apparaat: i pod en ipod;
- De aantallen antwoorden per respondent verschillen. Dat is eigenlijk een fout in de vraag; daar had expliciet moeten staan dat slechts één antwoord toegestaan was. De vraag is hoe hiermee omgegaan moet worden. Elke keuze is arbitrair, maar je kunt er voor kiezen het eerste antwoord te nemen bij de verdere verwerking.
Gezien de antwoorden zal de vraag als meerkeuzevraag worden gecodeerd.
Aanpak stap 2 Hoofdletters verwijderen
Dat kan via Compute. Er moet dan wel een aantal keuzes gemaakt worden. Probeer dat zelf eens uit. Het resultaatbestand is Tekstvraag2.sav .
Als er nu een frequentietabel gemaakt wordt zijn er nog 38 verschillende antwoorden. Een kleine verbetering. Het echte voordeel van deze stap heb je als je in stap 4 Recode gaat gebruiken.
Aanpak stap 3 Categorieën benoemen
Dat gaat in drie stappen: Via Automatic Recode een numerieke variabele maken van V02. Hier kost het verwerken van numerieke variabelen veel minder tijd dan het verwerken van String variabelen. Vandaar deze stap.
Via de Tekst in het LOG klassen benoemen;
![]() |
Op de PC waar de screenshots gemaakt
worden is ingesteld dat het Log niet getoond wordt. Dat
is bij Options onder Edit aan te passen. Dat is dan een
definitieve aanpassing. Tijdelijk het Log tonen kan via de knop ![]() Daarop drukken maakt het Log zichtbaar. |
Een overzicht van het Log:

Na bestudering van de antwoorden zie ik dat er eigenlijk 9 verschillende antwoorden zijn gegeven. In het codeboek zal daarom een variabele moeten worden gedefinieerd met de volgende Values en Value Labels:
Value | Value Labels |
0 | Geen apparaat |
1 | Föhn |
2 | Laptop / Computer |
3 | Magnetron |
4 | Mp3-speler / Ipod |
5 | (Mobiele) telefoon |
6 | Scheerapparaat |
7 | Tandenborstel |
8 | Televisie |
9 | Onbekend (Missing Value) |
Aanpak stap 4 Recode gebruiken
De antwoorden bij variabele V02_n vormen de basis voor de nieuwe variabele. Die zal "V01_gecategoriseerd" gaan heten. Dat in een handig tabelletje zetten kan geen kwaad. Meestal maak ik een afdruk van het Log en daarin zet ik de nieuwe codes naast de oude codes. Het levert de volgende hercodering op:
Value V02_n | Nieuw | Value V02_n | Nieuw | Value V02_n | Nieuw | Value V02_n | Nieuw |
1 | 5 | 11 | 5 | 21 | 5 | 31 | 6 |
2 | 3 | 12 | 4 | 22 | 5 | 32 | 6 |
3 | 2 | 13 | 2 | 23 | 5 | 33 | 5 |
4 | 1 | 14 | 2 | 24 | 5 | 34 | 5 |
5 | 0 | 15 | 2 | 25 | 5 | 35 | 5 |
6 | 5 | 16 | 3 | 26 | 4 | 36 | 8 |
7 | 5 | 17 | 2 | 27 | 4 | 37 | 8 |
8 | 0 | 18 | 7 | 28 | 0 | 38 | 8 |
9 | 4 | 19 | 5 | 29 | 2 | ||
10 | 0 | 20 | 5 | 30 | 2 |
Hercoderen gaat via Recode into Different Variables:
Als alle oude en nieuwe Values gedefinieerd zijn krijg je dit:
Nu nog in het codeboek de juiste aanpassingen doen:
Aanpak stap 5 Een eerste analyse
En dan kan een frequentietabel of een grafiek worden gemaakt van de nieuwe variabele:
Enkele opmerkingen tot slot over het coderen
- Je ziet dat alle antwoorden gecodeerd zijn;
- Twee antwoorden zijn veel genoemd, andere antwoorden hadden wellicht in een categorie "overige" gezet kunnen worden. Dat kan trouwens altijd nog;
- Dit codeerwerk kost relatief veel tijd, maar is noodzakelijk als er kruistabellen en dergelijke gemaakt moeten worden;
- Als je later niet wil coderen moet je je bedenken of je de vraag dan wel had moeten stellen, en of dat de vraag anders (zeg scherper) geformuleerd had moeten worden.
- Bovenstaande opmerkingen moet je je eigenlijk realiseren voordat je met de afname van je vragenlijst begint. Dan moet je je al druk maken over de wijze waarop je de data wilt analyseren!
Een speels alternatief
Gebruikt is hier de website:
www.wordle.net
.
Het was wel noodzakelijk om de antwoorden enigszins aan te
passen.
Hoe vaker genoemd, hoe groter het woord.
Welk elektronisch apparaat kan de student niet missen
Bron: Onderzoek IB&C, 8 april 2010