Data Merge Files

Via Merge Files kun je bestanden samenvoegen. Dat kan op twee manieren, namelijk via

Merge Files 01

Merge Files, Add Cases

  • Add Cases, je voegt de cases van twee databestanden met overeenkomstige variabelen samen;

Merge Files, Add Variables

  • Add Variables, je voegt dan twee databestanden samen, waarin cases via een Key(sleutel)-variabele gelinkt zijn.

Merge Files, Add Cases

De volgende stappen zijn te onderscheiden

topknop

De voorbereiding

Als afgenomen vragenlijsten handmatig moeten worden ingevoerd is het soms handig als dat door meerdere mensen tegelijk wordt gedaan. Zeker voor projectgroepen is dat het geval. De werkwijze is dan de volgende:

topknop

Nu kan men aan de slag met het samenvoegen in SPSS

In het voorbeeld wordt gewerkt met drie losse bestanden: mergebestand_1.sav , mergebestand_2.sav en mergebestand_3.sav .

Open mergebestand_1.sav in SPSS

Je ziet dat er slechts 7 cases zijn.

Merge Files 02

Kies dan voor Data, Merge Files en Add Cases.

Opmerking
In de kolom bij segment zijn nu de valuelabels te zien. Als je wilt switchen tussen valuelabels en values kan dat via View -> Values Labels, of via de knop Value Labels Knop.

Je krijgt het volgende scherm:

Merge Files 04

Browse naar mergebestand_2.sav en klik op Continue.

Opmerking: Je kunt ook eerst mergebestand_2.sav openen, dan staat het bestand bij "An open dataset". Zelf vind ik dat prettiger werken. Per saldo zijn er dan twee databestanden actief.

topknop

Resultaat

Het resultaat is onderstaand scherm:

Merge Files 05

Hierin is te zien dat

Klik dan op OK.

Een uitsnede uit het datascherm:

Merge Files 06

Je ziet dat er drie cases toegevoegd zijn aan het databestand.

Bovendien is de controle op het op de juiste wijze samenvoegen van de databestanden eenvoudig, doordat er gewerkt is met respondentennummers.

Voeg op dezelfde wijze mergebestand_3.sav toe aan het actieve databestand.
Sla het samengevoegde bestand nu op onder een gepaste naam. Hier is mergebestanden_totaal.sav gebruikt.

topknop

Merge Files, Add Variables

Als er variabelen worden toegevoegd, verrijk je als het ware de data. Je voegt dan data van verschillende databestanden samen tot één bestand. Bijvoorbeeld een databestand met antwoorden uit een vragenlijst met een databestand met achtergrondvariabelen, zoals sociaalgeografische data.

Belangrijk is hierbij dat je weet hoe deze data aan elkaar gekoppeld moeten worden. Daarvoor moeten er in elk bestand een of meer sleutelvariabelen zijn opgenomen; de zogenaamde Key Variables.

In dit voorbeeld worden twee databestanden gebruikt: mergebestand_4.sav en mergebestand_5.sav . Beide bestanden moeten in SPSS worden geopend. In de screenshots wordt hier ook van uitgegaan.

Het is altijd verstandig beide bestanden goed te bestuderen, voordat ze worden samengevoegd

mergebestand_4.sav mergebestand_5.sav
Add Variables 01 Add Variables 02

Beide databestanden bevatten een variabele 'respnr', de andere variabelen verschillen.

De variabele 'respnr' gaat gebruikt worden om de databestanden te koppelen. Hierbij is het essentieel dat de definities van 'respnr' in beide bestanden exact gelijk zijn. Dat betreft Variable Name, Type en Width.

Maak mergebestand_4.sav het actieve databestand en ga naar Merge Files via Data, Merge Files en Add Variables.

Add Variables 03

Selecteer mergebestand_5.sav en klik op Continue.

Add Variables 04

Selecteer respnr(+) en zet deze bij Key Variables.

Add Variables 05

Je ziet dan tevens dat respnr(*) verdwijnt uit het rijtje onder New Active Dataset.
Daarna kan er op OK worden geklikt.

Voor de volledigheid een uitsnede uit het resulterende databestand.

Add Variables 06

Enkele opmerkingen

  1. Aan elke case in mergebestand_4.sav, waarvoor er een respnr is, zijn de corresponderende gegevens uit mergebestand_5.sav toegevoegd. Hier is echter niet het gehele mergebestand_5.sav gebruikt.

  2. Als je mergebestand_5.sav had willen verrijken, had je voor de optie 'Active dataset is keyed table' moeten kiezen.

  3. In beide gevallen heeft het samengevoegde bestand de naam van het actieve bestand, hier mergebestand_4.sav. Sla het bestand onder een andere naam op als je het oorspronkelijke bestand wilt bewaren. Beter is het om al van tevoren een kopie te maken en hieraan de variabelen toe te voegen.

  4. Als je beide databestanden helemaal wilt samenvoegen, moet de optie 'Both files provide cases' gekozen worden. Tevens had er dan een vinkje gezet moeten worden bij 'Cases are sorted in order of key variables in both datasets'. Hierbij is het dus noodzakelijk dat er in beide bestanden op gelijke wijze gesorteerd is op de variabele 'respnr'. Sla na het sorteren beide bestanden overnieuw op, daarna kan de merge uitgevoerd worden!

  5. In versie 23 hoeft er bij eerste twee opties om variabelen toe te voegen niet gesorteerd te worden op de key variabele. In eerdere versies moet er per se wel eerst gesorteerd worden.

  6. Bij grote bestanden zou ik altijd sorteren op de key variabele(n) en een vinkje zetten bij 'Cases are sorted in order of key variables in both datasets'. Dat versnelt volgens mij het samenvoegen.

topknop