SOEP-Einführung: Erste Schritte mit dem SOEP

Vorbemerkung

Diese kleine Einführung in den SOEP-Datensatz wurde ausgelagert und gehört eigentlich zum Seminar: Datenanalyse mit SPSS für Fortgeschrittene: Das Sozio-oekonomische Panel - Sommersemester 2003 oder Multivariate Datenanalyse - Das Sozio-ökonomische Panel (SOEP) - Wintersemester 2006/2007

Die Seiten sind somit keine offiziellen SOEP-Seiten. Es können somit Fehler oder Ungenauigkeiten enthalten sein. Bitte schreiben Sie in diesem Fall eine E-Mail (Adresse siehe www.hinner.com).

Der SOEP-Datensatz ist nicht frei erhältlich. Um ihn zu erhalten, müssen Sie ein konkretes Forschungsprojekt durchführen und die Datenschutzerklärung unterschreiben. Näheres finden Sie unter http://www.diw.de/de/diw_02.c.222829.de/nutzung_des_soep.html

Achtung: Viele Informationen und Textsequenzen stammen direkt von der WWW-Seite des DIW - die Zitate sind nicht immer kenntlich gemacht worden.

Der Datensatz...

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung privater Haushalte in Deutschland. Sie wird im jährlichen Rhythmus seit 1984 bei denselben Personen und Familien in der Bundesrepublik durchgeführt. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Die Stichprobe umfaßte im Erhebungsjahr 2004 fast 12.000 Haushalte mit mehr als 22.000 Personen.

Das SOEP zeichnet sich durch eine hohe Kontinuität aus. 1984 beteiligten sich im SOEP-West 5921 Haushalte mit 12290 Personen an der Befragung;
nach 19 Wellen im Jahre 2002 sind es noch 3889 Haushalte mit 7175 Personen. Im SOEP-Ost wurden 1990 2179 Haushalte mit 4453 Personen befragt; 2002 gaben 3466 Personen in 1818 Haushalten Auskunft über ihre Lebenssituation. Die Zuwanderer-Stichprobe der Jahre 1994/95 behielt mit 402 Haushalten und 780 Personen im Jahre 2002 einen nahezu stabilen Umfang.
Von den 1932 Personen in 1067 Haushalten der Ergänzungsstichprobe E aus dem Jahre 1998 konnten im Jahre 2002 1373 Personen in 773 Haushalten wiederholt befragt werden.
Im Jahre 2000 wurde eine Erweiterungsstichprobe F gezogen, um auf Basis einer großen Fallzahl bessere Analysen kleiner Teilgruppen der Bevölkerung zu ermöglichen. Für das Jahr 2002 stehen dafür Informationen zu 8427 Personen in 4586 Haushalten zur Verfügung.

...für die Lehre

Die SOEP-Daten werden als Rohdaten sowie in SPSS-, SAS- und STATA-Format mit ausführlichen Arbeitsunterlagen auf CD-ROM weitergegeben.
Der Lehre-File des SOEP ist eine 50%-Zufallsstichprobe, das heißt, 50% der befragten Haushalte der jeweils ersten Welle einer Stichprobe wurden nachträglich zufällig aus dem Datensatz entfernt. Längsschnittanalysen können somit unproblematisch durchgeführt werden. Das Verfahren verzerrt die Ergebnisse nicht; selbstverständlich ist der Stichprobenfehler aufgrund der geringeren Fallzahl größer als im 100%-Datensatz.

Dokumentation

Kernstück der SOEP-Dokumentation ist das Desktop Companion (DTC). Das DTC (Herausgeber: J. Haisken-DeNew und J. Frick) ist die Hauptreferenz für die meisten Fragen zum SOEP. Es ist aus vielerlei Artikeln, Diskussionspapieren, und Seminar-Handouts gewachsen, um zentral an einer Stelle das SOEP zu dokumentieren. Die Basisstruktur der SOEP Daten, sowie die verschiedenen Daten-Extensions werden hier beschrieben. Sie können das DTC als pdf-Dokument online abrufen.

SOEPinfo ist ein Datenbank-gestütztes Informationssystem, über das man online die Variablen des SOEP heraussuchen kann. Außerdem lassen sich einfache Häufigkeitsauszählungen und Syntax-Scripts für die Variablen-Selektion einfach online erzeugen. Sie können SOEPInfo hier online starten.

Häufige Fragen und Antworten finden Sie in einer entsprechenden FAQ-Liste beantwortet. Diese läßt sich ebenfalls direkt beim DIW online abrufen.

Beispiele

Im folgenden einige Analysebeispiele, aufbereitet als Schritt-für-Schritt-Anleitungen. [Das folgende ist inzwischen korrigiert, die Zeilen habe ich aus historischen Gründen nicht entfernt und damit evtl. ähnliche Fehler einfacher behoben werden können. K.H., 14.1.2007]