»Wie kaum in einem anderen Land ...«? - Hartmut Esser - E-Book

»Wie kaum in einem anderen Land ...«? E-Book

Hartmut Esser

0,0

Beschreibung

Seit PISA 2000 gilt es als ausgemacht, dass die frühe Differenzierung der Bildungswege nach Fähigkeiten und Leistungen das Bildungsniveau nicht verbessere, sondern die soziale Bildungsungleichheit und -ungerechtigkeit verstärke, besonders in Deutschland. Das Fazit daraus war nahezu einhellig: Abschaffung der frühen Differenzierung und Übergang zu integrativen Schulen, auch ohne Gymnasium und Abitur. Immer schon gab es auch Einwände dagegen, sowohl bildungspolitisch als auch wissenschaftlich. Hartmut Esser zeichnet die Kontroverse nach und unterzieht sie einer systematischen empirischen Überprüfung. In Band 1 geht es um die verschiedenen Begründungen für und gegen die Differenzierung sowie eine theoretische Modellierung der Effekte von Bildungssystemen insgesamt und der Differenzierung speziell. Band 2 (Frühjahr 2022) betrachtet die empirischen Befunde und liefert eine empirische Untersuchung am Beispiel der deutschen Bundesländer. Das Ergebnis ist die deutliche Korrektur der gängigen Auffassung von der verstärkten sozialen Stratifikation durch eine stringente Leistungsdifferenzierung.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern
Kindle™-E-Readern
(für ausgewählte Pakete)

Seitenzahl: 568

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android
iOS
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Hartmut Esser

»Wie kaum in einem anderen Land …«?

Die Differenzierung der Bildungswege und ihre Wirkung auf Bildungserfolg, -ungleichheit und -gerechtigkeit. Band 1: Theoretische Grundlagen

Campus Verlag Frankfurt / New York

Über das Buch

Seit PISA 2000 gilt es als ausgemacht, dass die frühe Differenzierung der Bildungswege nach Fähigkeiten und Leistungen das Bildungsniveau nicht verbessere, sondern die soziale Bildungsungleichheit und -ungerechtigkeit verstärke, besonders in Deutschland. Das Fazit daraus war nahezu einhellig: Abschaffung der frühen Differenzierung und Übergang zu integrativen Schulen, auch ohne Gymnasium und Abitur. Immer schon gab es auch Einwände dagegen, sowohl bildungspolitisch als auch wissenschaftlich. Hartmut Esser zeichnet die Kontroverse nach und unterzieht sie einer systematischen empirischen Überprüfung. In Band 1 geht es um die verschiedenen Begründungen für und gegen die Differenzierung sowie eine theoretische Modellierung der Effekte von Bildungssystemen insgesamt und der Differenzierung speziell. Band 2 (Frühjahr 2022) betrachtet die empirischen Befunde und liefert eine empirische Untersuchung am Beispiel der deutschen Bundesländer. Das Ergebnis ist die deutliche Korrektur der gängigen Auffassung von der verstärkten sozialen Stratifikation durch eine stringente Leistungsdifferenzierung.

Vita

Hartmut Esser, Prof. Dr., lehrte an der Fakultät für Sozialwissenschaften der Universitä Mannheim Soziologie und Wissenschaftslehre.

Inhalt

Vorbemerkungen

Zum Buch

Teil I: Allgemeine Konzepte und theoretische Grundlagen

1.Der Streit um die Leistungsdifferenzierung

2.Der gesellschaftliche und institutionelle Rahmen

Der allgemeine Rahmen

Die Qualität des Bildungswesens

Drei Ziele: Effizienz, Gleichheit und Gerechtigkeit

Effizienz

Gleichheit

Gerechtigkeit

Eine Übersicht

Zielkonflikte

Effizienz und Gleichheit

Effizienz und Gerechtigkeit

Gleichheit und Gerechtigkeit

Bildung und der Konflikt um die »Leitkultur«

Die Inhärenz der Zielkonflikte: Zwei Konstellationen

Scheren- oder Matthäus-Effekte

Gleichheit und Effizienz

Das Interaktionssystem der Bildung

Bildungsverläufe

Leistung und Bildungsbeteiligung

Lernen und Leistung

Sortierung, Übergang und Bildungsbeteiligung

Das Grundmodell

Primäre, sekundäre und tertiäre Effekte

Raymond Boudon

Das CPO-Modell

»Education, Opportunity and Social Inequality«

Bildungssysteme und Systemeffekte

Varianten

Systemeffekte

Bildungssysteme und Gesellschaft

3.Lernen und Handeln

3.1Lernen und Handeln als Aktivität

Lernen und Handeln als »Produktion«

Effizienz

Wert-Erwartungstheorie

Lernen und Handeln als Investition

3.2 Rahmung und Routine

Die »Definition der Situation«

Relevanz und Salienz

Teil II: Das Interaktionssystem der Bildung

4.Kognitive Fähigkeiten, kognitive Entwicklung, Differenzierung und Stratifikation

4.1Fähigkeiten, Lernen und Leistungen

Potenzial und Passung

Aptitude Treatment Interaction

Motivation und Selbstkonzept

Das Modell

4.2Kognitive Entwicklung

Exposition, Passung und Entwicklung

Ein Beispiel: Die kognitive Entwicklung bei Migrantenkindern

Die Heckman-Hypothese

Die Ausschöpfung des Potenzials

4.3Kognitive Differenzierung und Stratifikation

Kognitive Differenzierung

Kognitive Stratifikation

Kumulative Vorteile

Strukturelle Stratifikation

Scheren- oder Matthäus-Effekte

Kollateral-Stratifikation

4.4Kognitive Fähigkeiten und das Interaktionssystem der Bildung

5.Familie und soziale Herkunft

5.1Soziale Herkunft und Bildungsungleichheit

5.1.1Ungleichheit als »Residuum«

5.1.2 Der soziale Gradient

Varianten

Kompensation und meritokratische Kontrolle

Änderungen

Primäre, sekundäre und tertiäre Effekte

Die Trennung der Effekte

Primäre Effekte und Übergangswahrscheinlichkeit

5.1.3Kausalmodelle

5.1.4Mediation und Moderation

Mediation

Beispiel 1: Suppressor-Effekte

Beispiel 2: Der Bildungstrichter

Moderation

5.2Korrespondenzregeln, Brückenhypothesen und die Erklärung der Effekte der sozialen Herkunft

Korrespondenzregeln: Theoretische Konstrukte und strukturelle Bedingungen

Brückenhypothesen: Strukturelle Bedingungen und soziale Herkunft

5.3Die Erklärung der Herkunftseffekte

5.3.1Lernen, kognitive Entwicklung und Leistungen

5.3.2Bildungsentscheidungen und Bildungsbeteiligung

Bildungsentscheidung als »Investition«

Aspirationen

Sekundäre Effekte und das Residuum der sozialen Herkunft

5.3.3 Der spezielle Einfluss der Familie: Das Verhältnis von primären und sekundären Effekten

Das CPO-Modell

Vergleich und Bewertung

Einordnung und Grenzen

5.4Familie, soziale Herkunft und das Interaktionssystem der Bildung

6.Schule und Schuleffekte

6.1Schuleffekte: Kontext- und Mehrebenen-Analyse

6.1.1Kontexte und Kontextanalyse

Schultypen und Schulformen

Ebenen

Kognitives Niveau und kognitive Homogenität

Soziale Stratifikation, Segregation und Segmentation

Kategorien, Kontexte und Kontext-Effekte

Drei Mechanismen

Eigenschaften von Kontexten

Zwei Besonderheiten

6.1.2Kontext-Effekte und Mehrebenen-Analyse

Verteilungs- und Kontext-Effekte

Varianzzerlegung und Ko-Varianz-Theorem

Kontext-Effekte: Varianten 1

Kontext-Effekte: Varianten 2

Eine Übersicht

6.1.3Fehlschlüsse, Schein- und Phantom-Effekte

Fehlschlüsse

Schein- und Phantomeffekte

6.2Schuleffekte 1: Urteile

6.2.1Urteile und Urteilsbildung

Objektivität und Fehlurteile

Ungenauigkeit und Diskriminierung

Urteilsbildung

Korrespondenzhypothesen und theoretische Erklärung

6.2.2Bewertungen und tertiäre Effekte

Kausale Vermittlung

Die Verteilung der Effekte

Fehlplatzierungen

Fehlbewertungen

Verallgemeinerungen

6.2.3Erwartungen, Selbstbild und self-fulfilling prophecies

Genese

Erwartungen und die Änderung des Unterrichts

Selbstkonzept

6.3Schuleffekte 2: Unterricht und peer-Kontakte

Strukturelle Bedingungen

Unterricht und peer-Effekte

Kognitive Differenzierung und soziale Stratifikation

6.4Schule, Schuleffekte und das Interaktionssystem der Bildung

Teil III: Das theoretische Modell

7.Bildungssysteme und Systemeffekte

7.1Drei Dimensionen

7.2Konstellationen und Kombinationen

Stringenz

Weitere Regelungen

Verbindlichkeit, Kontrolle und »Bildungsklima«

7.3Systemeffekte

8.Das Modell der Leistungsdifferenzierung

8.1Kognitive Differenzierung, Integration und soziale Stratifikation

»Nobility«-Tracking

Soziale Öffnung und Meritokratie

Leistungsbezug und Bildungsgerechtigkeit

Zwei Positionen

Zwei Hypothesen

8.2Das Modell der Leistungsdifferenzierung

8.2.1Allgemeine Bedingungen und Zusammenhänge

8.2.2Systemeffekte

Spezifische Regelungen

Die Stringenz der Differenzierung

8.2.3Varianten

Schul- und Systemeffekte

Konstellationen

8.3Alternativen

Interne Differenzierung

Frühe und späte Sortierung

Anzahl der Optionen

9.Hypothesen, Kausalmodelle und Caveats

9.1Hypothesen

9.2Das Kausalmodell der Leistungsdifferenzierung

9.3Kausalstrukturen und Kausalstrukturen

9.3.1Die drei Grundtypen von Kausalbeziehungen

9.3.2Spezifikation

Gemeinsame Ursache

Mediation

Collider

9.3.3Konditionierung

Was ist »Konditionierung«?

Konditionierung als Effektzerlegung

Das Grundprinzip

Varianten

9.3.4Caveats

Gemeinsame Ursache

Mediation

Collider

9.3.5Die Caveats und das Modell der Leistungsdifferenzierung

Literatur

Vorbemerkungen

Dieses Buch war so nicht geplant, schon gar nicht mit einem Umfang von zwei Bänden. Ausgangspunkt war vor inzwischen schon mehr als zehn Jahren das Vorhaben für eine State-of-the-art-Übersicht der Effekte von Bildungssystemen auf den Bildungserfolg von Migrantenkindern. Das schien eine klare Angelegenheit zu sein, die es nur noch einmal systematisch zu dokumentieren galt: Wie kaum in einem anderen Land der Welt, so hieß und heißt es weiter in fast jedem Beitrag, sei der Bildungserfolg so stark von der sozialen Herkunft bestimmt wie in Deutschland, gerade auch für die Kinder aus Familien mit Migrationshintergrund, und das noch einmal zusätzlich verschärft durch das dort besonders stark gegliederte Bildungssystem (vgl. die Anlage und Ergebnisse dieses Berichts bei Diehl, Hunkler und Kristen 2016). Und so sah es nach PISA 2000 mit – in dieser Breite erstmals – verlässlichen Daten zu den Leistungen am Ende der Sekundarstufe 1 im internationalen Vergleich ja auch aus: In den Ländern mit einer frühen und ausgeprägten Differenzierung der Bildungswege waren das Niveau der Leistungen nicht höher, eher geringer, aber die sozialen Ungleichheiten im Bildungserfolg deutlich stärker, und das in Deutschland in der Tat ganz besonders. Von der Differenzierung profitierten offenbar, wenn überhaupt, nur die ohnehin schon – nach Talent und Herkunft – Begünstigten, und das auch in der Form kumulativer Vorteile, den sog. »Matthäus«-Effekten. Das, was vielleicht als gut gemeinte Maßnahme der besseren Anpassung der Curricula und des Unterrichts an unterschiedliche Fähigkeiten und Interessen zugunsten aller gedacht war, gerate, so hieß es, ganz im Gegensatz zu den Intentionen zu einem meritokratisch nur verkleideten Instrument der Stratifikation und der Reproduktion von vertikaler Spaltung und Klassengesellschaft. So gut wie alle Übersichten kommen – davor wie danach – zu einem ähnlichen Schluss wie etwa Adam Gamoran (2009), einem der international bekanntesten Bildungsforscher schon seit langer Zeit:

»These findings are consistent with numerous single-nation studies showing that tracking tends to reinforce inequality. … What is striking about the variation in the forms of tracking, however, is that the results are broadly similar: where tracking systems are present, achievement tends to diverge, and to reinforce initial differences by social class.« (Gamoran 2009: 9; Hervorhebungen nicht im Original)

Man könnte die Auffassung als die nach wie vor in Öffentlichkeit, Politik und Wissenschaft weithin unbezweifelte Standardposition bezeichnen. Ihr Kern lautet – als Subtext oder auch ganz offen: Die frühe institutionelle Sortierung nach den Fähigkeiten und Leistungen, das Ability-Tracking, bringe, wenn überhaupt, nicht viel an Verbesserungen in Qualität und Niveau, sie sei vielmehr kaum etwas anderes als Mittel der Eliten, sich die Unterschichten vom Halse zu halten (Bol und van de Werfhorst 2014: 304), ein besonders raffiniertes sogar, führe zu nichts als zum »Klassenkampf im Klassenzimmer« (Solga und Becker 2012: 23) und verstoße womöglich sogar gegen grundlegende Verfassungsbestimmungen (Cremer 2012: 24 ff.) und auch völkerrechtliche Normen (Wrase 2013: 27 f.). Der Übergang auf die Integration und ein »längeres gemeinsames Lernen« wären daher der längst überfällige Schritt nicht nur zur Modernisierung der Gesellschaft und der Öffnung des Bildungssystems insgesamt, sondern besonders auch zur nachhaltigen Verringerung von Bildungsarmut und der Bekämpfung der sozialen Bildungsungerechtigkeit (vgl. etwa Geißler und Weber-Menges 2010: 557 ff.; Allmendinger 2012: 78 ff., 98 ff.; Agasisti et al. 2018 für die deutsche Abteilung der OECD). Großen Zweifel daran gab und gibt es nicht – bis in die neuesten Veröffentlichungen hinein, die bei aller sonstiger, vergleichsweise abwägender Bewertung mit großer Selbstverständlichkeit und gleich auch im Titel die ungerechte Gesellschaft mit ihrem darin zwingend ungerechten Bildungssystem anprangern und vor allem sozialpädagogische Maßnahmen als Abhilfe in den Mittelpunkt stellen, etwa bei El-Mafaalani (2020: 19).

Kaum einmal wird dagegen ein in der (früheren) Modernisierungssoziologie und Mobilitätsforschung selbstverständlicher Gesichtspunkt auch nur erwogen, nämlich dass gerade erst mit einer möglichst strikt auf die kognitiven Fähigkeiten und die Leistungen der Kinder bezogenen institutionellen Struktur der schulischen Organisation eigentlich unverdiente Nachteile und Vorteile gebremst oder auch ausgeglichen werden können. Denn dann würden die sozialen Segregationen ja eben nicht zunehmen: Die kognitiven Potenziale der »Intelligenz« sind zwar zwischen Individuen, nicht aber zwischen sozialen oder ethnischen Gruppierungen unterschiedlich – anders als das oft behauptet wird, etwa bei Herrnstein und Murray (1994) in ihrem umstrittenen Buch über »The Bell Curve«. Nicht die beliebige Öffnung der Schulen und Bildungswege, die den Familien aus den oberen und bildungsnäheren Schichten eine Nutzung ihrer strukturellen Vorteile noch weiter erleichtert, als sie es ohnehin schon können und tun, wäre danach die naheliegende Forderung zur Steigerung der Bildungsgerechtigkeit, sondern eine möglichst leistungsgerechte und sozial neutrale Aufteilung in unterschiedliche Zweige, verbunden womöglich mit Spezialisierungsgewinnen über die Anpassung der Curricula an die kognitiven Unterschiede und die mit der Homogenisierung eher mögliche Fokussierung des Unterrichts darauf. Um das offensiver zu vertreten, würde es aber, neben den diversen theoretischen Begründungen für und gegen das Ability-Tracking, einer klaren Befundlage bedürfen. Aber genau das ist das Problem: Es gibt die unzweideutigen Befunde nicht, weder für noch gegen die Standardposition. In einer besonders weit ausholenden Übersicht befindet Betts (2011) gerade auch angesichts der Befunde der internationalen Vergleichsstudien nur wenig später nach Gamoran (2009):

»In spite of many decades of research, what we do not know about the effects of tracking on outcomes greatly exceeds what we do know.« (Betts 2011: 375; Hervorhebungen nicht im Original)

Das kann man wohl sagen. Und es ist nicht neu. Seine klassische Begründung für die frühe Differenzierung beginnt z.B. Sörensen (1970) über die bis dahin vorliegenden Übersichten so:

»It is a common conclusion in these surveys that no coherent pattern of results emerges from the existing research.« (Sörensen 1970: 356; Hervorhebungen nicht im Original)

Man findet das auch später und immer wiederkehrend in den Übersichten, etwa bei Kulik und Kulik (1982, 1984) oder bei Slavin (1987, 1990) oder neueren Datums bei Deunk et al. (2015). Als Grund vermutet Betts insbesondere methodische Probleme:

»Our uncertainty reflects not only the usual methodological debates about causal inference, but also, and perhaps more fundamentally, quite poor measures of tracking combined with differences across countries in what tracking really means.« (Betts 2011: 375)

Es ist aber wohl noch etwas anderes. Sörensen erwähnt es damals schon:

»Nearly all studies relate a pattern of organizational differentiation to achievement or some other performance measure, without describing the mechanisms that would account for the predicted relationship. Relevant intervening variables are ignored and the possibility of stating the conditions under which a given result is to be expected is bypassed.« (Sörensen 19070: 356)

Es genügt also nicht, die empirischen Effekte bestimmter Regeln eines Bildungssystems z.B. gegen unbeobachtete Heterogenität und Messfehler abzusichern und auf ihre Robustheit gegen allerlei Heterogenitäten nach anderen Variablen und mit den allerneuesten ökonometrischen Verfahren über immer wieder andere Datensätze und Vergleiche zu testen, man muss vielmehr zuerst einmal theoretisch wissen, warum ein bestimmter Effekt eigentlich zu erwarten wäre und welche Bedingungen und Vorgänge dabei zusammenspielen, was evtl. bei einer empirischen Untersuchung fehlt und womöglich zu falschen Ergebnissen geführt hat, die sich, wenn man die gleichen Fehler macht, natürlich auch in Replikationen und Meta-Analysen zeigen, und zwar sehr robust.

Eigentlich hätte das schon lange auffallen müssen. In den Daten der internationalen Vergleichsstudien bei den Analysen der Systemeffekte waren zwar die soziale Herkunft (in unterschiedlichen Operationalisierungen) als wichtiger Faktor für die Erklärung von Unterschieden in Bildungsbeteiligung und Leistungen erfasst, auch die Schulklassen und deren soziale Zusammensetzung. Aber es fehlte der für jede Erklärung des schulischen Geschehens unverzichtbare Kernaspekt: die neben allen anderen Talenten und Begabungen gerade für die Vorgänge und die Bestimmung der empirischen Zusammenhänge entscheidenden kognitiven Fähigkeiten der Kinder. Und entsprechend fehlte auch die Berücksichtigung der kognitiven Zusammensetzung der Schulklassen nach Niveau und Homogenität, über die doch alle Effekte der Differenzierung verlaufen und vermittelt werden. Die Verbesserung der Lerneffizienz über Anpassungs- und Spezialisierungsgewinne aber war von Anfang an der Kern der Argumente für die Differenzierung der Bildungswege gewesen (so Sörensen 1970 insbesondere): Wenn die Schulklassen mit einer – möglichst objektiv und strikt – nach den Leistungen vorher vorgenommenen Aufteilung in der Zusammensetzung nach den kognitiven Fähigkeiten und den damit verbundenen inhaltlichen Neigungen strukturell homogener werden, dann können die Curricula passgenauer und der Unterricht leichter auf die jeweiligen Inhalte und Anforderungen ausgerichtet und fokussiert werden – mit der Folge, dass es bei den Leistungen zu einer Steigerung kommen kann, ohne dass der Aufwand sonderlich zunähme. Und vor allem: ohne dass soziale Stratifikationen entstehen – wenigstens nicht über das hinaus, was es daran schon ohnehin und überall gebe. So gesehen wäre die Differenzierung eigentlich nichts anderes als ein erster, wenngleich nur recht grober Schritt hin auf eine – wünschenswerte und auch immer wieder eingeforderte – »Individualisierung« des Unterrichts: die strukturell verankerte Berücksichtigung der Unterschiedlichkeiten und Besonderheiten in den kognitiven Fähigkeiten und in den damit verbundenen inhaltlichen Neigungen der Kinder, nicht zuletzt auch in Hinsicht auf die besonderen Probleme der Kinder aus den schwierigeren Verhältnissen.

PISA 2000 schien nun genau das aber empirisch deutlich zu widerlegen: Leistungsgewinne für die differenzierenden Länder zeigten sich eher nicht oder nur für die schon Begünstigten, aber eine Verschärfung der sozialen Unterschiede in Bildungsbeteiligung und Leistungsniveau. Untersucht wurden in der Folge letztlich nur diese beiden Einflüsse: der allgemeine Effekt der sozialen Herkunft der Kinder auf die Leistungen in der Sekundarstufe und die Unterschiede dieses Zusammenhangs, des sozialen Gradienten, zwischen verschiedenen Ländern und Bildungssystemen. Es ist der Kern der PISA-Berichte und ähnlich angelegter Dokumentationen, etwa die IQB-Berichte für die deutschen Bundesländer. Variiert wurden die Auswahl und die Zuordnung der Länder zu bestimmten Typen von Bildungssystemen, weitere Kontrollvariablen, etwa Migrationshintergrund oder Vorschulbesuch, und die Verfahren der Kontrolle auf unbeobachtete Heterogenität zwischen den Ländern. Nur wenigen aber fiel, wie gesagt, auf, dass das, so dezidiert jedenfalls, wohl nicht ausreichen konnte oder auch ganz danebenlag. Erwähnt wurde gelegentlich zwar etwa, dass man eigentlich Daten auch zum Vorgang der Sortierung in die verschiedenen Bildungswege benötige, etwa die Leistungen vorher oder die Noten oder die Empfehlungen, ganz zu schweigen von den kognitiven Fähigkeiten, weil ansonsten ein schon gravierender Selektivitäts-Bias drohe: die Fehldeutung der Unterschiede aus der bloßen Verteilung auf unterschiedliche Schultypen als eigene Effekte der Differenzierung, ein bei Mehrebenenmodellen gern aufkommender Fehler. Aber das blieben eher unbeachtete Ausnahmen. Folgen hatte das für die Selbstverständlichkeit der Standardposition weiter nicht. Kein Wunder: Ein explizites theoretisches Modell der Begründung für die Systemeffekte der Differenzierung und der Folgen unterschiedlicher Regeln der Verteilung, das auf solche und andere Lücken und mögliche Fehlspezifikationen hätte hinweisen können, gab es nicht. Was man hatte, waren lange Listen von Effekten der verfügbaren Variablen, an denen sich die folgenden Analysen orientierten und sich dann andere wiederum abarbeiteten, die dann nicht viel mehr fanden als immer wieder die Standardposition. Kein Wunder.

Kurz: So recht glauben mochte man den kritischen Stimmen angesichts der Sicherheit, mit der die Standardposition weiter vertreten wurde, nicht, aber ein unbestimmtes, aber durchaus deutliches Unbehagen blieb, aber auch gewisse, durchaus nicht interessefreien Routinen der etablierten Bildungsforschung und eingefahrene Muster in den Redaktionen der Feuilletons, wenn es wieder einmal so weit war mit PISA und anderen Berichten.

Den eigentlichen Anlass zu einem dann doch ernsthafteren Überdenken der Standardperspektive gab im Zuge der Arbeiten an dem angesprochenen Berichtsprojekt ein zunächst höchst sonderbar erscheinendes Resultat in einer erst etwas später zugänglich gewordenen (PhD-)Arbeit von Allison Dunne von 2010 am European University Institute in Florenz (Dunne 2010), einem der Zentren der empirischen Bildungsforschung, und mit Gutachern aus der ersten internationalen Klasse, denen man schon ein Urteil zutrauen konnte. Es betraf die Schuleffekte: die Einbeziehung der Schulen bzw. der Schulklassen als eine eigene Ebene und die Effekte der Zusammensetzung nach bestimmten Eigenschaften der Schüler. Nach den Begründungen für die Differenzierung wäre das, wie gesehen, unverzichtbar gewesen, denn die Systemeffekte wirken ja erst über die strukturellen Veränderungen in der Zusammensetzung der Schulklassen und einem entsprechend angepassten Unterricht. Auch mit den PISA-Daten schon wäre der Einbezug von Schuleffekten im Prinzip möglich gewesen, aber es wurde (bis dahin) nicht gemacht, teilweise und auch heute noch mit Argumenten begründet, die schon mehr als unverständlich sind: Die Vermittlung der Systemeffekte über die Schul(-klassen)-Effekte würde nicht interessieren, weil nur der sog. »totale« (System-)Effekt wichtig sei, es käme mit der Berücksichtigung der Schulklassen zu statistischen Überkontrollen und es könne sich obendrein sowieso nur um »Phantom«-Effekte handeln, resultierend aus der Überschreibung von Messfehlern bei der Aggregation der individuellen Eigenschaften der Schülerinnen und Schüler zu einem analytisch aggregierten Kontextmerkmal.

Nun gut. Allison Dunne hatte es einfach mal probiert – und die prominenten Gutachter in Florenz hatten es offenbar passieren lassen. Und was zeigte sich? Innerhalb der Schulklassen drehte sich der Herkunftseffekt auf die Leistungen in der Sekundarstufe. Es sah also danach so aus, als begünstige ein integriertes System in den Schulklassen die oberen sozialen Schichten bei den Leistungen, bzw. als wäre ein differenziertes System für die Kinder aus den unteren Schichten besser, geradezu also das Gegenteil der Standardposition (Dunne 2010: 92 ff., Abbildungen 4.2 bis 4.5). Daran anschließend hat Jaap Dronkers, ein international wirklich bekannter Bildungssoziologe aus den Niederlanden, der Doktorvater der Arbeit von Allison Dunne in Florenz, zusammen mit seinem Kollegen Rolf van der Velden und Allison Dunne, der Entdeckerin des Effekts, eine Reihe von (Diskussions-)Papieren mit entsprechenden Analysen der PISA-Daten zu diesem dann auch als DVD-Ansatz bezeichneten Vorgehen mit der Einbeziehung der Schulklassen als dritter Ebene geschrieben und versucht, sie in der Debatte um die Bildungssysteme zu etablieren (Dronkers et al. 2011, 2012). Das ist allerdings so gut wie ganz misslungen: Einige lehnten es strikt ab, sich überhaupt mit der Ebene der Schulklassen zu befassen, und machten einfach ohne die Schuleffekte und mit den »totalen« Effekten weiter, andere rechneten schlichtweg beide Modelle parallel und ließen es so stehen, die meisten aber haben die Diskussion, bis heute, erst gar nicht wahrgenommen – als ob es nichts ausmache, ob man die Schulklassen berücksichtigt oder nicht und sich die Differenzierung einmal verstärkend und einmal abschwächend auf den Herkunftseffekt auszuwirken scheint.

Was jetzt? Auf jeden Fall erschienen die so eigenartigen und widersprüchlichen Befunde so oder so als ein äußerst interessantes wissenschaftliches Puzzle, theoretisch, methodisch, empirisch, auch wissenschaftssoziologisch, und eine engere Zusammenarbeit in der Aufklärung der Sache mit Jaap Dronkers, der sich der wissenschaftlichen Popularisierung seines, wie er es nannte, Drei-Ebenen-Modells der Systemeffekte verschrieben hatte, war die Folge. Bald wurde allerdings in dieser Zusammenarbeit klar, dass die Interpretation, die Herkunftseffekte würden sich mit dem Einbezug der Schulklassen bei Differenzierung verringern, selbst wieder ein leicht zu durchschauender Fehlschluss war, diesmal ein statistischer: Mit der Aufteilung in Schultypen und Schulklassen nach den Leistungen gibt es eine Trennung der Gesamt(-Ko)-Varianz der Beziehung zwischen sozialer Herkunft und den Leistungen: in einen Anteil zwischen den Schulklassen und einen innerhalb. Und wenn es überhaupt eine Zwischengruppen(-Ko)-Varianz aus der Sortierung nach den Leistungen gibt, dann muss die Binnengruppen(-Ko)-Varianz innerhalb der Schulklassen im Vergleich zur Gesamt(-Ko)-Varianz statistisch kleiner werden – u.U. sogar negativ, nämlich wenn es eine starke Zwischengruppen(-Ko)-Varianz gibt, wie das ja gerade bei einer strikten Sortierung nach der sozialen Herkunft der Fall sein müsste. Aber DVD hatten nur auf die Binneneffekte der sozialen Zusammensetzung geachtet und nicht auf den Gesamteffekt, der auch die Zwischeneffekte der Sortierung vorher einschließt. Wenn man das berücksichtigte, kam eigentlich weiter heraus: Ja, es bleiben die Effekte der sozialen Herkunft bei den Individuen innerhalb der Schulklassen, sie sind auch kleiner als der »totale« Effekt der Differenzierung, aber es gibt weiterhin starke Unterschiede nach der sozialen Zusammensetzung der Schulklassen.

Das wäre also alles eigentlich weiter auf der Linie der Standardposition. Aber das einmal geweckte Unbehagen blieb, und die hinter diesen ganzen Nebelstochereien stehende Frage stellte sich nun erst recht: Müsste man nicht jetzt erst einmal das eigentlich schon von Anfang an benötigte theoretische Modell zu den Effekten der Differenzierung bauen, das auf allgemein gut bewährten Zusammenhängen beruht, etwa einer Lerntheorie für die Erklärung der Leistungen und einer Handlungstheorie für die Bildungsentscheidungen der Eltern und für den Einsatz des Lehrpersonals bei der Objektivität der Bewertungen und dem Engagement im Unterricht? Und könnte man dann nicht erst die benötigten Konstrukte und Variablen benennen und zuordnen, was eine systematische Ableitung spezieller Hypothesen zu den verschiedenen Effekten erst erlauben würde und darüber etwas mehr Ordnung in die zahllosen Ad-hoc-Hypothesen der Bildungssystem-Forschung bringen könnte? Und – wer weiß? – vielleicht zeigt sich ja dann, wenn man alles auf den Tisch legt, was zur Erklärung von Bildungsbeteiligung und Leistungen und den Effekten des Ability-Tracking noch nötig ist und zur Gewinnung eines klareren Bildes gefehlt hat: Ein übergreifendes theoretisches Modell der Leistungsdifferenzierung.

So wurde, von Anfang an in engem Kontakt mit Jaap Dronkers und Jan Skopek, der mit ihm in Florenz zusammenarbeitete, mit einer theoretischen Modellierung zur Erfassung der Systemeffekte von Bildungssystemen allgemein begonnen. Das Ergebnis war das inzwischen so genannte »Model of Ability Tracking«, abgekürzt als »MoAbiT« (vgl. die ersten Versionen bei Esser 2016a, b, c und d). Die beiden zentralen Änderungen zum Standardansatz sind die Berücksichtigung nun auch der kognitiven Fähigkeiten, wie das durch die frühen Begründungen der Differenzierung unabdingbar erschien, und die der entsprechenden Schuleffekte der kognitiven Zusammensetzung der Schulklassen nach Niveau und Homogenität. Das Grundargument folgt – explizit wie implizit – der Argumentation bei Sörensen (1970). Das Modell verbindet vor diesem Hintergrund drei Vorgänge, die ansonsten meist jeweils für sich angegangen wurden: die Sortierung bzw. die Bildungsbeteiligung nach dem Ende der Grund-Pflichtschule, die damit ggf. verbundenen Änderungen der Strukturen in Schulen und Schulklassen in ihrer kognitiven und sozialen Zusammensetzung, speziell nach Niveau und Homogenität, und damit in den schulischen Lernbedingungen, der Lerneffizienz und schließlich der Leistungen. Diese Verbindung ist der Kern des Modells.

Die meist separat gehaltene Analyse der drei Aspekte ist vermutlich einer der Gründe dafür, dass es nie so recht vorangegangen ist mit der Identifikation der Systemeffekte der Differenzierung. Man erkennt das gut an den beiden Traditionen der Untersuchung von Systemeffekten der Differenzierung: Die soziologische Mobilitätsforschung mit ihrer Konzentration nahezu allein auf die Bildungsbeteiligung und die neuere empirische Bildungsforschung in der Folge der internationalen Vergleichsstudien vor allem ebenso ausschließlich fast auf die Leistungen. Die Effekte auf die kognitive und soziale Zusammensetzung und deren Folgen für die Leistungen werden in beiden Traditionen kaum behandelt, schon gar nicht als systematische Brücke der Mediation und Moderation der Effekte bestimmter Regeln schon gleich zu Beginn oder auch schon vorher in Antizipation dessen, was noch kommen kann.

Mit der Entwicklung des MoAbiT und seinen Implikationen für die möglichen Fehlinterpretationen der verschiedenen Befunde wurde nun endgültig auch theoretisch klar, dass man weder auf den Einbezug der kognitiven Fähigkeiten noch auf die Schuleffekte und die kognitive Zusammensetzung der Schulklassen nach Niveau und Homogenität verzichten kann. Damit aber trat jene andere Frage immer stärker drängend in den Vordergrund: Mit welchen Daten und Analysen könnte man das inzwischen sich abzeichnende theoretische Modell denn auch empirisch testen? Wenn nicht mit den internationalen Vergleichsstudien, in denen insbesondere die kognitiven Fähigkeiten fehlen, dann vielleicht im Vergleich von einzelnen Schulen innerhalb bestimmter Distrikte, in denen integrierte wie differenzierende Schulformen als Optionen zu Verfügung stehen? Oder Regionen mit unterschiedlichen Regeln der Differenzierung, die Schweiz etwa mit ihren Kantonen oder Deutschland mit seinen 16 Bundesländern und seinen schon sehr unterschiedlich geregelten Bildungssystemen? Jaap Dronkers begann das mit einem Vergleich von »selektiven« mit »nicht selektiven« Schulen in den Niederlanden, was eine schwierige Sache ist, weil man, wie bei den Integrierten Gesamtschulen in Deutschland, die internen Differenzierungen in den integrierten Schulen nachstellen müsste, was fast unmöglich ist und mit Querschnittsuntersuchungen ganz ausgeschlossen.

Dann war 2015 die erste Welle der Startkohorte 3 der »National Educational Panel Study« (NEPS), einem breit angelegten Programm zur längsschnittlichen Verfolgung der Bildungswege und der dabei beteiligten Bedingungen und Vorgänge, eine Frucht auch des PISA-Schocks, verfügbar, die den Übergang von der Grundschule in die Sekundarstufe 1 nachbildete. Jaap Dronkers versuchte es damit, zusammen mit Jan Skopek, damals noch in Florenz (Dronkers 2015, Skopek und Dronkers 2015). Das Ergebnis: Die kognitiven Fähigkeiten saugen in der Tat einen Teil der Herkunftseffekte auf, erklären aber lange nicht alles, aber in den strikter differenzierenden Bundesländern ist der Herkunftseffekt tatsächlich geringer als in den eher offenen. Es fehlte allerdings noch der nächste Schritt: die Entwicklung bei den Leistungen. Wir selbst hatten uns inzwischen die BiKS-Studie vorgenommen, einen Vergleich von Hessen mit Bayern, zwei Bundesländern mit deutlich unterschiedlichen Regelungen der Differenzierung, eine Art von Vorläufer zum NEPS. In dem BiKS-Vergleich zeigte sich ebenfalls schon eine klare Bestätigung des MoAbiT: Mit der Stringenz der Differenzierung (in Bayern) steigen (im Vergleich zu Hessen, einem Land mit einem im Vergleich offenen System) die Leistungen insgesamt, der Effekt der kognitiven Zusammensetzung der Schulklassen wird stärker, aber jener der sozialen Herkunft bleibt unverändert, er sinkt in der Tendenz mit der strikten Differenzierung eher (Esser und Relikowski 2015). Alles, wie erwartet – und gegen die Annahmen der Standardposition.

Mitten in diesen Arbeiten starb Jaap Dronkers ganz unerwartet im Frühjahr 2016. Der gemeinsam eingeschlagene Weg wurde nun erst recht weitergegangen. Und rasch zeigte sich, dass so gut wie alles auf der gleichen Linie und in einem fast schon verdächtigen Einklang sowohl mit den theoretischen Überlegungen wie mit den bisherigen Analysen war. Im Herbst 2016 gab es dann einen ersten ausführlichen, nicht veröffentlichten Bericht zu den NEPS-Analysen (Esser 2016d), allerdings immer noch unter gewissen Vorbehalten der weiterhin beim NEPS nötigen Datenaufbereitungen dieses doch sehr anspruchsvollen und extrem sorgfältig verwalteten Projektes. Nach intensiven Prüfungen und der Klärung einer Reihe kritischer Punkte liegen inzwischen die Befunde zu den beiden zentralen Aspekten von Bildungserfolg, Bildungsgleichheit und Bildungsgerechtigkeit, auch in publizierter Form vor: die Effekte einer strikt nach den kognitiven Fähigkeiten und Leistungen vorher vorgenommenen Differenzierung auf die Bildungsbeteiligung, auf die Homogenisierung der Schulklassen und auf die Leistungen in der Sekundarstufe (Esser und Hoenig 2018, Esser und Seuring 2020). Die Analysen beziehen sich auf den Übergang von der 4. in die 5. Klasse für die Bildungsbeteiligung und auf die 7. Klasse zwei Jahre danach für die Leistungen, also früher als bei den üblichen Beiträgen zum ersten Übergang. Das wird nun ausgearbeitet und nach Möglichkeit weitergeführt.

Das Buch ist die auf zwei Bände aufgeteilte Zusammenfassung der zentralen theoretischen Überlegungen und empirischen Befunde zu den Effekten einer Differenzierung, die die Bezeichnung »Ability«-Tracking wirklich verdient, entlang der skizzierten Linie des MoAbiT. Das wohl wichtigste Ergebnis ist die schon deutliche Korrektur der Standardposition, nicht nur empirisch, sondern, was besonders schwer wiegen dürfte, auch der angenommenen theoretischen Argumente zur Begründung der Differenzierung, die in der Zwischenzeit so gut wie ganz in Vergessenheit, wenn nicht: in Verruf, geraten waren: Wenn bei der Sortierung, beim Übergang und bei der Zusammensetzung der Schulklassen mehr auf die kognitiven Fähigkeiten und Leistungen der Kinder geachtet wird, dann steigen die Leistungs-Gerechtigkeit bei der Bildungsbeteiligung und das Niveau in den Leistungen danach, ohne dass sich der Einfluss anderer Merkmale, wie jener der sozialen Herkunft, verändert oder gar verstärkt – und das gerade bei den Kindern unter den schwierigeren Verhältnissen und in den nicht-akademischen Bildungswegen.

Nach wie vor beherrscht die Standardposition die Debatten, und die Reaktionen darauf, wenn etwas anderes gefunden wird, sind meist ziemlich aufgeregt, und es fehlt auch nicht an Hinweisen, dass etwas anderes als die Botschaft, dass Leistungsdifferenzierung und soziale Stratifikation enge Verwandte sind, nicht leicht zu verstehen, geschweige denn zu akzeptieren ist. Auch weil den dabei vorgebrachten Argumenten bis in oft kaum noch unüberschaubare Einzelheiten nachzugehen war, hat es so lange gedauert. Die theoretischen Argumente und empirischen Befunde passen, dem kann man sich nicht verschließen, gewiss auch so gar nicht in die Zeit, und ob sich aufgrund der Ergebnisse etwas ändern wird, ist mehr als fraglich. Darauf aber kommt es auch nicht an. Der Beitrag ist, wie die Wissenschaft allgemein, nicht so gedacht, dass daraus gleich wieder diese oder jene »Reform« folgen müsste, das gewiss auch, weil die schulischen Leistungen, um die es hier letztlich geht, nur einen Ausschnitt aus dem weiten Bereich der Aufgaben des »Bildungswesens« eines Landes darstellen. Es ist aber auch nicht nur ein weiterer Robustheitstest, bei dem man nur und letztlich blind darauf sieht, ob sich empirisch etwas wiederholt, was vorher untersucht und gefunden wurde, und wo man sich freut, wenn sich nichts geändert hat. Es ist eher so etwas wie eine wissenschaftstheoretische und -soziologische Fingerübung in der Form einer, wie man sagen könnte, korrigierenden Replikation: Was wäre wohl, vor allem aus den PISA-Studien und dann gerade auch für Deutschland, herausgekommen, wenn man gleich ein korrekt spezifiziertes theoretisches Modell und die erforderlichen Daten gehabt und die ggf. sehr unterschiedlichen Regelungen der Differenzierung zwischen und innerhalb der Länder stärker beachtet hätte?

Mehr war unter den gegebenen Umständen kaum möglich. Aber auch nicht weniger. Womöglich stellen sich die Dinge aber auch mit noch anderen theoretischen Argumenten, Daten und Analysen noch anders dar als hier. Das ist nie auszuschließen, besonders in diesem auch institutionell komplizierten Feld mit einem beständigem Wandel, etwa wenn es einmal auch die entsprechenden Vergleiche zu den integrierten Schulen mit internen Differenzierungen, den Integrierten Gesamtschulen in Deutschland etwa, oder eine »International Educational Panel Study« gibt, die alles enthält, von dem man weiß, dass es unerlässlich ist. Das wird abzuwarten sein. Man fragt sich freilich schon, warum es denn so lange hat dauern müssen: Dass die Standardposition nicht das letzte Wort gewesen sein konnte, hätte seit den frühen Begründungen, bei Sörensen etwa, und dem, was dann im Zuge von PISA vor allem kam, eigentlich schon länger auffallen müssen.

Viele haben das Projekt begleitet, manche auch mit mehr oder weniger großer Distanz. Ihnen allen sei gedankt, den kritischen Stimmen ganz besonders, denn sie sind es meist, die zeigen, wo und welche Leichen noch im Keller liegen könnten, und wo man noch genauer ausleuchten müsste, was bisher unentdeckt blieb. Deshalb hat alles zwar länger gedauert als zunächst avisiert und ist auch an Umfang mehr geworden als gedacht, aber es hat sich wirklich gelohnt. Zu nennen sind u.a. Claudia Diehl, Jörg Dollmann, Allison Dunne, Aladin El-Mafaalani, Christian Hunkler, Roxanne Korthals, Cornelia Kristen, Clemens Kroneberg, Hanno Kruse, Nele McElvany, Heiner Meulemann, Walter Müller, Amelie Mummendey, Guido Schwerdt, Steffen Schindler, Jan Skopek und Susanne von Below. Zu danken und zu gedenken ist aber vor allem Jaap Dronkers, der zuerst auf die Spur gekommen war, dass etwas nicht stimme könne mit der Standardposition und den Ländervergleichen mit PISA, und mit dem es in tastenden Schritten dann weiter ging, auch immer mit dem Blick darauf wie man die theoretischen Ideen auch empirisch umsetzen könne, wenn es denn mit den gewohnten Daten und Annahmen nicht ging. Seine Begleitung und Unterstützung und sein unerschöpfliches Wissen über viele Details eines wirklich weiten Feldes haben, nicht nur mir, danach ganz besonders gefehlt. Wichtig waren darüber hinaus der Austausch mit Ricarda Steinmayr über die Bedeutung und die Möglichkeiten der verlässlichen Identifikation der kognitiven Potenziale der Kinder. Und mit Roland Grüttner, der, von einer ganz anderen Seite herkommend, viele der Argumente gegen die Differenzierung klarer und zugänglicher gemacht hat, besonders auch aus der Sicht der alltäglichen Arbeit in den Schulen, mit dem aber, ganz anders als sonst in dieser Debatte, eine argumentative und sachliche Klärung auch über gewisse Barrieren an Voreinstellungen möglich wurde. Janna Teltemann schließlich war immer da, wenn man etwas aus den Untiefen der PISA-Daten näher wissen wollte. Und Michael Kühhirt hat mit großer Geduld dabei geholfen, die zunächst doch etwas ungewohnten Gedanken zum Counterfactual-Ansatz zu verstehen. Ganz besonders zu danken aber ist den Mitautor:innen bei den drei Publikationen, die im Zuge der Arbeiten nach und nach entstanden sind. Sie haben weit über ihre Expertise der oft verwickelten Pfade des Standes der Forschung und des NEPS hinaus zur Entwicklung, Korrektur und diskursiven Absicherung der Überlegungen, methodischen Entscheidungen und inhaltlichen Folgerungen neben allen sonstigen Verpflichtungen ihres akademischen Alltags beigetragen. In der zeitlichen Reihenfolge der Beteiligung und der Publikationen: Ilona Relikowski und Kerstin Hoenig in den früheren Phasen und dann später ganz besonders Julian Seuring mit seinen vielen punktgenauen und unbestechlichen Hinweisen bei der Klärung und Präzisierung der theoretischen Argumentation und ihrer empirischen Umsetzung. Ohne sie wäre alles rasch steckengeblieben. Sie zählen zu dem, was ich in diesem Zusammenhang gerne inzwischen als das Bamberger Milieu bezeichne, getragen zuerst von den Begründer:innen und Verantwortlichen des NEPS, darunter speziell Hans-Peter Blossfeld und Sandra Buchholz, die die Entwicklung des Ansatzes von Anfang unterstützt haben, sowie, auch stellvertretend für alle anderen, Daniel Fuß vom NEPS, sowie verschiedenen anderen Kolleg:innen im weiteren Bereich der Universität Bamberg, die ein Zentrum der Bildungsforschung erstellt haben und tragen, das wohl seinesgleichen sucht. Auch das: wie kaum in einem anderen Land!

Zum Buch

Das Buch erscheint in zwei Bänden. Der erste Band befasst sich mit den konzeptionellen, theoretischen und methodischen Grundlagen zur Erklärung von Unterschieden im Bildungserfolg und von Effekten der Differenzierung nach den Fähigkeiten und Leistungen. Der Kern ist ein allgemeines theoretisches Modell zur Erklärung von Systemeffekten der Differenzierung im Vergleich zu integrierten Systemen. Daraus ergeben sich die grundlegenden Hypothesen als Ausgangspunkt und Richtschnur für die Systematisierung der vorhandenen empirischen Befunde und des Ansatzes für die eigene empirische Untersuchung. Darüber geht es dann im zweiten Band: die empirischen Ergebnisse. Sie beziehen sich auf zwei Hintergründe: eine Synopse und theoretische Systematisierung der wichtigsten bisherigen Befunde zu den Systemeffekten der Leistungsdifferenzierung und die Ergebnisse aus einer eigenen empirischen Untersuchung über einen Vergleich der deutschen Bundesländer mit ihren deutlich variierenden Regelungen von einer hohen Stringenz der Differenzierung bis hin zu Verhältnissen, die einer vollen Öffnung und Integration schon sehr nahe kommen. Es ging nicht anders: Keine der Studien zum internationalen Vergleich enthält die nötigen Daten, um das theoretische Modell zu überprüfen und festzustellen welche Effekte denn nun die (frühe) Differenzierung nach den Fähigkeiten hat. Aber schon das ist mehr als nur eine Notlösung mit bloß vorläufiger Geltung. Heraus gekommen ist jedenfalls eine deutliche Korrektur der Standardposition: Mit der Stringenz der Leistungsdifferenzierung wird die Bildungsbeteiligung leistungsgerechter, die kognitive Homogenität der Schulklassen nimmt über das durch die bloße Aufteilung erzielte Maß zu und das Niveau der Leistungen steigt auch dadurch, besonders in den unteren Leistungsbereichen, aber die Einflüsse der sozialen Herkunft verstärken sich nicht, eher im Gegenteil. Gewiss sind nicht alle Fragen zu klären gewesen, etwa wie es bis zum Ende der Pflichtschulzeit weiter geht, ob die Effekte anhalten, wenn sich die Strukturen etabliert haben und es in die Pubertät geht, was mit den später differenzierenden Ländern ist oder mit den Integrierten Gesamtschulen. Das wird man dann sehen: Eins nach dem anderen.

Teil I: Allgemeine Konzepte und theoretische Grundlagen

1.Der Streit um die Leistungsdifferenzierung

Es gibt praktisch kein Land der Welt ohne soziale Bildungsungleichheiten, aber es finden sich auch beträchtliche Unterschiede darin. Sie beziehen sich sowohl auf die Bildungsbeteiligung wie auf die Leistungen in der Sekundarstufe und danach. Von den verschiedenen Hypothesen darüber wurde von Beginn an auf Effekte der unterschiedlichen Bildungssysteme verwiesen, insbesondere auf die (frühe) Differenzierung in getrennte Schultypen nach Fähigkeiten und Leistungen (»Ability«-Tracking) gegenüber der Integration eines ggf. bis zum Ende der Pflichtschulzeit ununterbrochenen »gemeinsamen Lernens« (vgl. für die aktuelleren Übersichten bei Blossfeld et al. 2016, Part I: 1 ff.; Gross et al. 2016: 11 ff., Triventi et al. 2016: 3 ff., Dollmann 2019, Kapitel 4; Skopek et al. 2019, Kapitel 5; s. auch schon die Vorbemerkungen).

Als Begründung für die Differenzierung wird angenommen, dass eine Homogenisierung der schulischen Lernumgebung nach den kognitiven Fähigkeiten den Lernerfolg verbessere, nämlich durch eine dann besser mögliche Passung der Curricula an die unterschiedlichen Fähigkeiten und Neigungen der Schülerinnen und Schüler und die darüber mögliche stärkere Fokussierung des Unterrichts darauf (Sörensen 1970: 356 ff.; Sörensen und Hallinan 1977: 275 ff.; Gamoran und Mare 1989: 1148; Brunello und Checchi 2007: 974 ff.; Huang 2009: 781 ff.; Betts 2011: 343; Deunk 2015, Abschnitt 4.4: 38 ff.). Dieser Effekt wäre, so insbesondere die frühen Begründungen weiter, umso stärker, je mehr der jeweilige schulische Einfluss über den Schulalltag hinweg ununterbrochen und fokussiert und in andauernde soziale Kontakte eingebunden ist (»scope« bei Sörensen 1970: 362 f.): räumliche Trennung, gemeinsamer Lehrstoff, dauerhafte Klassenverbände, stabiles Lehrpersonal und ggf. auch eine besondere Identifikation mit der Schule oder »Anstalt«, auch aus einer gewissen Exklusivität heraus, dass nicht allzu viele auf die »Elite«-Schulen kommen (vgl. zu den verschiedenen Dimensionen des Ability-Tracking Domina et al. 2019). Eine solche Differenzierung wäre gerade auch für die weniger talentierten oder leistungsschwächeren Kinder von Vorteil: Auf deren Anforderungen und Bedürfnisse könnte ebenfalls besser eingegangen werden und sie müssten sich im Vergleich des Schulalltags nicht beständig mit einem Leistungsniveau vergleichen, dem sie nur schwer folgen können.

Gegen die Differenzierung wird dann angeführt, dass die weniger talentierten Schüler über die Trennung von einer anspruchsvolleren und besseren Lernumgebung und den peer-Kontakten einer integrierten Schule nicht profitieren könnten und dass sie über die Verweisung in eine geringer bewertete Schulform durch Stigmatisierung und eine negative Selbstwahrnehmung eher schlechtere Leistungen zeigten. Die Differenzierung nach den kognitiven Fähigkeiten führe so nicht nur unweigerlich zu einer Stratifikation in der Bildungsbeteiligung und in den Leistungen, sondern insbesondere auch nach der sozialen Herkunft, weil die für die Sortierung auf die verschiedenen Bildungswege wichtigen Ressourcen, Aspirationen, Bewertungen und Aktivitäten nach der Positionierung der Familien systematisch unterschiedlich verteilt seien (Oakes 2005 (1985): 40 ff.; Gamoran und Mare 1989: 1148 f.; Becker und Hadjar 2011: 51 ff.; Betts 2011: 343 f.; Allmendinger 2012, Kapitel 10; Becker 2016: xxviif.; Becker und Lauterbach 2016: 30 f.). Große Zweifel daran gibt es nicht. In ihrer breiten Übersicht über die Effekte des Ability-Tracking fassen Müller und Kogan (2010) das so zusammen:

»Defendersof early sorting usually assume that segmenting pupils into groups of homogeneous ability and school performance makes teaching and learning more efficient because it can be better adapted to the pace of students. However, effects in this direction are at most weak and its advantages can be counterbalanced by negative consequences of stigmatization of students in low achievement tracks and by weakening social integration and cohesion. As research discussed further below shows, it can be widely taken for granted that early tracking is furthermore associated with the generation of more educational inequality with particular disadvantage for lower class and migrant families.« (ebd.: 227; Hervorhebungen nicht im Original)

Es ist die Standardposition zur Frage nach Differenzierung und Integration (vgl. dazu die Vorbemerkungen bereits).

Zahllose Beiträge hat es zu dieser Kontroverse gegeben (vgl. dazu ausführlich noch den zweiten Band). Sie bezogen sich auf Effekte der Umstellung von der externen auf die interne Differenzierung wie die in den USA in den 1960er und 1970er Jahren oder auf die international vergleichenden soziologischen Mobilitätsstudien zur Bildungsbeteiligung und Statusvererbung in den 1990er Jahren. Einige der Übersichten kamen ganz dezidiert zu dem Ergebnis, dass die Differenzierung die Bildungsungleichheit in der Tat verstärke (etwa: Kerckhoff 1986, Gamoran und Mare 1989; Gamoran 2009: 4 ff.), aus anderen war das so eindeutig nicht herauszulesen (Kulik und Kulik 1982; Slavin 1987; Betts 2011: 351 f.), und wieder andere verwiesen darauf, dass es entscheidend darauf ankomme, die Differenzierung auch wirklich nach den Fähigkeiten der Kinder vorzunehmen und dafür zu sorgen, dass keine anderen Kriterien, wie die soziale Herkunft oder der Migrationshintergrund die Verteilung bestimme (Hallinan 1994). So schien etwa die als Übergang zur Integration verstandene Umstellung auf die interne Differenzierung in den USA die Stratifikationseffekte der externen Sortierung eher nur zu verbergen, als wirklich zu verringern (Lucas 1999, Kapitel 8). Und die in der soziologischen Mobilitätsforschung gefundenen Unterschiede in den Herkunftseffekten bei der Bildungsbeteiligung, etwa zwischen den skandinavischen Wohlfahrtsstaaten mit ihren integrierten Bildungssystemen und den kontinentaleuropäischen Ländern mit stark differenzierenden Systemen, erwiesen sich bei näherem Zusehen auch nicht als so ausgeprägt, dass man hätte sagen können, dass die Differenzierung die soziale Mobilität sonderlich behindert hätte (Shavit und Blossfeld 1993: 16 ff.; Müller und Karle 1993: 15 ff.; Müller 1996: 178 f.). Es wurde aber auch erst nach und nach klar wie voraussetzungsvoll die korrekte Identifikation von Systemeffekten des Ability-Tracking ist und dass es nicht damit getan ist, einfach Schulen, Regionen oder Länder mit und ohne Differenzierung zu vergleichen, wie das auch heute immer noch geschieht (vgl. zu diesen methodischen Problemen schon früh: Betts und Shkolnik 2000).

Diese Diskussion blieb lange Zeit eher verborgen, ganz besonders in Deutschland während und nach einer langen Phase der – seinerzeit: dringend nötigen – Bildungsexpansion. Wie tief saß da der PISA-Schock im Jahr 2000: das Leistungsniveau gerade in Deutschland deutlich unter dem internationalen Durchschnitt! Und nahezu der stärkste Einfluss der sozialen Herkunft auf den Bildungserfolg überhaupt (vgl. Tabelle 1.1 unten)! Das hatte man so nicht für möglich gehalten – auf beiden Seiten der bildungspolitischen Lager und der, wie gesagt, damals eher verhaltenen Kontroverse. Die Erklärung lag, wie es aussah, auf der Hand, zumal sich die Lage u.a. in Österreich und der Schweiz und ihren auch stark differenzierenden Systemen ähnlich darstellte und es u.a. in Schweden und besonders in Finnland mit ihren vollauf integrierten Systemen ganz anders zu sein schien: Je mehr Optionen ein Bildungssystem an getrennten Bildungswegen anbiete und je früher die Separation erfolge, umso stärker würden die »sozialen Disparitäten« bei der Bildungsbeteiligung, wie bei den Leistungen in der Sekundarstufe:

»… Deutschland (gehört) zu den Ländern, in denen die 15-Jährigen ein unterdurchschnittliches Kompetenzniveau erreichen und in denen gleichzeitig die engste Kopplung von sozialer Herkunft und Kompetenzerwerb nachweisbar ist.« (Baumert und Schümer 2001: 402; Hervorhebungen nicht im Original)

Ein Gespenst geht um seitdem, ganz besonders in Deutschland, und alle drei Jahre wird gebannt auf den neuesten OECD-Bericht schon als eine Art Staatsereignis gewartet. »Kaum irgendwo sonst«, so heißt es seitdem in periodischen Schüben, sei der Zusammenhang von Bildungserfolg und sozialer Herkunft so stark wie in Deutschland, verbunden mit einem alarmierend geringen Leistungsniveau, besonders bei den Kindern aus den unteren Leistungsbereichen, den unteren sozialen Schichten und denen aus Migrantenfamilien. 2006 wurde sogar der UN-Sonderbotschafter für Menschenrechte entsandt, und 2007 erstattete der seinen bestürzenden Bericht über die neuerliche Bildungskatastrophe in Deutschland. Und ungefähr alle halbe Jahre wieder verkündet Alexander Schleicher von der deutschen Vertretung der OECD nach einer »Sonderauswertung« der letzten PISA-Daten wie schlecht bestellt es ist mit dem deutschen Bildungssystem, bei allen Fortschritten in Teilbereichen, die es gewiss auch gebe: Kaum irgendwo, eben, sei der Bildungserfolg an die soziale Herkunft stärker gekoppelt als in Deutschland. Immer noch.

Bisher gibt es sechs PISA-Berichte über die Jahre 2000 bis 2018, der nächste steht zur Zeit der Abfassung dieser Einleitung hier (im Frühjahr 2021) bald bevor. Tabelle 1.1 gibt die Ergebnisse für vier nach ihren Bildungssystemen deutlich unterschiedliche Länder über diese Perioden wieder: nach dem Leistungsniveau (länderbezogene Mittelwerte im Lesen) und nach dem »sozialen Gradienten«, dem geläufig gewordenen Maß für die Kopplung der Leistungen an die soziale Herkunft. Finnland und Schweden repräsentieren die wohlfahrtstaatlichen skandinavischen Staaten mit ihren integrierten Bildungssystemen, Deutschland und die Schweiz die kontinentaleuropäischen Länder mit einer besonders ausgeprägten Form einer frühen und strikten Differenzierung.1

soziale Undurchlässigkeit (sozialer Gradient)

Jahr

2000

2003

2006

2009

2012

2015

2018

Finnland

28

30

29

31

33

39

38

Schweden

37

41

36

43

38

41

39

Deutschland

59

48

47

44

37

38

42

Schweiz

51

47

39

40

38

39

43

OECD

41

41

38

31

38

39

37

Leistungsniveau (Mittelwerte Lesen)

Jahr

2000

2003

2006

2009

2012

2015

2018

Finnland

546

543

547

536

524

526

520

Schweden

516

514

507

497

483

500

506

Deutschland

484

491

495

497

508

509

498

Schweiz

494

499

499

501

509

492

484

OECD

496

496

496

496

496

493

487

Tabelle 1.1:Leistungsniveau (Mittelwerte) und Herkunftseffekte (sozialer Gradient ESCS) im Lesen in der Sekundarstufe 1 in Finnland, Schweden, Deutschland und der Schweiz (OECD. PISA database 2000, 2003, 2006, 2009, 2012, 2015, 2018; http://www.oecd.org/pisa/data/; Zusammenstellung von Janna Teltemann).

Im Jahr 2000 zeigten sich für Deutschland in der Tat Verhältnisse, die beklagenswerter kaum hätten sein können: Niveau und soziale Durchlässigkeit bei den Leistungen ganz unten. Recht ähnlich die Schweiz. Dagegen für Schweden und besonders Finnland nachgerade das – krasse – Gegenteil. Aber schon 2003, spätestens 2006 hellt sich das Bild für die differenzierenden Systeme auf: Deutschland und die Schweiz bei den Leistungen nur noch knapp unter dem OECD-Durchschnitt, und auch die soziale Durchlässigkeit hat sich erhöht, besonders in der Schweiz. Finnland behält seine Spitzenstellung, aber für Schweden verändert sich schon etwas: ein kontinuierlicher Rückgang der Leistungen bei Konstanz der sozialen Durchlässigkeit. Aber dramatisch sind die Entwicklungen noch nicht, und die Klagen über das deutsche Bildungssystem haben, wie es nach PISA aussieht, immer noch ihre Berechtigung:

»Weder Kinder aus ärmeren Familien noch Kinder aus Familien mit Migrationshintergrund haben eine faire Chance, in unseren Schulen erfolgreich zu sein. In kaum einem anderen Industriestaat ist Bildungserfolg so sehr von der sozialen Herkunft abhängig wie in Deutschland.« (Barth et al. 2008: 69-132; Hervorhebungen nicht im Original)

Dann 2009. In Deutschland tut sich zwar immer noch nicht sonderlich viel, auch nicht in der Schweiz, aber in Finnland und Schweden sacken die Leistungen schon erheblicher ab und unterscheiden sich in Schweden nun nicht mehr von dem Niveau in Deutschland. Die soziale Durchlässigkeit ist in Deutschland nun fast so hoch wie in Schweden, in der Schweiz sogar stärker als dort. Aber auch in den eher wissenschaftlichen Publikationen bleibt es indessen bei dem Urteil:

»Bei der Chancengleichheit und dem Anteil an Bildungsarmen rangiert Deutschland im internationalen Vergleich der Wohlfahrtsstaaten im hinteren Bereich. Vor allem den skandinavischen Staaten gelingt es, soziale Ungleichheiten abzubauen und zugleich sowohl ein allgemeines hohes Niveau an Bildung als auch an persönlichem Wohlbefinden zu erreichen und so Zukunftsoptimismus und Integration zu gewährleisten.« (Quenzel und Hurrelmann 2010: 30).

2012 ist eine Art von Wende: Deutschland und die Schweiz erstmals deutlich über dem OECD-Niveau in den Leistungen, Finnland um 12 Punkte zu 2009 (und um 22 Punkte zu 2000) und Schweden um 14 Punkte im Vergleich zu 2009 abgesackt (und um schon beträchtliche 33 Punkte zu 2000) und kaum noch Unterschiede in der sozialen Durchlässigkeit. Weiter aber erfährt man aus den Zentren der gerade auch mit diesen Dingen befassten Wissenschaft:

»Mehrgliedrigkeit und Bildungsarmut sind Schlüsselthemen, wenn es um die Chancengleichheit unserer Kinder geht. Dies zeigt der internationale Vergleich: Schulsysteme, die von der Mehrgliedrigkeit abgerückt sind und die Kinder länger unterrichten, geben Kindern aus weniger privilegierten Schichten bessere Bildungschancen. Einige dieser Schulsysteme schaffen es, ›niemanden zurückzulassen‹ und fast alle Kinder aus der Bildungsarmut herauszuführen.« (Allmendinger 2012: 193)

Oder in einem der noch aufgeregteren Bildungs-Bestseller noch drei Jahre später in der 4. Auflage:

»Während die Abhängigkeit des Bildungserfolgs von sozio-ökonomischen Status der Eltern sowie von der ethnischen Zugehörigkeit in fast allen Ländern‹ der OECD in den letzten beiden Jahrzehnten gesunken ist, gehört Deutschland ›zu den Ländern, in denen der Einfluss des sozio-ökonomischen Hintergrundes am größten ist‹.« (Precht 2015: 61 mit Verweis auf Quenzel und Hurrelmann 2010: 28)

Weiter dann mit PISA 2015. Es sieht so aus, als stabilisierten sich die Dinge nach diesen Konvergenzen nun. Deutschland legt im Niveau noch einmal knapp etwas zu, Schweden erholt sich wieder etwas, liegt aber weiter hinter Deutschland, wo nun die soziale Durchlässigkeit genauso hoch ist wie in Finnland und etwas stärker sogar als in Schweden. Jetzt aber sackt die Schweiz kräftig ab, und es ist, für Schweden vor allem, nicht erkennbar warum (zu PISA 2018 siehe gleich unten).

In den Zusammenfassungen der Befunde über diese Entwicklungen wurde dann auch heftig gerätselt, was denn nun die Wende so um 2009 gebracht hätte (Klieme et al. 2010, Abschnitt 8.2: 287 ff.). Man weiß es eigentlich bis heute nicht. Es gibt, bei allen Änderungen, etwa der faktischen Auflösung der Hauptschulen und der vielen Erleichterungen des Übergangs, immer noch ein differenziertes Bildungssystem in Deutschland und der Schweiz, und in Finnland und Schweden hat es – jedenfalls nicht erkennbar – sonderliche institutionelle Änderungen nicht gegeben, auch in der Schweiz nicht solche, die den Abfall in 2015 erklären könnten. Vielleicht sind es besondere Anstrengungen in einzelnen Ländern gewesen, in Deutschland etwa die Bemühungen nach PISA 2000, die Kinder speziell aus den unteren Leistungsgruppen besser zu fördern – oder vielleicht auch nur der hierzulande in der Tat beispiellose Schock bei allen. Womöglich sind es auch besondere historische Verhältnisse gewesen, wie in Finnland. Sahlgren (2015: 63 ff.) etwa vermutet, dass die Vorbildwerte für Finnland bei PISA 2000 und auch danach nichts weiter seien als die, historisch erklärbare, Folge eines besonders hohen Ansehens des Lehrerberufs und einer strikt an den Leistungen orientierten Differenzierung bis in die späten 1990er Jahre und dass sich deren Effekte auf den Übergang zur Integration noch eine Weile haben halten können, aber inzwischen mehr und mehr verblassen. Jedenfalls: Mit Änderungen der institutionellen Regeln zur Differenzierung in den verschiedenen Ländern können die Entwicklungen über die 15 Jahre PISA-Studien allein nicht erklärt werden.

Die größte Aufregung hatte sich zu dieser Zeit durchaus etwas gelegt. Die Überzeugung hingegen, dass der Bildungserfolg in Deutschland »wie in kaum einem anderen entwickelten Land« der Welt von der sozialen Herkunft abhänge und dass dafür zweifellos die (frühe) Differenzierung der Bildungswege in unterschiedliche Schulformen nach den Fähigkeiten und Leistungen am Ende der Grundschule, das (frühe) Ability-Tracking also, verantwortlich wäre, ist indessen geblieben. So liest man weiter in resümierenden wissenschaftlichen Beiträgen zu den Effekten der Differenzierung bzw. den Verhältnissen in Deutschland:

»There is empirical evidence that the total efficiency and equity of the educational system in terms of average achievement of the individuals in a cohort is lower in early tracking systems compared to comprehensive systems.« (Becker 2016: xxviii)

Oder:

»Sowohl der Kompetenzerwerb als auch der Zugang zu verschieden anspruchsvollen Bildungslaufbahnen ist in Deutschland – wie in nur wenigen anderen entwickelten Staaten – eng an die soziale Herkunft der Schülerinnen und Schüler gekoppelt.« (Holtappels 2017: 34)

Es ist die Proliferation der Standardposition bis in die neueste Zeit, auch gegen viele Anzeichen, dass es so nicht ist. An öffentlicher Aufmerksamkeit, popularisierenden Übertreibungen, ernsthafter Diskussion und einem fast schon hypertrophierenden Aufwachsen der »empirischen Bildungsforschung« hat es jedenfalls nicht gemangelt, und es gibt inzwischen kaum ein sozialwissenschaftliches Gebiet, das so scharf bis in fast jede Ecke ausgeleuchtet worden wäre wie dieses. Manches ist ohne Zweifel erheblich klarer geworden, als es vorher war, einiges ist aber auch offen oder unbemerkt geblieben. Und inzwischen haben sich, meist als eher zufälliges Nebenergebnis oder in weniger beachteten Einzelheiten der diversen (Bildungs-)Berichte, eine ganze Reihe weiterer Abweichungen und Inkonsistenzen zur Standardposition gezeigt.

Besonders interessant ist dabei ein eigenartiges Puzzle aus den Befunden für die deutschen Bundesländer in den IQB-Berichten für 2009 und 2015. Tabelle 1.2 gibt die Ergebnisse daraus für vier ausgewählte deutsche Bundesländer mit deutlich unterschiedlichen Varianten der Differenzierung wieder: Baden-Württemberg (BW) und Bayern (BY) mit einer (in den betreffenden Jahren jedenfalls noch) deutlich strikteren Handhabung der Sortierung, Berlin (BE) und Bremen (HB) mit ihren immer schon sehr liberalen Regelungen, die recht nahe an »integrierte« Verhältnisse herankommen. Etwa: In Baden-Württemberg und Bayern sind die Empfehlungen der Schule verbindlich und die Inhalte des Unterrichts und die Prüfungen stärker kontrolliert, in Berlin und Bremen haben die Eltern die freie Schulwahl und es gibt deutlich weniger Kontrollen des Unterrichts und der Prüfungen (vgl. die Aufstellung bei Helbig und Nikolai 2015, Abbildung 28: 286). Hintergrund der Zusammenstellung in Tabelle 1.2 sind Angaben aus den IQB-Berichten für 2009 und 2015 über die 16 deutschen Bundesländer, die methodisch im Prinzip ähnlich aufgebaut sind wie die PISA-Reports. Die Befunde für die vier Bundesländer werden auch mit Finnland, Schweden, Deutschland insgesamt, der Schweiz und den OECD-Ländern zusammengenommen nach Tabelle 1.1 oben und den entsprechenden PISA-Werten für 2009 und 2015 verglichen. Nicht alle Felder der Tabelle konnten ausgefüllt werden, weil in den PISA-Berichten im Ländervergleich keine Angaben zur Bildungsbeteiligung vorkommen und im IQB-Bericht für 2015 die soziale Durchlässigkeit für die Leistungen in der Sekundarstufe nicht analysiert wurde.

Bildungsbeteiligung

Leistungen Sekundarstufe 1

soziale Durchlässigkeit

soziale Durchlässigkeit

Niveau

Odds-Ratio-Übergang Gymnasium EGP-Klassen I/II vs. V/VI

sozialer Gradient

Mittelwert

1

2

3

4

5

6

2009

2015**

2009

2015**

2009

2015

BW

6.5

34

509

496

BY

6.6

32

504

513

BE

1.7

42

480

483

HB

2.9

36

469

458

Finnland*

31

39

536

526

Schweden*

43

41

497

500

Deutschland*

44

39

497

509

Schweiz*

40

39

501

492

OECD

31

39

496

493

Tabelle 1.2:Unterschiede im Niveau und der sozialen Durchlässigkeit bei Bildungsbeteiligung und Leistungen (Lesen) zwischen Baden-Württemberg, Bayern, Berlin und Bremen (nach den IQB-Berichten für 2009 und 2015) im Vergleich zu Finnland, Schweden, Deutschland (gesamt) und der Schweiz für 2009 und 2015; Quellen: Spalte 1: Knigge und Leucht 2010, Tabelle 8.9: 198; Spalte 3: Knigge und Leucht 2010, Tabelle 8.1: 189; Spalte 5: Schipolowski, S. und K. Böhme 2010, Tabelle 5.1: 88; Spalte 6: Böhme und Hoffmann 2016, Tabelle 6.1: 335; * OECD-Angaben nur für die Leistungen verfügbar, ** keine IQB-Angaben für IQB 2015 verfügbar; zu den Hervorhebungen in Fett vgl. den Text).

Die Befunde sind z.T. erstaunlich und auch verwirrend, jedenfalls wenn man von der Standardposition ausgeht. In den beiden liberaleren Bundesländern (Berlin und Bremen) gibt es nach den Ergebnissen für 2009 praktisch keinen Einfluss der sozialen Herkunft auf die Chance, auf das Gymnasium zu gehen, ganz anders als in Baden-Württemberg und Bayern, wo früh und besonders strikt sortiert wird (Spalte 1: Übergangsraten von 6.6 und 6.7, fett hervorgehoben). Das entspricht der Standardposition: Kinder aus den oberen sozialen Schichten haben bei der (frühen) Differenzierung der Bildungswege große Vorteile bei der Bildungsbeteiligung, dem Zugang zu den höheren Bildungswegen. Dabei ist zu beachten, dass sich der Vergleich auf schon einen extremen Vergleich bezieht: Die sog. Dienstklasse als oberste Kategorie gegenüber Facharbeitern und darunter: Die intergenerationale Mobilität vollzieht sich allgemein in kleineren Sprüngen.

Gleichwohl gibt es bei strikter Sortierung ohne Zweifel die stärkeren sozialen Disparitäten bei der Bildungsbeteiligung. Das kann verschiedene Gründe haben: »Diskriminierung« in den Noten und Empfehlungen in den Schulen? Eine besonders ausgeprägte Bildungsmotivation der oberen Schichten? Oder gar beides zusammen: frühzeitige Einflussnahmen der Familien auf die Schulen und das Lehrpersonal oder auch danach, etwa wenn es um die Rückstufungen geht? Und wie sieht es mit den Leistungen vorher und den kognitiven Fähigkeiten aus, die doch eigentlich im Kern der Verteilung und der Bildungsbeteiligung stehen sollten? Haben die in den offenen beiden Ländern, Berlin und Bremen, keine Rolle gespielt?

Bei den Leistungen in der Sekundarstufe ist es umgekehrt: Hier ist der Einfluss der sozialen Herkunft, der soziale Gradient, in den liberaleren Bundesländern im Vergleich zu den strikteren Systemen in Baden-Württemberg und Bayern größer, und ausgerechnet Berlin ist bei den Leistungen für die Kinder aus den unteren Schichten sozial besonders undurchlässig (Spalte 2: sozialer Gradient von 42 für Berlin, fett hervorgehoben). Im Niveau der Leistungen liegen die strikteren Bundesländer im Jahr 2009 dann weit vor den liberaleren und übertreffen damit etwa Schweden schon deutlich (Spalte 5: 509 und 504 gegenüber 497, fett hervorgehoben). Das gilt grosso modo auch für 2015. Der Wert erhöht sich dabei für Bayern noch einmal auf nun 513 und ist mit dem Abfall von Finnland auf 526 Punkte nicht mehr allzu weit davon entfernt.

In Baden-Württemberg gibt es 2015 hingegen einen nicht unerheblichen Rückgang von dem höchsten Wert mit 509 in 2009 auf 496, nun ganz so weit entfernt nicht mehr jetzt von Berlin (Spalte 6, fett hervorgehoben). Man könnte durchaus auf den Gedanken kommen, dass das etwas mit der Umstellung der Bildungspolitik in Baden-Württemberg nach der Landtagswahl 2011 und mit der Abschaffung der Verbindlichkeit der Übergangsempfehlungen zu tun hat. Zu belegen ist das ohne weitere Kontrollen natürlich nicht, es ist aber eigentlich unwahrscheinlich, weil die faktische Umsetzung erst später hätte wirksam werden sollen. Aber die so rasche Änderung entspricht gewiss auch nicht der Standardposition, wonach die Öffnung im Zugang zu den höheren Bildungswegen die Leistungen womöglich eher sogar noch einmal steigern sollte, weil dann die nötigen peer-Kontakte möglich werden und die Stigmatisierungen unten geringer werden sollten. Vielleicht sind es aber ja auch kaum messbare Änderungen im gesamten »Bildungsklima« und bei den Anstrengungen bei allen gewesen, wenn offiziell von oben her die Bildungspolitik sagt: Was die Schule empfiehlt, ist unverbindlich, eigentlich also egal, man könnte es auch lassen und es kommt sowieso nicht so darauf an. Bei Eltern, Kindern, aber auch beim Lehrpersonal.

Die Ergebnisse des aktuellen IQB-Berichts für 2018 schließlich bestätigen die Befunde der o.a. früheren Berichte und den von 2015 (Mahler und Kölm 2019, Abbildung 8.10: 277; hier keine gesonderte Tabelle dazu; vgl. auch noch Kapitel 2 im zweiten Band ausführlich dazu): Die am striktesten sortierenden Länder (Bayern und Sachsen) haben wieder das höchste Leistungsniveau (in Mathematik; Lesen wurde 2018 nicht erhoben) und das erneut auch für die Kinder aus den unteren Schichten. Und Berlin weist weiter die mit Abstand stärkste soziale Undurchlässigkeit auf. Angedeutet hatte sich das, wie gesagt, bereits in dem Bericht für 2015 (Böhme und Hoffmann 2016: 257). Ohne weitere Kontrollen lässt sich aber auch hier nicht viel sagen. Jedoch auch so könnte man darauf kommen, dass die Standardposition keineswegs unzweifelhaft gilt, wonach die strikte und frühe Differenzierung die Leistungen eher senke, aber die soziale Ungleichheit verstärke, speziell den Kindern aus den schwierigeren Verhältnissen schade und die Öffnung des Zugangs die Lösung der Problem sei.

Schließlich PISA 2018 (Tabelle 1.1 oben). Wieder gab es eine durchaus dicke Überraschung: Der OECD-Durchschnitt in den Leistungen geht noch einmal deutlich zurück und im Zuge dessen auch die Leistungen in einzelnen Ländern: Finnland rutscht auch noch einmal und auf den tiefsten Stand seit 2000 – wie von Sahlgren (2015) vermutet –, auch die Schweiz wie nie zuvor, und Deutschland zurück auf den Stand von 2009. Nur Schweden, das vorher so abgesackt war, legt wieder zu.

In Deutschland geht der Rückgang, wie zu lesen war, auf die nunmehr und in Abweichung zum Trend wieder schlechteren Leistungen der sog. Risikoschüler zurück. Der Abfall in den Leistungen allgemein wie bei den leistungsschwächeren Kindern speziell in Deutschland könnte freilich eine einfache Erklärung haben: der große Zustrom auch an Flüchtlingskindern seit 2015 und dem auch hier deutlich geringeren Bildungsstand der Eltern im Vergleich. Weil bei diesen Befunden des OECD-Berichts aber nicht nach der sozialen Zusammensetzung, speziell der sozialen Herkunft, kontrolliert wird, kann nicht ausgeschlossen werden, dass der Rückgang ein bloßer Kompositionseffekt ist – anders als in anderen Ländern, die keine derartige Welle an Immigration auch von Familien mit Kindern hatten. Gut denkbar sind auch andere Turbulenzen in diesem Zusammenhang und eigentlich vorhersehbare demografischer Entwicklungen: Lehrermangel, Unterrichtsausfall, Einstellung von Seiteneinsteigern. Die allgemeine Bewegung wieder nach unten könnte aber auch an den Entwicklungen der Bildungssystemen über die letzten Jahre jeweils liegen: Wenn sich etwas geändert hat, dann gab es übergreifend und auch gerade auch in Deutschland eher eine voranschreitende Liberalisierung, wie z.B. in Baden-Württemberg mit der Abschaffung der Verbindlichkeit im Jahr 2011 (s. dazu gerade oben), aber auch anderswo mit der Zusammenlegung der unteren Bildungswege und der weiteren Liberalisierung in inzwischen fast allen Bundesländern.

In der sozialen (Un-)Durchlässigkeit unterscheiden sich 2018 jedenfalls die vier Länder ähnlich wie schon 2015 so gut wie nicht mehr. Auch Finnland und Schweden haben jetzt einen im Vergleich recht hohen sozialen Gradienten. Gleichwohl heißt es in den zusammenfassenden Berichten wie gewohnt:

»Gute Ergebnisse hängen oft mit der sozialen Herkunft zusammen.« (Headline bei ZEIT online, 3. Dezember 2019) Und: »Die negativen Auswirkungen von sozioökonomischer Benachteiligung auf die Bildungs- und langfristig auch Aufstiegschancen von jungen Menschen sind zwar in vielen Ländern stark, in Deutschland aber besonders ausgeprägt.« (ebd.; Hervorhebung nicht im Original)

Es waren Paraphrasen der offiziellen »Ländernotiz« der OECD für Deutschland zur raschen Information von Öffentlichkeit und Politik, wo es u.a. heißt:

»Chancengerechtigkeit bleibt eine der Herausforderungen für das deutsche Bildungssystem. So hat sich in Deutschland seit der letzten PISA-Studie mit Leseschwerpunkt (2009) beim Leseverständnis die Abhängigkeit der Leistung von der Herkunft noch verstärkt.« (OECD Ländernotiz Deutschland, PISA Ländernotiz 2019: 5).

Dabei bezog man sich nicht auf den sozialen Gradienten, wie sonst in den Tabellen (vgl. Tabelle 1.1 oben), sondern auf den Abstand der Kinder mit günstigem und ungünstigem sozioökonomischem Hintergrund in den Testwerten. Der war in der Tat nur in drei anderen Ländern größer als in Deutschland: Luxemburg, Israel und Ungarn. Übersehen wurde dabei jedoch, wie auch vorher schon in vielen Analysen zu PISA, z.B. in dem bekannten Beitrag von Hanushek und Wößmann 2006 zur Vergrößerung der Unterschiede in den Leistungen bei Differenzierung, dass es Abstände auf unterschiedlichen Niveaus