Was würde eine Wirkungsforschung in Schulbibliotheken ermöglichen?

<!– @page { margin: 2cm } P { margin-bottom: 0.21cm; text-align: justify } –>

Auf dem diesjährigen Bibliothekstag in Berlin wurde auf der Veranstaltung der Expertenkommission „Bibliothek und Schule“ von einem der Teilnehmer, die vom Podium per Namen angesprochen (also offenbar im Kreis der Kommission bekannt ist) wurde, die These aufgestellt, dass es für eine Verbesserung der Situation von Schulbibliothek in Deutschland notwendig wäre, eine Wirkungsforschung zu installieren, welche der Wirkungsforschung in den USA ähnlich sein sollte. Diese Aussage – der in der Veranstaltung mehr oder minder zugestimmt wurde – hat mich seitdem immer wieder beschäftigt, den sie wirft mehr Fragen auf, als sie beantwortet. Wieso soll eine Wirkungsforschung für eine Verbesserung der Situation von Schulbibliotheken notwendig sein? Was soll in diesem Zusammenhang Wirkungsforschung heißen? Wer soll die durchführen?

Ich bin ein großer Freund der Wissenschaft, aber ich habe ehrlich gesagt meine Zweifel an dieser Aussage – vielleicht auch gerade, weil ich die Wissenschaft der Bibliothekspolitik bevorzuge. Gehen wir die Fragen einmal kurz durch.

Warum macht niemand die geforderte Wirkungsforschung?

Eine kurze Anmerkung zu Beginn, die vielleicht etwas angriffig klingt, aber doch notwendig ist: Wenn im Umfeld der Expertenkommission Bibliothek und Schule offenbar die Vorstellung vorherrscht, dass Wirkungsforschung notwendig wäre, warum macht diese dann niemand aus deren Umfeld? Der Ruf nach einer Forschung, die – so wäre meine These – die Vorstellungen der Expertenkommission unterstützt, kann meines Erachtens nicht einfach aufgestellt und dann einer Bibliotheks- oder Bildungsforschung überlassen werden. Es ist nicht die Aufgabe der Wissenschaft, den Interessen von Interessensgruppen zu entsprechen. Das tut sie schon viel zu oft. Ein Großteil des bibliothekarischen Personals ist akademisch gebildet, der Kontakt zu Forschungs- und Ausbildungseinrichtungen – also vor allem den Universitäten und Fachhochschulen –, um Unterstützung zu erhalten, ist ebenso leicht herzustellen. Falls es tatsächlich ein Interesse an Wirkungsforschung zu Schulbibliotheken gibt, dann stellt sich die Frage, warum niemand, der oder die ein Interesse an dieser hat, sie durchführt.

Dies ist keine einfache Abwehr von Ansprüchen an die Wissenschaft, es ist ein Verweis darauf, dass diejenigen, die solche Forderungen erheben, auch die Verantwortung haben, an der Umsetzung der Forderung zu partizipieren. Gut möglich, dass beim Entwurf einer Wirkungsforschung auch den Beteiligten auffallen würde, dass ihre implizite Hoffnung auf Unterstützung ihrer Position gar nicht mit wissenschaftlichen Studien zu erfüllen ist. Gerade deshalb wäre es notwendig, die Fordernden einzubinden.

Was soll Wirkungsforschung herausfinden?

Dies führt zu einer wichtigen Frage: Was soll Wirkungsforschung eigentlich untersuchen? Das ist nicht trivial, ich würde vermuten, dass gerade hier der Unterschied zwischen Wissenschaft und dem Anspruch des Umfelds der Expertenkommission zu suchen ist.

Zumindest auf der Veranstaltung auf dem Bibliothekstag entstand der Eindruck, dass es bei der geforderten Wirkungsforschung gerade darum gehen sollte, empirische Nachweise zu führen, dass Schulbibliotheken die Schulqualität verbessern würden. Nicht weniger, aber auch nicht mehr. Das ist so einfach nicht. Zum einen müsste die Frage geklärt werden, was eigentlich Schulqualität – oder wie es auch immer benannt werden könnte – ausmachen soll: Die Noten und Ergebnisse der Schülerinnen und Schüler bei anderen Leistungstests? Die Zufriedenheit der Lehrkräfte mit der Situation an ihrer Schule? Die Zufriedenheit der Schülerinnen und Schüler? Die Lernbereitschaft? Die Ergebnisse in extra für die Wirkungsforschung entworfenen Tests? Geht es um die Ergebnisse in bestimmten Themenbereichen – zum Beispiel Sprachen und Recherchekenntnissen – oder allen Fächern? Die Reduzierung der Abhängigkeit der Lernergebnisse von sozialen Status der Schülerinnen und Schüler? Die Zufriedenheit der Eltern? Die Zufriedenheit der Politik und Öffentlichkeit mit den jeweiligen Schulen? Die Zufriedenheit des Schulbibliothekspersonals mit der eigenen Arbeit und ihrem Einfluss in den Schulen? Die Reduzierung des Schulabsentismus und Gewalt in Schulen? Diese Frage lässt sich nicht mit einer einfachen Antwort bewältigen, zumal ihre Beantwortung immer eine politische Komponente enthält (Vgl. u.a Zymek et al., 2011) und zudem Gefahr läuft, entweder die Realität unterkomplex erfassen zu vollen oder aber für sinnvoll durchführbare Forschung zu komplex zu werden.

Doch selbst, wenn diese Frage geklärt wird, müsste weiterhin geklärt werden, wie überhaupt empirische Nachweise der Wirkung von Schulbibliotheken geführt werden sollen. Die Gegenüberstellung von Schulen mit und ohne Schulbibliotheken reicht dazu beispielsweise nicht aus. Selbst, wenn wir finden würden, dass Schulen mit Schulbibliothek durchschnittlich bessere Ergebnisse in bestimmten Feldern der Schulqualität aufweisen, als Schulen ohne Schulbibliotheken, [1] ist das kein Nachweis einer Wirkung. Es ist der Nachweis eines Zusammenhanges. Die Frage allerdings, wie diese eventuell besseren Ergebnisse zustande kommen, ist damit nicht zu beantworten. Sind es wirklich die Schulbibliotheken? Gibt es vielleicht andere Faktoren, die dazu führen, dass Schulbibliotheken unterhalten und gleichzeitig bessere Ergebnisse erzielt werden? Oder führt erst die höhere Schulqualität dazu, dass Schulbibliotheken unterhalten werden? Empirie ist immer nur ein Werkzeug, dass bei der Formulierung und Überprüfung theoretischer Modelle benutzt werden kann. Beachtet man die Einschränkungen dieses Werkzeugs, dann ist es fraglos sinnvoll. Aber Empirie alleine kann keine Aussagen oder gar Theorien produzieren, sie kann nur Nachweise erbringen.

Auch eine Wirkungsforschung, die sich fast vollständig Empirie stützt – wie dies bei den School Library Impact Studies, auf welche die Expertenkommission Bibliothek und Schule immer wieder einmal verweist und die wohl auch bei diesem Wunsch Pate standen, getan wird – kommt nicht umhin, zu benennen, wie sie sich Wirkung von Schulbibliotheken vorstellt. Also: Wie wird aus einem Bestand von XYZ Medien pro Schülerin / Schüler eine Notenverbesserung von 0 Komma XYZ? Wie wird aus XZY ausgebildeten Bibliothekarinnen / Bibliothekaren ein Unterschied in der Zufriedenheit der Lehrerinnen / Lehrer um XYZ Prozent? Wenn diese Modelle nicht benannt werden, dann wird mit der Empirie, die Schulen untereinander vergleicht, keine Wirkung nachgewiesen. Solche Modelle finden sich allerdings bislang für Schulbibliotheken in Deutschland kaum.

Was soll eine Wirkungsforschung bewirken?

Interessant ist auch die Frage, wofür die geforderte Wirkungsforschung dienen soll. Schließlich wurde auf dem Bibliothekstag der Zusammenhang zwischen dieser Forschung und der Verbesserung der Situation von Schulbibliotheken direkt hergestellt. Der Eindruck, dass sie vor allem den bibliothekspolitischen Interessen der Expertenkommission dienen soll, entsteht sehr leicht. Bislang ist dem auch niemand entgegengetreten. Dies allerdings würde mehrere Probleme aufwerfen. So kann es nicht die Aufgabe von Forschung sein, irgendein politisches Interesse zu unterstützen. Wissenschaft ist – auch wenn sie von diesem Ideal immer wieder abweicht – gerade ein Weise, Wissen so zu produzieren, dass es überprüfbar dargestellt, transparent erhoben und zudem im eigentlichen Forschungs- und Interpretationsprozess nicht durch politische Erwartungen geleitet wird. Forschung muss ergebnisoffen sein; Politik, auch Bibliothekspolitik, ist dass selbstverständlich nicht.

Man könnte eigentlich erwarten, dass Wirkungsforschung darauf abzielt, zu verstehen, was in Schulbibliotheken eigentlich passiert, wie die Arbeit dort organisiert ist, was die Schülerinnen und Schüler, die Lehrerinnen und Lehren und auch die Institution Schule – ganz abgesehen von weiteren Kooperationspartnern – dort tun, für sich mitnehmen und wie sie die Schulbibliotheken in ihren Alltag in der Schule einbinden. Eine solche Wirkungsforschung könnte über den vollkommen berechtigten Erkenntniswunsch hinaus die Schulbibliotheken darüber informieren, was sie und andere Schulbibliotheken eigentlich tun und wie sie sich verändern können. Ist das bei der Wirkungsforschung, welche die Expertenkommission und ihr Umfeld fordert, angedacht? Das ist nicht so richtig klar.

Die vorbildhaften School Library Impact Studies geben beispielsweise wenig Hinweise für die einzelnen Schulbibliotheken, sie informieren auch gar nicht über deren direkte Arbeitsweisen, sondern liefern Hinweise darauf, dass eine bestimmte Ausstattung von Schulbibliotheken mit bestimmten Ergebnissen in Schulleistungstest korrelieren. (Warum sie korrelieren ist eher selten eine Frage.)

Aber selbst, wenn man akzeptieren würde, dass die Wirkungsforschung vor allem die Thesen der Expertenkommission zur Bedeutung von Schulbibliotheken unterstützen soll, würde das ein großes Problem aufwerfen: Was tun, wenn die Wirkungsforschung gar nicht zu den erwarteten Ergebnissen kommt, wenn sie zum Beispiel keinen Zusammenhang zwischen Schulbibliothek und Ergebnissen der Schulen in Leistungstests feststellen kann? Wird die Expertenkommission dann dafür plädieren, aus diesen Ergebnissen zu lernen und Schulbibliotheken zu schließen? (Oder wenn gefunden wird, dass Schulbibliotheken mit besseren Ergebnissen korrelieren, aber die Arbeit von Öffentlichen Bibliotheken mit Schulen keinen Einfluss auf Noten hat? Soll Öffentliche Bibliotheken dann ihre Arbeit für Schulen einstellen?) Wenn man sich schon politisch der Forschung bedienen will, sollte dies aus Fairness eigentlich erwartetet werden. Eine kleinteilige Wirkungsforschung würde mit hoher Wahrscheinlichkeit auch zu dem Ergebnis kommen, dass es zumindest bis zu einem bestimmten Größe des Bestandes relativ irrelevant für die „Wirkung“ einer Schulbibliothek ist, ob diese von bibliothekarisch ausgebildetem Personal oder von anderem Personal geführt wird. Der Effekt wird sich eher daran bemessen, ob es überhaupt eine Schulbibliothek gibt oder nicht. Würde dann die Expertenkommission die Forderung, in Schulbibliotheken Diplom-Bibliothekarinnen/Bibliothekare einzustellen, aufgeben? Was, wenn sich herausstellt, dass im Schulkontext die Leitung einer Schulbibliothek durch Lehrerinnen und Lehrer mehr Effekte hat, als die Leitung durch Bibliothekarinnen und Bibliothekare? Dies ließe sich mit einem sehr einfachen theoretischen Modell erklären, schließlich ergeben sich die Anforderungen an Schulbibliotheken aus dem Schulalltag und dem Unterricht, nicht aus der bibliothekarischen Praxis. Das würde die gleiche Frage aufwerfen.

Auch dies ist wieder keine triviale Frage. Eine Wirkungsforschung wird nicht zu den Ergebnissen kommen, die sich von den bibliothekspolitisch Interessierten erhofft werden. Das ist normal: Keine Wirkungsforschung zu irgendeiner Intervention in den Schualltag hat jemals die erhofften Ergebnisse erbracht. Egal ob Ganztagsschulen oder bewegter Unterricht, gegliedertes Schulsystem oder programmierter Unterricht, Projektarbeit oder Einsatz elektronischer Medien – durchgängig sind die Effekte geringer, als sie sich bei der Einführung erhofft werden. Warum ist das so? Zu vermuten ist, dass Schule und Lernen eine viel zu komplexe Struktur und ein zu komplexer Vorgang ist, um sie mit einer Intervention alleine vollständig zu verändern oder zu verbessern. Es geht offenbar immer wieder um graduelle Veränderungen, die zudem immer nicht intendierte Effekte – nicht unbedingt immer, aber oft, negative – zeitigen. Wer eine Wirkungsforschung zu Schulbibliotheken fordert, wird damit umgehen müssen, dass dieser Wirkungsforschung auch nachweisen wird, dass viele Hoffnungen, die in Schulbibliotheken gesetzt werden, sich nicht im großen Maße erfüllen.

Sind empirische Nachweise notwendig für eine bildungspolitische Entscheidung?

Ein kurzer Blick auf ein verwandtes Thema irritiert die implizite Hoffnung, mit einer Wirkungsforschung für Schulbibliotheken auch Argumente für Schulbibliotheken zu produzieren, noch mehr. Wir leben in Zeiten, in denen bildungspolitische Entscheidungen – und der großflächige Ausbau von Schulbibliotheken, zumal mit der Unterstellung unter das Bibliothekssystem, wäre eine solche – als rationale Entscheidungen präsentiert werden. Der aktuell stattfindende massive Ausbau von Ganztagsschulen wird beispielsweise nicht damit begründet, dass die politischen Parteien Ganztagsschulen als Teil ihrer Gesellschaftsvorstellungen ansehen, sondern es wird auf Studien verwiesen, aus denen sich ableiten ließe, dass Ganztagsschulen eine höhere Schulqualität aufweisen würden. Oder aber es wird behauptet, dass Ganztagsschulen eine logische Konsequenz aus den PISA-Studien darstellen würde. [2]

Es ist nicht uninteressant, in die empirische Forschung zu Ganztagsschulen zu schauen, die mit dem forcierten Ausbau von Ganztagsschulen in Deutschland in den letzten Jahren etabliert wurde. Hier zeigt sich nämlich eine erstaunliche Diskrepanz: Die Empirie unterstützt die Hoffnungen, welche mit dem Ausbau verbunden wurden, nicht. Dennoch wird der Ausbau fortgesetzt. Andreas Wiere hat kürzlich die vorhandenen Daten des Ganztagsschulforschung zusammengefasst und kommt zu folgendem Ergebnis:

Der empirischen Schulforschung dürfte es unter diesen Voraussetzungen [von unterschiedlichen Seiten zahlreich und zum Teil widersprüchlich formulierten Hoffnungen an Ganztagsschulen, K.S.] schwer fallen, die intendierte Wirksamkeit, sprich sämtliche Erwartungen, die an die Ganztagsschule gekoppelt sind, nachzuweisen. Sie ist damit auch kaum als argumentativer Steigbügelhalter für die Durchsetzung eines bereits in seinen Konturen absolut unscharfen Schulmodells geeignet. Selbstverständlich ist es möglich, Schülerzahlen zu erheben, die am Nachmittag im Rahmen des Ganztagsangebots betreut werden. Hiermit lässt sich eine Aussage hinsichtlich der Wirkung von Ganztagsangeboten in Bezug auf das Ziel der Verbesserung der nachmittäglichen Betreuungssituation formulieren. Darüber hinaus kann die erziehungswissenschaftliche Forschung mehr oder weniger verlässlich die Wirkung eines Ausschnitts der sich etablierenden Praktiken beschreiben, aber nicht mit Sicherheit Aussagen über erreichte intendierte Wirkungen formulieren, die allein auf die Existenz irgendeiner ganztätigen Organisationsform zurückzuführen sind. Die empirische Schulforschung ist deshalb von allen ein bedeutender ‚Seismograph‘ der Situation. Man kann von ihr aber keine abschließenden Urteile über das Funktionieren oder Scheitern einer mit vielen Erwartungen verbundenen Idee erhoffen, die zum einen in ihren Konturen verschwimmt und zum anderen lediglich Teil eines systemischen Bedigungskontextes ist.“ (Wiese 2011b, S. 36f.)

Die tatsächlich vorhandenen Ergebnisse zur Wirkung von Ganztagsschulen beschreibt er mit Bezug auf die mit der Ganztagsschule verbundenen Hoffnungen wie folgt:

„Im Hinblick auf die […] dargestellten sozial-, bildungs- und wirtschaftspolitischen sowie schul- und sozialpädagogischen Begründungen für mehr Zeit in der Schule erscheint die Lösung Ganztagsschule fast so unspezifisch und flexibel wie ein Gesundheitsbad. Das ist generell auch für alles gut. Wenn man nicht genau weiß, ob es hilft, kann es zumindest nicht schaden und hinterher fühlt man sich auch irgendwie besser.“ (Wiese 2011a, S. 30)

Oder anders gesagt: Zumindest im Fall der Ganztagsschulen ist es bislang relativ egal, was die Wirkungsforschung an Ergebnissen zeitigt. Diese Ergebnisse sind nicht für den Ausbau der Ganztagsschulen herangezogen worden, sie haben auch niemanden überzeugt, Entscheidungen zu treffen. Wiese (2011a) verweist sogar darauf, dass die aus den 1970er Jahren schon vorhandenen Ergebnisse der Ganztagsschulforschung, welche vielen Hoffnungen, die heute geäußert werden, widersprechen, einfach ignoriert wurden.

Insoweit wäre auch zu fragen, was eine Wirkungsforschung in Schulbibliotheken, die sich an den School Library Impact Studies orientieren würden, eigentlich bewirken könnte, selbst wenn sie die Hoffnungen aus dem bibliothekarischen Diskussionszusammenhang an Schulbibliotheken erfüllen würden. Es steht nicht zu erwarteten, dass solche Ergebnisse einen großen Einfluss auf politische Entscheidungen haben. Warum das so ist, soll hier aufgrund der Komplexität der Frage gar nicht besprochen werden. Wichtig ist erst einmal der Hinweis.

Sind Wirkungsforschungen sinnvoll?

Ich hoffe, dass klar geworden ist, warum es besser wäre, einige Vorsicht walten zu lassen, wenn man Wirkungsforschung für Schulbibliotheken fordert. Das Problem dabei wäre gar nicht die Forschung, sondern die Hoffnungen, die damit verbunden werden.

Interessant ist allerdings, dass wir bei der Diskussion dieser Frage von einer Institution abgekommen sind: Den Schulbibliotheken selber. Forschung sollte sich nicht an den Interessen der erforschten Institutionen orientieren, sondern, solange sich dies forschungsethisch begründen lässt, am Erkenntnisinteresse der Forschenden. Dennoch lässt sich die Frage stellen, ob eine Wirkungsforschung in Schulbibliotheken auch Schulbibliotheken selber zu Gute kommen könnte. Hier wäre tatsächlich die kritische Anfrage an School Library Impact Studies und ähnliche empirische Forschung zu stellen, was diese den einzelnen Schulbibliotheken in deren Arbeit eigentlich bedeuten können. Kurz: Relativ wenig, eigentlich gar nichts, da sie ja meist einfach Vergleiche anstellen, anstatt theoretische Modelle zu überprüfen. Was soll eine Schulbibliothek damit anfangen, dass es einen Zusammenhang auf institutioneller Ebene zwischen dem Vorhandensein eines Schulbibliothek und bestimmten Testergebnissen oder Zensuren gibt? Das zeigt nicht, wie die Arbeit von Schulbibliotheken wirkt oder verändert werden kann.

Es gibt die Tendenz, Forschung durch die Praxis zu begründen: Forschung wird damit begründet, dass sie der Praxis ein Wissen produziert, welches die Praxis verwenden kann. Das muss man nicht gut finden. Allerdings: Wenn man sich einmal darauf einlässt, wird sichtbar, dass für die Schulbibliotheken selber eine ganz andere Form von Wirkungsforschung sinnvoll wäre, nämlich eine, welche die tatsächliche Arbeit in den einzelnen Einrichtungen untersucht. Auch dabei stellen sich hunderte von Fragen, die erst noch beantwortet werden müssten: Welche Arbeit? Wie soll welche Wirkung überprüft werden? Wie bildet man die Komplexität der Lern- und Lehrprozesse ab, um darin dann die Wirkung von Schulbibliotheken zu untersuchen? Bekanntlich gibt es die Tendenz, je näher man Forschung an den einzelnen Einrichtungen verortet, umso weniger Vergleichswerte wie Zensuren oder PISA-Ergebnisse heranzuziehen. Fragen danach, ob die Schülerinnen und Schüler sich in der Schule wohl fühlen und der Meinung sind, gut Lernen zu können, werden dann beispielsweise wichtiger, als die Frage, ob eine pädagogische Intervention zur Steigerung der Durchschnittsnote von 0,1 Zensurenpunkten führt. Dies wird auch passieren, wenn man eine Wirkungsforschung auf die einzelnen Schulbibliotheken bezieht und nicht auf übergreifende Entitäten wie „alle Schulen in Bundesland XYZ mit Schulbibliotheken“. Eine solche Wirkungsforschung kann sinnvoll sein, fraglos. Nur halt weniger für bibliothekspolitische Belange.

Literatur

Wiese, Andreas (2011a) / Warum Ganztagsschule? : Rekonstruktion einer bildungspolitischen Kampagne. – In: Gängler, Hans ; Markert, Thomas (Hrsg.) / Vision und Alltag der Ganztagsschulbewegung als bildungspolitische Kampagne und regionale Praxis. (Studien zur ganztägigen Bildung). Weinheim ; München: Juventa Verlag, 2011, S. 13-32.

Wiese, Andreas (2011b) / Wie wirkt die Ganztagsschule? : Forschungsfragen und Befunde. – In: Gängler, Hans ; Markert, Thomas (Hrsg.) / Vision und Alltag der Ganztagsschulbewegung als bildungspolitische Kampagne und regionale Praxis. (Studien zur ganztägigen Bildung). Weinheim ; München: Juventa Verlag, 2011, S. 33-58.

Zymek, Bernd; Wendt, Sabine; Hegermann, Moritz; Ragutt, Frank (2011) / Regional Governance und kommunale Schulentwicklungspolitik im Prozess des Rück- und Umbaus regionaler Schulangebotsstrukturen. – In: Zeitschrift für Pädagogik, 57 (2011) 4, S. 497-512.

Endnoten

[1] Selbstverständlich würde man in der Forschung weiter differenzieren zwischen Schulen mit unterschiedlichen Schulbibliotheken.

[2] Ganztagsschulen sind das hier gewählte Beispiel, aber fast alle bildungspolitischen Entscheidungen werden heute auf ähnliche Weise begründet. Diese vorgebliche rationale Grundlage – die allerdings immer wieder durch die unterschiedliche Interpretation der gleichen Daten und Studien irritiert wird – hat den bildungspolitischen Diskurs, in dem mit politischen Argumenten – also beispielsweise der Vorstellung, dass eine demokratische Gesellschaft ein demokratisches Schulsystem benötigt, weil sie sonst nicht demokratisch wäre – Politik gemacht wird, ersetzt. Allerdings heißt dies nicht unbedingt, dass die politischen Vorstellungen nicht doch die handlungsleitenden wären. Sie scheinen nur nicht mehr offen ausgesprochen zu werden.

Evident oder nicht evident? School Library Impact Studies

In der Literatur über Schulbibliotheken, insbesondere in Texten, die einen explizit werbenden Charakter haben, wird gerne einmal darauf verwiesen, dass es durch Studien aus den USA „längst nachgewiesen“ wäre, dass Schulbibliotheken einen positiven Einfluss auf die Schulergebnisse haben würden. Dies müsse, so die implizite Argumentation, einfach mal verstanden werden. Ein wenig scheint in solchen Argumentationen – so erscheint es mir zumindest, aber vielleicht bin ich ja der Einzige – eine gewisse Wissenschaftsgläubigkeit durch, die irgendwie nicht mehr ins 21. Jahrhundert, in die Zeit nach feministischer und postmoderner Wissenschaftskritik, passt: die Idee, dass es immer genau eine Wahrheit gäbe, die dann von einer Studie nachgewiesen wird – und dann wäre die Sache gegessen. (Okay, dass war jetzt polemisch. Aber dafür ist das hier ja auch ein Blog.)

Some kind of test-based educational governance
Interessant ist allerdings die Frage: Was hat es eigentlich mit diesen Studien auf sich? Warum gibt es sie nicht auch in Deutschland?
Es gibt sie nicht in Deutschland, um das vorneweg zu sagen, weil wir eine andere Kultur der Bildungssteuerung haben. Es gibt sie aber – bevor wieder jemand behauptet, der Rest der Welt wäre fortschrittlich und nur Deutschland rückständig [1] – auch in vielen anderen Staaten nicht. Auch in Staaten mit einem stark ausgebauten Schulbibliothekssystem nicht. Diese School Library Impact Studien basieren auf einer Bildungssteuerung durch Schulleistungsvergleichsstudien, Standardisierung und einer gewissen Begeisterung (in der Bildungspolitik und zum Teil der Bildungsverwaltung, nicht unbedingt in der Bildungspraxis, als zum Beispiel den Lehrerinnen und Lehrern) für möglichst viele miteinander vergleichbare Zahlen. „Test-based education reforms“ nennt Daniel Koretz die Veränderungen der Bildungssteuerung, die vor allem – aber nicht nur – in den USA in den letzten 30 Jahren umgesetzt wurden. [2]
Im Rahmen dieser Bildungssysteme herrscht die Überzeugung vor, dass es möglich wäre, die Qualität von Schulen mittels standardisierter Tests der Lernerfolge von Schülerinnen und Schülern und ebenso standardisierter Messungen vom Umgebungsvariablen – und das kann, wie sich im Laufe der Zeit zeigte, alles mögliche sein: Klassengröße, Stundenzahl, soziale Zusammensetzung der Lehrenden und Lernenden in den Schulen, die Größe der Gebäude, die Anzahl und Form der Unterstützungsleistungen für Lernende, die Länge der außerunterrichtlichen Aktivitäten, die Anzahl und Nutzungsdauer von elektronischen oder nicht-elektronischen Medien und so weiter – zu bestimmen und zu steuern. Solange es irgend möglich ist, es in Zahlen zu erfassen (was zum Teil auch geht, indem man eine ausreichend große Zahl von Schülerinnen und Schüler zu einer Frage eine Note vergeben lässt – das sind am Ende auch Zahlen), gab es in den letzten Jahrzehnten zumindest schon Überlegungen, ob und wie es in die Messung einbezogen werden könnte.
Die Idee dahinter ist relativ einfach, aber deswegen nicht unbedingt falsch: hat man nur genug Daten, kann man auch die Bedingungen für Qualität bestimmen, kann man Zusammenhänge zwischen den Werten herstellen und – das ist der wichtige Grund, warum solche Datensammlungen beständig finanziert werden – Ansatzpunkte finden, um diese Qualität in allen Schulen herzustellen. Mit genügend Daten – das ist beispielsweise, wie Koretz betont, Ansatzpunkt des No Child Left Behind-Act von 2001 – können auch Aussagen über die tatsächlichen strukturellen Probleme bei der Förderung von zahlenmäßig kleineren und größeren benachteiligten Gruppen getroffen werden. Und nicht nur Aussagen: es geht bei diesen Studien auch immer darum, herauszufinden, wo man mittels Beratung, Anweisung oder Förderung durch die Bildungspolitik die Bildungspraxis verbessern kann.
So absurd die Formen dieser Datensammeltätigkeiten auch sein mögen, sollte man nicht vergessen, dass es im Hintergrund immer darum geht, die Bildungsqualität zu verbessern. Die Bildungspolitik in den USA und anderen Staaten ist zur Zeit davon überzeugt, mit solchen Zahlen besser arbeiten und Bildung steuern zu können, als dies in anderen Systemen der Fall ist.
Sicherlich: es funktioniert nicht, zumindest nicht in dem Maße, wie es sich erhofft wird. Statistik ist immer nur ein Hilfsmittel, wichtig ist die Interpretation und die Umsetzung vor Ort. Zudem hat der übermäßige Einsatz von Statistik den Effekt, dass nicht statistisch zu erfassende Variablen und Zusammenhänge immer weniger wahrgenommen werden, obgleich sie für die Praxis relevant sein können. [3] Es steigen die Anreize, mehr oder minder zu betrügen, um die geforderten statistischen Werte zu erreichen. Und nicht zuletzt hat die ständige statistische Messung von Bildungspraxis auch den Effekt, dass sich die Praxis mehr und mehr auf die gemessenen Faktoren konzentriert – was nicht immer gewollt sein muss. Aber trotzdem: erstens funktionieren auch andere Systeme der Bildungssteuerung und -berichterstattung nicht viel besser und zweitens sollte nicht vergessen werden, dass das grundlegende Ziel dieser Messungen ein ehrenwertes ist: die Qualität von Bildung ganz allgemein und eigentlich auch für alle Schülerinnen und Schüler zu verbessern.

School Library Impact Studies
Was aber haben die Studien, in denen nachgewiesen wird beziehungsweise werden soll, welche Effekte Schulbibliotheken haben, mit all dem zu tun? Das ist nicht schwer zu sehen: Sie sind die logische Fortsetzung dieser Form der Bildungssteuerung im Rahmen von Schulbibliotheken.
An der Mansfield University (Pennsylvania) hat letztens eine Abschlussklasse der School Library and Information Technologies (einer Ausbildungsrichung für Schulbibliothekarinnen und -bibliothekare, allerdings an einer fast schon dörflichen Universität, fernab der großen Forschung) alle diese Studien, welche in den USA und Kanada vorgenommen wurden – bis auf eine – zusammengefasst und deren positiven Ergebnisse in einer Tabelle zusammengefasst [School Library Research Summarized. A Graduate Class Project (2011): ttp://libweb.mansfield.edu/upload/kachel/ImpactStudy.pdf].
Diese Idee ist nicht neu. Mit „School Libraries Work!“ gibt die U.S. National Commission on Libraries and Information Science seit 2004 eine solche Zusammenfassung heraus, die aktuell in der dritten Edition vorliegt. Auf der Unterseite zu School Library Impact Studies der Dokumentensammlung Library Research Service finden sich ebenso die meisten dieser Studien verlinkt. Die Besonderheit des Projektes der Mansfield University sei – so Debra E. Kachel, welche den Kurs leitete – die geordnete Darstellung der positiven Aspekte. (Gleichzeitig ist das selbstverständlich ein sinnvolles Projekt in der universitären Ausbildung. Die Studierenden mussten sich mit den Studien auseinandersetzen und ihre Hauptaussagen systematisieren. Das ist unbenommen.)
Die Übersicht soll, so Debra E. Kachel weiter, dabei helfen, quasi immer die richtigen Argumente für School Libraries aus diesen Studien anführen zu können. Ganz offensichtlich nämlich überzeugen diese Studien gar nicht so sehr, wie man hierzulande manchmal vermuten würde. Trotzdem eigentlich alle zu positiven Ergebnissen gelangen und, so behauptet Kachel weiter, auch immer wieder nachweisen würden, dass sich Effekte von School Libraries nachweisen ließen, die nicht mit anderen Einflüssen zu erklären seien, wirkt sich das nicht unbedingt positiv auf die Stellung der School Libraries oder den Etat aus. Vielmehr müssen die Einrichtungen weiter beständig für eine Finanzierung, teilweise auch für den Erhalt, aber auch für eine bessere Einbindung in den Schulalltag kämpfen. Nur, weil die Studien als wissenschaftlich auftreten und Evidenzen nachweisen, wirken sie offenbar nicht überzeugend.

Warum überzeugt das nicht?
Warum ist das so? Das ist keine unwichtige Frage und es erstaunt ein bisschen, dass diese weder von Kachel, noch von den Autorinnen und Autoren von School Libraries Work! oder den einzelnen Studien gestellt wird. Die Antwort ist vielschichtig. Aber da ist zum einen die Qualität der Studien: So hoch ist diese leider nicht. Bislang zumindest werden fast durchgängig einfache Wirkmodelle geprüft, also ungefähr: Hat eine Schule mit so-und-so-großer Schulbibliothek in diesem-oder-jenem-Test durchschnittlich höhere Punktzahlen? Kann man einen anderen Zusammenhang zu diesen Punktzahlen herstellen (soziale Zusammensetzung der Schülerinnen und Schüler zum Beispiel) [oder können wir das alles auf die Schulbibliothek beziehen]? Über diese Ebene der Fragestellung gehen die meisten Studien nicht hinaus.
Ein Problem dabei ist, dass die Antwort dann selber nicht überzeugend ist. [4] Stellt man beispielsweise fest, dass es einen statistischen Zusammenhang zwischen Größe der Schulbibliothek und Testergebnis gibt, ist man noch nicht wirklich weiter mit der Frage, wie dieser Zusammenhang eigentlich zustande kommt. Aber das ist es, was Lehrerinnen und Lehrer eigentlich interessiert: Wie nutze ich die Schulbibliothek im Unterricht, damit meine Schülerinnen und Schüler bessere Testergebnisse einfahren? (Wenn man das einfahren von guten Testergebnissen als Ziel hat, was man als Lehrerin / Lehrer eigentlich nicht haben sollte, schließlich geht es darum, Kindern und Jugendlichen das Lernen zu ermöglichen, nicht darum, gute Tests zu schreiben.) Das ist in der schulischen Praxis wichtig.
Gleichzeitig kann man das Spiel selbstverständlich mit allen möglichen Zusammenhängen spielen: Hängt die Qualität der Mensaspeisung positiv mit Testergebnissen zusammen? (Ja, tut sie.) Hängt die durchschnittliche Fahrtzeit zwischen Schule und Wohnort der Schülerinnen und Schüler mit den Testergebnissen zusammen? (Ja, je weniger und kürzer Schülerinnen und Schüler fahren müssen und je mehr sie ihrer Freizeit auch mit MitschülerInnen verbringen können, umso höher sind durchschnittlich – aber nicht immer – ihre Testergebnisse.) Hat die Anzahl der Schulstunden, die sich mit Umweltthemen beschäftigen oder mit künstlerisch-ästhetischer Erziehung einen positiven Einfluss auf Testergebnisse? (Das kommt drauf an. Da gibt es keine einfache Antwort.) Hat die Größe der Klassen einen Einfluss auf die Testergebnisse der Schülerinnen und Schüler? (Auf jeden Fall.) Und so weiter. Auch die andere Seite der Frage ist nicht so richtig geklärt: Welcher Test eigentlich? In US-amerikanischen Schulen gibt es unzählige Test. Einige vorgeschrieben, andere freiwillig. Einige auf die Lernerfolge abzielend, andere auf die Berufsfähigkeit. Einige für alle Schülerinnen und Schüler, einige nur für ausgewählte Teile. Und jeder einzelne dieser Tests ist zudem umstritten.
All diese Fragen werden in den Studien gestellt. Das Spiel kann nicht nur hypothetisch gespielt werden, es wird auch gespielt. Nicht nur im Bereich School Libraries, sondern auch in allen anderen möglichen Bereichen. Interessant dabei ist, dass fast alle Studien positive Effekte nachweisen. [5] Ob nun für Mensen, Freizeitbereiche oder School Libraries. Und fast alle dieser Studien haben das Problem, dass sie nicht den direkten Effekt erklären können, sondern statistische Zusammenhänge herstellen. Nicht weniger, aber auch nicht mehr.
In der Masse der Studien, die solche Zusammenhänge nachweisen wollen, gehen diejenigen zu School Libraries unter, zumal sie, wie gesagt, auch nicht so viel erklären. Das, was in der Schulpraxis interessiert, also die Frage, wie eigentlich die School Libraries genau das Lernen von Schülerinnen und Schülern beeinflussen, ist etwas, was mit diesen „Evidence Studies“ nicht beantwortet werden kann.

Das funktioniert in Deutschland überhaupt nicht.
Die Übersicht von Kachel und ihren Studierenden zeigt noch einmal, warum man diese Studien überhaupt nicht für die Argumentation in Deutschland heranziehen sollte: Diese Studien reden einfach von etwas ganz anderem, als den hiesigen Schulbibliotheken. Zum einem kann man mit der Bemessungsgrundlage der meisten Studien gar nichts anfangen: PSSA (Pennsylvania System of School Assessment) reading score, STAR test score im CST (California Standards Test), National Assessment of Educational Progress (NAEP) usw. Das sind alles standardisierte Tests, die mit dem, was in deutschen Schulen vermittelt wird, nichts zu tun haben.
Zum anderen heben diese School Library Impact Studies aber auch regelmäßig auf Werte ab, die in deutschen Schulbibliothek fast nirgends erreicht werden. Würde man diese Studien ernst nehmen, müsste man davon ausgehen, dass die deutschen Schulbibliotheken praktischen keinen Effekt haben dürften, dass sie praktisch nur vor sich dahin darben würden, was bekanntlich nicht stimmt. Kachel et al. fassen beispielsweise zusammen, dass viele Studien davon ausgehen, dass Schulbibliotheken erst einen positiven Effekt auf die Lernergebnisse der Schülerinnen und Schüler hätten, wenn sie einen „Full-time librarian“ angestellt hätten beziehungsweise einen „Certified school librarian“ und weiteren „Support staff“. Insbesondere einen „certified school librarian“ gibt es in Deutschland gar nicht. Ein Blick in die Tabelle ihrer Veröffentlichung (pp. 6-8) zeigt, dass von einer ganz anderen Form von Schulbibliotheken ausgegangen wird. Nicht nur von einer besser finanzieren, sondern tatsächlich einer anderen Form.

Rosa-rote Brille
Erstaunlich bleibt allerdings auch bei dieser Veröffentlichung, dass all diese Studien eines nicht nachweisen: negative Effekte. Das ist mehr als unglaubwürdig. Schlimmer noch, es finden sich kaum Studien, die auch nur ansatzweise darauf eingehen, dass School Libraries – oder was auch immer gerade das Thema der Impact Study ist – für bestimmte untersuchte Merkmale gar keinen oder nur einen sehr schwierig feststellbaren Einfluss haben. Dieses kontinuierliche Positiv-Zeichnen aber ist es, was die Studien als das auszeichnet, was sie sind: als interessengeleitete Interpretation und Auswahl von Daten innerhalb einer (bildungs-)politischen Diskussion. Wie gesagt: dass machen im Rahmen der US-amerikanischen Bildungspolitik nicht nur School Libraries, sondern quasi „alle“. Insoweit ist es nicht anrüchig. Aber man sollte deshalb auch nicht erwarten, in diesen Studien allzu viel über die tatsächliche Arbeit von School Libraries oder gar deren Einfluss auf den jeweiligen Schulalltag zu erwarten.

Kachel, Debra E. and the Graduate Students of LSC 5530 School Library Advocacy, Spring 2011 (2011). School Library Research Summarized: A Graduate Class Project. – Mansfield, PA: School Library & Information Technologies Department, Mansfield University ( http://libweb.mansfield.edu/upload/kachel/ImpactStudy.pdf).

Fußnoten
[1] Kein Bildungssystem, nirgendwo, ist perfekt und das deutsche hat große Fehler – unbestritten. Aber rückständig sind so viele Bildungssysteme und kaputt auch. Und gerade das US-amerikanische Bildungssystem produziert noch weit mehr AbbrecherInnen, Menschen, die mit ihrer Bildung nach der Schule trotzdem arbeitslos werden oder in Trailer Parks wohnen et cetera, als das man sich gerade auf dieses als positives Beispiel beziehen müsste (was man beim Thema Schulbibliotheken aber oft macht). Es gibt unbestritten einiges positives am US-amerikanischen Bildungswesen, insbesondere die affirmative action und die Förderung von Studierenden aus schwächeren sozialen Schichten in den Hochschulen des Landes. Aber das ist wieder ein anderes Thema.
[2] Der Text von Koretz im aktuellen Sonderheft der Zeitschrift für Erziehungswissenschaft thematisiert zudem auch die Ergebnisse dieser Reformen. Dieser Text (Koretz, Daniel (2011) / Lessons from test-based education reform in the U.S. In: Zeitschrift für Erziehungswissenschaft, Sonderheft 13, 14 (2011), 9-23) ist, gerade für Leute, die gerne mal behaupten, in Deutschland müssten vor allem „internationale Erfahrungen“ im Bildungssystem umgesetzt und „internationale Experten“ für den Umbau des Bildungswesens herangezogen werden, eine wärmstens empfohlene Lektüre. Ebenso das Buch vom Koretz (Koretz, Daniel / Measuring Up: What Educational Testing Really Tells Us. Cambridge: Harvard University Press, 2008) zum gleichen Thema.
[3] Was selbstverständlich nicht heißt, dass sich nicht immer wieder darüber Gedanken gemacht wird, wie man auch solche Effekte statistisch bestimmt werden können. Die Ernsthaftigkeit dieser Bemühungen soll gar nicht in Frage gestellt werden. Aber für Deutschland ist beispielsweise die Frage, wie die ästhetisch-musikalische Schulbildung, die lange als Besonderheit des deutschen Schulsystems herausgestellt wurde, eigentlich in Kompetenzen ausgedrückt und deren Effekte gemessen werden können, noch lange nicht beantwortet.
[4] Zumal bekannt ist, dass die Wirkung von Interventionen im Schulalltag immer komplexer ist, also man es sich in solchen einfachen Modellen vorstellt. Allerdings sind komplexere Wirkmodelle auch nur komplexer zu testen. Und ab einer bestimmten Komplexität auch gar nicht.
[5] Oder, um es polemisch zu sagen: Evidenz kann man für alles finden, wenn man nur will. Und auch Evidenz dagegen.

Vier Modelle von Schulbibliotheken

Als Nummer 274 der Berliner Handreichungen für Bibliotheks- und Informationswissenschaft ist gerade mein Text zu Schulbibliotheken in Berlin 2008-2010 erschienen. (Hier: http://edoc.hu-berlin.de/series/berliner-handreichungen/2010-274) Eine erste Auswertung der Statistik, auf der dieser Text basierte, habe ich schon früher in diesem Blog veröffentlicht. Der Text selber verortet die Entwicklung der Schulbibliotheken in Berlin in den letzten drei Jahren im Rahmen der Schulentwicklung der Stadt Berlin, außerdem wird die Methode der Datensammlung mit anderen Versuchen einer Schulbibliotheksstatistik für andere Bundesländer verglichen. Eine etwas tiefer gehende Auswertung der Daten konnte auch aufzeigen, dass Schulbibliotheken nicht nur eröffnet, sondern auch wieder geschlossen werden.
Das meines Erachtens wichtigste Ergebnis meiner Recherche zu Schulbibliotheken in Berlin stellt allerdings die Differenzierung der Einrichtungen in vier unterschiedliche Schulbibliotheks-Modelle dar, die ich hier noch einmal außerhalb des Textes ansprechen möchte, da sie auch einen Grundlage für eine Diskussion über die Frage: Welche Schulbibliotheken wollen wir? darstellen können.
Gebildet wurden diese Modelle auf der Grundlage der Dokumente, die ich in den letzten Jahren zu Schulbibliotheken in Berlin sammeln konnte und den Besuchen in und Kontakten zu einer Anzahl dieser Schulbibliotheken. Sie sind als Idealtypen gebildet, dass heißt nicht empirisch untermauert oder aufgrund einer multifaktoriellen Analyse modelliert, sondern vor allem eine Zusammenfassung von auffälligen, wiederkehrenden Strukturen unterschiedlicher Schulbibliotheken. Sie sind wohl am Besten als realitätsgesättigte Hypothesen zu verstehen, deren empirische Fundierung noch aussteht.
Dennoch können sie den Zweck erfüllen, die Realität der Schulbibliotheken in Berlin und darüber hinaus in Deutschland besser als Grundlage einer möglichen Schulbibliotheksforschung und in einer Diskussion über Schulbibliotheken abzubilden.

Abgrenzung zur dbv-Differenzierung
Mit diesen Modellen grenze ich mich gegen die vor allem von der heutigen Expertenkommission Bibliothek und Schule im dbv vertretene Unterteilung von {a} Öffentlichen Bibliotheken in Schulen, {b} bibliothekarisch betreuten, aber eigenständigen Schulbibliotheken und {c} andere Schulbibliotheken ab. Es ist nicht klar, ob dies ein Berliner Spezifikum ist, aber nahezu alle Schulbibliotheken in Berlin ließen sich der Kategorie {c} zuordnen, was den Sinn dieser Unterteilung aufhebt: Wozu die Einrichtungen unterteilen, wenn sie nach dem verwendeten Modell nahezu alle strukturähnlich sind? In anderen Bundesländern oder Regionen mag dieser Unterteilung wieder sinnvoll sein, dazu liegen bislang einfach keine Daten vor. Allerdings ist auch für andere Bundesländer zu vermuten, dass die Kategorie {c} so groß sein wird, dass eine weitere Unterteilung dieser Kategorie sinnvoll wäre, um der Realität der Schulbibliotheken gerecht zu werden.
Wird man dieser Realität gerechter, kann man die Arbeit der Einrichtungen nicht nur besser beschreiben und untersuchen, sondern auch fairer beurteilen und die Unterstützung dieser Einrichtungen durch Öffentliche Bibliotheken (oder Schulämter, und auch einmal die andere Seite anzusprechen) besser organisieren.
Gerade in der von der Expertenkommission des dbv und eigentlich auch einem großen Teil der Öffentlichen Bibliotheken eher stiefmütterlich behandelten Kategorie {c} findet sich die – wissenschaftlich interessante – breite Varietät von Ansätzen und Lösungen im Bereich der Schulbibliotheken und geleichzeitig einer der bevorzugten Orte bürgerschaftlicher Verantwortungsübernahme von nicht-bibliothekarischen Engagierten für die bibliothekarische Grundversorgung der Bevölkerung.

Vier Modelle
Auf Grundlage der Daten, die ich über drei Jahre lang gesammelt habe, stelle ich die These auf, dass für die Berliner Schulbibliotheken die folgenden vier Modelle formuliert werden können, in welche sich eine überwältigende Zahl der Einrichtungen einteilen lassen.

  • Modell: Schulbibliotheken als Orte des guten Unterrichts (1)
  • Modell: Schulbibliotheken als Lese-Lern-Räume (2)
  • Modell: Schulbibliotheken als Offene Lernräume (3)
  • Modell: Schulbibliotheken als schulfreie Räume in Schulen (4)

Allen diesen Modellen ist gemein, dass sie sich wenig bis gar nicht an bibliothekarische Vorgaben halten. Zwar sind sie geordnete Bücher- und Mediensammlungen (und damit eigentlich qua Definition Bibliotheken), auch sehen sie auf den ersten Blick wie Öffentliche Bibliotheken aus – also mit Medienaufstellung, Arbeitstressen und Arbeitsplätzen, motivierenden Postern etc. an den Wänden. Aber ein genauer Blick zeigt, dass Kataloge, ein Ausleihsystem, eine bibliothekarische Systematik etc. nicht zum Allgemeingut dieser Einrichtungen gehören. Es gibt sie, aber sie sind auch nicht zwingend notwendig. Das fünfte mögliche Modell der einer kleineren Stadtbibliothek nachempfundenen Schulbibliothek findet sich in Berlin kaum. Eher haben sich die Einrichtungen, die ehemals Zweigstellen von Öffentlichen Bibliotheken in Schulen waren, aber in den letzten Jahren oder Jahrzehnten an die Schulen übergeben wurden, zumeist transformiert und beispielsweise Kataloge oder die „komplizierte“ bibliothekarische Systematik abgeschafft.
Die Modelle selber sind in der Arbeit selber weiter dargestellt. Letztlich kann man festhalten, dass sie Einrichtungen mit unterschiedlichen Zielen repräsentieren, die sich jeweils diesem Ziel und der Schule, in der sie sich befinden, angepasst haben. Der Bestand in Modell (1) ist beispielsweise auf den Unterricht der Schule ausgerichtet, ebenso das Mobiliar und die Nutzungskonditionen; im Modell (2) ist der Bestand aber auch die Möbel darauf ausgerichtet, dass die Schülerinnen und Schüler selbstständig Lesen üben bzw. das Lesen in ihren Schulalltag integrieren.
Wichtig ist allerdings, wie ich auch aus anderen Diskussion und Schulbibliotheksbesuchen in der letzten Zeit gelernt habe, dass diese Einrichtungen oft mit ihrer grundsätzlichen Ausrichtung zufrieden sind, sich aber dennoch oft – nicht immer – eine Unterstützung von anderer Seite (Schulamt, andere Geldgeber, Öffentliche Bibliotheken) vorstellen können, teilweise auch einfordern. Sie wollen in ihrer Arbeit akzeptiert werden – oder anderes gesagt: Bibliotheken, die daher kommen und ihnen ohne weitere Begründung erzählen, dass ein elektronischer Katalog notwendig sei und eine bibliothekarische Systematik auch, wollen sie gerade nicht haben –, aber darauf aufbauend sind sie doch an Beratung und Unterstützung, die sie selber mitbestimmen können, interessiert. Geht man davon aus, dass diese oft ehrenamtlich oder mit prekären Beschäftigungsverhältnissen betriebenen Einrichtungen einen Betrag zur bibliothekarischen Grundversorgung leisten können, würde sich für Öffentliche Bibliotheken anbieten, auf Grundlage dieser vier Modelle Unterstützungsleistungen für Schulbibliotheken zu konzipieren, die angeboten, aber nicht aufgedrückt werden. Immerhin – das zeigt die Statistik, auf der mein Text basiert ja – wächst die Anzahl von Schulbibliotheken in Berlin (und bestimmt auch in anderen Bundesländern).

Schulbibliotheken in Berlin, 2010

Wieder einmal — nach 2008 und 2009 — habe ich die Schulen in Berlin nach Schulbibliotheken durchsucht. Mit diesen gesammelten Daten kann man nun ganz vorsichtig anfangen, Trendaussagen über die Entwicklung der Schulbibliotheken in Berlin vorzunehmen. Sehr sehr vorsichtig.
Das wird alles in einem längeren Text geschehen, in welchem auch über den Einfluss der Berliner Schulpolitik auf Schulbibliotheken und den Unterschied der Berliner Situation zu anderen Bundesländern und deren Schulbibliotheken (vor allem Schleswig-Holstein, Hamburg, Rheinland-Pfalz) berichtet werden wird. Vorerst aber hier die Zusammenfassung der Ergebnisse der diesjährigen Recherche: Schulen und Schulbibliotheken in Berlin, 2010.
(Oder auch so: 235 bei 827 Schulen, d.h. 28,4%, haben nach Eigenangaben Schulbibliotheken/-büchereien.)

Nachtrag: Die Liste der Schulen mit Bibliotheken und Nachweisen: hier.

Mit Evidence Based Librarianship gegen die Forschungs-Praxis-Lücke?

Wolfgang G. Stock berichtet in einem kurzen Text in der aktuellen Bibliotheksdienst über die letzte Evidence Based Library & Information Practice Conference in Stockholm. [Stock, Wolfgang G. (2009) / Evidenzbasierte Bibliotheks- und Informationspraxis : EBLIP5, Stockholm, 2009. – In: Bibliotheksdienst 43 (2009) 8/9, S. 902-908]. Dies scheint der erste – und wenn nicht, dann einer der ersten – deutschsprachigen Text zum Evidence Based Librarianship (EBLS) zu sein. [1] Deshalb ist Stock auch genötigt, überhaupt das Konzept einzuführen.
Allerdings folgt auch er ohne Not der Unsitte, englische Begrifflichkeiten, die nicht mit ihrem gesamten relevanten Bedeutungsinhalt übersetzt werden können, trotzdem ins Deutsche zu übersetzen. Seine eins-zu-eins-translation zu „Evidenzbasierte Bibliotheks- und Informationspraxis“ unterschlägt deshalb leider den Zusammenhang des Begriffes Evidence – der im Englischen weit gebräuchlicher ist, als dass Deutsche „Evidenz“ – mit der Vorstellung, Menschen Wahlmöglichkeiten zu eröffnen (having a choice) und die Möglichkeit zu geben, Ihre gesellschaftliche Umwelt zu beeinflussen (make a difference). Während das EBLS als Praxis im Englischen in einem engen Zusammenhang zur Gestaltung der Gesellschaft und der Betonung der Individualität steht, wird in der Darstellung von Stock dieser Bedeutungszusammenhang unterschlagen. Das ist deshalb relevant, weil meines Erachtens das wirklich Interessante an der EBLS-Bewegung ist, dass Bibliothekarinnen und Bibliothekare sich als mit ihrer Arbeit gesellschaftlich aktiv verorten und (Forschungs-)Fragen stellen, die für die lokale und die gesamte Gesellschaft relevant sind. Bei Stock hingegen wird die EBLS zu einer Praxis der Verwaltung von Bibliotheken – was sie auch sein kann, aber gerade nicht ausschließlich ist.
Nichtsdestotrotz ist die Einführung von Stock zu empfehlen, gerade weil sie kurz und knapp eine grundlegende Darstellung des EBLS bietet. EBLS ist ein Praxis, in der Bibliotheken sich selber die Definitionsmacht über die Entscheidungen, welche die langfristige Strategie ihrer Organisationsentwicklung betreffen, zuschreiben und sich in einem geordneten Prozess daran machen, zu untersuchen, welche Instrumente zur Lösung welcher Problemstellungen oder einfach zur Verbesserung ihrer Arbeit erfolgversprechend sind. Dazu untersuchen sie die im Begriff EBLS angesprochen Evidence, sie fragen also, ob Instrumente Effekte haben und wenn ja, welche und in welchem Maße. Diese Effekte werden dann für Entscheidungen über die Organisationsentwicklung der Bibliotheken genutzt.
Stock wählt aus mehreren konkurrierenden Prozessdarstellungen, die für die EBLS vorliegen, eine zehnstufige aus, die er am sinnvollsten hält. Folgend die zehn Stufen (Seite 902-903, mit erläuternder Skizze auf Seite 903):

  1. Frage formulieren (z.B. Wie nutzen unseren Nutzerinnen und Nutzern die Selbstlernbereiche?, Wie wird unser Bestandsaubau wahrgenommen?, Wie nutzen Jugendliche unsere Bibliothek?)
  2. Suche nach Evidenz (Quellenrecherche in bibliothekarischen/bibliothekswissenschaftlichen Studien und Statistiken, aber auch in angrenzenden Themenbereichen, eventuell eigene Forschung)
  3. Kritische Bewertung der Quellen
  4. Entscheidung (Organisationsentwicklung, Projekte etc.)
  5. Evaluation (Gesamtprozess)
  6. Ist die richtige Entscheidung getroffen worden? (rekursive Evaluation)
  7. Wurde die Evidenz korrekt bewertet? (rekursive Evaluation)
  8. War die eigenen Forschung derart erfolgreich, dass sie die passende Evidenz erbrachte?
  9. Ist überhaupt richtig recherchiert worden?
  10. Wurde zu Beginn die richtige Frage gestellt?

Bei Punkt 2 und 8 würde ich Stock zum Teil widersprechen. Er stellt es so dar, als würde eine eigenständige Forschung durch Bibliothekarinnen und Bibliothekare im Rahmen des EBLS eine Ausnahme darstellen, die dann greift, wenn anderweitig keine Quellen gefunden werden können, um die gestellten Fragen zu beantworten. Schaut man aber die englisch-sprachige Literatur zum EBLS durch, scheint es eher so zu sein, als wäre das herausragend Neue gerade das Bibliothekarinnen und Bibliothekare eigenständig im Rahmen ihrer Bibliothek forschen und dabei Forschungsfragen stellen, die sich an der Realität ihrer Einrichtung orientieren (und beispielsweise weniger an den Wünschen der Verwaltung).
So oder so wertet Stock die EBLS als Möglichkeit, auch in Deutschland eine von ihm (und zahlreichen anderen) postulierten Forschungs-Praxis-Lücke zwischen bibliothekarischer Praxis und Bibliotheks- und Informationswissenschaft zu überwinden, wie dies zum Teil auch in anderen Ländern gelungen sei. Dem ist zuzustimmen.

Fußnote
[1] (Some shameless self-promotion) But watch out for my forthcoming Doktorarbeit, Kapitel 3.3.

Für eine andere Wirkungsforschung

Nicht nur für die didaktischen und pädagogischen (und anderen) Aktivitäten von Öffentlichen Bibliotheken stellt sich letztlich immer wieder einmal die nie so richtig beantwortete Frage, was sie eigentlich genau bringen. Auch die Soziale Arbeit und die Jugendarbeit muss sich immer wieder einmal – und zwar weit öfter als Bibliotheken – dieser Frage stellen: Was genau ist eigentlich die Auswirkung all der von uns engagiert betriebenen Arbeit im Leben der Personen, mit denen wir arbeiten? Dabei geht es bei diesen Fragen noch gar nicht einmal darum, dass daran gezweifelt werden soll, dass diese Arbeit Auswirkungen hat [1], genauso wenig wie hier daran gezweifelt werden soll, dass die Arbeit von Öffentlichen Bibliotheken für die Literarisierung von Kindern und Jugendlichen oder andere bibliothekarische Angebote für spezifischen Personengruppen eine Wirkung haben. Die Frage ist aber immer, welche Wirkung das genau ist, wieso gerade diese Wirkung und ob diese Wirkung tatsächlich gewünscht ist. Ein Blick zu den aktuellen Debatten um die Wirkungsforschung in der Sozialen und der Jugendarbeit könnte deshalb auch für Bibliotheken interessant sein. Die Feststellungen und Warnungen aus der Sozialen Arbeit lassen sich im Groben auf die Frage einer möglichen Forschung zu Wirkungen bibliothekarischer Arbeit, insbesondere im didaktischen und pädagogischen Bereich, übertragen.

Managerialismus
Holger Ziegler [Ziegler, Holger (2009) / Zum Stand der Wirkungsforschung in der Sozialen Arbeit. – In: Jugendhilfe 3 (2009) 47, S. 180-187] stellt einerseits die aktuellen Versuche, welche hauptsächlich aus der Politik initiiert werden, dar, die Wirkung von Interventionen in der Jugendarbeit zu bestimmen, die Ergebnisse dieser Untersuchungen in Standards umzuschreiben und für die Jugendarbeit zu nutzen; nur um im gleichen Artikel eine fundierte Kritik dieser Ansätze zu üben.
Diese Wirkungforschung – welche übrigens auch zunehmend im Bibliothekswesen referiert wird – sei größtenteils den Placebo-Forschungen / Randomized Controlled Trials aus der medizinischen Forschung nachempfunden. Gefragt wird in diesen quasi-experimentellen Untersuchungen nach der Wirkung einer spezifischen Intervention Sozialer Arbeit auf eine Gruppe, indem versucht wird, eine Gruppe, welche diese Intervention erfahren hat mit einer anderen, ansonsten möglichst identischen Gruppe, welche diese Intervention nicht erfahren hat, zu vergleichen. Dabei müsste allerdings jeder andere Einfluss auf die untersuchten Gruppen kontrolliert werden, so dass nur die Wirkung der untersuchten Intervention bestimmt werden kann.
Dieses Vorgehen zeitige allerdings einen von Ziegler als „managerialistisch“ beschriebenen Effekt: um die Aussagen zur Wirkung einer Intervention valide zu halten, müsse diese nach der Überprüfung auch standardisiert umgesetzt werden. Es würde praktisch eine Art verbindliches Handbuch erstellt, welches dann in der Praxis abgearbeitet werden müsste. Würde man von diesem Handbuch abweichen, wären die Ergebnisse der Wirkungsforschung sofort wieder hinfällig, weil dann ja andere Einflüsse hinzukommen. (Stichwort „Programmintegrität“) Selbstverständlich ist das pädagogischer Unsinn: eine didaktische Methode oder eine Intervention in der Sozialen Arbeit muss notwendig an lokale und individuelle Bedingungen angepasst werden, weil sie ja in einer komplexen sozialen und persönlichen Situation angewandt wird und nicht unter Laborbedingungen. Wie diese Anpassung zu passieren hat, ist hauptsächlich von der Professionalität der handelnden Akteure – der Sozialarbeiterinnen / Sozialarbeiter oder auch der Lehrenden – abhängig.
Würde man hingegen tatsächlich solchen Handbüchern folgen, würde dies zu einer Deprofessionalisierung der Arbeit (und erfahrungsgemäß zu schlechteren Ergebnissen) führen, da die Aufgabe der Professionellen dann ja nur noch wäre, zu bestimmen, welche Situation vorläge und mit welchem standardisierten Programm darauf reagiert werden sollte.

Wirkungsorientierte Steuerung auf der Basis der dominanten experimentellen Wirkungsforschung impliziert demnach eine Standardisierung der Kinder- und Jugendhilfepraxis. Fallinterpretativ-hermeneutisches Ermessen und professionelle Inferenz- und Handlungsentscheidungen stellen sich dann nicht mehr als Gütekriterien angemessener sozialpädagogischer Validität evidenzbasierter Programme. In diesem Sinne verlangt die dominante Form der Wirkungsorientierung keine sozialpädagogische Professionalität, sondern eine möglichst genaue technologische Applikation manualisierter Programmvorschriften. [Ziegler (2009), S. 183]

Ziegler äußert im Anschluss drei konkrete Kritikpunkte an den aktuellen Formen der „evidenzbasierten“ Wirkungsforschung, welche sich halt sehr stark an Konzepte der Betriebswirtschaft anlehnen:

  1. Der „technizistische Fehlschluss“ [ebenda, S. 183], welcher sich praktisch darin niederschlägt, dass davon ausgegangen wird, dass die Wirkung einer Intervention, welche unter quasi-experimentellen Bedingungen nachgewiesen wurde, auch genauso in der viel komplexeren Lebenswelt funktionieren würde.
  2. Die „Dominanz kognitiv behaviouraler Symptomabtrainierungsstrategien“. [ebenda, S. 184] Diese Kritik bezieht sich darauf, dass die in der Wirkungsforschung verwendeten Forschungsdesigns einfache und auf ein Symptom zugeschnittene Interventionen bevorzugen und gleichzeitig die Untersuchung lebensweltlicher Ansätze Sozialer Arbeit ausschließen. Diese sind einfach zu komplex für quasi-experimentelle Forschungen. Das reduziert aber die Aussagekraft solcher von Placebo-Studien geprägten Forschungen elementar. Vor allem ist es nicht möglich, mit ihnen zu bestimmen, ob die untersuchten Ansätze überhaupt die bestmöglichen Interventionsmöglichkeiten sind, da einfach ein riesiger Anteil möglicher Interventionen nicht untersucht werden kann.
  3. Zudem bestimmt Ziegler die „[h]ohe Effektstärke genereller Wirkfaktoren“ [ebenda, S. 184] als Bias der Wirkungsforschung, da sie den Effekt der untersuchten Interventionen bei Weitem überschätzt, einfach weil sie nur diese Interventionen als ursächlich für die bestimmten Wirkungen begreift und nicht die jeweils vorhandenen Wirkungszusammenhänge. Insoweit, meint Ziegler, solle man sich auch nicht zu sehr von den in Studien gemessenen Wirkungsgraden irritieren lassen. In der realen Sozialen Arbeit würden diese Wirkungsgrade einzelner Interventionen nicht einmal ansatzweise zu erreichen sein. Vielmehr sei bekannt, dass Verhaltens- und Lebensveränderungen immer das Ergebnis von Handlungszusammenhängen wären.

Klar ist, dass auch die Forschung mit dem Dispositiv einer relativ einfachen Wirkungsforschung ihres möglichen aufklärerischen Charakters beraubt und praktisch auf eine reine sozial-mechanische Planungsinstanz reduziert wird. Eine Forschung, die sich fast gänzlich auf die Bestimmung der Wirkungen von Interventionen mithilfe von Placebo-Studien einlässt, wird folgerichtig zu einer Art Ingenieursarbeit. Dabei geht dann allerdings die Instanz der Forschung verloren, welche versucht zu klären, warum eine Intervention oder ein Handlungszusammenhang in der realen Lebenswelt welche Wirkung hat oder nicht hat. Eine solche Forschung, die auf empirischer Basis über diese Wirkungen aufklärt, bezeichnet Ziegler abschließend allerdings als notwendig.

Handlungswissenschaft
Mit dieser Forderung steht Ziegler nicht allein. Susanne Zeller definiert in einem weiteren, unlängst erschienen Text die Aufgabe von Wirkungsforschung in der Sozialen Arbeit auch weit anders, als sie – wenn man den Ausführungen von Ziegler folgt – tatsächlich gehandhabt wird. [Zeller, Susanne (2009) / Theorie der Sozialen Arbeit als „emergente Handlungswissenschaft“. – In: Soziale Arbeit 6 (2009) 58, S. 213-221]

Sozialarbeiterinnen und Sozialarbeiter müssen zuerst das Warum sozialer Problemlagen klären, bevor sie nach dem Wie (also den Praxismethoden) fragen können. Oder anders ausgedrückt: Theorie informiert die Praxis über die jeweiligen individuellen und vor allem gesellschaftlichen Ursachen(bündel) und Entstehungsbedingungen von Problemlagen. [Zeller (2009, S. 213]

Zeller bestimmt die Aufgabe von Wirkungsforschung also äquivalent zu Ziegler darin, ein Handlungswissen zu ermöglichen, aufgrund dessen professionelles Handeln möglich wird; und nicht etwa darin, Handlungen zu standardisieren und als „Best Practice“ und Standards vorzuschreiben. Dabei orientiert sie sich an der Praxis der Sozialen Arbeit in englischsprachigen Ländern, also hauptsächlich den USA und Großbritannien. Als sinnvoll führt sie eine in der englischsprachigen Literatur verbreitete Differenzierung der Theorieproduktion im Rahmen der Sozialen Arbeit an:

  1. Theories for practice (Theorien für die Praxis)
  2. Theories from practice (Theorien aus der Praxis)
  3. Theories of practice (Praxistheorie)

Eine Theorieproduktion kann für die Praxis nur sinnvolle und nutzbare Ergebnisse zeitigen, wenn sie alle diese drei Bereiche abdeckt, die sich unterschiedlich übereinander aufklären. Eine Vernächlässigung führt entweder zu einer Praxisferne oder zu einer unwirksamen, weil bestenfalls kurzfristig gedachten und zu weit von der komplexen Lebenswelt abstrahierten Anwendungsfixierung.
Dabei orientiert sich die Soziale Arbeit in dieses Ländern den Aussagen Zellers nach hauptsächlich an den Bedürfnissen der jeweiligen Klientel und nicht hauptsächlich, wie in Deutschland, an den Interessen der Politik. Dies mag ein Grund sein für die unterschiedliche Aufgabenzuschreibung von Wirkungsforschung: während in Deutschland von der Politik hauptsächlich abrechenbare Interventionen gefordert werden, die bestimmte Zustände ändern sollen, ist das Hauptinteresse der Klientel Sozialer Arbeit in den USA und anderswo das Überwinden individueller Problemlage und das Empowerment von Communities. [2]
In einem weiteren Abschnitt argumentiert Zeller zudem, dass nicht nur eine andere Auffassung von Wirkungsforschung notwendig wäre, sondern das ein Grund für die fehlende Praxisnähe der deutschen Forschungsliteratur und der Forschung selber darin zu suchen sei, dass „Sozialarbeiterinnen und Sozialarbeiter [bedauerlicherweise] kaum [publizieren], um die Konzepte aus der Profession heraus für Theorie und Praxis weiterzuentwickeln.“ [Zeller (2009), S. 217] Stimmt man dem zu, so wäre es eine Aufgabe, die Professionellen der Sozialen Arbeit zu solchen Publikationen zu ermutigen und dafür Publikationsmöglichkeiten zu schaffen, was ja nicht unbedingt nur Fachzeitschriften sein müssen. [3]

Das Jugendzentrum
Dass ein sehr langfristiger Forschungsansatz von Wirkungsforschung, nämlich eine biographische Forschung, trotz aller Unsicherheiten und obwohl mit diesem keine statistisch valide Daten produziert werden, sinnvolle Aussagen produzieren kann, bewiest Rainer Kilb in seiner Untersuchung über die Wirkung der Arbeit eines Jugendzentrums Ende der 1970 bis Mitte der 1980er Jahre in Frankfurt am Main. [Kilb, Rainer (2009) / 25 Jahre später… : Wie ehemalige Jugendzentrumsbesucher heute ihre Erfahrungen und ihre Zeit als Besucher der Offenen Jugendarbeit einschätzen. – In: deutsche jugend, Zeitschrift für die Jugendarbeit, 7-8 (2009) 57, S. 327-336]
Diese Forschung kam eher aufgrund der Initiative der ehemaligen Nutzerinnen und Nutzer des Jugendclubs zustande, die 2008 ein Treffen der „Ehemaligen“ inklusive ihrer Sozialarbeiter organisierten und nicht aufgrund einer konkreten Forschungsinitiative. Dennoch wurde dieses Treffen für eine sinnvolle Forschung genutzt. Die Teilnehmenden wurden schon im Vorhinein mit Hilfe eines kurzen Fragebogens darauf vorbereitet, dass diese Zusammenkunft auch für eine Wirkungsforschung genutzt würde. Vor Ort wurden aufgrund der Ergebnisse des Fragebogens Gespräche über die damalige Zeit (1977-1985) geführt. Dieses Studiendesign genügt selbstverständlich keinesfalls den Kriterien, die heute gerne einmal als notwendig für eine „gute Forschung“ beschrieben werden. Und dennoch war es gute Forschung.
Die grundsätzliche Frage war, ob und wenn ja, wie sich die Nutzung des damaligen Jugendzentrums biographisch niedergeschlagen hat. Dabei handelte es sich nicht um ein Jugendclub für Gymnasiasten, denen Demokratie vermittelt werden soll, wie das gerne einmal konzipiert wird [4], sondern um einen Ort, welcher aufgrund einer Initiative von Mitgliedern eines Boxclubs eröffnet wurde, dann insbesondere deliquente Jugendliche ansprach, hauptsächlich Sportaktivitäten anbot und mit einer KFZ-Werkstatt ausgestattet war. Die Jugendlichen engagierten sich damals nicht nur in ihrer Fußballmannschaft, sondern verübten ebenso ausländerfeindliche und homophobe Straftaten – also ging es bei der Arbeit mit Ihnen gerade nicht darum, nette Jugendliche auf einem netten Weg in die Gesellschaft zu begleiten, sondern tatsächlich schwierige sozialarbeiterische Aufgaben zu lösen. Der Club wurde von zwei Sozialarbeitern betreut, welche darüber hinaus Mädchenarbeit, Hausaufgabenhilfe und ein Photoprojekt organisierten.
Selbstverständlich sind die in durch die Befragung erhaltenen Ergebnisse verzerrt. Befragt wurden nur diejenigen, die zum Treffen kamen. Dass waren von 119 Angeschrieben immer noch 75 – wobei 22 der Angeschriebenen schon verstorben sind, nur zwei davon auf „natürliche“ Weise –, aber dennoch stellt dies einen Bias dar: wer nicht zu Gruppe gezählt wurde, wurde wohl noch nicht mal eingeladen und konnte somit nicht berichten.
Dennoch: die Arbeit im Jugendzentrum hat offensichtlich etwas gebracht. Ganz überwiegend wird dieser Ort von den Ehemaligen positiv beurteilt und mit ihm wichtige Erfahrungen – sowohl partnerschaftlich/sexuell als auch im Bezug auf die Sozialisation in Gruppen, Selbstständigkeit- und Selbstwirksamkeitserfahrungen und dem Ausstesten riskanter Lebens- und Konsumweisen – verbunden. Diese Zeit wird, trotz der Deliquenz und der konflikträchtigen, teilweise gewalttätigen Atmosphäre im damaligen Zentrum, heute kaum als Grund für spätere riskante Lebensformen wie „Konsumismus“ (Markengeilheit und Shoppingorientierung), Spielsucht oder Kriminalität angegeben. Vielmehr scheinen die Erfahrungen im damaligen Jugendzentrum oft gegen Tendenzen zu solchen Lebensweisen gewirkt zu haben, wenn auch der direkte Zusammenhang in der Studie von Kilb nicht herausgearbeitet werden kann. Die Ehemaligen würden ihre potentiellen oder realen Kindern zwar Ratschläge mitgeben, wenn diese in ein ähnlichen Jugendzentrum gehen wollten, aber offenbar würden sie diese nicht davon abhalten, sondern vielmehr oft sogar ermutigen. Insbesondere wird dabei der Treffpunktcharackter und die Bildung von Gruppen bzw. (wenn auch in einer anderen Terminologie) die Ausbildung von Handlungs- und Konfliktbewältigungsfähigkeiten in diesen Gruppen als positiver Wert hervorgehoben. Als nicht so wichtig wird das konkrete Angebot des damaligen Jugendzentrums angesehen, wenn auch nur wenige spezifische Angebot vollkommen unwichtig finden.
Interessant für die pädagogische Arbeit ist auch die Einschätzung der befragten Ehemaligen zur Arbeit der Sozialarbeiter. Wichtig für die individuelle Entwicklung war offenbar die Ansprechbarkeit dieser erwachsenen Partner und die Organisation von Hilfe- und Beratungsangeboten, weniger die Organisation des Zentrums selber (obwohl diese immer noch als relevant angesehen wird).
Im Fazit kann festgehalten werden, dass auch eine solche methodisch nicht allzu kontrollierte Studie, wie sie Kilb vorlegt, wichtige Ergebnisse produzieren kann, welche für eine zukünftige Jugendarbeit handlungsleitend wirken können. Und zwar gerade, weil sie nicht auf die kurzfristige, einfach zu erfassende Wirkung der Arbeit abzielt, sondern den biographischen Einfluss aus einer gewissen Entfernung abzuschätzen versucht.

Fußnoten
[1] Obwohl es auch dazu Stimmen gibt, bzw. eine bekannte, nämlich die des notorisch mediengeilen Chefs des Krimonologischen Forschungsinstituts Niedersachsen, Christian Pfeiffer. Allerdings … lohnt es sich eigentlich noch, etwas zu Pfeiffer zu sagen? Er ist bekannt dafür, einen starken Staat zu fordern, der gegen jede Deliquenz und Abweichung polizeilich vorgeht und diese Forderung mit Studien zu untermauern, die keiner auch nur ansatzweise kritischen Prüfung standhalten. Allerdings: er wird in der Presse und bei bestimmten Politikerinnen und Politikern gerne zitiert, deshalb kommt man offenbar nicht so richtig um ihn herum.
[2] Ein kleiner Schlenker sei erlaubt: in bestimmter Weise scheint diese Orientierung der Community Organizer, also dieser eher US-amerikanischen Variante der Sozialarbeit, die sich auf die Aktivierung von Individuen konzentriert, sich im Wahlkampf und der Politik Barack Obamas widerzuspiegeln. Hier wird weit mehr, als in der deutschen Politik, auf die Organisation politischer und gesellschaftlicher Initiativen von den Betroffenen selber – die beim Wahlkampf nicht unbedingt die Klientel Sozialer Arbeit darstellen müssen – gesetzt. Es scheint, dass die frühere Arbeit Obamas als Community Organizer einen gewissen Anteil an dieser ja schon sehr oft festgestellten neuen, empowernden Form von Politik und Politisierung hatte und hat. [Vgl. als ein Beispiel: Moorstedt, Tobias (2008) / Jeffersons Erben : Wie die digitalen Medien die Politik verändern. – Frankfurt am Main : Suhrkamp, 2008.] Das es eine solche Tradition in Deutschland kaum gibt, könnte ein Grund dafür sein, dass die Übernahme einiger Charakteristika des Obama’schen Wahlkampfs in Deutschland (Twitteracounts, Youtube-Videos, Inszenierung von Politikern als Messiasgestalt etc.) kaum Auswirkungen hat. Hier wird offenbar nur die Oberfläche gesehen, nicht die Denk- und Handlungsstruktur.
[3] Hier könnten Bibliotheken, wenn sie dann die dazu nötigen Kompetenzen und Infrastrukturen haben, eine Aufgabe finden. Dabei postuliert Zeller, dass solche eigenständigen Forschungen und Publikationen auch gegen Tendenzen des „Ausbrennens“ im Beruf helfen könnten. Insoweit wäre die Zurverfügungsstellung einer Publikations- und Forschungsinfrastruktur, ob nun von Bibliotheken, Hochschulen, Fachverbänden oder anderen Institutionen und Initiativen, auch ein Beitrag zur Qualitätssicherung der tatsächlichen Praxis.
[4] **wink** zu meinem alten Schul-/Jugendklub. No disrespect.

Schulbibliotheken in Berlin, 2009

Ich hatte schon im letzten Jahr eine Recherche zu den Schulbibliotheken in Berlin durchgeführt, die an eine Recherche anschloss, die ich 2006 in meiner Magisterarbeit verwendet hatte. Diese Recherche habe ich nun in diesem Monat wiederholt. Dabei habe ich die Homepages aller Berliner Schulen nach Hinweisen zu Schulbibliotheken durchsucht.
Wozu das ganze? Es gibt einfach keine anderen Daten zu Schulbibliotheken. Deshalb schweben alle Angaben und Texte zu Schulbibliotheken erstaunlich unempirisch in der Luft, es sei den, sie basieren auf individuellen Erfahrungen (wie z.B. bei Günter Schlamp). Solche Erfahrungen sind selbstverständlich wichtig und interessant, aber sie erlauben beispielsweise nicht, Aussagen darüber zu treffen, wieviele Schulbibliotheken es eigentlich gibt. Angesichts dessen, dass der Bildungspolitik alle paar Jahrzehnte mal einfällt, dass Schulbibliotheken irgendwie sinnvoll sein könnten, ist das schon erstaunlich. Berlin bietet sich als Recherchegegenstand an, weil es gerade nicht als Hochburg der Schulbibliotheken bekannt ist.
Eine kurze Zusammenfassung der Ergebnisse:

  • Schulbibliotheken sind weiterhin schulinterne Einrichtungen, die sich nach den Anforderungen der jeweiligen Schule richten, nicht danach, was in den (seltenen) bibliothekarischen oder pädagogischen Texten über sie gesagt wird.
  • Sie sind deshalb vollständig eigenständig. Es scheint keine Gemeinsamkeit in Ausstattung, Nutzungskonzept, tatsächlicher Nutzung, Öffnungszeiten, Personal, Bestand und Bestandsentwicklung, Einbindung in den Schul- und Unterrichtsalltag, Etat oder anderes zu geben.
  • Öffentlichen und Schulbibliotheken arbeiten in Berlin offenbar so gut wie gar nicht zusammen.
  • Eine relativ große Anzahl von Schulen betreibt Schulbibliotheken (oder ermöglicht es, dass andere, z.B. Schulfördervereine sie betreiben), allerdings entscheidet sich die große Zahl von Schulen dagegen. Einige wenige Schulen geben dafür Geld- und Raumnot an, der Großteil beschäftigt sich zumindest in Öffentlichen Dokumenten nicht mit dieser Frage.
  • Die gerundeten Zahlen: Nach Eigenangabe haben in Berlin 25,3% der Grundschulen (110 von 434), 11,3% der Hauptschulen (6 von 53), 6,8% der Realschulen (5 von 73), 28,7% der Gymnasien (31 von 108), 30,2% der Gesamtschulen (16 von 53), 11,0% der Schulen mit besonderem Förderschwerpunkt (8 von 73) und 11,1% (naja, 1 von 9) Freien Schulen, also insgesamt 22,0% (177 von 803) Schulen bis zur Sekundarstufe II eine Einrichtung, die sie als Schulbibliothek, -bücherei, -mediothek oder ähnlich beschreiben.
  • Im Vergleich zu den Daten von 2008 ist das eine leichte Steigerung bei allen Schultypen, wobei es immer noch so ist, dass die Schülerinnen und Schüler, die einen „hohen“ Bildungsabschluss anstreben, eine weit größere Chance haben, eine Schulbibliothek zu nutzen, als diejenigen, welche einen „geringeren“ Bildungsabschluss anstreben. Oder anders: Gymnasiasten und Gymnasiastinnen haben mehr Schulbibliothek, als Lernende auf Real- und Hauptschulen, obwohl Schulbibliotheken zumeist diskursiv mit dem Lesenlernen verbunden werden und nicht mit dem Abitur. Allerdings reichen zwei Datensammlungen nicht aus, eine Entwicklungstendenz zu konstatieren.

Ich habe einen kleinen Text, „Schulen und Schulbibliotheken in Berlin, 2009“ geschrieben, welcher die Daten genauer bespricht. Dieser findet sich hier: http://www.divshare.com/download/7214782-286
Außerdem habe ich für diejenigen, welche mit den Daten arbeiten wollen, diese Daten inklusive der Zotero-Schnappschüssen in ein Archiv gepackt, welches hier zu finden ist: http://www.divshare.com/download/7214551-9de [Achtung: durch die Zotero-Dateien ist es ziemlich groß, genauer gesagt 67 MB.]
Die Daten zur Recherche 2008, nach denen ich auch immer wieder mal gefragt wurde, finden sich hier: http://www.divshare.com/download/7214893-71f

Lernen aus Bibliotheksbüchern

John Amosford berichtet von einer Studie von Bibliotheken im Devon County [England], in welcher versucht wurde, festzustellen, was Nutzerinnen und Nutzer eigentlich aus den Büchern lernen, die sie sich in Bibliotheken ausborgen. [Amosford, John / Assessing Generic Learning Outcomes in public lending libraries. – In: Performance Measurements and Metrics, 8 (2007) 2, pp. 127-136] Diese Frage stellte sich im Rahmen der in England an quasi alle öffentlichen Einrichtungen ergehenden ständigen Aufforderung, die Effekte ihrer Arbeit nachzuweisen und gegebenenfalls auf der Basis nachvollziehbarer empirischer Grundlangen zu verbessern [Evidence Based Librarianship].
Dabei wird selbstverständlich auch in England davon ausgegangen, dass Bibliotheken einen Lerneffekt bei ihren Nutzerinnen und Nutzern auslösen würden, obwohl Amosford noch einmal kurz diskutiert, warum eine Bibliothek trotzdem keine formale Bildungseinrichtung (wie Schulen oder Universitäten) sein und mit diesen auch nicht vergliechen werden kann. Allerdings stellt auch Amosford fest, ist dieser weithin angenommen Lerneffekt schwierig zu bestimmen. Der Ausgangspunkt der Studien war folgender: Bibliotheken würden, ganz egal welche Funktionen und Angebote sie ansonsten anbieten und welchen Reformen sie unterworfen würde, immer noch vorrangig von der Öffentlichkeit genutzt, um Bücher auszuleihen:

While the role of libraries has broadened in recent years, the book lending function of libraries is still seen as a core function of libraries by many members of the public, and will remain central to debates about service reform. [p. 135]

Das Problem sei nun, dass zwar vermutet werden kann, dass diese Bücher unter anderem für Lernaktivitäten genutzt werden oder „nebenher“ Wissen vermitteln; aber gerade diese Vermutung schwierig zu beweisen ist. Die Bibliotheken im Devon County versuchten dies mithilfe einer Umfrage anzugehen. Sie formulierten folgende Fragen:

Did the book:
Provide you with insight (knowledge and understanding)?
Help you learn new facts (knowledge and understanding)?
Help develop your skills (skills)?
Challenge your attitudes (attitudes and values)?
Change your opinions (attitudes and values)?
Entertain you (enjoyment, inspiration, creativity)?
Motivate or inspire you (enjoyment, inspiration, creativity)?
Change your daily life (activity behaviour and progression)?
Benefit you personally (activity behaviour and progression)? [p. 129]

Interessant war der Weg, diese Fragen zu stellen. Sie wurden auf einem A4-Blatt zusammegefasst, welches den einzelnen ausgeliehen Büchern beigelegt wurde. Dies machte deutlich, dass sich die Fragen auf das jeweilige Buch bezogen. Außerdem konnten sie so von den Ausleihenden on-the-fly beim oder gleich ach dem Lesen des jeweilgen Buches beantwortet werden und nicht erst eine Zeit nach dem Lesen, wie dies bei Interviews der Fall wäre.
Amosford spricht von einer Antwortrate von 20%, was einerseits bedeutet, dass die Daten zwar Trends anzeigen, aber nicht als repräsentativ gelten können. Dennoch erhielten die Bibliotheken 3636 Anworten für belletristische und 1706 für Sachliteratur.
Ein Großteil der Antwortenden gab an, aus dem jeweiligen Buch etwas mitgenommen zu haben, ob nun eine neue Sichtweise oder neue Fakten. Dies gilt nicht nur für die Sachliteratur, sondern ebenso für Belletristik. Kaum jemand gibt an, dass das jeweilige sein oder ihr Leben verändert hätte. Interessant ist allerdings, dass nur eine Minderheit von – immerhin – 27% der Menschen, die sich Sachliteratur ausgeborgten, dies taten, weil sie diese für eigenständige Lernprozesse benötigten. Vielmehr gaben 57% (bei der Belletristik 96%) an, das jeweilige Werk zum privaten Vergüngen („private enjoyment“) gelesen zu haben. Dies ist ein Rückschlag für die Vorstellung, dass Menschen im Allgemeinen ein konkretes Informationsinteresse formulieren und sich danach gezielt Medien aus der Bibliothek besorgen. Das gibt es auch, aber ein Großteil der Menschen liesst offenbar Sachliteratur aus Spass. Es ist zumindest zu fragen, ob man den Bestandsaufbau an stark an solchen angenommenen Informationsinteressen ausrichten sollte.
Obwohl die Methode ihre Grenzen hat, die von Amosford auch besprochen werden, zeigen sie doch einen gangbaren Weg, um zumindest grundlegende Aussagen über die Nutzung von Bibliotheksmedien treffen zu können.

Woher kamen eigentlich die PISA-Studien?

Vor einigen Jahren dominierten in Deutschland die PISA-Studien die öffentliche Debatte, die Bildungspolitik und auch die bibliothekarischen Konzeptpapiere und Texte. Das scheint heute anders geworden zu sein, so richtig wurde PISA 2006 nicht mehr wahrgenommen und langsam verschwindet die Phrase, dass man an den PISA-Studien sehen könnte, wie schlecht das deutsche Bildungssystem ist und das deshalb eigentlich sofort xxxx [1], wieder aus diesen Texten.
Was allerdings in diesen Debatten und auch heute nicht so richtig gefragt wurde, war, wieso es eigentlich diese Studien gab. Immerhin kosteten sie jeweils (für Deutschland) rund 30 Millionen Euro. Und sie waren auch nicht die einzigen Studien im Feld der Bildungsstatistik. Hinzu kamen unter anderem die IGLU-Studien, die Stefi-Studie, die DESI-Studie und weitere lokale Studien wie Markus, QuaSum, LAU und LaC. Nicht zu vergessen die Anstrengungen, eine nationale Bildungsberichtserstattung aufzubauen (nicht nur – wie schon länger praktiziert – für die Weiterbildung, sondern auch für Kindertagesstätten oder den gesamten Bildungssektor). Hingegen erschienen die PISA-Studien in den meisten Texten, die sich auf sie bezogen, quasi vom Himmel gefallen zu sein. Irgendwie schien irgendwer (die OECD, wenn man genauer nachschaute) auf den Gedanken gekommen zu sein, diese Studien durchzuführen und irgendwie konnten sie dann auch relativ einfach durchgeführt werden (was immerhin hieß, dass jeweils rund 5.000 Schülerinnen und Schüler drei Stunden Tests schreiben und zudem von allen beteiligten Schulen Fragebögen ausgefüllt werden mussten). Die eigentlich selbstverständliche Frage, welche Aufgaben diese Studien haben, wie sie initiiert und durchgeführt wurden, schien kaum gestellt zu werden, bevor sie jeweils zur Untermauerung des eigenen bildungspolitischen Standpunkts herangezogen wurden.
Dabei sind diese Studien Teil einer relativ grundlegenden Wende der deutschen Bildungspolitik. Es herrscht heute die Vorstellung vor, dass Bildungseinrichtungen nur durch eine möglichste breite und große Unterstützung durch wissenschaftliche Methoden politisch gesteuert werden könnten. Euphemistisch wird diese Hinwendung zu Vergleichsstudien gerne als Anpassung an internationale Gepflogenheiten dargestellt. Das ist selbstverständlich so nicht richtig. Es gibt einige Staaten, in denen in der Bildungspolitik ein Focus auf die externe und interne Evaluationen gelegt wird und es gibt auch Staaten, die sich nicht auf solche Evaluationen konzentrieren oder in denen die Bedeutung von Bildungsevaluationen (schon wieder) zurückgeht. [2] Letztlich ist das immer eine politische Entscheidung, egal wie sehr sich darauf berufen wird, dass es sich bei den Studien um wissenschaftliche Werke handeln würde. [3]
Diese Umorientierung in der Bildungspolitik ist – egal, was man von ihr hält – weit relevanter, als dies in den meisten Bezügen auf die PISA-Studien thematisiert wurde. Die Hinwendung zu empirischen Bildungsberichten verschiebt die Wahrnehmung der Politik von der Aufgabe und Funktion von Bildungseinrichtungen relevant. Letztlich machen diese Bildungsstudien das Versprechen, dass es möglich ist, Bildungsqualität empirisch zu messen und dies sogar in einer solchen Weise, dass (faire) Vergleiche zwischen Bildungseinrichtungen möglich werden und sich aus diesen Ergebnissen Handlungsoptionen für die Bildungspolitik ableiten lassen. Dieses Versprechen wird seit etwas mehr als zehn Jahren in der deutschen Bildungspolitik allgemein geteilt, auch wenn der gesellschaftliche und journalistische Hype um die PISA-Studien offenbar vorbei ist. Letztlich ist dieser Paradigmenwechsel auch relevanter, als beispielsweise jede Aussage über die Lesekompetenz deutschen Schülerinnen und Schüler im Vergleich zu Lernenden in anderen Staaten, die mithilfe der PISA-Studien gemacht wurde.
Eine sehr übersichtliche Zusammenfassung der Versprechen, welche sich die Bildungspolitik von dieser empirischen Wende macht, liefert Isabell van Ackeren [Ackeren, Isabell van (2007) / Nutzung großflächiger Tests für die Schulentwicklung : Exemplarische Analyse der Erfahrungen aus England, Frankreich und den Niederlanden. – Bonn ; Berlin : Bundesministerium für Bildung und Forschung. – (Bildungsforschung ; 3)] im ersten Teil ihrer Untersuchung über verschiedene Ansätze der Nutzung des in solchen Vergleichsstudien generierten Wissens.

Der Blick über die nationalen Grenzen zeigt, dass in vielen Schul­systemen Europas die Einzelschulen in den letzten Jahren immer stärker dazu angehalten werden, Verantwortung über ihre Leistun­gen abzulegen. Zentral organisierte Leistungsmessungen und Eva­luationsprogramme spielen dabei eine wichtige Rolle. Mit ihrer Hilfe werden Auskünfte über die Qualität der Einzelschule einge­holt und öffentlich oder/und vertraulich verschiedenen Zielgrup­pen zur Verfügung gestellt. Großflächige externe Evaluationsfor­men stellen ein wichtiges Element grundsätzlicher, auf die Anhe­bung des Leistungsniveaus eines Bildungssystems ausgerichteter Reformen dar: Die Schulen vieler Länder sind zum Subjekt einer Gesetzgebung und Politik geworden, die große Veränderungen in Bereichen wie ‚Curriculum’, ‚Leistungsmessung’ und ‚Schulauto­nomie’ mit sich brachten. So sind die curricularen Forderungen restriktiver geworden, Testverfahren, aber auch regelmäßige Schul­inspektionen wurden ausgeweitet, Bildungspolitik wurde bei gleichzeitiger Dezentralisierung der Verantwortung für ihre Imple­mentierung stärker zentralisiert und verschiedene Regierungen haben versucht, Marktelemente im Bildungsbereich einzuführen, indem Eltern verstärkt Schulwahlmöglichkeiten eingeräumt wur­den und die Finanzierung der Schulen an die eingeworbene Schü­lerzahl gekoppelt wurde. In diesem Kontext ist ein Denken in be­trieblichen Begriffen auch im schulischen Bereich nicht mehr ungewöhnlich. Unterricht wird durchaus als ein Produktionsprozess gesehen, mit dem Inputs in Outputs transformiert werden. Die Ausprägung solcher Reformen variiert von Land zu Land aufgrund historischer, kultureller, institutioneller und politischer Faktoren. Es gibt einige gemeinsame Elemente, die sich über die Ländergrenzen hinweg identifizieren lassen; großflächige, extern gesteuerte Evaluationsformen sind ein Beispiel dafür, obgleich solche Reform­elemente im Kontext des jeweiligen nationalen Bildungssystems einschließlich seines historischen und gegenwärtigen sozialen Zusammenhangs zu betrachten sind. Vor diesem Hintergrund stre­ben Regierungen vieler Länder der ganzen Welt nach Möglichkeiten, Wissen und Kompetenzen zu testen und sie interessieren sich dafür, ob und wie dadurch das Lehren und Lernen mit den entsprechenden Arbeitsergebnissen kontrolliert werden kann. Die Etablierung von Tests, Prüfungen und Studien wird als wichtiger Steuerungsmechanismus in vielen Ländern angesehen: Alle Schü­ler/innen werden demnach zur Teilnahme an standardisierten Tests und Prüfungen verpflichtet. Das Erreichen bzw. Nicht-Errei­chen der geforderten Standards ist nicht selten mit positiven bzw. negativen Sanktionen, z. B. finanzieller Art, verknüpft, um in Schu­len und Klassenräumen Änderungen zu erreichen und dadurch insgesamt Reformen in Bildungssystemen umzusetzen. Die erhofften Möglichkeiten einer testbasierten Reform scheinen dabei auch aus Kostengründen attraktiv. Tests sind offensichtlich weniger teuer als Reformen, die direkten Einfluss auf das Unterrichtsgeschehen nehmen wollen.
[Ackeren (2007), S. 8f.]

Diese Versprechen werden sich nicht im erhofften Maße erfüllen – dies ist aufgrund internationaler Erfahrungen und der Erfahrung aus anderen Bildungsreformen in Deutschland, schon jetzt problemlos vorher zu sagen. Allerdings ist ein teilweises Scheitern von Reformen im Rahmen demokratischer Prozesse auch kein wirkliches Problem, sondern Triebfeder gesellschaftlicher Auseinandersetzungen. Deswegen wird auch dieses Scheitern insgesamt nicht zum Untergang des deutschen Bildungssystems führen, auch wenn solcher Szenarien immer wieder gerne aufgerufen werden. Trotzdem bestimmen diese Vorstellungen aktuell die Wahrnehmung von Bildungseinrichtungen durch die Bildungspolitik. Und, auch dies ist kein wirklich schwierige, Vorhersage, wenn Bibliotheken Einrichtungen sein wollen, die irgendetwas mit Bildung zu tun haben wollen, dann werden sie gezwungen sein, sich unter dieses Regime zu ordnen. Die PISA-Studien sind nicht vom Himmel gefallen, sie sind Teil eines politischen Paradigmenwechsels. Und dieser ist – wie alle Paradigmenwechsel – weder eindeutig zu begrüßen noch eindeutig abzulehnen.

Fußnote:
[1] Hier beliebige bildungspolitische Massnahme einsetzen. Gerade in der Hochzeit der Debatte schien es, als könnte einfach jede politische Entscheidung (von der egalitären Ganztagsgesamtschule bis zur Förderung der Bildung im Familienverband) und kulturelle Veranstaltung mit den PISA-Studien begründet werden, auch wenn das die eigentlichen Studien bei genauerem Lesen eher selten hergaben.
[2] Dies hat auch lange nicht so viel mit den in Deutschland gerne gepflegten modernen Feindbildern zu tun, wie dies auf den ersten Blick erscheinen könnte. Beispielsweise ist Englang ein Land, in welchem fast ausschließlich Evaluationen und (sich ständig ändernde) Bildungsstandards zur Steuerung von Bildungseinrichtungen eingesetzt wird, wohingegen in Schottland nicht einmal ein allgemein akzeptiertes landesweites Curriculum für Bildungseinrichtungen existiert. In Wales und Nordirland haben Evaluationen ebenso nicht die Bedeutung, die sie in England haben. Ähnlich verhält es sich mit den USA, in dem die Bedeutung von Vergleichsstudien für die nationale Bildungspolitik groß ist – was allerdings in seiner Wirkung dadurch eingeschränkt ist, dass die Bundesregierung keinen verfassungsrechtlichen Anspruch auf die Bildungspolitik der Staaten hat und wenn überhaupt, dann durch die Vergabe von Finanzmitteln Einfluss auf die Bildungspolitik nehmen kann. In einigen US-amerikanischen Bundeststaaten ist die Bedeutung solcher Studien ebenfalls groß, in anderen ist sie praktisch sehr gering. Auch die in Deutschaldn gerne als Vorbild begriffenen skandinavischen Staaten sind ähnlich divers. Norwegen setzt stark auf Bildungsevaluationen und die Veröffentlichung der auf diesem Weg gewonnen Daten, während Schweden sehr verhalten damit umgeht. Auch in Finnland, dass in Deutschland gerne als „PISA-Gewinner“ begriffen wird, haben Bildungsstatistiken einer eher geringen Wert. Und das Frankreich ebenso wie Deutschland in den PISA-Studien eher schlecht abschnitt, hat die dortige Bildungspolitik nicht wirklich groß tangiert. Man sollte also mit einfachen Erklärungen, warum in einem Land empirische (und teilweise auch pseudo-empirische) Bildungsberichterstattungen eine große Bedeutung haben und in anderen nicht, sehr zurückhaltend sein. Dies scheint sehr von der nationalen Bildungspolitik und den dort vertrenden Ansichten beeinflusst zu sein.
[3] Was für einige Studien, die außerhalb Deutschlands eingesetzt werden, teilweise bestritten werden kann.

Ungewollte Effekte weitflächiger Evaluationen

[Gesellschaftliche] Technik, im umfassenden Sinne begriffen, ist funktionierende Simplifikation, ist eine Form der Reduktion von Komplexität, die sich konstruieren und realisieren läßt, obwohl man die Welt und die Gesellschaft nicht kennt, in der dies geschieht: ausprobiert an sich selber. Die Emanzipation der Individuen – wohlgemerkt: auch der unvernünftigen Individuen – ist ein unvermeidlicher Nebeneffekt dieser Technisierung.
Nur ein so weit gefaßter Technikbegriff kann den Anspruch einlösen, zur Selbstbeschreibung der modernen Gesellschaft beizutragen. Er mach das Beiseiteschieben von Hinsichten und Rücksichten verständlich. Er bezeichnet das Absehen von individualpsychologischen und von ökologischen Auswirkungen gleichermaßen. Er klärt die technische Seite der Wissenschaft, und zwar ganz unabhängig von den Anwendungen wissenschaftlicher Erkenntnisse auf Produktionsprozesse. Er macht verständlich, daß die moderne Gesellschaft zur humanistischen und zur ökologischen Selbstkritik neigt; aber auch: daß sie in Reaktion darauf wiederum nur Technik einsetzen kann, indem sie zum Beispiel Humandefizite und ökologische Probleme als Fianzierungsprobleme auffaßt.
[Luhmann, Niklas / Beobachtungen der Moderne. – 2. Aufl. – Wiesbaden : VS Verlag für Sozialwissenschaften, 2006 [1992], S.21f.]

Am 24. und 25. Juni 2008 fand am Wissenschaftszentrum Berlin für Sozialforschung (WZB) die eher wenig besucht Konferenz „Changing Educational Accountablility in Europe“ statt. Während im deutschen Bildungssystem, hauptsächlich im Bezug auf Schulen, Diskussionen darüber geführt werden, ob allgemeine Standards zu einer Erhöhung der Schulqualität führen können, ob mehr nationale und internationale Vergleichsstudien zu einer Verbesserung der Bildungsergebnisse führen werden und ob die Orientierung am betriebswirtschaftlichen Paradigma der informierten Kundin bzw. des informierten Kunden und einem verstärkten Wettbewerb zwischen autonomen Schulen positive Effekte für Schülerinnen, Schüler und deren Familien haben könnten, ist eine solche Test- und Wettbewerbssituation in anderen Staaten die allgemeine Praxis im Schulsystem. Dabei stechen die USA und England (nicht Schottland, Wales und Nordirland) hervor, in denen die bildungspolitische Steuerung der Schulen hauptsächlich über nationale, regionale und kommunale Standards, Test und Wettbewerbssituationen erfolgt. Erklärtes Ziel der deutschen Bildungspolitik ist es, sich dieses Praxis anzunähern. Der sogenannte Konstanzer Beschluss von 1997, in welchem die Kultusministerkonferenz beschloss, dass Deutschland (wieder) an internationalen vergleichenden Bildungsstudien teilnehmen und die Ergebnisse dieser Studien zur Weiterentwicklung des Bildungssystems nutzen soll, war der offizielle Beginn dieses bildungspolitischen Paradigmenwechsels. Die IGLU- und die PISA-Studien waren seine bisher bekanntesten Ergebnisse.

Inkonsistente Studienergebnisse
Die Grundfrage der Konferenz war, so die Präsidentin der WZB Jutta Allmendinger, herauszufinden, was das Messen, Testen und Standardisieren im Hinblick auf Schul- und Unterrichtsqualität bringt. Insbesondere interessierten die Veranstaltenden dabei ungewollte Effekte dieser Steuerungsmodelle. Dabei steht man, wenn man einmal versucht, über eine einzelne Studien hinauszuschauen, beständig vor einem weiteren Rätsel: die Ergebnisse verschiedener Studien lassen sich kaum konsistent miteinander verbinden. Als Beispiel zeigte Prof. Allmendinger, dass es keinen statistischen Zusammenhang zwischen den Ergebnissen von Staaten in den PISA-Studien und der Verteilung und Anzahl und vorgeblichen Qualität der Schulabschlüsse in diesen Staaten gibt. Einen solchen Zusammenhang gibt es auch nicht, wenn man die einzelnen deutschen Bundesländern miteinander vergleicht. Wie im Laufe der Konferenz ersichtlich wurde, gilt dies für verschiedene Studien und Kriterien, die zur Bestimmung der Qualität von Bildungssystemen herangezogen werden.

name and blame
Gwyn Bevan, Professor an der London School of Economics and Political Science, stellte die Praxis des name and blame im englischen Gesundheitssektor vor. Der Gesundheitssektor ist dabei als Vorreiter einer Entwicklung zu sehen, welche mit einiger Verzögerung auch im englischen Bildungssektor zur Anwendung kam. Gesundheitseinrichtungen – Krankenhäuser, Kurhäuser, einzelne Praxen – werden als relativ autonome Akteure auf einem Pseudomarkt verstanden. Diese Institutionen werden so wenig wie möglich direkt bürokratisch kontrolliert und gesteuert, sondern – soweit möglich – als Black-Box verstanden, die einen Input erhalten und einen messbareren Output erzielen sollen. Wie sie den Weg von Input zu Output organisieren, bliebt dabei idealtypisch ihnen selbst überlassen. Die Eingriffsmöglichkeiten des Staates soll sich – neben der Gesetzgebung – auf Hilfe im unabwendbaren Notfall und die finanzielle Förderung guter Praxis beschränken. Gemessen wird diese „gute Praxis“ mithilfe von Standards, d.h. mit mehr oder weniger komplexen Fragesätzen, deren Antworten in möglichst einfache Zahlen übersetzt werden. Im Allgemeinen werden diese Ergebnisse in einfach Punktesystemen (z.B. null bis vier Sterne) und Ranglisten ausgedrückt und in dieser Form auch intensiv medial verbreitet. Insbesondere die Einrichtungen, die bei solchen Tests schlecht abschneiden, werden öffentlich von der Regierung und der Presse benannt und als schlechte Beispiele dargestellt. Dies ist zwar unter der New Labour Regierung seit 1997 verstärkt worden, wurde aber ähnlich schon unter der Regierung der Conservative Party praktiziert.
Erwartet wurde nun, dass sich Institutionen anstrengen würden, möglichst hohe Punktzahlen (Sternchen) zu erhalten, dass sie dies durch eine allgemeine Steigerung der Qualität tun würden und dass gleichzeitig die Grundsätze des kapitalistischen Wettbewerbs dazu führen würden, dass die durch die Ranglisten informierten Bürgerinnen und Bürger das jeweils beste Produkt wählen, bzw. die jeweils beste Einrichtung besuchen würden und somit diejenigen Einrichtungen, die schlechte Ergebnisse erreichen, entweder ihre Qualität verbessern oder aber untergehen würden. [1]
Das trat allerdings, so lässt sich der Vortrag von Bevan zusammenfassen, nicht ein. Egal, wie gut oder schlecht eine Praxis oder ein Krankenhaus abschnitt: es gingen weder relevant mehr noch relevant weniger Menschen hin. Dies ist bei Schulen nicht anders: immer noch gehen Kinder und Jugendliche vor allem in möglichst wohnortnahe Schulen, egal wie sehr sich diese spezialisieren oder wie gut und schlecht diese Schulen bei Rankings abschließen. Der erwartete Markteffekt, welcher durch die Darstellung möglichst einfach nachvollziehbarer Informationen [2] und möglichst großer Wahlmöglichkeit der Individuen erreicht werden soll, trat bis heute nicht ein. Ähnliches berichtete im Laufe der Tagung auch Guri Skedsmo für das norwegische Schulsystem, welches ebenso die Wahlfreiheit der Schülerinnen, Schüler und Eltern fördert.
Ebenso ist allerdings auch kein qualitätssteigender Effekt auf die einzelnen Einrichtungen nachzuweisen. Zwar steigen die gemessenen Werte tendenziell, aber das auch überall. Die Abstände bleiben ähnlich groß.
Hingegen sind negative Effekt für die Reputation und Selbstwahrnehmung der getesteten Einrichtungen nachzuweisen. Zum einen das Gefühl des Personals, für minderwertige Einrichtungen zu arbeiten, dass insbesondere nach schlechten Testergebnissen auftritt. Bevan erwähnte Berichte von Menschen, die sich „am Tag danach“ (d.h. nach einem schlechten Testergebnis) leer und ausgebrannt fühlen und auf ihr Arbeitsstelle als trostlos und emotional herabziehend ansehen. Dies ist nicht nur bei Null-Sterne-Ergebnisse zu beachten, sondern auch bei (meist vorübergehenden) Verlusten von einem Stern, was zu wahren Panikreaktionen in den Einrichtungen führen kann. Zudem ist zu beobachten, dass gerade Einrichtungen, die mit einer solchen Abqualifzierung rechnen, hauptsächlich auf Marketing-Aktionen setzen und nicht auf langfristige Strategien.
Verstärkt wird dieser Effekt dadurch, dass es nicht etwa ein einziges nationales Testsystem gäbe, welches immer und überall angewandt würde, sondern immer wieder wechselnde Tests , ausgehend von unterschiedlichen politischen Ebenen und mit unterschiedlichen Blickwinkeln.

Campbell’s Law

The more any quantitative social indicator is used for social decisionmaking, the more subject it will be to corruption pressures and the more apt it will be to distort and corrupt the social processes it is intended to monitor. [Campbell’s Law]

Daniel Koretz von der Harvard University zitierte Campbell’s Law, um die Wirkung von Tests im us-amerikanischen Bildungssystem zu kennzeichnen. Campbell’s Law besagt, dass ein Indikator um so mehr ein Objekt von direkter und indirekter Korrumption wird, je mehr er als Basis für gesellschaftliche und politische Entscheidungen herangezogen wird.
Bevor er dies ausführte, stellte Koretz klar, dass der überwältigen Bedeutung von unterschiedlichen Tests und Evaluationen im politischen und gesellschaftlichen Diskurs wenig bis quasi gar kein Wissen über diese Tests gegenüberstehen. Die gesamten Tests, egal ob lokal eingesetzte Überprüfungen von Standards oder Tests im Umfang der PISA-Studien, sind selber bisher kaum Gegenstand wissenschaftlicher Untersuchungen geworden. Wir haben kaum Daten über die Reliabilität von Tests, wir haben auch kaum ein Wissen darüber, wie groß die tatsächliche Aussagekraft solcher Tests tatsächlich ist.
Dabei erinnerte Koretz an einen eigentlich trivialen, aber gerne übersehenen Fakt, nämlich daran, dass Tests das jeweils gemessene auf small samples reduziert, beispielsweise die Schulabschlussprüfung das Lernen von 10 oder mehr Jahren Schule in einige Stunden Tests oder die IGLU- und PISA-Studien die Lernerfolge von Schülerinnen und Schülern der vierten Klasse respektive 15-Jährigen in jeweils 2-stündigen Tests. Das jeweils abgefragte Sample soll also immer einen größeren Wissens- und Kompetenzbestand repräsentieren. Ob das Sample dies tatsächlich tut, ist nicht so klar, wie dies gerne angenommen wird. Dies ist bei Schulnoten aus zahlreichen Anekdoten bekannt und immerhin soweit akzeptiert, dass gegen Noten der Klageweg vor Gericht möglich ist. Bei den PISA-Studien hingegen oder auch zahlreichen anderen Evaluationen scheint das quasi nicht thematisiert zu werden.
Desweiteren stellte Koretz auf der Basis seiner Forschungsergebnisse zu Evaluationen im Bildungsbereich klar, dass die in diesen Evaluationen jeweils gemessenen Daten und Kompetenzen zumeist „simple and unspecified“ seien, bzw. dass sie zumeist so grob gefasst werden, dass die Menschen zwar mit ihnen umgehen, aber nicht wirklich sagen können, was jetzt genau gemessen wurde und was die jeweiligen Ergebnisse heißen. Lesekompetenz zum Beispiel: was ist das?
Und nicht zuletzt scheint ein Charakteristika von Ergebnissen solcher Test zu sein, dass sie regelmäßig für Aussagen herangezogen werden, die eine gesellschaftliche oder politische Bedeutung haben, aber überhaupt nicht getestet wurden. Hier kann beispielsweise an die im Rahmen der Debatten um die PISA-Studien mit voller Überzeugung geäußerte Behauptungen verweisen werden, dass Bibliotheken einen positiven Einfluss auf die Entwicklung der – wie gesagt nicht wirklich klar gefassten – Lesekompetenz haben würden, obwohl dieser Einfluss in den Studien überhaupt nicht abgefragt wurde.

Die Überbetonung einzelner Werte, die Campbell’s Law als problematisch herausstellt, führt laut Koretz in US-amerikanischen Schulen zu vier ungewollten Mechanismen:

  1. Cheating, also einfacher Betrug. Je bedeutender das Erreichen bestimmter Werte für die Existenz einer Einrichtung ist oder auch nur dafür, von weiteren Beobachtungen und ungewollten Unterstützungsleistung verschont zu bleiben wird, umso höher ist die Chance, dass dies mit Betrug versucht wird. Dieser Effekt ist allerdings zu erwarten und wird in den meisten Anlagen von Testläufen antizipiert.
  2. Changing which people are treated or measured. Bei jedem bedeutsamen Test kommt es laut Koretz dazu, dass Schulen und lokale Behörden versuchen, bestimmte Schülerinnen und Schüler aus Tests herauszuhalten, indem beispielsweise Ausschlussgründe, die es in jedem Test gibt, sehr weitreichend ausgelegt werden. Bevans hatte Ähnliches für Gesundheitseinrichtungen in England berichtet, wo teilweise bestimmtes Personal oder bestimmte Patientinnen und Patienten an Testtagen von der Einrichtung ferngehalten wird. Selbstverständlich verzerrt sich so jedes Ergebnis.
  3. Shifting efforts from unmeasured to measured outcomes. Dieser Effekt ist eigentlich vorhersehbar, insbesondere, wenn Evaluationen beständig wiederholt werden. Man muss sich allerdings daran erinnern, dass die jeweils gemessenen Werte konstruiert werden, um Aussagen über weiterreichende Kompetenzen zu liefern. Bei der Konstruktion der Tests wird jeweils davon ausgegangen, dass durch das Messen eines Teilbereiches eine Aussage über eine ganzheitlich vermittelte Kompetenz getroffen werden könne. So wurde aus den Ergebnissen der PISA-Test geschlossen, wie die tatsächliche Lesekompetenz der Schülerinnen und Schüler sei. Lesekompetenz ist dabei ein Konstruktion, welches den alltäglichen und problemzentrierten Einsatz des Lesens und der Verarbeitung des Gelesenen beinhaltet. Letztlich waren aber auch diese Test zeitlich begrenzte schriftliche Kontrollen im Klassenraum. Während dies bei einmaligen Test vor allem eine Problem der Aussagekraft darstellt, wird dies bei regelmäßiger Wiederholung zu einen Verzerrungsproblem und führt zu einer Veränderung des Unterrichts. Die Vermittlung von ganzheitlichen Lernstoffen wird zurückgestellt zugunsten des Lernens von getesteten Werten. Dies ist bei den PISA-Studien so überhaupt nicht gewollt. Eigentlich sollen diese Tests so etwas wie ein Photo aus verschiedenen Schulsystemen liefern, während die Schulsysteme davon unbeeinflusst nebenher laufen sollen. Aber das funktioniert einfach nicht. Die Studien selber verändern, worauf im Unterricht und der Wissensvermittlung geachtet wird. Schwierig ist es, den Einfluss dieser Test auf die Gestaltung des Unterrichts genau zu beziffern, aber Koretz nannte Schätzungen, wonach es in US-amerikanischen Schulen üblich sei, sechs Wochen eines Schuljahres vor allem für solche Test – die, anders als die „normalen“ Schularbeiten oder Schuabschlusstests, keinen Einfluss auf die Bildungskarriere der Lernenden haben – zu üben. Abgefragt wird durch die Tests dann also vor allem eine Erinnerung an Geübtes, nicht – wie eigentlich impliziert – eine Kompetenz oder ein Wissensbestand. [3]
  4. Undermining the measured outcomes. Das ist einer unerwünschter, aber eigentlich auch zu erwartender Nebeneffekt: gemessenen werden Daten immer, um mehr, als sich selber auszudrücken. Aber die Fokussierung auf diese Daten – die für die Vergleichbarkeit zwischen Einrichtungen oft notwendig ist – führt dazu, dass die Aussagekraft dieser Daten abnimmt. Die Einrichtungen werden sich, bewusst oder unbewusst, darauf ausrichten, diese Datenwerte zu verbessern und zwar nicht nur, indem die Qualität des Gesamtzusammenhangs, der durch die Daten repräsentiert werden soll, verbessert wird, sondern auch indem hauptsächlich die gemessenen Werte beeinflusst werden. Dies funktioniert oft viel banaler, als man sich das gerne vorstellen will. Der Effekt ist aus Bibliotheken in klein bekannt: am Eingang werden durch einen Zähler die Menschen gezählt, die durch diesen Eingang gehen. Aus dieser Zahl wird auf die Annahme der Bibliothek durch Besucherinnen und Besucher geschlossen. Würde – so die dahinter stehende Überlegung – die Qualität der Bibliothek erhöht, würden auch mehr Menschen diese besuchen. Deshalb wird bei der Bewertung von Bibliotheken die Zahl der Besuche beständig einbezogen. Aber da jede Bibliothek das weiß, kann sie auch darauf achten, dass die Anzahl der am Eingang gezählten Menschen hoch ist, ohne dabei wirklich zu cheaten: beispielsweise andere Ein- und Ausgänge schließen, ein Hinweis darauf abringen, dass es ein öffentliches Klo in der Bibliothek gibt, häufig den offiziellen Eingangs für bibliotheksinterne Gänge nutzen und nicht den Personaleingang, Bestände anschaffen, die zum Mitnehmen und weniger zum in-der-Bibliothek-Nutzen anregen. Das heißt nicht, dass die Zahl der Menschen, die durch den Eingang gehen, unbedeutend wäre. Sinkt sie innerhalb eines Jahres um 50% Prozent, ist das immer noch ein schlechtes Zeichen. Aber ihre Aussagekraft sinkt tendenziell immer weiter, je mehr sich das Wissen um die Bedeutung eines Wertes für die Bewertung einer Einrichtung verbreitet.

Hinzu kommt, so Koretz weiter, dass im schulischen Kontext die Präsentation von Tests zu gänzlich unterschiedlichen Ergebnissen führt, also beispielsweise eine Frage, die als Aufzählung präsentiert wird zu anderen Ergebnissen führt, als die gleiche Frage, die als Fließtext oder als Tabelle präsentiert wird. Insgesamt sei die Aussagekraft von Tests sehr gering, bzw. größtenteils „Nonsense“. Als Forschungsperspektive im Bereich Evaluationen und Standards nannte Koretz abschließend den impact on behavoir and on learning and the score inflation.
[Vgl. auch: Koretz, Daniel / Measuring Up : What Educational Testing Really Tells Us. – Cambridge, MA: Harvard University Press, 2008]

In der abschließenden Fragerunde nannte Koretz auf explizite Nachfrage als positiven Effekt der beständigen Evaluation und Testung US-amerikanischer Schulen, dass sowohl die Lehrkräfte als auch die Schulleitungen gezwungen wären, ihre eigene Arbeit schriftlich zu dokumentieren und zu reflektieren. (Allerdings gibt es aus englischen Bibliotheken auch schon die Klage, dass sie durch das ständige Berichteschreiben nicht mehr zum bibliothekarischen Arbeiten kämen.)
Gwyn Bevan argumentierte im Anschluss an Koretz‘ Vortrag, dass die Steuerung öffentlicher Einrichtungen durch Evaluationen und Standards strukturelle Ähnlichkeiten zum Kommandosystem der Sowjetunion aufweise, in welcher auch der Großteil der Verantwortung bei den jeweiligen Einrichtungen gelegen hätte und hauptsächlich über die Vorgabe von zu erreichenden Werten, die zumeist vereinheitlicht waren und auf die realen Gegebenheiten vor Ort wenig Rücksicht nahmen, regiert wurde.
Seine geringe Meinung von Testwerten untermauerte Koretz noch einmal mit dem Hinweis, dass seiner Erfahrung nach Tests zumeist nur das herauskriegen, was eh bekannt sei. Unerwartete Ergebnisse seinen zumeist auf Fehler in den Tests zurückzuführen. Wouter Van Dooren (Universiteit Antwerpen) illustrierte das an den PISA-Ergebnissen in Belgien. Belgien besteht bekanntlich aus zwei Regionen, Flandern und Wallonien, sowie der Hauptstadt Brüssel als eigener Region. Die Geschichte des Schulsystems in den beiden großen Regionen lange gleich verlaufen, erst vor ungefähr zehn Jahren wurden sie in den Verantwortungsbereich der Regionen überlassen, wobei die Struktur der Schulsysteme trotzdem ähnlich blieb. Die Schulen haben in beiden Landesteilen eine relativ große Autonomie. Die PISA-Ergebnisse fallen allerdings radikal auseinander: nimmt man nur Flandern, dann ist diese Region besser, als Finnland und Südkorea, misst man nur Wallonien, dann ist diese Region ungefähr so schlecht wie Deutschland. Es gibt für diese Ergebnisse keine wirkliche Erklärung, da die Strukturen, die gesellschaftlichen und sozialen Voraussetzungen und die Geschichte der Schulsysteme nahezu identisch sind. Eventuell, so Van Doorens Vermutung, liegt der Fehler tatsächlich in der Konzeption der PISA-Studien, nicht in den Schulsystemen, was allerdings die Frage aufwirft, wozu diese Studien dann überhaupt gut seien.

Anne West (London School of Economics and Political Science) konnte Koretz‘ Einschätzungen für die Schulen in England bestätigen. Sie stellte einen weiteren ungewollten Effekt der beständigen Evaluation, das ressourcen fest. Englische Schulen werden nach Standards bewertet, die beispielsweise besagen, dass 30% der Schülerinnen und Schüler in einem bestimmten Test eine bestimmte Note erhalten sollen. Nun haben Schulen immer solche Lernenden, die diese Noten von sich aus erreichen, Lernende, welche solche Noten nicht erreichen und Lernende, deren durchschnittlichen Leistungen an der Grenze dieser Noten liegen, die also vielleicht, aber vielleicht auch nicht diese Note erreichen. Intern logisch, aber nicht intendiert, ist nun, dass Schulen ihre Ressourcen auf die Schülerinnen und Schüler konzentrieren, die sich an dieser Grenze befinden, also beispielsweise Nachhilfestunden oder besondere Förderung im Unterricht erhalten, damit diese bei den relevanten Tests die bessere Note erreichen. Davon haben weder die Klassen als Gesamtverband etwas, da nur ein Teil der Lernenden gefördert wird, noch die leistungsschwachen Schülerinnen und Schüler, die eigentlich besondere Aufmerksamkeit verdienen würden und für deren Förderung eigentlich von Regierung Mittel bereitgestellt werden, die aber von den Schulen zum großen Teil zum ressourcen genutzt würden.
Zudem bestätigte auch West den Trend, das Schulen versuchen, Kinder und Jugendliche bei Test außen vor zu halten, auch wenn es dafür keine direkten Hinweise gäbe. Wichtig ist, dass diese Trends allgemein festzustellen sind, es also kein individuelles Fehlverhalten einzelner Schulen oder Lehrkräfte sei, sondern Effekte, die in der Struktur von Evaluationen und Bildungsstandards angelegt scheint.
Die Frage, warum überhaupt evaluiert würden und warum die Bildungspolitik trotz negativer Erfahrungen immer wieder auf Standards und Vergleichsstudien zurückgreift, konnte auch West nicht beantworten. Sie vermutete aber, dass es eher mit der Funktion des politischen Systems und weniger mit dem Bildungssystem zu tun habe: „at least there have to measure something“. Alles andere würde heißen, dass die Politik eingestehen müsse, dass die Evaluationen, welche das englische Schulsystem prägen würden, eine jahrelang beschrittene Sackgasse darstellen würde.

Tests sind politisch
Evaluationen und Vergleichsstudien sind, so kristallisierte sich im Laufe der Konferenz in fast allen Redebeiträgen immer mehr heraus, hauptsächlich politische Instrumente und nicht, wie sie oft verstanden werden, unangreifbare, wissenschaftlich fundierte und objektive Instrumente. [4]
Bénédicte Robert (Université Paris 12 val de Marne, Sciences Po) stellte dies an der Umsetzung des No Child Left Behind Act in Chicago dar. Der No Child Left Behind Act, erlassen 2001, definiert, dass bis 2014 eigentlich alle (100%, wobei politisch umstritten ist, was diese 100% genau heißt) Schülerinnen und Schüler in den USA den gleichen Standard in Lesekompetenz und der mathematischen Kompetenz erreichen sollen. Dazu wird auf eine standardbasierte Evaluation und Steuerung des Schulsystems, auf sogenannte, aber auch nicht genauer beschriebene, „scientifically based research“ und eine Wahlfreiheit zwischen den einzelnen Schulen gesetzt. Zumeist bedeutet die „scientifically based research“ die Vergabe von Evaluationsaufträgen an Unternehmen, die zwar wissenschaftliche Methodiken einsetzen, aber nicht Teil von wissenschaftlichen Einrichtungen darstellen, vergleichbar mit Umfrageinstituten wie Emnid, forsa oder Infratest und Einrichtungen wie Sinus Sociovision. Wichtig ist für diese Politik die Formulierung nationaler Bildungsstandards und der beständige Einsatz von Vergleichsstudien. Die im Rahmen des Gesetzes angewendeten Standards sind Ergebnis politischer Auseinandersetzungen, nicht pädagogischer Debatten.
Ergebnis dieser Politik war allerdings bislang nicht, dass sich die Qualität der Schulen verbessert hätte. Zwar steigen die Ergebnisse bei den regelmäßigen Test, doch scheint dies eher zu den von Koretz dargelegten ungewollten Effekten von Evaluationen zu gehören. Vielmehr hat sich, wie Robert darstellte, ein Kompetenzstreit zwischen unterschiedlichen politischen Ebenen darüber entwickelt, was genau, wie und wann gemessen wird. In Chicago hat dies beispielsweise den Effekt, dass die Schülerinnen und Schüler pro Schuljahr zwei unterschiedliche Tests schreiben müssen, einmal den, der im Bundesstaat Illinois verwendet wird und einmal den, welchen die Stadt Chicago verwendet. Interessant ist, dass durch die Konzentration auf Standards und Evaluationen, trotz aller Rhetorik von der erweiterten Autonomie der Schulen, der (verfassungsrechtlich nicht zu begründende) Einfluss des Nationalstaates und von Nicht-schulischem Personal, insbesondere aus der lokalen Wirtschaft, auf die Schulen zugenommen hat.
Giliberto Capano (Università di Bologna) fasste die Situation in Italien zusammen. In Italien existiert zwar seit 1994 eine Einrichtung, die für die Regierung Daten über die Hochschulen sammeln soll, was sie auch – das erste Mal in der italienischen Geschichte – kontinuierlich tut. Allerdings wird auf diese Daten von der Regierung – die in Italien auch relativ oft wechselt – kaum zurückgegriffen. Bisher gäbe es keine klaren und konsistenten Aussagen der Politik, was diese überhaupt von den Hochschule wolle, schlimmer noch: die einmal gemachten Forderungen scheinen relativ belanglos, ihre Umsetzung wird weder überprüft, noch bewertet. Ob eine Universität sie umsetzt oder nicht, scheint relativ egal. Ohne solche Vorgaben sei allerdings – abgesehen von allen anderen Problemen – jewede Evaluation vollkommen sinnlos.

Auch wenn das auf der Konferenz selber kein Thema war, geht die Formulierung von Tests immer auch mit einer kritischen Forschungsrichtung zusammen, die daran arbeitet, „faire Tests“ zu entwickeln, die unterschiedliche Ausgangsbedingungen einbeziehen und es beispielsweise ermöglichen sollen, unterschiedliche langfristig angelegte Schulkonzepte abzubilden. Der Einfluss dieser Forschungen scheint bisher aber nicht allzu groß zu sein.

Was ist zu erwarten?
Die Konferenz wurde einberufen, um sich darüber klar zu werden, was die sich abzeichnende Wende hin zu Standards und evaluationsbasierte Outcome-Analysen in der Bildungspolitik für das deutsche (formale) Bildungssystem bedeutet. Allerdings, so fasste Jutta Allmendinger am Ende der Konferenz zusammen, wissen wir immer noch nicht, was das ganze Messen und Standardisieren mit der Entwicklung der Schulqualität zu tun hat. So wie es aussieht, scheinen die negativen Einflüsse zu überwiegen.
Allmendinger verwies darauf, dass auch in deutschen Debatten um die Bildungsqualität der Fokus auf bestimmte Werte gelegt wird. Sie kündigte an, dass das WZB sich in der nächsten Zeit damit beschäftigen wird, wie in diesen Debatten soziale Kompetenzen einbezogen werden können, die bislang überhaupt nicht thematisiert sind.

Die Wende hin zum Testen und Betonen von evaluierbaren Outcomes wird nicht allein im Schulbereich stattfinden. Vielmehr scheint aktuell die gesamte öffentliche Verwaltung davon ergriffen zu sein. Deshalb wird sich dies auch auf Bibliotheken auswirken. Der BIX-Bibliotheksindex ist dabei nur ein kleiner Schritt. Seine Reichweite ist beschränkt, die Teilnahme an ihm ist noch freiwillig und die Kritik an den in ihm bedeutsamen Werten und deren Analyse ist wenn auch nicht dokumentiert, so doch relativ weit verbreitet. Aber die Grundidee, dass Standards dabei helfen würden, dass die Qualität von Bibliotheken nachgewiesen und verbessert werden könnte, scheint sich immer mehr durchzusetzen, obwohl dies bislang im besten Fall eine theoretische Möglichkeit darstellt. Eine empirische Evidenz für den positiven Effekt von Standards und Evaluationen gibt es für Schulen nicht, es gibt ihn für das Gesundheitswesen nicht, insoweit wäre es überraschend, wenn es ihn für Bibliotheken gäbe. Die Arbeitgruppe „Bibliothek 21“ schlägt dennoch relativ ausgearbeitete „Leistungs- und Qualitätsstandards für Bibliotheken“ vor, dass sich hauptsächlich auf Prozentwerte stützt. Ob dieser Vorschlag irgendeinen Einfluss zeitigen wird, wird abzuwarten bleiben.
Wichtiger erscheint, dass es mit einiger Wahrscheinlichkeit dazu kommen wird, dass auch für Bibliotheken Standards von Dritten erlassen werden, denen man sich nicht so leicht wird entziehen können, wie dem BIX. Die PISA-Studien kamen ja auch nicht, weil die Schulen sie gewollt hätten, sondern weil die Kultusministerkonferenz einem Vorschlag der OECD zustimmte. Es ist in diesem Zusammenhang vielleicht hilfreich, an Nico Stehrs Fazit seiner Studie zum Einfluss des Wissens auf die Konstitution moderner demokratischer Einrichtungen und Gesellschaften zu erinnern:

Dennoch wird die Abhängigkeit vom Wissen weiter zunehmen. Denn trotz der Demystifizierung des Wissens kann die Alternative nicht lauten, statt dessen mehr oder weniger zufällig auf irgendwelche Glaubensvorstellungen zu vertrauen. Man muß sich mit dem Gedanken der Kontingenz des Wissens vertraut machen und die Illusion verabschieden, daß dieser Zustand nur eine vorübergehende Erscheinung sei, die über kurz oder lang wieder verschwindet.
[Stehr, Nico / Die Zerbrechlichkeit moderner Gesellschaften : Die Stagnation der Macht und die Chancen der Individuums. – Weilerswist : Velbrück Wissenschaft, 2000, S. 309]

Fußnoten:
[1] Hierzu ist in Gesundheitsbereich eine freie Wahlmöglichkeit der Bürgerinnen und Bürger notwendig, die in Deutschland durch das Hausarztprinzip nicht gegeben ist. Im Bildungsbereich ist für eine solches System auch eine Wahlfreiheit notwendig, die aufgrund des Wohnortprinzips bei Schulen (d.h. das prinzipiell Schülerinnen und Schüler in der nächstgelegenen Einrichtung eingeschult werden sollen) in Deutschland ebenso nicht gegeben ist.
[2] Im Allgemeinen gehen alle zeitgenössischen betriebswirtschaftlichen Theorien davon aus, dass zum funktionieren eines Marktes informierte Marktteilnehmer gehören. Nur wenn alle Teilnehmenden an einem Markt auf die gleichen Informationen zurückgreifen können werden sie dieser Überzeugung nach rationale Marktentscheidungen treffen. Ansonsten würde die Interaktionen auf dem Markt nicht unter Gleichen stattfinden. Als ein möglicher Grund für ein Marktversagen wird deshalb die angebliche oder reale Uninformiert einzelnen Akteure angesehen. Obwohl klar ist, dass Informationsmonopole einen einschränkenden Einfluss auf Märkte haben, ist der positive Markteffekt einer allgemeinen Informiertheit bislang nicht wirklich empirisch abgesichert, ebenso wenig wir die Vorstellung, dass Marktteilnehmer hauptsächlich rationale Entscheidungen treffen würden.
[3] Dies wird auch möglich, da sich um diese Tests herum ein eigenständiger Wirtschaftszweig entwickelt hat. Dies Tests werden öfter von wirtschaftlichen Einrichtungen und weniger von wissenschaftlichen Institutionen entworfen und durchgeführt. Aus Gründen der Transparenz sind die Anlage all dieser Test inklusive Beispielaufgaben im Buchhandel zu erhalten, zudem Übungsbücher und Kurse für die jeweiligen Kurse, was genau genommen vollkommen gegen die Grundüberlegung dieser Tests wirkt, die ja eigentlich Aussagen über größere Zusammenhänge ermöglicht werden solle. Zu vergleichen ist dies teilweise mit dem absurden Wettlauf um den perfekten Lebenslauf, in den sich in Deutschland (und anderswo) Arbeitssuchende stürzen. Einerseits gibt es Hinweise, Bücher und Kurse darüber, worauf Arbeitergeber achten würden und zwar in einer wachsende Zahl mit durchaus widersprüchlichen Angaben. Anderseits gibt es die Arbeitgeber, die sich immer wieder auf neue Auswahlkriterien einigen müssen, da die alten nichts mehr taugen, einfach, weil zu viele Menschen absichtlich auf bestimmte Dinge achten, wenn die Bedeutung dieser Dinge erstmal bekannt gemacht wurde. Gab es beispielsweise eine Zeit, in der bei einer Anzahl von Stellen darauf geachtet wurde, das Menschen irgendwie in ihrem Anschreiben andeuten, sozial aktiv zu sein, setzte sich irgendwann die Floskel, man wolle „gerne was mit Menschen machen“ so sehr in fast allen Bewerbungen durch, dass dieses Kriterium nichts mehr galt. War einst ein Lebenslauf, der viele ehrenamtliche Tätigkeiten enthielt, ein Auswahlkriterium, da Menschen mit einem solchen ein hohe Selbstorganisationsfähigkeit zugestanden wurde, gilt dieses Kriterium immer weniger, nachdem es sich herumgesprochen hat und heute jede zweistündige Tätigkeit als Linienrichter bei einem Sportfest als bedeutsame ehrenamtlich Tätigkeit in den Lebenslauf aufgenommen wird, die auch nicht mehr von einer langjährigen Tätigkeit als Jugendtrainer zu unterscheiden ist. Dies ist ein ständiger Wettlauf, der dem eigentlichen Ziel, sich a.) als Arbeitsuchende möglichst gut zu präsentieren und b.) als Arbeitgebende, dass für die jeweilige Stelle und den Arbeitszusammenhang passende Personal zu finden, nicht im geringsten dienlich ist. Letztlich scheinen oft die Menschen „zu gewinnen“, die die zufällig richtigen Bewerbungsratgeber gelesen haben und weniger die, welche am Besten auf die Stelle passen würden. (Erinnert sich noch jemand an die Zeit, wo die Handschrift auf den Briefumschlägen, mit denen Bewerbungen geschickt wurden, angeblich graphologisch ausgewertet wurden? Und daran, wie Menschen tatsächlich diese Adressen von anderen Menschen schreiben ließen, weil sie meinten, ihrer Handschrift vermittle das falsche Bild?)
[4] Zumal, wie Nico Stehr immer wieder betont, gesellschaftlich ein unzutreffendes Bild von wissenschaftlichem Wissen verbreitet ist. Während wissenschaftsinterne die Prekarität und beständige Diskussion wissenschaftlicher Methoden und Ergebnisse als Vorteil gilt, versteht die Gesellschaft allgemein wissenschaftliches Wissen als unumstößliches Tatsachenwissen, quasi als letztmögliche Tatsachenaussage. Zumindest wird wissenschaftliches Wissen so benutzt, als sei es unumstößlich. Deshalb wird der Expertin und dem Experten eine Aussagekraft zugestanden, die sich nicht aus der Qualität der gelieferten Daten heraus begründen lässt.