Neue Zürcher Zeitung BILDUNG UND ERZIEHUNG Donnerstag, 23.03.2000 Nr.70 85
Von Margrit Stamm, Bildungsforscherin, Aarau
Überblickt man die gegenwärtige Situation an den schweizerischen Bildungsinstitutionen, kann man unschwer feststellen, dass Unterrichtsbeurteilungen als Evaluationsinstrument zwar relativ häufig, meist jedoch unsystematisch eingesetzt werden, auf die eigentliche Durchführung beschränkt bleiben und deshalb in vollkommener Konsequenzlosigkeit enden. So bleibt auch die vielleicht wesentlichste Frage unüberprüft und deshalb unbeantwortet, nämlich ob sich die Qualität von Lehre und Unterricht durch Unterrichtsbeurteilung tatsächlich verbessert und mit welchen Mitteln dies erreicht werden könnte. Gesamthaft sieht die Bilanz also düster aus: Aufwand enorm - Ertrag praktisch nicht vorhanden - Wirkungslosigkeit gross.
Sind Schülerinnen und Schüler in der Lage, den Unterricht ihrer Lehrkräfte adäquat zu beurteilen? Können Studierende die Qualität von Lehrveranstaltungen so einschätzen, dass ihr Urteil als gültig angesehen werden kann? Führen derartige Beurteilungen zu einer tatsächlichen Verbesserung des Unterrichts? Solche Fragen stehen momentan berechtigterweise im Fadenkreuz der Diskussionen und Kontroversen rund um die «Unterrichtsbeurteilung», ist sie doch zu einem virulenten bildungspolitischen Thema geworden. Noch vor kurzer Zeit von nicht wenigen Betroffenen als «standeswidriges Vorgehen» bezeichnet, haben nun entsprechende Gesetze und Projekte viel sozialen Druck entstehen lassen. An Fachhochschulen kommt die «Kundenperspektive» der Studierenden dazu, welche mit Verweis auf die Wettbewerbssituation zwischen den Fachhochschulen eine durch das Studentenurteil erhobene Unterrichtsqualität geradezu einfordern. Die Bildungspraxis ist somit gezwungen, sich dieser Fragestellung anzunehmen. Bei den Lehrkräften ist die Akzeptanz eines solchen Verfahrens insbesondere dann vorhanden, wenn die Unterrichtsbeurteilung positiv ausfällt, in klasseninterner und somit privater Initiative durchgeführt werden kann und mögliche Konsequenzen ebenfalls in der Eigenverantwortung bleiben. Widerstände wachsen jedoch, wenn es um systematische, schulumfassende und von der Schulleitung initiierte Beurteilungen geht, die auch einen gewissen Anspruch auf empirische Wahrheit haben.
Ein Grund für die Wirkungslosigkeit von Unterrichtsbeurteilungen liegt in den unterschiedlichen Qualitätsanforderungen. Geht es lediglich darum, den Dialog zwischen Lehrperson und Schülerschaft über den Unterricht herzustellen, muss das Instrument zwar keinen hohen Anforderungen genügen, läuft jedoch Gefahr, wenig zu bewirken. Soll die Unterrichtsbeurteilung aber weiterführenden Zwecken dienen und beispielsweise auch zur Legitimation der Unterrichtsqualität nach aussen oder zur Personalentwicklung eingesetzt werden, steigen die Anforderungen an Messgenauigkeit, Zuverlässigkeit und Objektivität des Instruments, im gleichen Masse aber auch die Widerstände und Ablehnungen der Lehrerschaft. Kritische Stimmen bezeichnen Unterrichtsbeurteilungen etwa als Popularitätstest von Lehrkräften, der von der Benotungsstrenge in Prüfungen, von der Themenschwierigkeit, der Hausaufgabenlast und nicht zuletzt von der fachlichen Begabung der Lernenden, deren Geschlecht und (Studien-) Alter abhänge. Attraktive Lehrkräfte und insbesondere Frauen würden zudem besser beurteilt. Derartige Vorurteile sind ernst zu nehmen und auf der Grundlage empirischer Untersuchungen zu beantworten.
Eine mit praktischen Konsequenzen verbundene Durchführung von Unterrichtsbeurteilungen bedingt, dass vor allem ein Thema aus der Tabuzone herausgeholt wird: Lehrpersonen, die schlechte Beurteilungen erhalten. Obwohl eigentlich jede Bildungsinstitution mit dem Problem unzureichender Lehr- und Unterrichtsleistungen konfrontiert ist, war bis heute kaum jemand genötigt, sich damit auseinanderzusetzen. Systematische Unterrichtsevaluation bringt nun jedoch die unangenehme Aufgabe mit sich, dass Schulverantwortliche diese Problematik nicht weiter ignorieren können. Damit Unterrichtsbeurteilung tatsächlich etwas bewirkt, müssen bereits in der Planungsphase mögliche Entwicklungsschritte festgelegt werden. Dazu gehört auch die Frage nach Konsequenzen bei ungenügenden Lehrleistungen. Die Schulleitung hat dabei eine Schlüsselposition zu übernehmen. Wenn es ihr gelingt, mit dem Kollegium eine Verständigung über Ziel und Zweck der Unterrichtsbeurteilung zu erreichen und die geplanten Massnahmen und Handlungsschritte von Anfang an transparent darzustellen, hat sie einen wesentlichen Schritt getan, um systematische in wirksame Unterrichtsbeurteilung überzuführen.
Nun wäre es ein einfaches, solche Probleme als Empfehlung zur Absage an die Lehr- und Unterrichtsbeurteilung durch Schüler oder Studierende zu interpretieren und - mit Verweis auf die bereits in den siebziger Jahren gemachten Erfahrungen - ganz auf das Urteil der Lernenden zu verzichten. Im Rahmen eines umfassenden Qualitätsmanagements ist dies jedoch aus zwei Gründen nicht möglich: Erstens fordern Gesellschaft und Politik, dass Leistungen von Bildungsinstitutionen (z. B. von Fachhochschulen in den Bereichen Ausbildung, Weiterbildung, Forschung und Dienstleistung) zugänglich gemacht und ihre Leistungsbereitschaft der Öffentlichkeit und den potentiellen Studierenden gegenüber kommuniziert werden soll. Zweitens sollte zumindest eine wesentliche Unterrichtskritik von studentischer oder schülerbezogener Seite her kommen, da dies die einzige Gruppe ist, die über einen zeitlich umfassenden Beobachtungshintergrund verfügt. Wenn also den Unterrichtsbeurteilungen derart wesentliche Bedeutung zukommt, scheint ein Rückgriff auf die umfangreichen Forschungsarbeiten im deutschsprachigen Raum gerechtfertigt. Sie können Antworten auf die immer wieder geäusserte Behauptung geben, Schüler- oder Studentenurteile seien nicht gültig (valide) und deshalb nicht brauchbar. Derart befürchtete Verzerrungseinflüsse scheinen zwar gemäss unseren eigenen Untersuchungen und in Übereinstimmung mit einem Grossteil der internationalen Studien unbegründet zu sein. So üben beispielsweise weder Alter, Geschlecht, Semesterzahl oder Vorbildung einen wesentlichen Einfluss auf die Beurteilung aus. In der Regel sind die Urteile von Schülerinnen und Schülern bzw. Studierenden auch ausserordentlich differenziert und in der Tendenz eindeutig positiv: Die Erfahrung zeigt, dass die Resultate zu etwa 80 Prozent positiv und zu je etwa 10 Prozent eindeutig negativ oder ausgezeichnet ausfallen. Wichtiger scheint indes der Umstand zu sein, dass die Zuverlässigkeit der Beurteilungen negativer eingeschätzt werden muss. Im Rahmen eines breitangelegten Fachhochschulprojekts kristallisierten sich in unseren Untersuchungen zwei wesentliche Resultate heraus: Erstens wurden die Veranstaltungen von verschiedenen Studierendengruppen stark unterschiedlich beurteilt. Nicht nur das Fach, sondern die Klasse stellte die stärkste Einflussgrösse dar. Zweitens wurden Dozentinnen, welche an technisch orientierten Fachhochschulen unterrichten, im Vergleich zu Dozentinnen nicht-technischer Fachhochschulen signifikant schlechter beurteilt als ihre männlichen Kollegen.
Aber auch die Qualität des Verfahrens an sich, das ja meist als Fragebogen eingesetzt wird, hat einen Einfluss auf die Gültigkeit und Zuverlässigkeit der Ergebnisse. Glaubwürdige Resultate können nur mit einem Instrument erhoben werden, das unterschiedliche Dimensionen enthält, also etwa zwischen Rahmenbedingungen, didaktischen Qualitäten der Lehrperson, Lehr- und Lernklima und Ergebnissen unterscheidet und auch die Bewertung des eigenen Verhaltens durch die Lernenden (Lerngewinn, Kompetenzerwerb) einschliesst. Bedenklich scheint indes, wenn pro Beurteilung lediglich ein Gesamtmittelwert berechnet, dieser als Qualitätsindikator interpretiert und darauf basierend sogar ein Ranking durchgeführt wird. Richtig wäre, wenn lediglich Aspekte gleicher Dimensionen zu einem Mittelwert verrechnet werden. Da Mittelwerte allerdings als problematische Grössen anzusehen sind, muss die Heterogenität der Urteile immer mitberücksichtigt werden.
Völlig fehlerfreie und durch keine Störfaktoren beeinflusste Unterrichtsevaluationen sind nicht möglich, auch nicht auf der Grundlage der ausgereiftesten und theoriebasierten Modelle. Gerade deshalb darf Unterrichtsqualität nie ausschliesslich über Studenten- oder Schülerurteile definiert werden. Vielmehr gilt es, sie um Selbsteinschätzungen der Lehrkräfte und fachliche Qualifizierungen durch Experten zu ergänzen. Ein Qualitätsmanagement, das seinen Namen verdient, deklariert den Unterricht zwar als Herzstück der Qualitätsbemühungen, richtet sein Augenmerk jedoch auf die Qualität der Bildungsinstitution als ganzer inklusive ihrer curricularen Prozesse sowie auf die Nachhaltigkeit der Ausbildungsleistungen, die über Absolventen- und Abnehmerevaluationen erhoben werden können.
Damit Unterrichtsbeurteilung durch Studierende nicht zu einem Etikettenschwindel und damit zu einer netten Aufmachung medienbewusster Schulen verkommt, sind verschiedene die Wirksamkeit fördernde Schritte zu berücksichtigen: Erstens sind unmittelbar an die Beurteilung anknüpfende Rückmeldegespräche zwischen Lehrperson und Schüler bzw. Klasse als verbindlich zu erklären. Dozierende werden so angehalten, ihre Resultate im Sinne eines Feedbacks zu besprechen. Dies führt dazu, dass Verbesserungseffekte wahrscheinlicher werden, weil der Verpflichtungscharakter grösser wird. Dazu kommen zweitens darauf aufbauende Qualifizierungsgespräche mit der Schulleitung, welche Zielvereinbarungen und Konsequenzdiskussionen umfassen. Diese wiederum sollen auf Gratifizierungssysteme für Unterrichtsoptimierungen zurückgreifen können und als Motivierungsmassnahmen eingesetzt werden. Dozierende, deren Unterrichtsqualität ungünstig beurteilt wurde, sind in dieses Vorgehen explizit einzubeziehen. Drittens ist ein Parallelangebot an Beratung und Unterrichtsbegleitung mit ausschliesslicher Unterstützungsorientierung zu etablieren, das viertens mit gezielten, bei ungenügenden oder kritisch beurteilten Unterrichtsleistungen als verpflichtend bezeichneten Weiterbildungsangeboten verbunden wird. Fünftens sind die Hauptakteure - Schülerinnen, Schüler, Studierende - in die Überlegungen einzuschliessen: Werden sie gezielt in ihre verantwortungsvolle Aufgabe eingeführt, ist es auch möglich, sie auf gerechte, objektive Urteile zu verpflichten. Um einer gewissen Evaluationsmüdigkeit - die sich beim kontinuierlichen Ausfüllen von Fragebögen zwangsläufig ergibt - vorzubeugen, ist die Evaluation während des regulären Unterrichts und in einem Rhythmus von drei bis vier Semestern durchzuführen.
Zu guter Letzt setzen Bemühungen um einen qualitativ hochstehenden Unterricht jedoch an einem ganz anderen Ort ein, nämlich bei der Berücksichtigung der pädagogischen Eignung von Dozentinnen und Dozenten bei Einstellungs- und Berufungsverfahren. Indikatoren zur Unterrichtsqualität sollten deshalb auch die Frage umfassen, welche Bemühungen eine Schule tatsächlich unternimmt, um methodisch-didaktisch ausgewiesene Lehrkräfte zu gewinnen und sich nicht lediglich auf Forschungs- und Publikations- bzw. andere Reputationsleistungen auszurichten.
Insgesamt birgt studentische und schülerbezogene Unterrichtsevaluation Chancen und Gefahren. Die Chancen liegen in erster Linie darin, dass die Diskussion über Lehr- und Unterrichtsqualität eröffnet und die Arbeit von Lehrerinnen und Lehrern an bestimmten Standards gemessen wird. Durch die stärkere Gewichtung des eigenen Unterrichts kann das Qualitätsbewusstsein gefördert, die Sensibilität der Lehrkräfte gegenüber methodischen Stärken und Mängeln erhöht und die Fähigkeit zur kritischen Selbstreflexion gefestigt werden. Akzeptieren Lehrkräfte die Forschungsergebnisse, so müssen sie lernen, mit positiven und negativen Resultaten zu leben, ohne diese einfach mit Argumenten wie mangelnde methodische Qualität des Verfahrens oder unzureichende Beurteilungsfähigkeit der Schüler oder Studierenden abzutun. Die Gefahren finden sich indes dort, wo Unterrichtsbeurteilung allein eine von oben verordnete Massnahme bleibt, ad hoc eingeführt, nicht bezüglich der Konsequenzen kommuniziert und zu den Rahmenbedingungen der Schule oder des Fachbereichs in Bezug gesetzt wird. So gehandhabte Unterrichtsbeurteilung bewirkt dann entweder gar nichts und bleibt Etikettenschwindel, oder sie unterwirft die Lehrerschaft einem erniedrigenden Rapport, was einer reinen Dozentenbewertung gleichkommt. Sie führt zu Missbrauch und Polemik gegenüber den Lehrkräften und entspricht nicht den ethischen Standards der Evaluationsforschung.
© AG für die Neue Zürcher Zeitung NZZ 2000