Damit sind personenbezogene Standards benannt, die am Ende der ersten und zweiten Phase erfüllt sein sollten. Entscheidend ist, ob man Modalitäten des Evaluierens/Prüfens findet, die es erlauben, das Vorliegen bzw. auch den relativen Grad des Vorliegens dieser Standards zu ermitteln.

Hinsichtlich einer Erfassung der Ergebnisse der 1.Phase im Bereich der erziehungswissenschaftlichen Studien liegen einige wenige punktuelle Forschungen vor.(18) Eine (nicht repräsentative) Studie über die u.a. auf das erziehungswissenschaftliche Begleitstudium bezogenen Lesegewohnheiten von Wigger (2000; Keiner 2000) bringt eher deprimierende Ergebnisse. Befragungen von Absolventen zur Einschätzung der Qualität und des Wertes ihrer Ausbildung sind nicht unwichtig, unterliegen jedoch starken Verzerrungen. Evaluation von Ausbildung muss mehr sein als eine nachgängige Befragung von Absolventen zu Erfahrungen und Wert der Ausbildung: Die tatsächlich erworbenen Kompetenzen müssen – an Standards orientiert – erfasst werden.

Der aktuellste und am weitesten ausgearbeitete Versuch einer solchen Evaluation der erziehungswissenschaftlichen Studienanteile wird derzeit von A. Nolle an der Universität Dortmund (Institut für Schulentwicklungsforschung) durchgeführt (Dissertation): Erfasst werden Lehramtsstudierende der Universitäten Bremen (n=26), Dortmund (287), Leipzig (309) und Erlangen–Nürnberg und Bamberg (n=264). Somit lagen insgesamt 886 auswertbare Fragebögen vor. Einschränkend muss angemerkt werden, dass es [/S. 36:] sich um eine Befragung von Studierenden handelt; 508 der Befragten befanden sich noch im Grundstudium! Insofern kann man nicht von einer Analyse der Wirkungen des erziehungswissenschaftlichen Studiums sprechen; es handelt sich vielmehr um eine Befragung der Teilnehmer während des Prozesses der Lehrerbildung zum erziehungswissenschaftlichen Ausschnitt des Lehramtsstudiums. Darüber hinaus erfolgt diese Evaluation nicht mit Blick auf vorab definierte Standards (also gewissermaßen ‚lernzielorientiert'), sie erfolgt vielmehr als eine Erfassung des Zustandes, die erhaltene Verteilungen (Durchschnitte, Abweichungen etc.) zeigt (also gleichsam ‚durchschnittsorientiert').

Hinsichtlich der Vorgehensweisen bei der Überprüfung des Grades der Erreichung von Standards sind – bei der Personenevaluation – verschiedene Formen praktikabel und praktiziert worden:

Vier Stufen einer an Standards orientierten Evaluation
  1. Selbsteinschätzung: Die Personen geben selbst an, wie weit sie ihrer Selbsteinschätzung zufolge die Standards erfüllen. Vorteil: Einfache Durchführung; Nachteil: äußerst unsichere Informationsbasis
  2. Testverfahren: Die Personen werden durch geeignete diagnostische Instrumente hinsichtlich ihrer Wissens–, Reflexions– und Urteilskompetenzen erfasst. Vorteil: Unabhängigkeit der Information von der Selbstdeutung; Nachteil: hoher testdiagnostischer Aufwand in Vorbereitung, Durchführung und Auswertung; in Deutschland praktisch keine Vorerfahrung.
  3. Beobachtung und Beurteilung: Die Personen werden in ihrem beruflichen Handeln von Schulleitern, Ausbildern, Kollegen (peers) o.ä. beobachtet und beurteilt, inwieweit sie Standards erfüllen. Hierbei sollten auch von den zu evaluierenden Personen erstellte Portfolios Berücksichtigung finden.
  4. Lernleistung/Erfahrung der Schüler: Anhand der Befragung von Schülern und/oder der Ermittlung von Schülerleistungen wird ermittelt, welche Lehrer die Standards am deutlichsten erfüllen. Allerdings: Unsichere Wirkungskette zwischen Lehrerkompetenz, Lehrerhandeln und Schülerlernen/ Schülererfahrung. Wie erwähnt wird in dieser Expertise diese Evaluationsform noch nicht anvisiert.

Diese vier Formen einer an Standards orientierten Evaluation (auf der Personenebene) sind auf einer Skala von einfach/wenig aussagekräftig bis anspruchsvoll/sehr aussagekräftig anzuordnen; sie stellen Stufen dar. Die Selbsteinschätzung, die bislang dominierte, auch noch in der Schweizer Studie, sollte in dem angestrebten Evaluationen keines– [/S. 37:] wegs die alleinige Basis sein – sie sollte sogar weitgehend minimiert werden. Die zweite Stufe – testdiagnostische Verfahren (Papier und Bleistift) sollte dominieren, da mit ihr aussagekräftigere Informationen gewonnen werden können. Sie sollte aber – zumindest punktuell – durch Beobachtungs–/Beurteilungsverfahren mit Blick auf das berufliche Handeln ergänzt werden; dies in einem quantitativ begrenzten Rahmen. Die vierte Stufe – Erfassung der Wirkungen bei Schülern – halte ich, wie oben bereits dargelegt, angesichts der immensen theoretischen und methodischen Probleme, des sehr hohen Aufwandes und der am Ende nicht präzise zu ermittelnden Zusammenhänge zum gegenwärtigen Zeitpunkt für nicht opportun: Der ungewöhnlich hohe Aufwand stünde in keinem Verhältnis zum unsicheren Ertrag.

Insofern besteht die Aufgabe bei der Personenevaluation darin, die Standards weiter zu konkretisieren und auf dieser Basis dann sowohl geeignete diagnostische Instrumente zu entwickeln wie auch entsprechende ergänzende Beobachtungsverfahren. Wenn sich dann etwa zeigen ließe, dass – richtig konstruiert und durchgeführt – diagnostische Verfahren zuverlässig zu ähnlichen Ergebnissen kommen wie Beobachtungsverfahren, so könnte man auf letztere – da aufwendig – verzichten. Genau dies aber muss vorher erprobt werden.