Bewertung von Mehrfachauswahlaufgaben

Autor: Immo Schulz-Gerlach, ZDI
Version: 2.8 — 19. Februar 2026
[PDF-Version] [ePub-Version]

Einleitung

Überblick

Der Standardbewerter des Online-Übungssystems unterstützt verschiedene Bewertungsmodi für Mehrfachauswahl-Aufgaben („X aus N“, Multiple Choice). Der Aufgabenautor entscheidet über die zur Aufgabe passende und für den Einsatzzweck angemessene Bewertung.

Bei diesen Aufgaben werden zu einer Frage eine bestimmte Anzahl N von Antwortalternativen angeboten, von denen beliebig viele zutreffen können. Sie1 entscheiden zu jeder Antwortalternative, ob Sie diese für zutreffend halten oder nicht und kreuzen die Ihrer Meinung nach zutreffenden Alternativen an2. Für „klassische“ Multiple-Choice-Aufgaben mit genau einer Checkbox pro Antwortalternative (anders als bei Aufgaben mit 3 Antwortmöglichkeiten) gilt dabei: Wenn Sie bei einer Antwortalternative nicht sicher sind, geben Sie dennoch in jedem Fall eine Antwort: angekreuzt oder nicht angekreuzt. (Denn auch nicht angekreuzte Checkboxen stellen eine Antwort Ihrerseits dar, nämlich, dass Sie die Alternative für nicht zutreffend halten.) Dabei haben Sie allein durch Raten eine „Trefferchance“ von 50%.

Worin sich nun die verschiedenen Bewertungsmodi unterscheiden, ist in erster Linie die Frage, wie sich diese allein durch Raten erreichbare 50%-Trefferquote pro Alternative auf die vergebene Gesamtpunktzahl zur X-aus-N-Frage auswirken soll.

Eine Bewertung ohne Ratekorrektur vergibt einfach Pluspunkte für jede richtig markierte Alternative. Damit können jedoch allein durch Raten statistisch gesehen bereits 50% der Gesamtpunkte erreicht werden, weshalb die Einsatzmöglichkeiten dieser Bewertung eher limitiert sind bzw. das Ergebnis anders zu lesen ist. Eine typische Bestehensgrenze für Einsendearbeiten (oder Klausuren) aus Mehrfachauswahlaufgaben ohne Ratekorrektur wäre z.B. 75%: 50% der möglichen Punkte werden im Schnitt bereits durch Raten erreicht, und mindestens die Hälfte der darüber hinaus möglichen Punkte, also weitere 25%, sollten erreicht werden, um hinreichendes Wissen nachzuweisen.

Eine sog. Ratekorrektur dagegen bewirkt, dass allein durch Raten im Schnitt gar keine oder nur sehr wenige Punkte erreicht werden. Die verschiedenen Ratekorrektur-Modi unterscheiden sich in ihrer Rigorosität: Bei der neueren Ratekorrektur (V2) werden nur dann 0 Punkte vergeben, wenn alle Antworten falsch sind3, bei der klassischen Ratekorrektur (V1) muss mehr als die Hälfte der gegebenen Antworten richtig sein, um mehr als 0 Punkte zu erreichen.

Eine Variante solcher „X aus N“-Aufgaben (mit den oben genannten verschiedenen Bewertermodi) sind die „1 bis X aus N“-Aufgaben: Bei diesen ist immer mindestens eine Antwortalternative korrekt (während es bei „X aus N“ prinzipiell auch sein kann, dass alle Antwortalternativen falsch sind). Bei diesen Aufgaben muss mindestens eine Antwort gegeben (als richtig markiert) werden, um überhaupt Punkte erreichen zu können – kreuzen Sie nichts an, gelten diese Aufgaben als nicht bearbeitet.

Alternativ können Multiple-Choice-Aufgaben auch so gestellt werden, dass Sie nicht nur eine einzige Checkbox pro Antwortalternative angeboten bekommen (zutreffend oder nicht zutreffend), sondern zwei, über welche Sie insgesamt 3 Antwortmöglichkeiten haben: Sie können markieren, dass Sie die Alternative für zutreffend oder für nicht zutreffend halten, oder Sie können sich der Antwort enthalten. Wenn Sie sich also bei einer Alternative nicht sicher sind, können Sie entscheiden, ob Sie eine Antwort raten oder lieber gar keine Antwort geben.

Was das Weglassen von Antworten genau bewirkt, hängt wieder vom Bewertungsmodus ab:

In den letzten beiden Fällen hätten Sie keinen Vorteil davon, sich gegen Raten zu entscheiden und statt dessen einfach gar keine Antwort zu geben. Die Unterscheidung, ob Sie überhaupt eine Antwort geben oder nicht, dient bei solchen Aufgaben in erster Linie Ihrer eigenen Übersicht: Sie können dann – im Gegensatz zu Aufgaben mit nur einer Checkbox pro Alternative – erkennen, zu welchen Antwortalternativen Sie schon eine Entscheidung getroffen / eine Antwort gegeben haben (»richtig« oder »falsch«) und zu welchen Ihre Antwort noch offen ist.

Vereinbarungen

Es bezeichne in den folgenden Kapiteln stets N die Anzahl der Antwortalternativen, P die bei der Aufgabe maximal erreichbare Punktzahl.

Mit „richtiger Antwort“ zu einer Antwortalternative sei im Folgenden jeweils gemeint, dass eine laut Lösung richtige Antwortalternative genannt (bzw. angekreuzt / als zutreffend markiert) oder eine laut Lösung falsche Antwortalternative nicht genannt (nicht angekreuzt bzw. als nicht zutreffend markiert) wurde. Entsprechend wird das Nennen einer falschen Alternative ebenso wie das Nicht-Nennen einer richtigen Alternative als „falsche Antwort“ gewertet.

Die Anzahl der richtigen Antworten bezeichnen wir mit r, die Anzahl der falschen mit f. Für gewöhnliche Multiple-Choice-Fragen gilt dann r + f = N. Mit G(r) bezeichnen wir die zu r richtigen Antworten insgesamt vergebene / erreichte Punktzahl.

Bei Mehrfachauswahlaufgaben mit 3 Antwortmöglichkeiten dagegen, bei denen man sich auch zu einzelnen Antwortalternativen der Antwort enthalten kann, gilt dann r + fN, und die vergebene Gesamtpunktzahl hängt dann nicht nur von der Anzahl r der richtigen Antworten ab, sondern auch davon, wieviele der übrigen Alternativen man falsch beantwortet hat (f) oder gar nicht (Nrf). Daher wird bei diesen Aufgabentypen die vergebene Gesamtpunktzahl in Abhängigkeit von r und f angegeben: G(r, f).

Jede Kursumgebung im Online-Übungs- bzw. Online-Prüfungssystem ist auf ein bestimmtes Punkteformat eingestellt, und zwar entweder ganze Punkte, Zehntelpunkte oder Hundertstelpunkte, d.h. die Gesamtpunktzahl, die in der Korrektur zu einer Aufgabe erreicht werden kann, ist entweder eine ganze Zahl oder kann bis zu eine bzw. zwei Nachkommastellen haben. Die hier beschriebenen Multiple-Choice-Bewerter richten sich nach diesem Punkteformat der jeweiligen Kursumgebung, d.h. die zu jeder einzelnen automatisch bewerteten Frage ermittelte Punkte-Bewertung wird ggf. auf die entsprechende Nachkommastellenzahl (0, 1 oder 2) gerundet.

Wenn also in den folgenden Kapiteln zu den Bewertungsmodi jeweils eine Bewertungsfunktion G(r) bzw. G(r, f) angegeben wird, die eine beliebige Fließkommazahl berechnet, so wird deren Ergebnis eben im Anschluss noch auf das Punkteformat des Kurses gerundet (je nach Bewerter entweder „kaufmännisch“ oder immer abgerundet zur nächstkleineren passenden Zahl). Falls im Text nur kurz nochmals erwähnt wird, dass das Ergebnis gerundet wird, ist damit genau eine Rundung auf null, eine oder zwei Nachkommastellen je nach Punkteformat der konkreten Kursumgebung gemeint. (Da die Rundung von einer Einstellung der jeweiligen Kursumgebung abhängt, wurde die Rundung nicht explizit mit in die Formeln mit aufgenommen.)

Bewertungsmodi

Dieser Teil stellt alle Bewertungsmodi vor, wobei wir diese zunächst nach drei Aufgabenklassen (X aus N, 1 bis X aus N sowie X aus N mit 3 Antwortmöglichkeiten, siehe auch Einleitung oben) gruppieren und dann pro Klasse die Bewertungsmodi weiter nach dem Ratekorrekturmodus unterscheiden.

Klasse 1: Standard-Multiple-Choice-Aufgaben (»X aus N…«)

Hier fassen wir die Bewertermodi für den Standardfall von Multiple-Choice-Fragen zusammen, d.h. für solche Aufgabentypen, in denen Sie grundsätzlich zu jeder Antwortalternative eine Auswahl treffen und bei denen es auch möglich ist, dass keine Antwortalternative zutreffend ist.

Ein typischer Aufbau einer solchen Aufgabe besteht aus einer Reihe von Antwortalternativen mit je einer Checkbox: Markieren Sie diese Checkbox, wenn Sie die Alternative für zutreffend/korrekt halten, oder lassen Sie sie unmarkiert, wenn Sie die Alternative für nicht zutreffend/falsch halten. Zu einer Alternative gar keine Antwort zu geben, also keine Aussage zu treffen, ob Sie die Alternative für richtig oder falsch halten, ist bei diesem Aufgabentyp also nicht möglich, denn ein Nicht-Ankreuzen ist auch eine Aussage („nicht zutreffend“). Es ist bei diesem Aufgabentyp insbesondere auch möglich, dass Sie gar keine Checkbox ankreuzen und somit aussagen, dass Sie keine der Alternativen als zutreffend ansehen.

Derartige Aufgaben können nach einem der folgenden Modi bewertet werden:

Mehrfachauswahlaufgabe ohne Ratekorrektur (»X aus N +«)

In diesem Modus vergibt der Bewerter ausschließlich Pluspunkte: Jede richtige Antwort wird mit \(\frac{1}{N} P\) Punkten bewertet jede falsche mit 0 Punkten.
Sollte P nicht durch N teilbar sein und sich keine ganze Zahl errechnen, wird das Ergebnis auf die nächstenkleinere ganze Zahl (bzw. je nach Kurseinstellungen auch auf eine oder zwei Stellen nach dem Komma) abgerundet.

Wie im Überblick bereits gesagt, werden damit allein durch Raten im Schnitt 50% der Punkte erreicht, erst Ergebnisse ab rund 75% sind typischerweise als ausreichend zu interpretieren.

Die Punktevergabe selbst ist zwar einerseits besonders einfach zu nachzuvollziehen, andererseits jedoch ist es nicht sehr intuitiv, dass ein Ergebnis von z.B. 50%, 60% oder gar 70% zwar „nach viel klingt“, tatsächlich aber kein gutes Ergebnis ist.

Die nachfolgenden Bewertungsverfahren liefern „sprechendere“ Punktzahlen, dafür ist jedoch die Punktevergabe komplexer und erklärungsbedürftiger.

Mehrfachauswahlaufgabe mit klassischer Ratekorrektur (»X aus N«)

Die Bewertung erfolgt in diesem Modus nach dem klassischen LOTSE4-Schema: Bei N > 0 Antwortalternativen ist jede Alternative \(\frac{1}{N} P\) Punkte „wert“, und diese werden bei richtiger Antwort zur Gesamtpunktzahl addiert, bei falscher Antwort von der Gesamtpunktzahl abgezogen (als so genannte Ratekorrektur, s.o.). Negative Gesamtpunkte werden nicht vergeben, d.h. bei mehr falschen als richtigen Antworten werden 0 Punkte vergeben.

Sei also P die erreichbare Punktzahl, N die Anzahl der Antwortalternativen (N > 0) und geben Sie davon r viele richtige und f viele falsche Antworten (wobei r + f = N gilt), so berechnet sich Ihre Gesamtpunktzahl G wie folgt:

\[ G = max\left(0, \frac{r - f}{N} P \right) = max\left(0, \frac{2r - N}{N} P \right) \]

Sollte P nicht durch N teilbar sein und sich keine ganze Zahl errechnen, wird das Ergebnis auf die nächstkleinere ganze Zahl (bzw. je nach Punkteformat der Kursumgebung auch auf eine oder zwei Stellen nach dem Komma) abgerundet.

Beispiel: Es gebe vier Antwortalternativen A bis D. Die Musterlösung laute „A,D“, d.h. man muss genau die Antworten A und D geben, darf jedoch weder B noch C antworten, um die volle Punktzahl zu erhalten. Antworten Sie nun z.B. „A,B“, so ist die Antwort „A“ korrekt, die Antwort „B“ falsch, das Nicht-Geben der Antwort „C“ korrekt, das Nicht-Geben der Antwort „D“ wiederum falsch, so dass Sie insgesamt r = 2 richtige und f = 2 falsche Antworten gegeben hätten und somit \(\frac{2-2}{4} P\) = 0 Punkte erhielten. Die Antwort „A,B,D“ dagegen bestünde aus r = 3 richtigen und f = 1 falschen Antworten und würde mit \(\frac{3-1}{4} P = \frac{1}{2} P\), also der Hälfte der erreichbaren Punktzahl bewertet.

Auswirkung dieser Bewertung bei typischen x-aus-5-Aufgaben

Der folgende Text stammt von den Erläuterungen zum LOTSE-System, ist aber allgemein auf diesen Bewertungsmodus des Online-Übungssystems übertragbar. Er geht exemplarisch von den bei LOTSE typischen 5 Antwortalternativen aus (N = 5) und der Einfachheit halber auch von genau 5 erreichbaren Punkten (P = 5):

»Wenn Sie alles richtig wissen, erhalten Sie 5 Punkte.

Wenn Sie 4 Antworten wissen und eine Antwort raten erhalten Sie 3 oder 5 Punkte, je nachdem ob Sie richtig raten oder nicht. Im Durchschnitt werden Sie 4 Punkte erhalten.

Wenn Sie 3 Antworten wissen und 2 Antworten raten, gibt es vier Möglichkeiten: Sie haben beide Antworten richtig (5 Punkte), beide falsch (1 Punkt) oder eine von beiden richtig (3 Punkte) geraten. Im Durchschnitt erhalten Sie 3 Punkte.

Wenn Sie 2 Antworten wissen, gibt es acht Möglichkeiten, die verbleibenden 3 Antworten zu raten: 3 richtig (1 Möglichkeit mit 5 Punkten), 2 richtig (3 Möglichkeiten mit 3 Punkten), 1 richtig (3 Möglichkeiten mit 1 Punkt) oder keine richtig (1 Möglichkeit mit 0 Punkten). Sie erreichen also im Durchschnitt 17/8= 2,125 Punkte.

Wenn Sie eine Antwort wissen, raten Sie 4 Antworten mit 16 Möglichkeiten: 5 Punkte (1 Möglichkeit), 3 Punkte (4 Möglichkeiten) 1 Punkt (6 Möglichkeiten). Die anderen 5 Möglichkeiten ergeben 0 Punkte. Sie erreichen im Durchschnitt 23/16=1,4375 Punkte.

Wenn Sie nur raten, gibt es 1 Möglichkeit mit 5 Punkten, 5 Möglichkeiten mit 3 Punkten, 10 Möglichkeiten mit 1 Punkt und 16 Möglichkeiten ohne Punkte, im Durchschnitt 30/32= 0,9375 Punkte (18,75 %).

Ergebnis dieser Veranschaulichung soll sein, dass Sie erkennen, dass Sie statistisch etwa die Punkte bekommen, die Ihrem Wissensstand entsprechen. Erst wenn Sie weniger als die Hälfte wissen, profitieren Sie leicht vom Raten.

Folgen für die Benotung bei Klausuren: Wie bei Einfach-Auswahlaufgaben mit 5 Alternativen erreichen Sie bei diesem Aufgabentyp etwa 20 % der Gesamtpunkte durch Raten. Wenn die Hälfte der nicht durch Raten erreichbaren Punkte (80%) erzielt werden muss, ergibt sich eine Bestehensgrenze von 60%: 20% + (80% ÷ 2).«

Mehrfachauswahlaufgabe mit Ratekorrektur Version 2 (»X aus N (V2…)«)

Auch bei diesem Verfahren handelt es sich um eine Bewertung mit Ratekorrektur, jedoch nach einem anderen Schema (LOTSE-Bewertung Version 2), welches im Idealfall5 nur dann 0 Punkte vergibt, wenn wirklich alle Alternativen falsch beantwortet wurden. Für genau eine richtige Antwort wird i.d.R. (s.u.) noch 1% der erreichbaren Punkte vergeben (gerundet auf eine ganze Zahl bzw. je nach Kurseinstellungen auch auf eine oder zwei Stellen nach dem Komma), und für mehr richtige Antworten werden auch anteilig mehr Punkte vergeben, jedoch in immer größeren Stufen, so dass auch hier durch Raten nicht im Schnitt 50% der Punkte erreicht werden können. Bei keinem Fehler oder genau einem Fehler stimmt die Bewertung (vor Rundung) noch mit der klassischen LOTSE-Bewertung überein6, bei mehr als einem Fehler werden dagegen jeweils etwas mehr Punkte als bei der klassischen Ratekorrektur vergeben.

Dieses Bewertungsschema wurde ursprünglich für das alte LOTSE-System für genau X-aus-5-Aufgaben als starres Schema festgelegt, das in der ersten der beiden nachfolgenden Tabellen) wiedergegeben wird. Darauf aufbauend wurde fürs Online-Übungssystem dann ein verallgemeinertes, aber zu LOTSE kompatibles Schema für eine beliebige Anzahl N von Antwortalternativen entwickelt. Die zweite der nachfolgenden Tabellen zeigt dieses verallgemeinerte Schema zur Berechnung der Gesamtpunktzahl G(r) zur Anzahl N von Antwortalternativen (N > 0) und einer erreichbaren Punktzahl P für die Anzahl r der von Ihnen gegebenen richtigen Antworten (0 ≤ rN).

LOTSE-Bewertungsschema für X aus 5 V2
r G(r) in Prozentpunkten
5 100%
4 60%
3 30%
2 10%
1 1%
0 0

Bewertungsschema X aus N V2 (rekursive Definition)
r G(r)
N P (also 100%)
N – 1 \( \frac{N-2}{N} P \)
N – 2 \( \frac{N-3}{N-1} G(N-1) = \frac{N-3}{N-1} \frac{N-2}{N} P \)
N – 3 \( \frac{N-4}{N-2} G(N-2) = \frac{N-4}{N-2} \frac{N-3}{N-1} \frac{N-2}{N} P\)
u.s.w.: \( \frac{r-1}{r+1} G(r+1) = \left( \prod_{i=r+1}^N \frac{i-2}{i} \right) P \) für 1 < r < N
1 \( \frac{1}{100} P \), also 1% (in V2.0)
0 0

Die Bewertung folgt also folgendem Schema:

Version 2.0

Dies ist die einfachste Variante, die bei 1 = r < N (also genau einer richtigen Antwort aus mehreren Alternativen) immer ein Prozent der Bestpunktzahl P vergibt. Die oben stehende Tabelle zeigt also genau die Wertung für Version 2.0. Diese tabellarische Darstellung lässt sich auch als Formel zusammenfassen zu:

\[ \def\arraystretch{1.2} G(r) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ P & \text{, falls } r = N \\ \frac{1}{100} P & \text{, falls } 1 = r < N \\ \frac{r (r-1)}{N (N-1)} P & \text{, falls } 1 < r < N \end{array} \right. \]

Sollte das Endergebnis G(r) keine ganze Zahl sein, so wird es auf die nächste ganze Zahl (bzw. je nach Punkteformat der Kursumgebung – siehe Vereinbarungen – auch auf eine oder zwei Stellen nach dem Komma) gerundet. (Die rekursiven Bezüge G(r+1) in der Tabellendarstellung oben werden natürlich ungerundet weiterverarbeitet, erst die Endpunktzahl wird gerundet.)

Hat eine Frage z.B. genau N = 5 Antwortalternativen, so werden bei einem Fehler (r = 4) noch \(\frac{3}{5} P\), also 60% der erreichbaren Punkte vergeben, bei zwei Fehlern (r = 3) noch 30% (\(\frac{2}{4} 60\% \)), bei drei Fehlern (r = 2) noch 10% (\(\frac{1}{3} 30\%\)) der erreichbaren Punkte, bei vier Fehlern noch 1% und erst bei fünf Fehlern, also gar keiner richtigen Antwort, 0 Punkte.

Da, wie gesagt, die Berechnungsergebnisse gerundet werden, kann es jedoch auch vorkommen, dass auch bei genau einer richtigen Antwort (durch Abrundung) 0 Punkte vergeben werden, z.B. wenn immer auf ganze Punkte gerundet wird und die erreichbare Gesamtpunktzahl kleiner als 50 ist, so dass also 1% P < 0,5 ist. Oder wenn zwar auf eine Stelle nach dem Komma genau gerundet wird, aber die erreichbare Gesamtpunkzahl kleiner als 5 ist, so dass 1% P < 0,05 ist und somit zu 0,0 abgerundet wird.

An diesem Punkt setzt die im Folgenden beschriebene Ratekorrektur V2.1 an.

Version 2.1

Die Weiterentwicklung in Version 2.1 strebt an, den Fall zu vermeiden, dass es (aufgrund einer Abrundung) für noch genau eine richtige Antwort (1 = r < N) 0 Punkte gibt (genau wie für 0 richtige Antworten), selbst wenn für zwei richtige Antworten schon mehr als 1 Punkt erreichbar wäre. Vielmehr soll in diesem Fall dann 1 Punkt für r = 1 vergeben werden, selbst wenn das etwas mehr als (rund) 1% (aber immer noch weniger als G(2)) ist.

Genauer wird hier nach dem Punkteformat (siehe Vereinbarungen) der Kursumgebung unterschieden:

  1. Bei Kursen, die ihre Korrekturpunkte immer als ganze Punkte angeben, gilt:
    • Falls in einer Aufgabe die maximal erreichbare Punktzahl kleiner als 50 sein sollte, so wären die bei genau einer richtigen Antwort vergebenen 1% der Punkte kleiner als 0,5 und würden daher zu 0 Punkten abgerundet (bei V2.0). Die Ratekorrektur V2.1 vergibt in diesem Fall dagegen noch 1 Punkt – sofern für genau zwei richtige Antworten mindestens 2 Punkte erreichbar sind.
    • Ist die erreichbare Punktzahl der Aufgabe so niedrig, dass selbst mit zwei richtigen Antworten maximal 1 Punkt erreichbar ist, vergibt auch V2.1 nur 0 Punkte auf genau eine richtige Antwort, da die für nur eine richtige Antwort vergebene Punktzahl natürlich niedriger sein soll die für zwei korrekte Antworten.
    • Ist die erreichbare Punktzahl P größer als 50, so unterscheiden sich V2.0 und V2.1 nicht. Insbesondere kann es dann auch sein, dass für genau eine richtige Antwort mehr als 1 Punkt vergeben wird: Für P ≥ 150 ist 1% von P, auf eine ganze Zahl gerundet, ≥ 2.
  2. Bei Kursen, die ihre Korrekturpunkte auf eine Stelle nach dem Komma runden, gilt analog:
    • Falls in einer Aufgabe die maximal erreichbare Punktzahl keiner als 5 sein sollte, so wären die bei genau einer richtigen Antwort vergebenen 1% der Punkte kleiner als 0,05 und würden daher zu 0,0 Punkten abgerundet (bei V2.0). Die Ratekorrektur V2.1 vergibt in diesem Fall dagegen noch 0,1 Punkte – sofern für genau zwei richtige Antworten mindestens 0,2 Punkte erreichbar sind.
    • Ist die erreichbare Punktzahl der Aufgabe so niedrig, dass selbst mit zwei richtigen Antworten maximal 0,1 Punkte erreichbar sind, vergibt auch V2.1 nur 0 Punkte auf genau eine richtige Antwort, da die für nur eine richtige Antwort vergebene Punktzahl natürlich niedriger sein soll die für zwei korrekte Antworten.
    • Ist die erreichbare Punktzahl P größer als 5, so unterscheiden sich V2.0 und V2.1 nicht.
  3. Bei Kursen, die ihre Korrekturpunkte auf zwei Stellen nach dem Komma runden, gibt es keinen Unterschied zwischen V2.0 und V2.1.
    • Grund: Die erreichbare Maximalpunktzahl P ist immer ganzzahlig. 1% von der kleinstmöglichen ganzzahligen Maximalpunktzahl P = 1 wäre hier also 0,01 Punkte und würde niemals auf 0,00 Punkte abgerundet.

Zusammengefasst ergibt sich folgende Bewertung für »X aus N (V2.1)« (wobei sich diese Formeln nur im Fall 1 = r < N von der obigen V2.0-Formel unterscheiden):

Dabei stehen die Klammern \( \lceil \dots \rfloor \) für Runden auf eine ganze Zahl, d.h. bei der Prüfung, ob eine einprozentige Punktzahl < 0,5 zu 1 aufgerundet werden soll, wird verglichen, ob die nach Rundung für 2 richtige Antworten erreichbare Punktzahl > 1 ist, bzw. bei der Prüfung, ob eine einprozentige Punktzahl < 0,05 zu 0,1 aufgerundet werden soll, wird verglichen, ob das gerundete Zehnfache der für 2 richtige Antworten vergebenen Punktzahl > 1 ist (also die auf eine Stelle nach dem Komma gerundete Punktzahl für 2 richtige Antworten > 0,1 ist).

G(r) wird auch hier abschließend auf die nächste ganze Zahl (bzw. je nach Kurseinstellungen auch auf eine oder zwei Stellen nach dem Komma) gerundet.

Version 2.2

Version 2.0 und 2.1 sind beide nur bis zu einer gewissen „Aufgabengröße“ einsetzbar. Denn wenn sowohl die Anzahl N der Antwortalternativen als auch die erreichbare Punktzahl P relativ groß sind, kann es dazu kommen, dass 1% P größer ist als die für 2 richtige Antworten vergebene Punktzahl.9 D.h. für solche Fragen (große Alternativenzahl N und große Maximalpunktzahl P) sind Version 2.0 und 2.1 nicht anwendbar, da sie keine Monotonie der Bewertung sicherstellen. Dieses Problem wird von Version 2.2 behoben.

Dazu wird ab dieser Version für 1 = r < N die Ein-Prozent-Punktevergabe nach oben beschränkt auf ein Drittel von G(2), also der mit r = 2 erreichbaren Punktzahl. Insbesondere ist so (selbst nach Rundung) sichergestellt, dass G(1) < G(2) – außer falls beide zu 0 Punkten abgerundet werden –, also dass es für zwei richtige Antworten auch mehr Punkte gibt als für nur eine richtige Antwort, selbst bei entsprechend „großen Aufgaben“ (mit hohen N und P).)

Formal lautet die Bewertung für »X aus N (V2.2)«:

\[ \def\arraystretch{1.2} G(r) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ P & \text{, falls } r = N \\ min\left(E(P); \frac{2}{3N(N-1)}P \right) & \text{, falls } 1 = r < N \\ \frac{r (r-1)}{N (N-1)} P & \text{, falls } 1 < r < N \end{array} \right. \]

Dabei stehe die Funktion E(P) wiederum für die Ein-Prozent-Regel mit ggf. Aufrundung in Abhängigkeit vom Punkteformat der Kursumgebung:

\[ E(P) = \left\{\begin{array}{ll} max(1;\frac{1}{100} P) & \text{ bei Rundung auf ganze Punkte} \\ max(0{,}1;\frac{1}{100} P) & \text{ bei Rundung auf eine Nachkommastelle} \\ \frac{1}{100} P & \text{ bei Rundung auf zwei Nachkommastellen} \end{array} \right. \]

Das Endergebnis G(r) wird wieder ggf. auf das verwendete Punkteformat gerundet.

Im Fall 1 = r < N werden also in der Regel 1% von P Punkten vergeben, jedoch…

Direkter Vergleich obiger Bewertungsmodi

Hinweis vorab: Die Verfahren liefern offensichtlich für gleiche Antworten unterschiedliche Ergebnisse. Entscheidend ist daher, wie die erreichten Punkte anschließend zu bewerten/interpretieren sind. Falls die Aufgaben nicht nur zur Selbstkontrolle dienen, sondern z.B. relevant für eine Klausurzulassung oder Prüfungsleistung sind, werden die entsprechenden von Ihnen zu erreichenden Mindestpunktzahlen von den Aufgabenanbietern mit dem jeweils gewählten Bewertungsverfahren abgestimmt.

Die folgenden Tabellen zeigen die Anwendung der verschiedenen Bewerter beispielhaft für verschiedene Anzahlen N von Antwortalternativen.

Vergleich der Bewertungen für N = 6 Antwortalternativen
Richtige Antworten (aus 6) X aus N X aus N (V2) X aus N +
6 100,00% 100,00% 100,00%
5 ⅔ ≈ 66,67% ⅔ ≈ 66,67% \(\frac{5}{6}\) ≈ 83,33%
4 ⅓ ≈ 33,33% 40,00% ⅔ ≈ 66,67%
3 0 20,00% 50,00%
2 0 \(\frac{2}{30}\) ≈ 6,67% ⅓ ≈ 33,33%
1 0 1,00%* ⅙ ≈ 16,67%
0 0 0 0
Vergleich der Bewertungen für N = 5 Antwortalternativen
Richtige Antworten (aus 5) X aus N X aus N (V2) X aus N +
5 100,00% 100,00% 100,00%
4 60,00% 60,00% 80,00%
3 20,00% 30,00% 60,00%
2 0 10,00% 40,00%
1 0 1,00%* 20,00%
0 0 0 0
Vergleich der Bewertungen für N = 4 Antwortalternativen
Richtige Antworten (aus 4) X aus N X aus N (V2) X aus N +
4 100,00% 100,00% 100,00%
3 50,00% 50,00% 75,00%
2 0 ⅙ ≈ 16,67% 50,00%
1 0 1,00%* 25,00%
0 0 0 0

*) Die Versionen V2.0 und V2.1 der Ratekorrektur sind in den Tabellen jeweils zusammengefasst, da sich der Unterschied ohnehin nicht als Prozentpunktzahl darstellen lässt. Vielmehr wurde die Angabe „1,00%“ an dieser Stelle mit einem Sternchen versehen, um zu markieren, dass sich die beiden Versionen genau hier unterscheiden: Falls 1% von P kleiner als 0,5 sein sollte und der Kurs so eingestellt ist, dass immer auf ganze Punktzahlen gerundet wird, so wird V2.0 hier immer auf 0 abrunden, während V2.1 hier auf 1 aufrundet, sofern für 2 richtige Antworten mehr als 1 Punkt erzielt werden kann. Falls Punktzahlen im betreffenden Kurs auf eine Stelle nach dem Komma gerundet werden und 1% der erreichbaren Punktzahl kleiner als 0,05 ist, so wird V2.0 hier immer auf 0 abrunden, während V2.1 auf 0,1 aufrundet, sofern mit zwei richtigen Antworten mehr als 0,1 Punkte erreichbar sind.

Version V2.2 unterscheidet sich weiterhin bei den obigen Tabellen nicht von Version 2.1, da bei diesen kleinen Werten für N stets die „1%-Regel“ greift (weil ein Drittel der für 2 richtige Antworten vergebenen Punkte jeweils noch größer als 1% wäre).
Erst bei größeren Alternativenzahlen N unterscheidet sich V2.2 von V2.0/V2.1, so zeigen die folgende Tabellen eine entsprechende Übersicht für N=10 bzw. für N=20.

Vergleich der Bewertungen für N = 10 Antwortalternativen
Richtige Antworten (aus 10) X aus N X aus N (V2.0/1) X aus N (V2.2) X aus N +
10 100,00% 100,00% 100,00% 100,00%
9 80,00% 80,00% 80,00% 90,00%
8 60,00% 62,22% 62,22% 80,00%
7 40,0% 46,67% 46,67% 70,00%
6 20,00% 33,33% 33,33% 60,00%
5 0 22,22% 22,22% 50,00%
4 0 13,33% 13,33% 40,00%
3 0 6,67% 6,67% 30,00%
2 0 2,22% 2,22% 20,00%
1 0 1,00%* 0,74% 10,00%
0 0 0 0 0

Im Fall N=10 vergibt V2.2 ggf. (zumindest vor Rundung) etwas weniger Punkte für 1 richtige Antwort. Das ist aber nur bei größeren P überhaupt von Relevanz11.

Vergleich der Bewertungen für N = 20 Antwortalternativen
Richtige Antworten (aus 20) X aus N X aus N (V2.0/1) X aus N (V2.2) X aus N +
20 100,00% 100,00% 100,00% 100,00%
19 90,00% 90,00% 90,00% 95,00%
18 80,00% 80,52% 80,52% 90,00%
17 70,00% 71,57% 71,57% 85,00%
16 60,00% 63,16% 63,16% 80,00%
15 50,00% 55,26% 55,26% 75,00%
14 40,00% 47,90% 47,90% 70,00%
13 30,00% 41,05% 41,05% 65,00%
12 20,00% 34,74% 34,74% 60,00%
11 10,00% 28,95% 28,95% 55,00%
10 0 23,68% 23,68% 50,00%
9 0 18,95% 18,95% 45,00%
8 0 14,74% 14,74% 40,00%
7 0 11,05% 11,05% 35,00%
6 0 7,89% 7,89% 30,00%
5 0 5,26% 5,26% 25,00%
4 0 3,16% 3,16% 20,00%
3 0 1,58% 1,58% 15,00%
2 0 0,53% 0,53% 10,00%
1 0 1,00%* 0,18% 5,00%
0 0 0 0 0

In Fällen wie hier N ≥ 20 sind V2.0 und V2.1 im Allgemeinen nicht sinnvoll anwendbar, weil sie für nur eine richtige Antwort mehr Punkte vergeben als für zwei (zumindest bei so großer erreichbarer Punktzahl P, dass 1% und 0,53% von P nicht auf dieselbe Punktzahl gerundet werden). Genau für solche Fälle wurde V2.2 eingeführt.

Klasse 2: Mehrfachauswahlaufgaben mit min. einer korrekten Antwort (»1 bis X aus N …«)

Eine zweite Klasse von Mehrfachauswahlaufgaben ist weitgehend identisch zur obigen, typischerweise wieder dargestellt als eine Liste von Antwortalternativen mit je einer Checkbox, über welche Sie die Ihrer Meinung nach zutreffenden Alternativen markieren. Es gibt bei dieser Variante jedoch folgende zwei Besonderheiten:

Für bearbeitete Aufgaben, d.h. wenn Sie mindestens eine Antwort als zutreffend markiert haben, entspricht die Bewertung aber genau den „X aus N“-Aufgaben im jeweiligen Modus (mit oder ohne Ratekorrektur) wie oben beschrieben.

Für diese Aufgaben stehen dieselben Bewertungsmodi bereit wie oben zu Klasse 1 beschrieben, die Bewertung unterscheidet sich nur darin, dass, wenn Sie gar nichts ankreuzen, die Aufgabe als unbearbeitet gilt und grundsätzlich mit 0 Punkten bewertet wird, während bei einer Aufgabe aus Klasse 1 das Ankreuzen gar keiner Alternative als Antwort gewertet wird, die eine (Teil-)Punktzahl erreichen kann, wenn tatsächlich alle oder viele der Alternativen falsch sind.

Klasse 3: Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten

Multiple-Choice-Aufgaben können auch so gestellt werden, dass Sie pro Antwortalternative insgesamt 3 Antwortmöglichkeiten haben: »richtig«, »falsch« oder keine Antwort. Das hat dann Einfluss auf die Bewertung.

Die zuvor betrachteten Aufgabentypen (Klassen 2 und 3) haben gemein, dass Sie zu jeder Antwortalternative eine von zwei möglichen Antworten geben müssen: »richtig« oder »falsch« (bei Checkboxen: angekreuzt oder nicht angekreuzt). Sind Sie sich bei einer Antwort nicht sicher, müssen Sie raten.

Bei diesen Aufgabentypen dagegen haben Sie prinzipiell die Möglichkeit, auch gar keine Antwort zu geben. Dabei gibt es zunächst zwei „Unterklassen“ von Verfahren:

  1. Klasse 3.1 umfasst diejenigen Modi, bei denen Sie keinerlei Vorteil davon haben, keine Antwort zu geben und im Zweifel immer besser stehen, wenn Sie raten, weil keine Antwort genauso gewertet wird wie eine falsche Antwort.

  2. Für die Modi der Klasse 3.2 dagegen kann es sinnvoll sein, lieber keine Antwort zu geben statt zu raten: Durch Richtig-Raten könnten Sie hier zwar mehr, durch Falsch-Raten aber auch weniger Punkte erreichen als bei Rateverzicht (also gar keiner Antwort). In diesen Modi können Sie also bei Antwortalternativen, bei denen Sie sich nicht sicher sind, selbst entscheiden, ob Sie die Alternative unbeantwortet lassen wollen oder ob Sie raten wollen – mit der Chance auf mehr Punkte bei korrekter Antwort, aber ggf. auch auf weniger Punkte bei falscher Antwort (Ratekorrektur).

Klasse 3.1: Unbeantwortete Alternativen wie falsche Antworten behandelt (»… 3 Antw.*«)

Diese Modi stimmen weitestgehend mit denen aus Klasse 1 überein und wurden lediglich an die Möglichkeit der „offen gelassenen Antworten“ angepasst, indem einfach gilt: Jede nicht beantwortete Alternative wird genauso behandelt, als sei sie falsch beantwortet worden. Effektiv werden also nur Ihre richtigen Antworten gezählt.

Sie sollten also in der Regel alle Teilfragen beantworten, auch wenn Sie nicht sicher sind. Der wesentliche Vorteil dieser expliziten »wahr«- bzw. »falsch«-Markierungen gegenüber einer einzelnen Checkbox ist für Sie, dass Sie jederzeit Ihren Bearbeitungsfortschritt überblicken können, also erkennen können, für welche Antwortalternativen Sie sich schon eine Antwort überlegt haben und welche Sie noch bearbeiten müssen.

Auch gilt: Bei klassischen Ein-Checkbox-Formularen musste streng in »X aus N« (Klasse 1) und »1 bis X aus N« (Klasse 2) unterschieden werden, was die Bewertung von komplett offen gelassenen Fragen (ohne eine einzige »richtig«-Markierung) anging: Bei 1 bis X aus N gilt diese dann als unbearbeitet (0 Punkte) bei X aus N als »alle Alternativen als falsch eingeordnet«. Bei dieser Art von Aufgabenformular dagegen sind »falsch«-Antworten von unbearbeiteten Alternativen eindeutig zu unterscheiden, weshalb eine solche Trennung nicht mehr nötig ist: Falls Sie zu einer MC-Frage dieses Typs gar keine Antwort geben, sie also unbearbeitet lassen, haben Sie eben keine einzige richtige Antwort gegeben und erhalten genauso 0 Punkte, als hätten Sie zu jeder Antwortalternative die falsche Antwort gegeben12.

In den Bewerter-Kurzbezeichnungen werden die Modi dieser Klasse durch Anhängen eines Sternchens an den »3 Antw.«-Zusatz markiert, um sie von Klasse 3.2 abzugrenzen.

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten ohne Ratekorrektur (»X aus N + (3 Antw.*)«)

In diesem Modus vergibt der Bewerter wieder ausschließlich Pluspunkte: Jede richtige Antwort wird mit \(\frac{1}{N} P\) Punkten bewertet jede falsche mit 0 Punkten. Zu jeder Alternative, zu der Sie gar keine Antwort geben, erhalten Sie ebenfalls 0 Punkte, genauso als hätten Sie sie falsch beantwortet.

Die Bewertung entspricht also praktisch genau der „normalen“ Mehrfachauswahlaufgabe ohne Ratekorrektur (»X aus N +«), nur ergänzt um die Regel, dass Sie auf eine Antwortalternative, zu der Sie gar keine Antwort geben, ebenso 0 Punkte erhalten wie auf eine falsche Antwort.

Entsprechend ist das Bewertungsergebnis wieder so zu interpretieren, dass 50% der erreichbaren Punktzahl noch ein schlechtes Ergebnis darstellen (da man sie im Durchschnitt auch mit reinem Raten ohne jegliches Wissen erreichen kann), dass also erst Ergebnisse ab etwa 75% aufwärts ausreichendes Wissen nachweisen.

Hinweis zur Benennung: Dieser Korrekturmodus wurde früher in der Autokorrektur nur mit der Kurzbezeichnung »X aus N + (3 Antw.)« ohne Sternchen bezeichnet, diese ist entsprechend in früher erzeugten Autokorrekturen noch zu finden, bezeichnet aber denselben Modus. Das Sternchen wurde der Kurzbezeichnung erst nachträglich hinzugefügt, nämlich zusammen mit der Einführung der neuen Modi »X aus N (3 Antw.*)« und »X aus N (3 Antw.* V2.2)«, um die Zugehörigkeit zur selben Subklasse 3.1 zu verdeutlichen.

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten und klassischer Ratekorrektur analog zu 2 Antwortmöglichkeiten (»X aus N (3 Antw.*)«)

Dieser Bewertungsmodus bewertet analog zur Mehrfachauswahlaufgabe mit klassischer Ratekorrektur (»X aus N«), wobei unbeantwortete Alternativen genauso gewertet werden wie falsch beantwortete.

Kurz: Für jede richtige Antwort erhalten Sie \(\frac{1}{N} P\) Punkte gutgeschrieben, für jede falsche Antwort und hier auch für jede unbearbeitete Alternative dagegen \(\frac{1}{N} P\) Punkte abgezogen. Ist weniger als die Hälfte der Alternativen richtig beantwortet, bleibt es bei 0 Punkten, Negativpunkte gibt es nicht.

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten und Ratekorrektur Version 2 analog zu 2 Antwortmöglichkeiten (»X aus N (3 Antw.* V2.2)«)

Dieser Bewertungsmodus bewertet analog zur Mehrfachauswahlaufgabe mit Ratekorrektur Version 2 (»X aus N (V2.*)«), wobei auch hier wieder unbeantwortete Alternativen genauso gewertet werden wie falsch beantwortete.

Die Definitionen des obigen Abschnitts gelten hier also unverändert, wobei wieder r für die Anzahl der korrekten Antworten steht und keine gesonderte Unterscheidung zwischen der Anzahl falscher Antworten und der Anzahl unbeantworteter Alternativen nötig ist.

Anmerkung: Da dieser Bewertungsmodus erst nach der Ratekorrekturversion 2.2 eingeführt wurde, wird er üblicherweise nur mit Ratekorrektur V1 oder V2.2 kombiniert angeboten, nicht mit den älteren V2.0 oder V2.1.

Klasse 3.2: Spezifische Ratekorrektur für 3 Antwortmöglichkeiten (»… 3 Antw.«)

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten und klassischer Ratekorrektur (»X aus N (3 Antw.)«)

Bei dieser Variante erhalten Sie für jede korrekte Antwort Pluspunkte, für eine falsche Antwort entsprechend Minuspunkte, für eine unbeantwortete Alternative einfach gar keine Punkte. Genauer:

Sei wieder N die Anzahl der Antwortalternativen und P die maximal erreichbare Gesamtpunktzahl, dann ist analog zum klassischen „X aus N“ jede Antwortalternative \(\frac{1}{N} P\) Punkte „wert“. Für jede richtige Antwort werden dann \(\frac{1}{N} P\) Punkte gutgeschrieben, für jede falsche Antwort abgezogen, für unbeantwortete Alternativen gibt es 0 Punkte.

Bei r richtigen Antworten und f falschen Antworten (wobei hier im Unterschied zu obigen Modi 0 ≤ r + fN gilt, also insgesamt weniger als N Antworten gegeben werden können) errechnet sich somit die Gesamtpunkzahl G als:

\[ G(r,f) = max\left(0, \frac{r - f}{N} P \right) \]

(Im Prinzip ist das die gleiche Formel wie oben unter Mehrfachauswahlaufgabe mit klassischer Ratekorrektur (»X aus N«) angegeben, nur ohne die Nebenbedingung, dass r + f = N gilt und entsprechend ohne die Umformungsmöglichkeit in eine nur von r abhängige Gleichung.)

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten und Ratekorrektur Version 2 (»X aus N (3 Antw. V2…)«)

In diesem Modus kommt dieselbe Ratekorrektur zum Einsatz wie bei einfacher Mehrfachauswahlaufgabe mit Ratekorrektur Version 2. Im Folgenden nennen wir den oben beschriebenen Bewertungsmodus einfach kurz „V2-Bewertung“. N bezeichne wieder die Anzahl der Antwortalternativen in der Aufgabe und P die maximal erreichbare Punktzahl.

Dann erfolgt die Anwendung der V2-Bewertung auf diesen Aufgabentyp wie folgt:

Wie bei der Mehrfachauswahlaufgabe mit Ratekorrektur Version 2 können auch hier wieder die drei Versionen 2.0, 2.1 oder 2.2 zum Einsatz kommen, die sich lediglich in bestimmten Grenzfällen in der Punktevergabe im Fall r = 1 und 0 < f < N unterscheiden, also für genau eine richtige Antwort bei mindestens einer falschen Antwort.

Version 2.0

Die an drei Antwortmöglichkeiten (bei Nicht-Wertung von unbeantworteten Alternativen) angepasste Bewertung nach oben beschriebenem Thema lässt sich (in Version 2.0) wie folgt als Formel zusammenfassen13:

\[ \def\arraystretch{1.2} G(r,f) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ \frac{r}{N} P & \text{, falls } f = 0 \\ \frac{1}{100} P & \text{, falls } r = 1 \wedge f > 0 \\ \frac{r(r-1)}{N(r+f-1)} P & \text{, falls } 1 < r < r + f \end{array} \right. \]

Version 2.1

Auch Mehrfachauswahlaufgaben mit 3 Antwortmöglichkeiten können natürlich mit der Ratekorrektur Verson 2.1 kombiniert werden, analog zu Klasse 1, Mehrfachauswahlaufgabe mit Ratekorrektur Version 2.1 (»X aus N (V2.1)«).

V2.1 und V2.0 unterscheiden sich auch hier wieder nur in einem Detail, nämlich falls 1% der Punkte von V2.0 auf 0 Punkte abgerundet würde:

Wieder als Formel zusammengefasst errechnet sich die Punktzahl dann also wie folgt:

Version 2.2

Und auch die neueste V2.2-Bewerterversion steht natürlich zur Verfügung, die im Fall sehr „langer Aufgaben“ mit einer hohen Anzahl von Antwortalternativen nochmals die Punkteberechnung für genau eine richtige Antwort (bei mindestens einer falschen) überarbeitet und strenge Monotonie der G-Funktion sicherstellt:

Hier greift wieder die Limitierung auf ein Drittel der bei zwei richtigen Antworten (und gleicher Anzahl beantworteter Alternativen, also einer falschen Antwort weniger) erreichbaren Punktzahl G(2, f − 1), sowie die Aufrundung auf 1 Punkt, falls 1% P sonst eigentlich zu 0 abgerundet würde und für zwei richtige Antworten mindestens 2 Punkte vergeben werden.

Wieder als Formel zusammengefasst errechnet sich die Punktzahl dann also wie folgt (wobei das Ergebnis G(r,f) abschließend auf das Punkteformat der Kursumgebung gerundet wird):

\[ \def\arraystretch{1.2} G(r,f) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ \frac{r}{N} P & \text{, falls } f = 0 \\ min\left(E(P); \frac{2}{3N f}P \right) & \text{, falls } r = 1 \wedge f > 0 \\ \frac{r(r-1)}{N(r+f-1)} P & \text{, falls } 1 < r < r + f \end{array} \right. \]

mit unveränderter Ein-Prozent-Funktion E(P):

\[ E(P) = \left\{\begin{array}{ll} max(1;\frac{1}{100} P) & \text{ bei Rundung auf ganze Punkte} \\ max(0{,}1;\frac{1}{100} P) & \text{ bei Rundung auf eine Nachkommastelle} \\ \frac{1}{100} P & \text{ bei Rundung auf zwei Nachkommastellen} \end{array} \right. \]

Das zweite Argument der Minimum-Funktion im Fall r=1, f > 0 entspricht dabei wieder einem Drittel der mit zwei richtigen Antworten bei insgesamt gleicher Antwortzahl, also einer falschen Antwort weniger, erreichbaren Punktzahl: \( \frac{1}{3} G(2, f-1) = \frac{2}{3N(2+f-2)}P = \frac{2}{3N f}P\).

Direkter Vergleich der Modi für 3 Antwortmöglichkeiten

Bei den „echten“ 3-Antwortmöglichkeit-Bewertern der Klasse 3.2 hängt die errechnete Gesamtpunktzahl G für eine Alternativenzahl N ja nicht mehr nur von der Anzahl richtiger Antworten ab, sondern auch von der Anzahl falscher Antworten (da diese hier nicht mehr gleich Nr ist, sondern auch kleiner ausfallen kann, falls eben weitere Antwortalternativen gar nicht beantwortet wurden). Daher soll hier wieder (analog zum Vergleich der X-aus-N-Bewertermodi der Klasse 1) eine Gegenüberstellung zumindest beispielhaft für den gebräuchlichen Fall N = 5 vorgenommen werden.

Weiterhin nehmen wir zum Vergleich auch noch die Bewerter der Klasse 3.1 hinzu. Die hängen zwar nicht von f ab, und liefern daher für alle Zeilen mit gleichem r identische Werte, aber so werden die Effekte unbeantworteter Fragen bei Klasse 3.2 im Vergleich zu korrespondierenden Modi der Klasse 3.1 direkt gegenübergestellt.

Analog zu „einfachen“ Mehrfachauswahlaufgaben unterscheiden sich die Ratekorrekturmodi auch hier genau dann in der Bewertung, sobald Sie mehr als eine falsche Antwort geben.

Die folgende Tabelle zeigt die verschiedenen Bewertungen für N = 5 Alternativen. In dieser stehe r wieder für die Anzahl Ihrer korrekten Antworten, d.h. die Anzahl der Antwortalternativen, für die Sie korrekt beantworten konnten, ob sie zutreffend sind oder nicht, und f steht entsprechend für die Anzahl Ihrer falschen Antworten. In der Spalte »k.A.« (für »keine Antwort«) steht mit der Differenz 5 − rf jeweils die Anzahl der unbeantworteten Alternativen. Aus Platzgründen (damit die Tabelle nicht zu breit wird) wurden die Bewerterbezeichnungen noch ein wenig stärker abgekürzt, insb. mit »3A« statt »3 Antw.«.

Vergleich der 3-Antwort-Bewerter für N = 5 Alternativen
r f k.A. X aus N (3A) X aus N (3A V2) X aus N (3A*) X aus N (3A* V2) X aus N + (3A*)
5 0 0 100% 100% 100% 100% 100%
4 0 1 80% 80% 60% 60% 80%
4 1 0 60% 60% 60% 60% 80%
3 0 2 60% 60% 20% 30% 60%
3 1 1 40% 40% 20% 30% 60%
3 2 0 20% 30% 20% 30% 60%
2 0 3 40% 40% 0 10% 40%
2 1 2 20% 20% 0 10% 40%
2 2 1 0 13,33% 0 10% 40%
2 3 0 0 10% 0 10% 40%
1 0 4 20% 20% 0 1%* 20%
1 1-4 3-0 0 1%* 0 1%* 20%
0 0-5 5-0 0 0 0 0 0

*) In der vorletzten Tabellenzeile gilt wieder, dass Version 2.0 des Bewerters die Punktzahl (1%) ggf. auf 0 Punkte abrundet (bei Rundung auf ganze Punkte im Fall P < 50, bei Rundung auf eine Nachkommastelle im Fall P < 5), während Versionen 2.1 und 2.2 hier einen Punkt (bzw. 0,1 Punkte) vergeben, sofern für eine richtige Antwort mehr (also 2 richtige) und eine falsche Antwort weniger mehr als ein Punkt (bzw. mehr als 0,1 Punkte) vergeben würde. Version 2.2 unterscheidet sich bei nur N = 5 Antwortalternativen nicht von V2.1, da ein Drittel von G(2, f −1) für alle f (und r = 1) immer > 1% ist.

Hinweise zur Quittungs- und Bewerterausgabe bei Aufgaben mit 3 Antwortmöglichkeiten

Bei klassischen Formularen mit einer Checkbox pro Antwortalternative wird Ihnen Ihre eigene Einsendung in der Einsendungsquittung und in der Autokorrektur-Anzeige einfach nur als Aufzählung der (Kennungen der) von Ihnen als »richtig« markierte Antwortalternativen angezeigt. Eine Anzeige wie »A,C« bedeutet also, dass Sie die Antwortalternativen A und C als richtig markiert haben (und die übrigen für falsch halten).

Bei Formularen mit drei Antwortmöglichkeiten in Form getrennter Checkboxen für »richtig«- und »falsch«-Markierungen unterscheidet sich auch die Anzeige Ihrer Einsendung ein wenig:

(Die Musterlösung zählt dagegen weiterhin nur die korrekten Antworten auf, siehe auch folgenden Teil.)


Hinweise zu den Musterlösungen

Die Bewertung, welche Ihrer Antworten richtig oder falsch ist, richtet sich nach der hinterlegten Musterlösung. In der Regel handelt es sich dabei schlicht um die Aufzählung der richtigen Antworten (z.B: »A,C,E«).

In gewissen Spezialfällen können folgende Besonderheiten vorkommen:


Anhang

Herleitung der Umformung zur Bewerterformel für X aus N V2

Oben im Abschnitt Mehrfachauswahlaufgabe mit Ratekorrektur Version 2 (»X aus N (V2…)«) wurde die Bewertung erst rekursiv in einer Tabelle definiert, daraus dann eine Produktformel hergeleitet und zu dieser dann folgende Vereinfachung zu einem Quotienten angegeben:

\[\left( \prod_{i=r+1}^N \frac{i-2}{i} \right) P = \frac{r(r-1)}{N(N-1)}P\]

Für Interessierte folgt hier der wesentliche Teil der Herleitung obiger Umformung:

Die Produktformel \( \prod_{i=r+1}^N \frac{i-2}{i} \) lässt sich wie folgt umformen14: \[ \prod_{i=r+1}^N \frac{i-2}{i} = \left( \prod_{i=r+1}^N (i-2) \right) \cdot \left( \prod_{i=r+1}^N \frac{1}{i} \right) = \frac{(N-2)!}{(r-2)!} \cdot \frac{r!}{N!} = \frac{r(r-1)}{N(N-1)} \]

Detailliertere Betrachtungen zu obigen Umformungen:

  1. Der wesentliche Kern der Umformung ist der zweite oben angegebene Schritt, in dem die Produktformeln durch Quotienten von Fakultäten ersetzt werden:

    \[ \left( \prod_{i=r+1}^N (i-2) \right) \cdot \left( \prod_{i=r+1}^N \frac{1}{i} \right) = \frac{(N-2)!}{(r-2)!} \cdot \frac{r!}{N!} \]

    Diese Umformung nutzt im Wesentlichen folgende Definition der Fakultätsfunktion:

    \[n! := 1 \cdot 2 \cdot 3 \cdot \ldots \cdot n = \prod_{i=1}^n i\]

    Aus dieser lassen sich die folgenden Hilfsregeln ableiten:

    \[ \def\arraystretch{2.5} \begin{array}{rl} (1) & \displaystyle \prod_{i=1}^n \frac{1}{i} = \frac{1}{1} \cdot \frac{1}{2} \cdot \frac{1}{3} \cdot \ldots \cdot \frac{1}{n} = \frac{1}{1 \cdot 2 \cdot \ldots \cdot n}= \frac{1}{n!} \\ (2) & \displaystyle \prod_{i=m+1}^n i = \frac{\prod_{i=1}^n i}{\prod_{i=1}^m i} = \frac{n!}{m!} \\ (3) & \displaystyle \prod_{i=m+1}^n \frac{1}{i} = \frac{\prod_{i=1}^n \frac{1}{i}}{\prod_{i=1}^m \frac{1}{i}} = \frac{\frac{1}{n!}}{\frac{1}{m!}} = \frac{m!}{n!} \end{array} \]

    Mit (2) lässt sich nun das erste der beiden Teilprodukte umformen…

    \[ \prod_{i=r+1}^N (i-2) = \prod_{i=r-1}^{N-2} i = \frac{(N-2)!}{(r-2)!}\]

    … und die Vereinfachung des zweiten Teilprodukts ergibt sich direkt aus (3):

    \[ \prod_{i=r+1}^N \frac{1}{i} = \frac{r!}{N!}\]

  2. Erläuterung zum letzten Umformungsschritt der oben stehenden Formel:

    \[ \frac{(N-2)!}{(r-2)!} \cdot \frac{r!}{N!} = \frac{r!}{(r-2)!} \cdot \frac{(N-2)!}{N!} = \frac{r(r-1)}{N(N-1)} \]

    Dieser Schritt eliminiert die Fakultäten durch einfaches Bruch-Kürzen, erstens:

    \[ \frac{r!}{(r-2)!} = \frac{1 \cdot 2 \cdot \ldots \cdot (r-2) \cdot (r-1) \cdot r}{1 \cdot 2 \cdot \ldots \cdot (r-2)} = (r-1) \cdot r \]

    und zweitens gilt analog \( \frac{N!}{(N-2)!} = (N-1) \cdot N \) bzw. \( \frac{(N-2)!}{N!} = \frac{1}{N(N-1)} \).

Herleitung der Formel für X aus N (3 Antw. V2)

Im Abschnitt zur Bewertungsmodus X-aus-N mit 3 Antwortalternativen Version 2.0 wurde folgende Formel für die Punkteberechnung genannt:

\[ \def\arraystretch{1.2} G(r,f) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ \frac{r}{N} P & \text{, falls } f = 0 \\ \frac{1}{100} P & \text{, falls } r = 1 \wedge f > 0 \\ \frac{r(r-1)}{N(r+f-1)} P & \text{, falls } 1 < r < r + f \end{array} \right. \]

Diese leitet sich wie folgt her:

Es wird als Ausgangspunkt die Formel von X-aus-N V2.0 für zwei Antwortalternativen verwendet, nämlich:

\[ \def\arraystretch{1.2} G(r) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ P & \text{, falls } r = N \\ \frac{1}{100} P & \text{, falls } 1 = r < N \\ \frac{r (r-1)}{N (N-1)} P & \text{, falls } 1 < r < N \end{array} \right. \]

Für diesen neuen Bewertungsmodus werden daran folgende Anpassungen vorgenommen:

Für die vier Fälle in der Fallunterscheidung der Formel gilt also:

  1. Fall 1 („alle Antworten falsch, 0 Punkte“) bleibt unverändert.
  2. Die Bedingung für Fall 2 („alles gegebenen Antworten waren richtig“) ändert sich somit von r = N zu r = r + f oder kurz f = 0, und die Punktzahl ist dann nicht mehr P, sondern \(P' = \frac{r+f}{N} P\), was sich hier im Fall f = 0 vereinfachen lässt zu \(\frac{r}{N}\).
  3. Im Fall 3 („Ein-Prozent-Regel“) muss nur die Bedingung leicht an den Fakt angepasst werden, dass nicht immer N Antworten gegeben werden, sondern r + f < N sein kann: Dieser „Ein-Prozent-Grenzfall“ soll genau dann eintreten, wenn erstens genau eine richtige Antwort gegeben wurde (r = 1) und diese zweitens nicht die einzige Antwort war (dann wären ja alle Antworten aus der einelementigen Menge der gegebenen Antworten korrekt und es läge Fall 1 vor), sondern noch mindestens eine falsche Antwort zusätzlich gegeben wurde (f > 0).
  4. In Fall 4 (Normalfall: Mischung aus falschen und richtigen Antworten und nicht Fall 3) wird wieder P ersetzt durch \(\frac{r+f}{N} P\), und N im Bruch davor durch r + f. Das Produkt, lässt sich dann noch kürzen: \[\frac{r(r-1)}{(r+f)(r+f-1)} \cdot \frac{r+f}{N} P = \frac{r(r-1)}{N(r+f-1)} P\]

  1. Adressaten dieses Dokuments sind die Studentinnen und Studenten, die solche Mehrfachauswahlaufgaben bearbeiten. Sollten Angehörige anderer Personengruppen dieses Dokument lesen, ist die persönliche Anrede „Sie“ entsprechend zu interpretieren.  ↩︎

  2. Zumindest ist das der Normalfall, dass sich vor jeder Antwortalternative eine Checkbox befindet, die Sie ankreuzen, wenn Sie die Alternative für korrekt halten, oder nicht ankreuzen, wenn Sie sie für falsch halten. Technisch sind jedoch durchaus auch andere Eingabeformen denkbar.  ↩︎

  3. Genauer: Bei der Ratekorrektur V2.0 vergibt der Bewerter nur bei komplett falsch beantworteten Fragen exakt 0% der erreichbaren Punkte. Bei einer richtigen neben ansonsten nur falschen Antworten wird z.B. mit 1% bewertet, bei noch mehr richtigen Antworten auch höher. Die daraus errechnete Punktzahl wird jedoch abschließend gerundet, so dass es – je nach erreichbarer Punktzahl – in solchen Fällen eine 0-Punkte-Wertung durch Abrundung geben könnte. Wenn z.B. 10 Punkte erreichbar sind und Sie mit genau einer richtigen von N Antworten noch 1% bekämen, so errechnet sich die Endpunktzahl als 1% von 10 P. = 0,1 P. ≈ 0 P. (auf volle Punktzahl 0 abgerundet). Bei 50 erreichbaren Punkten dagegen wäre 1% von 50 P. = 0,5 P. ≈ 1 P. (auf volle Punktzahl aufgerundet). (Diese Angaben gehen jeweils vom Normalfall aus, dass im Kurs nur mit ganzen Punkten gearbeitet wird. Es ist auch möglich, dass Kurse auf eine oder zwei Stellen nach dem Komma runden.)
    Die Ratekorrektur ab V2.1 dagegen rundet in solchen Fällen ggf. auf statt ab, sofern die mit 2 Richtigen erzielbare Punktzahl größer ist.  ↩︎

  4. Das Akronym „LOTSE“ steht für „Lernzielorientierte Testaufgaben zur standardisierten Erfolgsbeurteilung“. Unter diesem Namen wurde bereits ab 1976 ein erstes System zur Umsetzung „maschinenauswertbarer Einsendeaufgaben“ entwickelt. Das alte LOTSE-System (später oft auch „Lotse“ geschrieben, als die Bedeutung des Akronyms in Vergessenheit geriet) ist längst Geschichte. Das Online-Übungssystem hat die Aufgaben von LOTSE nach und nach übernommen. Die Bewertungsschemata für Multiple-Choice wurden dabei zunächst von LOTSE übernommen, später aber auch um neuere Modi ergänzt.  ↩︎

  5. Das setzt eine hinreichend große Maximalpunktzahl voraus. Für genau eine richtige Antwort werden i.d.R. – wie im Text noch genauer beschrieben – ein Prozent der erreichbaren Punkte vergeben. Bei relativ geringer erreichbarer Punktzahl ist es möglich, dass dieser Wert effektiv auf 0 Punkte abgerundet wird.  ↩︎

  6. Bei genau einer falschen Antwort werden von beiden Ratekorrekturversionen 60% der erreichbaren Punkte vergeben. Sollte es sich dabei jedoch nicht um eine ganze Zahl handeln, sondern diese auf das von der Kursumgebung verwendete Punkteformat (0, 1 oder 2 Nachkommastellen) gerundet werden müssen, so kann sich eine minimale Abweichung ergeben, da die klassische Ratekorrektur stets abrundet, während V2 hier kaufmännisch rundet.  ↩︎

  7. Eine Herleitung der Umformung der Produktformel zum Quotienten finden Sie bei Interesse im Anhang.  ↩︎

  8. Der Bruch wäre insb. undefiniert für N = 1, weil dann der Nenner Null wäre und eine Division durch Null nicht erlaubt ist. Im Fall r = 1 wäre der Zähler Null, es würden somit 0 Punkte vergeben, was nicht erwünscht ist. Also müssen r und N jeweils größer als Null sein. Im Fall r = N (alles richtig beantwortet) werden ohnehin direkt volle Punkte vergeben, auch wenn der Bruch dort prinzipiell anwendbar wäre und dasselbe Ergebnis (Zähler = Nenner, also Bruch = 1) ergäbe.  ↩︎

  9. Beispiel: Angenommen sei eine X-aus-20-Frage mit 1000 erreichbaren Punkten. Dann würden sowohl V2.0 als auch V2.1 für eine richtige Antwort 1% von 1000, also 10 Punkte vergeben. Das reguläre Schema berechnet für den Fall r=2, also nur zwei von zwanzig richtigen Antworten (sprich: 18 Fehlern) bei einer so großen erreichbaren Punktzahl aber nur \(\frac{2}{20 \cdot 19} \cdot 1000 = \frac{2000}{380} \approx 5\) Punkte. D.h. durch einen Fehler mehr könnte man seine Punktzahl verbessern (hier sogar verdoppeln).
    In der Praxis sind Fragen dieser Art (so viele Alternativen und große Punktzahlen) sicher die Ausnahme, m.W. gab es sie zum Zeitpunkt der Einführung von Version 2.2 noch gar nicht. Dennoch wurde V2.2 entwickelt, um sie für die Zukunft zu unterstützen.  ↩︎

  10. Während in der Bewerterformel für »X aus N V2.1« noch eine explizite Fallunterscheidung abhängig von \(\lceil G(2) \rfloor\) getroffen wurde, erfolgt dieselbe Fallunterscheidung in V2.2 implizit. Genauer funktioniert diese V2.1-Kompatibiltät wie folgt, hier am Beispiel des Punkteformats »ganze Punkte« demonstriert:
    Falls G(2) ≥ 1,5, d.h. falls (nach Aufrunden auf eine ganze Punktzahl) für zwei richtige Antworten mindestens 2 Punkte vergeben werden, so ist \( \frac{1}{3} G(2) \ge 0{,}5\). Gerundet auf eine ganze Punktzahl entspricht das mindestens 1 Punkt (und weniger als G(2)). Für genau eine richtige Antwort wird dann also mindestens \(min(max(1, ?), 1) = 1\) Punkt vergeben. (Das Fragezeichen steht hier für einen beliebigen Wert, der keine Auswirkung mehr auf die Bewertung hat.)
    Ist dagegen G(2) < 1,5, so wird erstens für zwei richtige Antworten (nach Rundung) maximal 1 Punkt vergeben, und zweitens ist dann ein Drittel von G(2) < 0,5, was auf 0 Punkte abgerundet wird. Für genau eine richtige Antwort gibt es dann also \(min(?, 0) = 0\) Punkte (und damit ebenfalls weniger als für zwei richtige Antworten).  ↩︎

  11. Für so kleine P (z.B. P = 100), dass G(2) nach Rundung = 2 oder = 1 ist, verhält sich V2.2 (nach Rundung) analog zu V2.1: Ist G(2) nach Rundung z.B. = 2, also vor Rundung ≥ 1,5 (und < 2,5), so ist G(1) (= G(2) / 3) ≥ 0,5 und < 0,83, wird also auf einen Punkt aufgerundet. Und für G(2) < 1,5, wenn also für 2 Richtige nach Rundung max. 1 Punkt vergeben wird, ist G(1) < 0,5, wird also dann zu 0 Punkten abgerundet.  ↩︎

  12. Eine Ausnahme von der Null-Punkte-Wertung kann vorliegen, falls einzelne Antwortalternativen nachträglich aus der Wertung genommen wurden (z.B. wegen Missverständlichkeit) und alle Teilnehmer darauf die Punkte erhalten haben, egal ob sie sie als richtig oder falsch markiert oder gar keine Antwort gegeben haben, vgl. Hinweise zu den Musterlösungen. In diesem Fall erhalten Sie hier auch die entsprechenden Teilpunkte für diese Antworten.  ↩︎

  13. Eine Herleitung dieser Formel aus dem „normalen“ X aus N V2.0 für zwei Antwortmöglichkeiten, modifiziert nach der obigen Beschreibung, finden Sie im Anhang.  ↩︎

  14. Dank an Patrick Holzer, der mich auf diese Vereinfachungsmöglichkeit hingewiesen hat!  ↩︎