?:linkContext
|
-
Der Einfluss von Häufigkeitsformaten auf die Messung von subjektiven Wahrscheinlichkeiten Zusammenfassung Die Messung subjektiver Wahrscheinlichkeiten ist ein zentrales Anliegen vieler Bevölkerungssurveys zu selbstberichteter . Ein bekanntes Problem ist hierbei die subjektive Überschätzung von Risiken im Zusammenhang mit seltenen Ereignissen. Fehler in der Risikoeinschätzung (z. B. ‚Nicht-Berücksichtigung von Basisraten' oder ‚Überschätzung') können sowohl auf kognitive Heuristiken der Befragten als auch auf Eigenschaften der Items zurückgeführt werden. Der erste Teil des Beitrags diskutiert und vergleicht Strategien und Formate der Messung von Wahrscheinlichkeiten, insbesondere Häufigkeiten versus Prozente. Hierbei zeigt sich, dass die Abfrage von Basisraten in Form von Häufigkeiten einen biasreduzierenden Effekt auf die Wahrscheinlichkeitseinschätzung seltener Ereignisse ausübt. Im zweiten Teil des Beitrags werden die theoretischen Vorteile von Häufigkeitsskalen in einen zweistufigen Messansatz subjektiver Wahrscheinlichkeiten überführt und durch ein Methodenexperiment empirisch belegt. Am Beispiel von subjektiven Entdeckungswahrscheinlichkeiten beim Schwarzfahren wird ein Kontexteffekt des Häufigkeitsformats demonstriert, der die Risikoüberschätzung seltener Ereignisse verringert. Ein solches Format könnte in der Praxis der empirischen Sozialforschung vermehrt Anwendung finden. In many surveys on deviant behavior the measurement of subjective probability is an important goal (e. g. German General Social Surveys ( ALLBUS) 1990 and 2000). A well-known problem is the subjective overestimation of risks in connection with rare events. Errors in risk assessment (e. g. 'base rate neglect' or 'overestimation') can result from cognitive heuristics of the respondents as well as item characteristics. The first part of the article discusses strategies and formats of probability measurement and, in particular, compares frequencies versus percentages. It can be shown that the availability of base rates in the frequency format reduces bias in subsequent probability assessments of rare events. In the second part, the theoretical advantages of frequency scales are transformed into a twostep measurement procedure of subjective probability, and a bias-reducing effect of the frequency format is empirically demonstrated. A methodical experiment on fare dodging shows that subjective probabilities of being caught for dodging the fare (the rare event) are more accurate if base rates are activated via frequencies. This kind of format could be applied more frequently in empirical social research. Einleitung 1 "As scientists and as technologists we should discard the idea of a 'true' or 'objective' probability. Instead, we should think of probability judgements as the result of an individual`s feelings of uncertainty, translated into a numerical response by internal decision processes." Die Relevanz der Messung von subjektiven Wahrscheinlichkeiten ist -trotz bekannten Problemen der Validität -unbestritten: In den Sozial-und Wirtschaftswissenschaften sowie in medizinischen Surveys bilden subjektive Wahrscheinlichkeiten die Basis für Entscheidungsfindungen, Verhaltensprognosen und Risikoeinschätzungen. So werden Befragte 2 im ALLBUS 1990 und 2000 nach ihrer Wahrscheinlichkeit gefragt, bei verschiedenen Delikten, wie Schwarzfahren oder Steuerhinterziehung, entdeckt zu werden. Die Messung dieser subjektiven Risiken erfolgt mit Kategorialskalen, die über sogenannte Vague Quantifier verbalisiert sind. Andere Surveys messen subjektive Risiken, so etwa die subjektive Wahrscheinlichkeit Opfer einer Straftat zu werden, ebenso über Vague Quantifier . Studien der Umfragemethodologie und Kognitionspsychologie zeigen, dass die Verwendung von Vague Quantifiers häufig zu einer starken inter-und intrapersonellen Variabilität bei der Interpretation der verbalen Wahrscheinlichkeitsausdrücke und folglich zu Mehrdeutigkeiten und Widersprüchlichkeiten bei der Übertragung der Vague Quantifiers in numerische Äquivalente führt (vgl. . Die vorliegende Arbeit untersucht deshalb alternative Messansätze der Erfassung subjektiver Risiken. Solche Alternativen sind numerische Skalen (Häufigkeiten oder Prozente), die sich durch eine geringere Anfälligkeit für Fehlurteile (Biases) sowie eine konsistentere Verwendung auszeichnen. Allerdings ist auch die Risikoeinschätzung Je nach Personen-, Item-, und Kontexteigenschaften variieren die Zuweisungen der numerischen zu den verbalen Risikoeinschätzungen, sodass eine Vergleichbarkeit zwischen Personen, Items oder Surveys in vielen Fällen problematisch ist. In einem Experiment von ordnen Befragte den Vague Quantifiers numerische Wahrscheinlichkeiten zu (Prozente oder Häufigkeiten). Hierbei zeigen sich Inkonsistenzen in den Zuordnungen. Eine Anwendung numerischer Skalen (insbesondere Häufigkeiten) wird deshalb empfohlen. auf numerischen Skalen, insbesondere auf Prozentskalen, nicht unproblematisch . So stehen subjektive Einschätzungen der Befragten häufig im Widerspruch zu mathematischen Wahrscheinlichkeitsgesetzen. 5 Subjektive Wahrscheinlichkeiten korrespondieren oftmals nur unzureichend mit tatsächlichen Risiken . Befragte unterschätzen systematisch die Wahrscheinlichkeit häufiger (bzw. alltäglicher) und überschätzen die Wahrscheinlichkeit seltener Ereignisse (Overestimation; vgl. . Zudem ist bekannt, dass Befragte die Wahrscheinlichkeit eines Ereignisses überwiegend danach beurteilen, wie repräsentativ es für ein jeweiliges Vergleichsobjekt ist. Entsprechend ignorieren sie wichtige Basis rateninformationen und sind unempfindlich gegenüber der Stichprobengröße (Base Rate Neglect; vgl. Tversky . Zunächst werden nachfolgend die Vorzüge von Häufigkeitsskalen gegenüber Prozentskalen theoretisch hergeleitet und diskutiert . Erstere können das wohl größte Problem der Wahr scheinlichkeitsbeurteilung eindämmen: Die subjektive Überschätzung des Risikos seltener Ereignisse. Auch andere Fehler, wie zum Beispiel die Nicht-Berücksichtigung von Basisraten oder die Fehlbeurteilung logischer Verknüpfungen, sind über die Häufigkeitsskala weniger stark ausgeprägt als über die Prozentskala. Die theoretischen Vorteile von Häufigkeitsskalen werden in einen zweistufigen Messansatz subjektiver Wahrscheinlichkeiten überführt und durch ein Methodenexperiment empi risch belegt. Am Beispiel von subjektiven Entdeckungswahrscheinlichkeiten beim Schwarzfahren wird ein Kontexteffekt des Häufigkeitsformats demonstriert, der die Risikoüberschätzung seltener Ereignisse verringert. Ein solches Format könnte in der Praxis der empirischen Sozialforschung vermehrt Anwendung finden. Als Beispiel kann hier die Verletzung der Konjunktionsregel angeführt werden. Die Konjunktionsregel besagt, dass die Wahrscheinlichkeit einer logischen UND-Verknüpfung zweier Ereignisse nicht größer sein kann als die einer ihrer Komponenten: . Das Heuristik-und Bias-Konzept von Kahneman und Tversky kann als Grundlage des Kognitiven Ansatzes angesehen werden: "In making predictions and judgments under uncertainty, people do not appear to follow the calculus of chance or the statistical theory of prediction. Instead, they rely on a limited number of heuristics which sometimes yield reasonable judgments and sometimes lead to severe and systematic errors." . Zentral ist hierbei die subjektiv erfahrene Leichtigkeit der Erinnerung: "Presumably, they monitor their cognitive processes and infer that a given class of events is frequent when relevant exemplars are easy to bring to mind but rare when exemplars are difficult to bring to mind" Hier liefert der Kognitive Ansatz jedoch bereits Lösungsstrategien für das Problem der Nicht-Berücksichtigung von Basisraten. Dieses könne folglich vermindert werden, indem Basisraten nicht nur als willkürliche Angaben über die Verteilung in der Gesamtpopulation vermittelt werden, sondern ihre Diagnostizität, Relevanz, Spezifizität und Kausalität hervorgehoben wird . Ziel der Messung subjektiver Wahrscheinlichkeiten sollte es demnach sein, die individualisierten Einzelfallinformationen und die Basisraten als gleichwertige, relevante Informationen zu kommunizieren, damit insbesondere letztere bei der Wahrscheinlichkeitseinschätzung berücksichtigt werden . Befragte greifen eher dann auf gegebene Basisraten-Informationen zurück, wenn inkonsistente und nicht kausale Einzelfallinformationen, die nur schwer in Bezug auf existierende stereotype Repräsentationen zu interpretieren sind, zu Mehrdeutigkeiten führen . kann zeigen, dass von den Befragten direkt erfahrene oder selbst generierte Basisraten eher genutzt werden als statistisch vermittelte, und dass Basisraten in Aufgabenkontexten mit 10 Die fiktive Person ‚Tim' wird als intelligent, ordnungsliebend und systematisch sowie in ihrem Schreibstil mechanisch beschrieben. ‚Tim' ist wenig kreativ, hat wenig Sympathie für andere Menschen und generell wenig Spaß an der Interaktion mit anderen. Die normativen Regeln der Vorhersage (welches ‚Tims' Abschlussfach sei) wurden durch die Anwendung der Repräsentativitätsheuristik von der Mehrheit der Befragten verletzt. Über 95 % schätzten die Wahrscheinlichkeit, dass ‚Tim' Informatikabsolvent ist, als größer ein als die, dass er seinen Abschluss in den Geistes-oder Erziehungswissenschaften hat. Das obwohl ihnen klar war, dass es sehr viel mehr Absolventen in den letzteren beiden Fächern gibt (wie es die Basisraten vorgeben). Siehe hierzu die Experimentalbeschreibungen bei . Ob die Basisrate tatsächlich ignoriert oder ihre Diagnostizität von den Befragten lediglich unterschätzt wird, müsste darüber hinaus dadurch geprüft werden, ob sich die Einschätzung bei zusätzlich angegebener Information über Basisraten im Vergleich zum Fehlen dieser Information verändert oder nicht. einer natürlichen und alltäglichen Problematik stärker verwendet werden als die im Kontext künstlicher oder konstruierter Probleme. 11 Das Überschätzen der Auftritts wahrscheinlichkeit seltener sowie das Unterschätzen der Wahrscheinlichkeit alltäglicher bzw. häufiger Ereignisse gehört ebenfalls zu den systematischen Fehlern, welche sich aufgrund der Nutzung von Heuristiken ergeben können. Beispielsweise werden bei der Frage nach der Wahrscheinlichkeit verschiedener Todesursachen die seltenen (Unfälle, Selbstmord, Feuer) überschätzt, während die alltäglichen (Diabetes, Schlaganfall) unterschätzt werden . Über-und Unterschätzung sind außerdem stark affektiv bestimmt. Insbesondere Ereignisse, die mit schwerwiegenden Folgen verbunden sind oder in den Medien überbetont werden, erfahren die stärkste Überschätzung . Begründet wird diese Verzerrung über kognitive Mechanismen des Erinnerns und der Betroffenheit: Die angenommene Wahrscheinlichkeit des Eintretens eines Ereignisses ist abhängig davon, wie leicht dieses Ereignis erinnert oder vorgestellt werden kann. Je eher ein Ereignis kognitiv verfügbar ist und je folgenträchtiger es ist, desto eher wird seine Auftritts wahrscheinlichkeit überhöht beurteilt Die Ursachen der Beurteilungsverzerrungen sieht der Inputorientierte Ansatz nicht primär bei den Individuen, sondern bei den Eigenschaften der Items. Die funktionalen Beurteilungsanlagen der Befragten sehen sich mit einem suboptimalen Input konfrontiert, der zu den fehlerhaften Risikoeinschätzungen führt. Dabei spielen vorangehende Fragen, die Itemformulierung und das Skalenformat eine wichtige Rolle . Persönlich erfahrene Informationen (Basisraten) sind anschaulicher und hervorstechender, damit also schneller verfügbar als ‚gelernte' Informationen. Zudem haben Menschen mehr Vertrauen in selbst generierte Basisraten, vor allem wenn diese über Erfahrungen aus erster Hand erworben wurden. Ausführliche Beschreibungen sowie methodische Anleitungen finden sich bei . 12 In Experimenten mit US-Studenten zum Thema HIV-Infektion zeigte sich, dass diese die Wahrscheinlichkeit einer Ansteckung mit HIV stark überschätzten (im Vergleich zu den tatsächlichen Risiken). Begründet wurden dieser Effekt mit der extensiven Berichterstattung zur HIV-Epidemie in den Medien und den schweren Konsequenzen einer HIV-Infektion. Das Thema HIV wurde durch eine starke Medienpräsenz kognitiv verfügbar gemacht, was in vielen Fällen zu einer Überschätzung der tatsächlichen (geringen) Risiken der allgemeinen Bevölkerung geführt hat (Pinkerton et al. 2000: 16f.). Im Gegensatz zu kategorialen Skalen mit einer geringen Anzahl verbaler Antwortkategorien erlauben Prozentskalen (üblicherweise Skalen von 0 bis 100 %, also 101 wählbaren Alternativen) eine präzisere Kommunikation von subjektiven Wahrscheinlichkeiten ). 13 Die Kommunikation von Wahrscheinlichkeiten im Prozentformat ist dennoch fehleranfällig, da die von den Befragten angegebenen allgemeinen oder subjektiven Wahrscheinlichkeiten häufig von den tatsächlichen Risiken abweichen. Oftmals werden Ereigniswahrscheinlichkeiten im Prozentformat überschätzt . konnten in ihrer Studie über die Erwartungen von Jugendlichen bezüglich wichtiger Lebensereignisse zeigen, dass die Befragten sowohl die Wahrscheinlichkeit positiver als auch negativer Ereignisse 14 überschätzen. Überschätzung kann unter anderem mit der über mäßigen Nutzung von 50 %-Antwor ten erklärt werden. Befragte verwenden diesen Wert weniger in seiner natürlichen numerischen Form, sondern interpretieren ihn vielmehr als Kategorie ‚keine Ahnung'. In einer Studie zu Schwangerschaftsrisiken deuteten die Befragten die Wahrscheinlichkeit von 50 % für einen genetischen Defekt beim Kind als ‚alles ist möglich' (Lippman-Hand/Fraser 1979: 118f.). Die vermehrte ‚Flucht in die Mitte', welche vor allem durch die Unsicherheit der Eltern begründet ist, führte so im prozentualen Wahrscheinlichkeitsformat zu einer Überschätzung der Risiken. Ein weiterer Grund für die überproportionale Verwendung der Mittelposition der Skala ist im sozialen Vergleich zu finden. Befragte orientieren sich bei der Kommunikation ihrer subjektiven Wahrscheinlichkeit häufig an der Referenzpopulation. Dabei interpretieren sie die Skalenmitte als ‚normalen' oder Durchschnittswert für diese Population und ordnen sich entsprechend ein . Die Überschätzung von kleinen Ereigniswahrscheinlichkeiten kann ebenso durch die Präferenz der Befragten für runde Zahlen erklärt werden. Befragte neigen dazu ihre Antworten auf Werte wie 0, 10, …, 50, … und 100 % zu runden, statt die verfeinerten Wahrscheinlichkeitsangaben auf der Prozentskala zwischen 13 "For example, when subjects say it is 'likely' that someone will get a headache as a result of using a certain medicine and say it is 'likely' that someone else will develop a more severe symptom as a result of using another medicine, they are not referring to the same numeric probability. The 'likely' probability of the less severe symptom will be higher (…)." (Coutts-Heller 2002: 7). Eine weiterführende Diskussion der Probleme von Vague Quantifiers findet sich bei . 14 Zum Beispiel: Positiv -Abschluss des College bis zum 30. Lebensjahr. Negativ -Inhaftierung oder Tod innerhalb des nächsten Jahres. 15 Eine Möglichkeit zur Reduzierung von 50 %-Antworten ist die Einführung einer zusätzlichen Antwortkategorie ‚keine Ahnung' oder ‚neutral' (Coutts-Heller 2002: 9). 0 und 100 % im vollen Umfang auszunutzen . Befragte benutzen die Prozentskala häufig wie eine Kategorialskala, die von 0 bis 10 reicht, und geben Antworten oftmals als Vielfache von 10. Da in den Studien aber meist Ereignisse untersucht werden, deren Wahrscheinlichkeiten (weit) unter 10 % liegen, könnte ein solches Befragtenverhalten zu den beobachteten Überschätzungen führen . Subjektive Wahrscheinlichkeitseinschätzungen spezifischer Ereignisse mit binärem Ausgang (wie die Entdeckungswahrscheinlichkeit eines Deliktes im kommenden Jahr) sind im Prozentformat fehleranfällig. Diese Probleme können auf evolutionäre Prozesse in der Entwicklung der menschlichen kognitiven Fähigkeiten zurückgeführt werden. Menschen besitzen demnach keinen angeborenen kognitiven Mecha nismus, der ihnen die Verarbeitung von Einzelereigniswahrscheinlichkeiten im Einklang mit den normativen Standards der Wahrscheinlichkeitstheorie ermöglicht . Laut liege der Hauptschwachpunkt der kognitiven und motivationalen Erklärungen für die Fehler bei der Risikoeinschätzung darin begründet, dass diese die Struktur der Aufgabe und deren Beziehung zur Struktur der natürlichen Umwelt des Befragten ausblenden würden. Die Fehleinschätzungen der Befragten seien keine Fehler im statistischen Denken, sondern lediglich bedingt durch eine suboptimale Kon struk tion von Informations-und Antwortformaten innerhalb der Studien: "The mind acts as if it were a frequentist; it distinguishes between single events and frequencies in the long run -just as probabilists and statisticians do. Despite the fact that researchers in the 'heuristics and biases' program routinely ignore this distinction fundamental to probability theory when they claim to have identified 'errors', it would be foolish to label these judgments 'fallacies'." Die Verwendung von Häufigkeitsformaten würde demnach, verglichen mit Einzelereigniswahrscheinlichkeiten im Prozentformat, zu einer klareren Einschätzung von Risiken führen. Häufigkeiten stellen eine intuitivere Metrik bei der Risikobeurteilung dar als Prozente . Natürliche Häufigkeiten sind (verglichen mit Prozenten) weniger abstrakt, einfacher zu verstehen sowie zu visualisieren und benötigen weniger kognitiven Aufwand bei der Einschätzung von Risiken . Zudem erhöhen sie die Anwendung der Bayes Regeln. Die Informationspräsentation in Häufigkeiten statt Prozenten steigert die Beurteilungsleistung der Befragten. Studien zur Qualität von Antwortskalen im Hinblick auf Wahrscheinlichkeitseinschätzungen zeigen, dass das Ersetzen von Prozent-durch Häufigkeitsskalen Fehleinschätzungen deutlich verringert und so zu Leistungssteigerungen bei der Genauigkeit der Wahrscheinlichkeitseinschätzungen führt . Während Basisraten bei Prozentinformationen und bei Abfrage auf einer Prozentskala kaum von den Befragten genutzt werden, kann die Nicht-Berücksichtigung von Basisraten durch die Präsentation von natürlichen Häufigkeiten und die Nutzung von Häufigkeitsskalen als Antwortmöglichkeit reduziert werden Natürliches Sampling bezeichnet die aufeinanderfolgende und fortlaufende Erfassung von Informationen über das Aktualisieren von Ereignishäufigkeiten, also das Zählen von erlebten oder überlieferten Objekten und Ereignissen . 17 Fehler, welche sich bei der Einschätzung von Wahrscheinlichkeiten ergeben, seien demnach vorwiegend auf das Informationsformat zurückführbar (vgl. Gigerenzer/Hoffrage 1995: 685ff.). Die von Menschen erworbenen mathematischen Algorithmen seien lediglich für bestimmte Repräsentationen angelegt -die Eingangsinformationen müssten demnach im richtigen Format vorliegen, damit die Algorithmen optimal arbeiten können (wie auch ein Taschenrechner nicht mit binären Zahlen arbeiten kann). Die Berechnung von Ereigniswahrscheinlichkeiten über Bayesianische Algorithmen fällt im Häufigkeitsformat leichter, da weniger und einfachere Rechenschritte notwendig sind. Detaillierte Informationen und Beispielstudien zu den Bayes Regeln und ihrem Zusammenhang zum Informationsformat geben , . Die Erinnerung relevanter Informationen wird bestimmt von der Frageformulierung, den Frageinstruktionen, der Verfügbarkeit früherer Überlegungen und Urteile sowie dem Inhalt vorangegangener Items . Kontexteffekte sind Antworteffekte, die durch eine oder mehrere vorangegangene Fragen (und Antworten) oder durch die Skalen vorhergehender Fragen hervorgerufen werden . Diese vorangegangenen Fragen haben zwei Funktionen: (1) Informationen zu aktivieren, sodass diese zu einem späteren Zeitpunkt leichter (automatisch und unbewusst) abgerufen werden können, und (2) eine Informationsbasis zu liefern, über die sich die Fragebedeutung erschließt. Über einen Priming Effekt sind Informationen, die entweder direkt in der vorangegangenen Frage enthalten sind oder vom Befragten bei deren Beantwortung aktiviert wurden, zugänglicher und strahlen auf die Folgefrage aus . Eine Beurteilung, die einmal abgegeben wurde, dient entsprechend als Anker, dem nachfolgende Beurteilungen angeglichen oder kontrastiert werden . Die Generierung subjektiver Wahrscheinlichkeiten hinsichtlich des Eintretens seltener Ereignisse ist häufig geprägt von Überschätzung, d. h. Befragte schätzen diese Wahrscheinlichkeiten im Vergleich zu objektiven Standards zu hoch ein stellt fest, dass die Wahrnehmung von Wahrscheinlichkeiten und Risiken ein mehrdimensionales Konstrukt ist. Bei den Überlegungen zu ihren eigenen Risiken nannten Befragte "zunächst die allgemeinen Risiken, besannen sich auf ihre üblichen Alltagsroutinen und leiteten daraus ihre Antwort auf das eigene Risiko ab" . Da jedoch nicht davon ausgegangen werden kann, dass alle Befragten diese kognitive Kalkulation ausführen, somit unterschiedliche Aus den theoretischen Überlegungen von Interpretationsgrundlagen bestehen würden und folglich die Ergebnisse schwer vergleichbar wären, ist es sinnvoll, die Abfrage allgemeiner Wahrscheinlichkeiten (Basisraten) generell vor der subjektiver Wahrscheinlichkeiten vorzunehmen. Aufgrund der erhöhten kognitiven Verfügbarkeit würde dies die Nutzung der Basisraten bei der individuellen Wahrscheinlichkeitseinschätzung erhöhen und damit Fehleinschätzungen verringern. Dabei ist es besonders hilfreich, die Basisraten nicht lediglich vorzugeben, sondern von den Befragten zu erfragen. So werden nicht (scheinbar) willkürlich Werte festgelegt, sondern die subjektiven Annahmen und Erfahrungen der Befragten berücksichtigt, was die Glaubhaftigkeit, Relevanz und Eindeutigkeit der Basisraten unterstreicht und ihre Weiterverwendung in Folgefragen zusätzlich verstärken kann . In , , sowie : "Frequency problems evoke a distributional approach of probability and are mentally represented in such a way that the relevance of extensional rules is more compelling. Case-specific problems evoke a singular approach and are modeled in ways that support the use of nonextensional heuristics such as representativeness. […] Presumably, solving frequency problems first not only cued extensional rules but also provided a model for how those rules could be applied. […] Evidently, simply having subjects solve problems that naturally evoke extensional rules will lead them to apply extensional rules to problems that would otherwise evoke nonextensional strategies." (Reeves/Lockhart 1993: 212) . Durch die Erhebung zu zwei Zeitpunkten mit zwei Gruppen wird es möglich, beide Befragten gruppen mit beiden Fragebogenversionen zu konfrontieren (faktorielles ‚between-within-Design' 24 ). Das Wirken beider Anker auf die subjektive Entdeckungswahrscheinlichkeit kann also sowohl zwischen als auch innerhalb der Gruppen verglichen werden. Die Fragebögen 25 enthalten neben dieser experimentellen Variation identische Fragen zu demografischen Aspekten (Alter, Geschlecht, Wohndauer in Leipzig, Hauptfach, Hochschulsemester), zu Themen der spezifischen Nutzung von öffentlichen Nahverkehrsmitteln (Transportmittel, Jahreszeit, Uhrzeit, Fahrscheinart, durchschnittliche Fahrtdauer), zur Beurteilung der Ticketpreise und des Schwarzfahrens sowie zur Einschätzung des aktiven Schwarzfahrens von Freunden/Bekannten und des Befragten selbst. Der Einschätzung der subjektiven Entdeckungswahrscheinlichkeit beim Schwarzfahren geht eine Ankerfrage voraus, die die allgemeine Entdeckungs- Detaillierte Informationen zum between-und within-Design sowie deren Anwendungen finden sich bei , , sowie . 25 Der vollständige Fragebogen in seinen zwei Versionen, der Datensatz und alle Analyseroutinen sind auf Anfrage erhältlich. wahrscheinlichkeit thematisiert und deren Format sich zwischen den Versionen unterscheidet. Mittels dieser wird der Kontext vor der Zielfrage variiert, indem Basisraten über zwei unterschiedliche Skalen (Häufigkeits-und Prozentskala) abgefragt werden. Die Zielfrage befindet sich abgetrennt auf der nächsten Seite des Fragebogens, sodass die Ankerfrage bei deren Beantwortung nicht direkt sichtbar ist. Der Einfluss der vorangegangenen Frage wirkt also vorwiegend über die Aktivierung und kognitive Bereitstellung von Informationen, statt unmittelbar visuell zugänglich zu sein; das Rückblättern der Befragten kann dennoch nicht ausgeschlossen werden. Geben Sie hierzu ihre Einschätzung auf einer Skala von 0 % = "sie wird auf keinen Fall entdeckt" bis 100 % = "sie wird auf jeden Fall entdeckt" an. Sie können bei Ihrer Antwort jeden beliebigen Wert dazwischen angeben. Geben Sie hierzu ihre Einschätzung auf einer Skala von 0 % = "ich werde auf keinen Fall entdeckt" bis 100 % = "ich werde auf jeden Fall entdeckt" an! Sie können bei Ihrer Antwort jeden beliebigen Wert dazwischen angeben. In Anwendung der allgemeinen Hypothesen auf die Entdeckungswahrscheinlichkeiten beim Schwarzfahren resultieren die folgenden spezifischen Vorhersagen: (1) Die Ankerfrage im Häufigkeitsformat liefert realistischere Einschätzungen der allgemeinen Entdeckungswahrscheinlichkeit als die im Prozentformat. Erstere führt zu geringeren Wahrscheinlichkeitseinschätzungen. Informationen über die empirischen Häufigkeitsverteilungen der allgemeinen und subjektiven Entdeckungswahrscheinlichkeiten sind im Anhang zu finden. Zunächst ist auffällig, dass sich die Angaben zwischen den allgemeinen und subjektiven Entdeckungswahrscheinlichkeiten unterscheiden, wobei letzteren im Durchschnitt höhere Werte zugeordnet werden. Die Einschätzung der allgemeinen Entdeckungswahrscheinlichkeit im Häufigkeitsformat fällt verglichen mit der Abfrage im Prozentformat signifikant geringer aus . Zudem verringert die Nutzung der Häufigkeitsskala als Anker, im Vergleich zur Nutzung der Prozentskala als Anker, die da rauf folgende subjektive Entdeckungswahrscheinlichkeit beim Schwarzfahren . Die Befunde zu den allgemeinen Entdeckungswahrscheinlichkeiten können unter Kontrolle der Variablen (1) Befragtengruppe und (2) Welle bestätigt werden: Befragte, die die Ankerfrage im Prozentformat beantwortet haben, zeigen signifikant höhere Werte als die Vergleichsgruppe mit Häufigkeitsformat . Der Effekt des Skalenformats kann demnach für beide Gruppen unabhängig nachgewiesen werden (vgl. Tabelle 2). Auch innerhalb der Gruppen ergeben sich in Abhängigkeit des Skalenformats deutliche Unterschiede Bei den subjektiven Entdeckungswahrscheinlichkeiten zwischen den Gruppen fallen die erwarteten Kontexteffekte schwächer aus (Inter-Gruppenvergleich): In der ersten Erhebungswelle zeigt sich der erwartete Effekt des Skalenformats der Ankerfrage auf die darauffolgende subjektive Entdeckungswahrscheinlichkeit. Befragte, die die Kontextfrage mit Häufigkeitsskala bearbeitet haben, zeigen bei der Zielfrage signifikant niedrigere Werte als solche, die zuvor mit Hilfe der Prozentskala geantwortet haben . Dieser Kontexteffekt des Skalenformats der Ankerfrage auf die Zielfrage zeigt in der zweiten Welle ebenso in die erwartete Richtung, fällt jedoch recht schwach aus (Differenz -2,81) und ist zudem nicht signifikant (auf den konventionellen 1 %-, 5 %-bzw. 10 %-Niveaus). Tabelle 3 visualisiert diese Befunde. Differenzen der Mittelwerte der subjektiven Ent de ckungswahr scheinlichkeit in Abhängigkeit des Skalenformats, der Welle und Befragtengruppe Auffällig ist die Differenz (37,44 -41,81 = -4,37) bei der subjektiven Entdeckungswahrscheinlichkeit mit jeweils vorgeschaltetem Prozentanker zwischen den Grup-pen. Befragte der Gruppe 2, denen der Prozentanker in Welle 2 vorgelegt wurde, zeigen eine geringere subjektive Entdeckungswahrscheinlichkeit (nicht signifikant: einseitiger T-Test; p=0,16) verglichen mit Befragten der Gruppe 1, denen der Prozen tanker bereits in Welle 1 vorgelegt wurde. Somit kann ein Kontexteffekt von Welle 1 auf Welle 2 nicht ausgeschlossen werden: Es besteht die Vermutung, dass in Gruppe 2 durch die Benutzung des Häufigkeitsankers und der sich daraus ergebenden geringen subjektiven Entdeckungswahrscheinlichkeit in Welle 1, diese auch in Welle 2 -trotz Prozentanker -nach unten korrigiert wurde. Solch ein Reihenfolgeeffekt (Häufigkeiten in Welle 1 und Prozente in Welle 2) wäre eine mögliche Erklärung des nur schwachen Kontexteffektes in Gruppe 2. Innerhalb der Gruppen zeigen alle Vergleiche der subjektiven Wahrscheinlichkeiten ebenso in die erwartete Richtung (Intra-Gruppenvergleich), wobei auch hier die angenommenen Effekte (verglichen mit Hypothese 1) schwächer ausfallen. Befragte der Gruppe 1, welche die Ankerfrage im Häufigkeits-statt Prozentformat beantwortet haben, zeigen eine geringere subjektive Entdeckungswahrscheinlichkeit . Auch bei Befragten der Gruppe 2 zeigt sich der Effekt in die erwartete Richtung, allerdings schwächer (Differenz -4,48) und nicht signifikant (p=0,14). Erneut drängt sich die Vermutung auf, dass ein Reihenfolgeeffekt (Gruppe 1: Prozente in Welle 1 und Häufigkeiten in Welle 2; Gruppe 2: Häufigkeiten in Welle 1 und Prozente in Welle 2) den Kontexteffekt der Anker-auf die Zielfrage moderiert. Tabelle 2 und Tabelle 3 zeigen, dass die Schätzungen in der zweiten Welle sowohl durch das Format der ersten wie der zweiten Welle beeinflusst werden. Befragte der Gruppe 1, die in der ersten Welle im Prozentformat antworteten, berichten in der zweiten Welle höhere Werte im Häufigkeitsformat als Befragte der Gruppe 2, die in der ersten Welle unmittelbar im Häufigkeitsformat antworteten. 30 Umgekehrt resultiert in Gruppe 2 das Häufigkeitsformat in Welle 1 in niedrigeren Werten im Prozentformat in Welle 2. 31 Dies deutet auf einen Ankereffekt über Welle und Format hin. Dieser Befund ist konsistent mit Ergebnissen bisheriger Studien, die zeigen, dass Manipulationen zum Zeitpunkt t1 die kognitive Repräsentation verändern, auf die zum Zeitpunkt t2 zurückgegriffen wird Bezüglich der Häufigkeitsanker sind die Angaben zur subjektiven Entdeckungswahrscheinlichkeit für die Gruppen nahezu identisch 1980). 32 Allerdings zeigen drei von vier Tests keine signifikanten Differenzen. Die von uns aufgestellten Vermutungen zum Reihenfolgeeffekt sollten daher in einer weiteren Untersuchung (mit höherer Fallzahl) repliziert werden. Zusammenfassend kann auch Hypothese 2 der Tendenz nach bestätigt werden, wobei weitere Untersuchungen eines möglichen Interaktionseffektes von (1) Skalenformat (Häufigkeitsanker versus Prozentanker) und (2) Präsentationsabfolge der Formate (Abfolge: Häufigkeitsanker-Prozentanker versus Prozentanker-Häufigkeitsanker) auf die Einschätzung der subjektiven Entdeckungswahrscheinlichkeit lohnenswert scheinen. 33 Im theoretischen Teil der Arbeit wurde die Problematik der Messung von subjektiven Wahrscheinlichkeiten besprochen. Auffällig sind die sich aus ihr ergebenden zahlreichen Fehleinschätzungen, wie Überschätzung und die Nicht-Berücksichtigung von Basis raten. Die Gründe hierfür sind zum einen in den kognitiven Prozessen der 32 Als eine mögliche Erklärung für diesen Effekt diskutiert die erhöhte Verfügbarkeit von stereotypen Antwortsequenzen (sog. kognitiven ‚Skripten'), die bei der erstmaligen Beantwortung der Frage gebildet, anschließend im Gedächtnis gespeichert und zu späteren Zeitpunkten (bei ähnlichen Fragestellungen) leichter aktiviert werden können. Ähnlich argumentiert : "Cognitive processes occurring after stimulus observation can alter the information subjects have available for making later impression judgements, and consequently, can alter the impression judgments that are made." 33 Neben dem Vergleich der konditionalen Mittelwerte wurden zudem 2 multiple OLS-Regressionen mit Interaktionstermen geschätzt: Im ersten Modell ist die abhängige Variable die allgemeine Entdeckungswahrscheinlichkeit (AEW), im zweiten Modell ist die abhängige Variable die subjektive Entdeckungswahrscheinlichkeit (SEW). In beiden Modellen stehen jeweils auf der rechten Seite der Gleichung die beiden Experimentalvariablen Skalenformat (SF: 1 = Häufigkeiten, 0 = Prozente) und Präsentationsabfolge (PA: 1 = Prozente zuerst, 0 = Häufigkeiten zuerst) sowie der entsprechende Interaktionsterm Skalenformat (SF) * Präsentationsabfolge (PA). Im ersten Modell zeigen die Regressionskoeffizienten der beiden Experimentalvariablen in die theoretisch erwartete Richtung: AEW = 30,17 -7,70*SF + 8,85*PA -7,12*SF*PA. Die Koeffizienten für das Skalenformat (p=0,01) und die Präsentationsabfolge (p=0,01) sind jeweils signifikant, der Interaktionsterm Skalenformat * Präsentationsabfolge (p=0,12) ist dagegen nicht signifikant. Im zweiten Modell zeigen die Regressionskoeffizienten der beiden Experimentalvariablen ebenfalls in die theoretisch erwartete Richtung: SEW = 37,44 -4,48*SF + 4,37*PA -2,70*SF*PA. Im Vergleich zum Prozentformat, resultiert die Fragebogenversion mit der Ankerfrage im Häufigkeitsformat in niedrigere subjektive Entdeckungswahrscheinlichkeiten. Im Vergleich zur Reihenfolge ‚Häufigkeiten zuerst', resultiert die Reihenfolge ‚Prozente zuerst' in höhere subjektive Entdeckungswahrscheinlichkeiten. Im Vergleich zum ersten Modell deuten die Koeffizienten im zweiten Modell auf schwächere Effekte hin. Zudem sind die Koeffizienten nicht signifikant (p=0,28 für das Skalenformat; p=0,32 für die Präsentationsabfolge; p=0,66 für den Interaktionsterm Skalenformat * Präsentationsabfolge). In einer separaten Analyse wurden zudem robuste Standardfehler geschätzt (Huber-White-Sandwich-Varianzschätzer). Die hieraus resultierenden p-Werte bleiben nahezu unverändert. Befragten zu finden, die ihre Einschätzungen häufig mittels einfacher Heuristiken, wie der Reprä sentativitätsheuristik und der Verfügbarkeitsheuristik, vornehmen. Zum anderen führt aber auch die Anwendung inadäquater Präsentations-und Abfrageformate zu den Fehleinschätzungen. Wie die Durchsicht früherer theoretischer und empirischer Forschungsarbeiten gezeigt hat, stellen die in zahlreichen Surveys verwendeten, mit Vague Quantifiers verbalisierten Kategorialskalen eine nur ungenaue und häufig inkonsistente Form der Risikoeinschätzung und -kommunikation dar (vgl. . Ausgangspunkt des vorliegenden Artikels war es deshalb, adäquatere Alternativen zur Erfassung von Wahrscheinlichkeiten zu untersuchen und experimentell zu vergleichen. Es wurden zwei numerische Formate (Häufigkeitsskala versus Prozentskala) vergleichend untersucht. Hierbei zeigte sich ein Einfluss des Formats auf die Wahrscheinlichkeitseinschätzungen der Befragten. Im Vergleich zum Prozentformat führt das Häufigkeitsformat zu niedrigeren Wahrscheinlichkeitseinschätzungen hinsichtlich des Eintretens seltener Ereignisse. Im Rahmen einer Schwarzfahrerstudie wurde ein experimentelles Design angewendet, welches in einem zweistufigen Ansatz die Abfrage allgemeiner Entdeckungswahrscheinlichkeiten vor der Abfrage subjektiver Entdeckungswahrscheinlichkeiten erfordert und das Wirken von Kontexteffekten annimmt. Die Ergebnisse dieses Methodenexperiments zeigen, dass die Ankerfrage im Häufigkeitsformat zu niedrigeren allgemeinen Wahrscheinlichkeitseinschätzungen führt. Überdies ergab sich ein Kontexteffekt der Ankerfrage mit Häufigkeitsskala auf die Zielfrage, wobei die subjektive Entdeckungswahrscheinlichkeit hier kleiner eingeschätzt wurde als bei der Ankerfrage mit Prozentskala. Die vorgestellten Ergebnisse können für die empirische Sozialforschung und die Umfragemethodologie von Nutzen sein: Erstens können sie in der Phase der Fragebogenentwicklung bzw. der Konstruktion von Messinstrumenten zur Erfassung und Kommunikation allgemeiner sowie subjektiver Entdeckungswahrscheinlichkeiten Anregungen liefern. Zweitens wurde eine Alternative zu den häufig verwendeten Vague Quantifiers bei der Erfassung von Entdeckungswahrscheinlichkeiten aufgezeigt. Drittens wurde argumentiert, dass bei der Informationspräsentation sowie Abfrage von Entdeckungswahrscheinlichkeiten in numerischen Formaten die Nutzung von natürlichen Häufigkeiten intuitiver und verständlicher sei und die subjektive Überschätzung von kleinen Wahrscheinlichkeiten abnehme, wenn Befragte Risiken in Häufigkeiten anstatt Prozenten schätzen. Dies könnte zunächst als Nachteil gedeutet werden, wenn man davon ausgeht, dass viele Umfragen durchgeführt werden, um aus den Antworten der Stichprobe auf Wahrnehmungen in der Population zu schließen. So wäre denkbar, dass Häufigkeitsformate die Wahrnehmungen und Antworten in der Stichprobe derart beeinflussen, dass diese von den spontanen Wahrnehmungen der Personen in der Population abweichen und dadurch als handlungsrelevante Variablen an Erklärungskraft verlieren würden Bisherige Forschungsarbeiten deuten allerdings darauf hin, dass das Häufigkeitsformat dem alltäglichen Denken näher ist Natural frequencies facilitate inferences because they carry implicit information about base rates (…) 1977: Intuitive theories of events and the effects of base-rate information on prediction Journal of Personality and Social Psychology Fragebögen und Codebücher The base-rate fallacy in probability judgments Acta Psychologica Waterplas und Geert Loosveldt, 1992: Context effects as substantive data in social surveys Context effects in social and psychological research How to show that 9 > 221. Collect judgments in a between-subjects design Psychological Methods Perceptions of breast cancer risk and screening effectiveness in women younger than 50 years of age Journal of the National Cancer Institute 1979: Vague quantifiers Public Opinion Quarterly Which statistical formats facilitate what decisions? The perception and influence of different statistical information formats Journal of Behavioral Decision Making Individuation, counting, and statistical inference: The role of frequency and whole-object representations in judgment under uncertainty Journal of Experimental Psychology General Verbal and numerical expressions of probability Organizational Behavior and Human Decision Processes The recall and use of traits and events in social inference processes Journal of Experimental Social Psychology Are humans good intuitive statisticians after all? Rethinking some conclusions from the literature on judgment under uncertainty Cognition Context effects in the measurement of subjective probabilities in surveys Unrealistic pessimism Journal of Social Psychology Perceptions of economic insecurity. Evidence from the survey of economic expectations Public Opinion Quarterly Können Befragte lügen? Zum Konzept des "wahren Wertes" im Rahmen der handlungstheoretischen Erklärung von Situationseinflüssen bei der Befragung Frequency versus probability formats in statistical word problems Constructive processes as a source of context effects in survey research. Explorations in self-generated validity Context effects in social and psychological research Teen expectations for significant life events Public Opinion Quarterly Communicating the frequency of adverse drug reactions to female patients Drug Information Journal On narrow norms and vague heuristics. A reply to Kahneman und Tversky The psychology of good judgment. Frequency formats and simple algorithms Medical Decision Making Ecological intelligence. An adaption for frequencies The evolution of mind Adaptive thinking. Rationality in the real world Probabilistic mental models. A Brunswikian theory of confidence Psychological Review How to improve Bayesian reasoning without instruction. Frequency formats Psychological Review Overcoming difficulties in Bayesian reasoning. A reply to Lewis and Keren (1999) and Mellers and McGraw Psychological Review Presentation and content. The use of base rates as a continuous variable Journal of Experimental Psychology: Human Perception and Performance The effects of base rates and individuating information on judgment about another person Journal of Experimental Social Psychology Frequency, probability, and prediction. Easy solutions to cognitive illusions? Cognitive Psychology Relative importance of scenario information and frequency information in the judgment of risk Acta Psychologica Representation facilitates reasoning. What natural frequencies are and what they are not Cognition Communicating statistical information Science Social comparison of health risks. Locus of control, the person-positivity bias, and unrealistic optimism Journal of Applied Social Psychology Calibration of subjective probability judgments in a naturalistic setting Organizational Behavior and Human Decision Processes Biases of probability assessment. A comparison of frequency and single-case judgments Organizational Behavior and Human Decision Processes 1972: Subjective probability. A judgment of representativeness Cognitive Psychology On the psychology of prediction Psychological Review On the study of statistical intuitions Cognition Variants of uncertainty Cognition Theoretical notes on the reality of cognitive illusions Nonunique Invulnerability. Singular versus distributional probabilities and unrealistic optimism in comparative risk judgments. Organizational Behavior and Human Decision Processes Order effects within personality measures Context effects in social and psychological research The base rate fallacy reconsidered. Descriptive, normative, and methodological challenges Behavioral and Brain Sciences When are people persuaded by DNA match statistics? Law and Human Behavior Wie wahrscheinlich ist "wahrscheinlich"? Zur subjektiven Einschätzung und Kommunikation von Viktimisierungs wahrscheinlichkeiten Zeitschrift für empirische Sozialforschung Genetic counselling. Provision and Reception of information American Journal of Medical Genetics How to improve Bayesian reasoning. Comment on Gigerenzer and Hoffrage Human inference. Strategies and shortcomings of social judgment The ´true probability` problem Acta Psychologica A quantitative study of the accuracy of college students` HIV risk estimates Journal of Applied Biobehavioral Research Effects of a relative-frequency elicitation question on likelihood judgment accuracy. The case of external correspondence Organizational Behavior and Human Decision Processes Distributional versus singular approaches to probability and errors in probabilistic reasoning Journal of Experimental Psychology Subjektive Wahrscheinlichkeiten und Antwortmuster. Der Einfluss von Personenbezug und Skalierungsart ZA-Information Unpacking, repacking, and anchoring. Advances in support theory Psychological Review Frequency or probability? A qualitative study of risk communication formats used in health care Medical Decision Making Das DEFECT-Projekt. Sampling-Errors und Nonsampling-Errors in komplexen Bevölkerungsstichproben ZUMA-Nachrichten Accessible content and accessibility experiences. The interplay of declarative and experiential information in judgment Personality and Social Psychology Review Context effects in social and psychological research Base-rates, representativeness, and the logic of conversation. The contextual relevance of "irrelevant" information Social Cognition Response scales. Effects of category range on reported behavior and comparative judgments Public Opinion Quarterly Experimental and quasi-experimental designs for generalized causal inference On the self-erasing nature of errors of prediction Journal of Personality and Social Psychology Risk as analysis and risk as feelings. Some thoughts about affect, reason, risk, and rationality Risk Analysis Probability, danger, and coercion. A study of risk perception and decision making in Mental Health Law Law and Human Behavior Order effects" in survey research. Activation and information functions of preceding questions Context effects in social and psychological research Overestimation of subjective probabilities Scandinavian Journal of Psychology Context effects on responses to attitude questions. Attitudes as memory structures Context effects in social and psychological research The psychology of survey response Availability. A heuristic for judging frequency and probability Cognitive Psychology Judgment under uncertainty. Heuristics and biases Extensional versus intuitive reasoning. The conjunction fallacy in probability judgment Psychological Review The accuracy of public beliefs about crime Social Forces Judging the accuracy of a likelihood judgment. The case of smoking risk Journal of Behavioral Decision Making How much is "Quite a bit"? Mapping between numerical values and vague quantifiers Applied Cognitive Psychology Upward versus downward anchoring in frequency judgments of social facts Korrespondenzadresse: Ivar Krumpal Universität Leipzig Institut für Soziologie Beethovenstraße 15 04107 Leipzig krumpal@sozio GROBID - A machine learning software for extracting information from scholarly documents Mandy Beuer-Krüssel und Ivar Krumpal Der Einfluss von Häufigkeitsformaten auf die Messung von subjektiven Wahrscheinlichkeiten The Impact of Frequency Formats on the Measurement of Subjective Probability Zusammenfassung Die Messung subjektiver Wahrscheinlichkeiten ist ein zentrales Anliegen vieler Bevölkerungssurveys zu selbstberichteter Delinquenz (z. B. ALLBUS 1990 . Ein bekanntes Problem ist hierbei die subjektive Überschätzung von Risiken im Zusammenhang mit seltenen Ereignissen. Fehler in der Risikoeinschätzung (z. B. ‚Nicht-Berücksichtigung von Basisraten' oder ‚Überschätzung') können sowohl auf kognitive Heuristiken der Befragten als auch auf Eigenschaften der Items zurückgeführt werden. Der erste Teil des Beitrags diskutiert und vergleicht Strategien und Formate der Messung von Wahrscheinlichkeiten, insbesondere Häufigkeiten versus Prozente. Hierbei zeigt sich, dass die Abfrage von Basisraten in Form von Häufigkeiten einen biasreduzierenden Effekt auf die Wahrscheinlichkeitseinschätzung seltener Ereignisse ausübt. Im zweiten Teil des Beitrags werden die theoretischen Vorteile von Häufigkeitsskalen in einen zweistufigen Messansatz subjektiver Wahrscheinlichkeiten überführt und durch ein Methodenexperiment empirisch belegt. Am Beispiel von subjektiven Entdeckungswahrscheinlichkeiten beim Schwarzfahren wird ein Kontexteffekt des Häufigkeitsformats demonstriert, der die Risikoüberschätzung seltener Ereignisse verringert. Ein solches Format könnte in der Praxis der empirischen Sozialforschung vermehrt Anwendung finden. Abstract In many surveys on deviant behavior the measurement of subjective probability is an important goal (e. g. German General Social Surveys (ALLBUS) 1990 and 2000). A well-known problem is the subjective overestimation of risks in connection with rare events. Errors in risk assessment (e. g. 'base rate neglect' or 'overestimation') can result from cognitive heuristics of the respondents as well as item characteristics. The first part of the article discusses strategies and formats of probability measurement and, in particular, compares frequencies versus percentages. It can be shown that the availability of base rates in the frequency format reduces bias in subsequent probability assessments of rare events. In the second part, the theoretical advantages of frequency scales are transformed into a twostep measurement procedure of subjective probability, and a bias-reducing effect of the frequency format is empirically demonstrated. A methodical experiment on fare dodging shows that subjective probabilities of being caught for dodging the fare (the rare event) are more accurate if base rates are activated via frequencies. This kind of format could be applied more frequently in empirical social research. 1 Einleitung 1 "As scientists and as technologists we should discard the idea of a 'true' or 'objective' probability. Instead, we should think of probability judgements as the result of an individual`s feelings of uncertainty, translated into a numerical response by internal decision processes." (Phillips 1970: 254) Die Relevanz der Messung von subjektiven Wahrscheinlichkeiten ist -trotz bekannten Problemen der Validität -unbestritten: In den Sozial-und Wirtschaftswissenschaften sowie in medizinischen Surveys bilden subjektive Wahrscheinlichkeiten die Basis für Entscheidungsfindungen, Verhaltensprognosen und Risikoeinschätzungen. So werden Befragte 2 im ALLBUS 1990 und 2000 nach ihrer Wahrscheinlichkeit gefragt, bei verschiedenen Delikten, wie Schwarzfahren oder Steuerhinterziehung, entdeckt zu werden. Die Messung dieser subjektiven Risiken erfolgt mit Kategorialskalen, die über sogenannte Vague Quantifier verbalisiert sind. 3 Andere Surveys messen subjektive Risiken, so etwa die subjektive Wahrscheinlichkeit Opfer einer Straftat zu werden, ebenso über Vague Quantifier (vgl. Wohlfahrtssurveys 1993 (vgl. Wohlfahrtssurveys , 1998 British Crime Surveys 2004 , 2005 . Studien der Umfragemethodologie und Kognitionspsychologie zeigen, dass die Verwendung von Vague Quantifiers häufig zu einer starken inter-und intrapersonellen Variabilität bei der Interpretation der verbalen Wahrscheinlichkeitsausdrücke und folglich zu Mehrdeutigkeiten und Widersprüchlichkeiten bei der Übertragung der Vague Quantifiers in numerische Äquivalente führt (vgl. Bradburn/Miles 1979; Krumpal et al. 2008; Wright et al. 1994) . 4 Die vorliegende Arbeit untersucht deshalb alternative Messansätze der Erfassung subjektiver Risiken. Solche Alternativen sind numerische Skalen (Häufigkeiten oder Prozente), die sich durch eine geringere Anfälligkeit für Fehlurteile (Biases) sowie eine konsistentere Verwendung auszeichnen. Allerdings ist auch die Risikoeinschätzung Je nach Personen-, Item-, und Kontexteigenschaften variieren die Zuweisungen der numerischen zu den verbalen Risikoeinschätzungen, sodass eine Vergleichbarkeit zwischen Personen, Items oder Surveys in vielen Fällen problematisch ist. In einem Experiment von Reuband (2002) ordnen Befragte den Vague Quantifiers numerische Wahrscheinlichkeiten zu (Prozente oder Häufigkeiten). Hierbei zeigen sich Inkonsistenzen in den Zuordnungen. Eine Anwendung numerischer Skalen (insbesondere Häufigkeiten) wird deshalb empfohlen. auf numerischen Skalen, insbesondere auf Prozentskalen, nicht unproblematisch (Hoffrage et al. 2000) . So stehen subjektive Einschätzungen der Befragten häufig im Widerspruch zu mathematischen Wahrscheinlichkeitsgesetzen. 5 Subjektive Wahrscheinlichkeiten korrespondieren oftmals nur unzureichend mit tatsächlichen Risiken (Johnson/Bruce 2001) . Befragte unterschätzen systematisch die Wahrscheinlichkeit häufiger (bzw. alltäglicher) und überschätzen die Wahrscheinlichkeit seltener Ereignisse (Overestimation; vgl. Fischhoff et al. 2000; Pinkerton et al. 2000; Warr 1980; Yamagishi 1997) . Zudem ist bekannt, dass Befragte die Wahrscheinlichkeit eines Ereignisses überwiegend danach beurteilen, wie repräsentativ es für ein jeweiliges Vergleichsobjekt ist. Entsprechend ignorieren sie wichtige Basis rateninformationen und sind unempfindlich gegenüber der Stichprobengröße (Base Rate Neglect; vgl. Tversky /Kahneman 1974) . Zunächst werden nachfolgend die Vorzüge von Häufigkeitsskalen gegenüber Prozentskalen theoretisch hergeleitet und diskutiert (vgl. Brase 2002; Gigerenzer/ Hoffrage 1995; Gigerenzer 1998) . Erstere können das wohl größte Problem der Wahr scheinlichkeitsbeurteilung eindämmen: Die subjektive Überschätzung des Risikos seltener Ereignisse. Auch andere Fehler, wie zum Beispiel die Nicht-Berücksichtigung von Basisraten oder die Fehlbeurteilung logischer Verknüpfungen, sind über die Häufigkeitsskala weniger stark ausgeprägt als über die Prozentskala. Die theoretischen Vorteile von Häufigkeitsskalen werden in einen zweistufigen Messansatz subjektiver Wahrscheinlichkeiten überführt und durch ein Methodenexperiment empi risch belegt. Am Beispiel von subjektiven Entdeckungswahrscheinlichkeiten beim Schwarzfahren wird ein Kontexteffekt des Häufigkeitsformats demonstriert, der die Risikoüberschätzung seltener Ereignisse verringert. Ein solches Format könnte in der Praxis der empirischen Sozialforschung vermehrt Anwendung finden. 5 Als Beispiel kann hier die Verletzung der Konjunktionsregel angeführt werden. Die Konjunktionsregel besagt, dass die Wahrscheinlichkeit einer logischen UND-Verknüpfung zweier Ereignisse nicht größer sein kann als die einer ihrer Komponenten: , 1982a . Das Heuristik-und Bias-Konzept von Kahneman und Tversky kann als Grundlage des Kognitiven Ansatzes angesehen werden: "In making predictions and judgments under uncertainty, people do not appear to follow the calculus of chance or the statistical theory of prediction. Instead, they rely on a limited number of heuristics which sometimes yield reasonable judgments and sometimes lead to severe and systematic errors." (Tversky/Kahneman 1973: 211f.) . Zentral ist hierbei die subjektiv erfahrene Leichtigkeit der Erinnerung: "Presumably, they monitor their cognitive processes and infer that a given class of events is frequent when relevant exemplars are easy to bring to mind but rare when exemplars are difficult to bring to mind" (Schwarz 1998: 88 Hier liefert der Kognitive Ansatz jedoch bereits Lösungsstrategien für das Problem der Nicht-Berücksichtigung von Basisraten. Dieses könne folglich vermindert werden, indem Basisraten nicht nur als willkürliche Angaben über die Verteilung in der Gesamtpopulation vermittelt werden, sondern ihre Diagnostizität, Relevanz, Spezifizität und Kausalität hervorgehoben wird (Bar-Hillel 1980: 216) . Ziel der Messung subjektiver Wahrscheinlichkeiten sollte es demnach sein, die individualisierten Einzelfallinformationen und die Basisraten als gleichwertige, relevante Informationen zu kommunizieren, damit insbesondere letztere bei der Wahrscheinlichkeitseinschätzung berücksichtigt werden (Ajzen 1977; Bar-Hillel 1980; Gigerenzer et al. 1988; Ginosar/Trope 1980; Nisbett/Ross 1980) . Befragte greifen eher dann auf gegebene Basisraten-Informationen zurück, wenn inkonsistente und nicht kausale Einzelfallinformationen, die nur schwer in Bezug auf existierende stereotype Repräsentationen zu interpretieren sind, zu Mehrdeutigkeiten führen (Ginosar/Trope 1980; Hendrickx et al. 1989; Schwarz et al. 1991) . Koehler (1996) kann zeigen, dass von den Befragten direkt erfahrene oder selbst generierte Basisraten eher genutzt werden als statistisch vermittelte, und dass Basisraten in Aufgabenkontexten mit 10 P(A ∩ B) ≤ P(A) und P(A ∩ B) ≤ (B Die fiktive Person ‚Tim' wird als intelligent, ordnungsliebend und systematisch sowie in ihrem Schreibstil mechanisch beschrieben. ‚Tim' ist wenig kreativ, hat wenig Sympathie für andere Menschen und generell wenig Spaß an der Interaktion mit anderen. Die normativen Regeln der Vorhersage (welches ‚Tims' Abschlussfach sei) wurden durch die Anwendung der Repräsentativitätsheuristik von der Mehrheit der Befragten verletzt. Über 95 % schätzten die Wahrscheinlichkeit, dass ‚Tim' Informatikabsolvent ist, als größer ein als die, dass er seinen Abschluss in den Geistes-oder Erziehungswissenschaften hat. Das obwohl ihnen klar war, dass es sehr viel mehr Absolventen in den letzteren beiden Fächern gibt (wie es die Basisraten vorgeben). Siehe hierzu die Experimentalbeschreibungen bei Kahneman und Tversky (1973: 238f.) . Ob die Basisrate tatsächlich ignoriert oder ihre Diagnostizität von den Befragten lediglich unterschätzt wird, müsste darüber hinaus dadurch geprüft werden, ob sich die Einschätzung bei zusätzlich angegebener Information über Basisraten im Vergleich zum Fehlen dieser Information verändert oder nicht. einer natürlichen und alltäglichen Problematik stärker verwendet werden als die im Kontext künstlicher oder konstruierter Probleme. 11 Das Überschätzen der Auftritts wahrscheinlichkeit seltener sowie das Unterschätzen der Wahrscheinlichkeit alltäglicher bzw. häufiger Ereignisse gehört ebenfalls zu den systematischen Fehlern, welche sich aufgrund der Nutzung von Heuristiken ergeben können. Beispielsweise werden bei der Frage nach der Wahrscheinlichkeit verschiedener Todesursachen die seltenen (Unfälle, Selbstmord, Feuer) überschätzt, während die alltäglichen (Diabetes, Schlaganfall) unterschätzt werden (Slovic et al. 2004) . Über-und Unterschätzung sind außerdem stark affektiv bestimmt. Insbesondere Ereignisse, die mit schwerwiegenden Folgen verbunden sind oder in den Medien überbetont werden, erfahren die stärkste Überschätzung (Warr 1980) . Begründet wird diese Verzerrung über kognitive Mechanismen des Erinnerns und der Betroffenheit: Die angenommene Wahrscheinlichkeit des Eintretens eines Ereignisses ist abhängig davon, wie leicht dieses Ereignis erinnert oder vorgestellt werden kann. Je eher ein Ereignis kognitiv verfügbar ist und je folgenträchtiger es ist, desto eher wird seine Auftritts wahrscheinlichkeit überhöht beurteilt (Pinkerton et al. 2000 Inputorientierter Ansatz Die Ursachen der Beurteilungsverzerrungen sieht der Inputorientierte Ansatz nicht primär bei den Individuen, sondern bei den Eigenschaften der Items. Die funktionalen Beurteilungsanlagen der Befragten sehen sich mit einem suboptimalen Input konfrontiert, der zu den fehlerhaften Risikoeinschätzungen führt. Dabei spielen vorangehende Fragen, die Itemformulierung und das Skalenformat eine wichtige Rolle (Cosmides/Tooby 1996; Gigerenzer et al. 1991; Koehler 1996) . 11 Persönlich erfahrene Informationen (Basisraten) sind anschaulicher und hervorstechender, damit also schneller verfügbar als ‚gelernte' Informationen. Zudem haben Menschen mehr Vertrauen in selbst generierte Basisraten, vor allem wenn diese über Erfahrungen aus erster Hand erworben wurden. Ausführliche Beschreibungen sowie methodische Anleitungen finden sich bei Koehler (1996) . 12 In Experimenten mit US-Studenten zum Thema HIV-Infektion zeigte sich, dass diese die Wahrscheinlichkeit einer Ansteckung mit HIV stark überschätzten (im Vergleich zu den tatsächlichen Risiken). Begründet wurden dieser Effekt mit der extensiven Berichterstattung zur HIV-Epidemie in den Medien und den schweren Konsequenzen einer HIV-Infektion. Das Thema HIV wurde durch eine starke Medienpräsenz kognitiv verfügbar gemacht, was in vielen Fällen zu einer Überschätzung der tatsächlichen (geringen) Risiken der allgemeinen Bevölkerung geführt hat (Pinkerton et al. 2000: 16f.). Prozentskalen Im Gegensatz zu kategorialen Skalen mit einer geringen Anzahl verbaler Antwortkategorien erlauben Prozentskalen (üblicherweise Skalen von 0 bis 100 %, also 101 wählbaren Alternativen) eine präzisere Kommunikation von subjektiven Wahrscheinlichkeiten (Schnell/Kreuter 2000; Coutts-Heller 2002: 8 ). 13 Die Kommunikation von Wahrscheinlichkeiten im Prozentformat ist dennoch fehleranfällig, da die von den Befragten angegebenen allgemeinen oder subjektiven Wahrscheinlichkeiten häufig von den tatsächlichen Risiken abweichen. Oftmals werden Ereigniswahrscheinlichkeiten im Prozentformat überschätzt (Black et al. 1995; Dominitz/ Manski 1997) . Fischhoff et al. (2000) konnten in ihrer Studie über die Erwartungen von Jugendlichen bezüglich wichtiger Lebensereignisse zeigen, dass die Befragten sowohl die Wahrscheinlichkeit positiver als auch negativer Ereignisse 14 überschätzen. Überschätzung kann unter anderem mit der über mäßigen Nutzung von 50 %-Antwor ten erklärt werden. Befragte verwenden diesen Wert weniger in seiner natürlichen numerischen Form, sondern interpretieren ihn vielmehr als Kategorie ‚keine Ahnung'. In einer Studie zu Schwangerschaftsrisiken deuteten die Befragten die Wahrscheinlichkeit von 50 % für einen genetischen Defekt beim Kind als ‚alles ist möglich' (Lippman-Hand/Fraser 1979: 118f.). Die vermehrte ‚Flucht in die Mitte', welche vor allem durch die Unsicherheit der Eltern begründet ist, führte so im prozentualen Wahrscheinlichkeitsformat zu einer Überschätzung der Risiken. 15 Ein weiterer Grund für die überproportionale Verwendung der Mittelposition der Skala ist im sozialen Vergleich zu finden. Befragte orientieren sich bei der Kommunikation ihrer subjektiven Wahrscheinlichkeit häufig an der Referenzpopulation. Dabei interpretieren sie die Skalenmitte als ‚normalen' oder Durchschnittswert für diese Population und ordnen sich entsprechend ein (Schwarz et al. 1985; Wright et al. 1994) . Die Überschätzung von kleinen Ereigniswahrscheinlichkeiten kann ebenso durch die Präferenz der Befragten für runde Zahlen erklärt werden. Befragte neigen dazu ihre Antworten auf Werte wie 0, 10, …, 50, … und 100 % zu runden, statt die verfeinerten Wahrscheinlichkeitsangaben auf der Prozentskala zwischen 13 "For example, when subjects say it is 'likely' that someone will get a headache as a result of using a certain medicine and say it is 'likely' that someone else will develop a more severe symptom as a result of using another medicine, they are not referring to the same numeric probability. The 'likely' probability of the less severe symptom will be higher (…)." (Coutts-Heller 2002: 7). Eine weiterführende Diskussion der Probleme von Vague Quantifiers findet sich bei Krumpal et al. (2008) . 14 Zum Beispiel: Positiv -Abschluss des College bis zum 30. Lebensjahr. Negativ -Inhaftierung oder Tod innerhalb des nächsten Jahres. 15 Eine Möglichkeit zur Reduzierung von 50 %-Antworten ist die Einführung einer zusätzlichen Antwortkategorie ‚keine Ahnung' oder ‚neutral' (Coutts-Heller 2002: 9). 0 und 100 % im vollen Umfang auszunutzen (Dominitz/Manski 1997: 270) . Befragte benutzen die Prozentskala häufig wie eine Kategorialskala, die von 0 bis 10 reicht, und geben Antworten oftmals als Vielfache von 10. Da in den Studien aber meist Ereignisse untersucht werden, deren Wahrscheinlichkeiten (weit) unter 10 % liegen, könnte ein solches Befragtenverhalten zu den beobachteten Überschätzungen führen (Slovic/Monahan 1995) . Subjektive Wahrscheinlichkeitseinschätzungen spezifischer Ereignisse mit binärem Ausgang (wie die Entdeckungswahrscheinlichkeit eines Deliktes im kommenden Jahr) sind im Prozentformat fehleranfällig. Diese Probleme können auf evolutionäre Prozesse in der Entwicklung der menschlichen kognitiven Fähigkeiten zurückgeführt werden. Menschen besitzen demnach keinen angeborenen kognitiven Mecha nismus, der ihnen die Verarbeitung von Einzelereigniswahrscheinlichkeiten im Einklang mit den normativen Standards der Wahrscheinlichkeitstheorie ermöglicht (Brase et al. 1998; Cosmides/Tooby 1996; Gigerenzer 1996b Gigerenzer , 1998 Gigerenzer , 2000 . Häufigkeitsskalen Laut Gigerenzer (2000) liege der Hauptschwachpunkt der kognitiven und motivationalen Erklärungen für die Fehler bei der Risikoeinschätzung darin begründet, dass diese die Struktur der Aufgabe und deren Beziehung zur Struktur der natürlichen Umwelt des Befragten ausblenden würden. Die Fehleinschätzungen der Befragten seien keine Fehler im statistischen Denken, sondern lediglich bedingt durch eine suboptimale Kon struk tion von Informations-und Antwortformaten innerhalb der Studien: "The mind acts as if it were a frequentist; it distinguishes between single events and frequencies in the long run -just as probabilists and statisticians do. Despite the fact that researchers in the 'heuristics and biases' program routinely ignore this distinction fundamental to probability theory when they claim to have identified 'errors', it would be foolish to label these judgments 'fallacies'." (Gigerenzer 2000: 253f.) Die Verwendung von Häufigkeitsformaten würde demnach, verglichen mit Einzelereigniswahrscheinlichkeiten im Prozentformat, zu einer klareren Einschätzung von Risiken führen. Häufigkeiten stellen eine intuitivere Metrik bei der Risikobeurteilung dar als Prozente (Gigerenzer/Hoffrage 1995; Schapira et al. 2001 (Cosmides/Tooby 1996; Gigerenzer 2000; Gigerenzer/Hoffrage 1999; Hoffrage et al. 2000 Hoffrage et al. , 2002 Jones et al. 1995) . Natürliche Häufigkeiten sind (verglichen mit Prozenten) weniger abstrakt, einfacher zu verstehen sowie zu visualisieren und benötigen weniger kognitiven Aufwand bei der Einschätzung von Risiken (Brase 2002; Gigerenzer 1996b Gigerenzer , 2000 Griffin/Buehler 1999) . Zudem erhöhen sie die Anwendung der Bayes Regeln. 18 Die Informationspräsentation in Häufigkeiten statt Prozenten steigert die Beurteilungsleistung der Befragten. Studien zur Qualität von Antwortskalen im Hinblick auf Wahrscheinlichkeitseinschätzungen zeigen, dass das Ersetzen von Prozent-durch Häufigkeitsskalen Fehleinschätzungen deutlich verringert und so zu Leistungssteigerungen bei der Genauigkeit der Wahrscheinlichkeitseinschätzungen führt (Brase et al. 1998; Evans et al. 2000; Gigerenzer et al. 1991; Hoffrage et al. 2000) . Während Basisraten bei Prozentinformationen und bei Abfrage auf einer Prozentskala kaum von den Befragten genutzt werden, kann die Nicht-Berücksichtigung von Basisraten durch die Präsentation von natürlichen Häufigkeiten und die Nutzung von Häufigkeitsskalen als Antwortmöglichkeit reduziert werden (Gigerenzer 1998, 16 Natürliches Sampling bezeichnet die aufeinanderfolgende und fortlaufende Erfassung von Informationen über das Aktualisieren von Ereignishäufigkeiten, also das Zählen von erlebten oder überlieferten Objekten und Ereignissen (Gigerenzer/Hoffrage 1995: 686) . 17 Fehler, welche sich bei der Einschätzung von Wahrscheinlichkeiten ergeben, seien demnach vorwiegend auf das Informationsformat zurückführbar (vgl. Gigerenzer/Hoffrage 1995: 685ff.). Die von Menschen erworbenen mathematischen Algorithmen seien lediglich für bestimmte Repräsentationen angelegt -die Eingangsinformationen müssten demnach im richtigen Format vorliegen, damit die Algorithmen optimal arbeiten können (wie auch ein Taschenrechner nicht mit binären Zahlen arbeiten kann). 18 Die Berechnung von Ereigniswahrscheinlichkeiten über Bayesianische Algorithmen fällt im Häufigkeitsformat leichter, da weniger und einfachere Rechenschritte notwendig sind. Detaillierte Informationen und Beispielstudien zu den Bayes Regeln und ihrem Zusammenhang zum Informationsformat geben Gigerenzer (1996a Gigerenzer ( , 1996b Gigerenzer ( , 1998 Gigerenzer ( , 2000 , Gigerenzer/Hoffrage (1995 , 1999 (Feldman 1992: 51ff.) . Die Erinnerung relevanter Informationen wird bestimmt von der Frageformulierung, den Frageinstruktionen, der Verfügbarkeit früherer Überlegungen und Urteile sowie dem Inhalt vorangegangener Items (Tourangeau 1992: 36) . Kontexteffekte sind Antworteffekte, die durch eine oder mehrere vorangegangene Fragen (und Antworten) oder durch die Skalen vorhergehender Fragen hervorgerufen werden (Billiet et al. 1992: 131) . Diese vorangegangenen Fragen haben zwei Funktionen: (1) Informationen zu aktivieren, sodass diese zu einem späteren Zeitpunkt leichter (automatisch und unbewusst) abgerufen werden können, und (2) eine Informationsbasis zu liefern, über die sich die Fragebedeutung erschließt. Über einen Priming Effekt sind Informationen, die entweder direkt in der vorangegangenen Frage enthalten sind oder vom Befragten bei deren Beantwortung aktiviert wurden, zugänglicher und strahlen auf die Folgefrage aus (Strack 1992: 25) . Eine Beurteilung, die einmal abgegeben wurde, dient entsprechend als Anker, dem nachfolgende Beurteilungen angeglichen oder kontrastiert werden (Knowles et al. 1992: 223) . Gesteuerte Kontexteffekte bei der Messung subjektiver Wahrscheinlichkeiten Die Generierung subjektiver Wahrscheinlichkeiten hinsichtlich des Eintretens seltener Ereignisse ist häufig geprägt von Überschätzung, d. h. Befragte schätzen diese Wahrscheinlichkeiten im Vergleich zu objektiven Standards zu hoch ein (Pinkerton et al. 2000; Teigen 1974; Warr 1980 Kreuter (2002) stellt fest, dass die Wahrnehmung von Wahrscheinlichkeiten und Risiken ein mehrdimensionales Konstrukt ist. Bei den Überlegungen zu ihren eigenen Risiken nannten Befragte "zunächst die allgemeinen Risiken, besannen sich auf ihre üblichen Alltagsroutinen und leiteten daraus ihre Antwort auf das eigene Risiko ab" (Kreuter 2002: 228) . Da jedoch nicht davon ausgegangen werden kann, dass alle Befragten diese kognitive Kalkulation ausführen, somit unterschiedliche 19 Aus den theoretischen Überlegungen von Esser (1986) Interpretationsgrundlagen bestehen würden und folglich die Ergebnisse schwer vergleichbar wären, ist es sinnvoll, die Abfrage allgemeiner Wahrscheinlichkeiten (Basisraten) generell vor der subjektiver Wahrscheinlichkeiten vorzunehmen. Aufgrund der erhöhten kognitiven Verfügbarkeit würde dies die Nutzung der Basisraten bei der individuellen Wahrscheinlichkeitseinschätzung erhöhen und damit Fehleinschätzungen verringern. Dabei ist es besonders hilfreich, die Basisraten nicht lediglich vorzugeben, sondern von den Befragten zu erfragen. So werden nicht (scheinbar) willkürlich Werte festgelegt, sondern die subjektiven Annahmen und Erfahrungen der Befragten berücksichtigt, was die Glaubhaftigkeit, Relevanz und Eindeutigkeit der Basisraten unterstreicht und ihre Weiterverwendung in Folgefragen zusätzlich verstärken kann (vgl. Koehler 1996) . Allgemeine Hypothesen In Kahneman/Tversky (1982b) , Klar et al. (1996) , Koehler (2001) sowie Reeves/Lockhart (1993) : "Frequency problems evoke a distributional approach of probability and are mentally represented in such a way that the relevance of extensional rules is more compelling. Case-specific problems evoke a singular approach and are modeled in ways that support the use of nonextensional heuristics such as representativeness. […] Presumably, solving frequency problems first not only cued extensional rules but also provided a model for how those rules could be applied. […] Evidently, simply having subjects solve problems that naturally evoke extensional rules will lead them to apply extensional rules to problems that would otherwise evoke nonextensional strategies." (Reeves/Lockhart 1993: 212) -versus Prozentskala) . Durch die Erhebung zu zwei Zeitpunkten mit zwei Gruppen wird es möglich, beide Befragten gruppen mit beiden Fragebogenversionen zu konfrontieren (faktorielles ‚between-within-Design' 24 ). Das Wirken beider Anker auf die subjektive Entdeckungswahrscheinlichkeit kann also sowohl zwischen als auch innerhalb der Gruppen verglichen werden. Die Fragebögen 25 enthalten neben dieser experimentellen Variation identische Fragen zu demografischen Aspekten (Alter, Geschlecht, Wohndauer in Leipzig, Hauptfach, Hochschulsemester), zu Themen der spezifischen Nutzung von öffentlichen Nahverkehrsmitteln (Transportmittel, Jahreszeit, Uhrzeit, Fahrscheinart, durchschnittliche Fahrtdauer), zur Beurteilung der Ticketpreise und des Schwarzfahrens sowie zur Einschätzung des aktiven Schwarzfahrens von Freunden/Bekannten und des Befragten selbst. Der Einschätzung der subjektiven Entdeckungswahrscheinlichkeit beim Schwarzfahren geht eine Ankerfrage voraus, die die allgemeine Entdeckungs- 24 Detaillierte Informationen zum between-und within-Design sowie deren Anwendungen finden sich bei Birnbaum (1999) , Kahneman/Tversky (1996) , Price (1998) sowie Shadish et al. (2002) . 25 Der vollständige Fragebogen in seinen zwei Versionen, der Datensatz und alle Analyseroutinen sind auf Anfrage erhältlich. wahrscheinlichkeit thematisiert und deren Format sich zwischen den Versionen unterscheidet. Mittels dieser wird der Kontext vor der Zielfrage variiert, indem Basisraten über zwei unterschiedliche Skalen (Häufigkeits-und Prozentskala) abgefragt werden. Die Zielfrage befindet sich abgetrennt auf der nächsten Seite des Fragebogens, sodass die Ankerfrage bei deren Beantwortung nicht direkt sichtbar ist. Der Einfluss der vorangegangenen Frage wirkt also vorwiegend über die Aktivierung und kognitive Bereitstellung von Informationen, statt unmittelbar visuell zugänglich zu sein; das Rückblättern der Befragten kann dennoch nicht ausgeschlossen werden. Geben Sie hierzu ihre Einschätzung auf einer Skala von 0 % = "sie wird auf keinen Fall entdeckt" bis 100 % = "sie wird auf jeden Fall entdeckt" an. Sie können bei Ihrer Antwort jeden beliebigen Wert dazwischen angeben. Geben Sie hierzu ihre Einschätzung auf einer Skala von 0 % = "ich werde auf keinen Fall entdeckt" bis 100 % = "ich werde auf jeden Fall entdeckt" an! Sie können bei Ihrer Antwort jeden beliebigen Wert dazwischen angeben. _____ Prozent In Anwendung der allgemeinen Hypothesen auf die Entdeckungswahrscheinlichkeiten beim Schwarzfahren resultieren die folgenden spezifischen Vorhersagen: (1) Die Ankerfrage im Häufigkeitsformat liefert realistischere Einschätzungen der allgemeinen Entdeckungswahrscheinlichkeit als die im Prozentformat. Erstere führt zu geringeren Wahrscheinlichkeitseinschätzungen. 2 Informationen über die empirischen Häufigkeitsverteilungen der allgemeinen und subjektiven Entdeckungswahrscheinlichkeiten sind im Anhang zu finden. Zunächst ist auffällig, dass sich die Angaben zwischen den allgemeinen und subjektiven Entdeckungswahrscheinlichkeiten unterscheiden, wobei letzteren im Durchschnitt höhere Werte zugeordnet werden. 28 Die Einschätzung der allgemeinen Entdeckungswahrscheinlichkeit im Häufigkeitsformat fällt verglichen mit der Abfrage im Prozentformat signifikant geringer aus 99) . Zudem verringert die Nutzung der Häufigkeitsskala als Anker, im Vergleich zur Nutzung der Prozentskala als Anker, die da rauf folgende subjektive Entdeckungswahrscheinlichkeit beim Schwarzfahren 30) . Die Befunde zu den allgemeinen Entdeckungswahrscheinlichkeiten können unter Kontrolle der Variablen (1) Befragtengruppe und (2) Welle bestätigt werden: Befragte, die die Ankerfrage im Prozentformat beantwortet haben, zeigen signifikant höhere Werte als die Vergleichsgruppe mit Häufigkeitsformat 97) . Der Effekt des Skalenformats kann demnach für beide Gruppen unabhängig nachgewiesen werden (vgl. Tabelle 2). Auch innerhalb der Gruppen ergeben sich in Abhängigkeit des Skalenformats deutliche Unterschiede 70 Bei den subjektiven Entdeckungswahrscheinlichkeiten zwischen den Gruppen fallen die erwarteten Kontexteffekte schwächer aus (Inter-Gruppenvergleich): In der ersten Erhebungswelle zeigt sich der erwartete Effekt des Skalenformats der Ankerfrage auf die darauffolgende subjektive Entdeckungswahrscheinlichkeit. Befragte, die die Kontextfrage mit Häufigkeitsskala bearbeitet haben, zeigen bei der Zielfrage signifikant niedrigere Werte als solche, die zuvor mit Hilfe der Prozentskala geantwortet haben 85) . Dieser Kontexteffekt des Skalenformats der Ankerfrage auf die Zielfrage zeigt in der zweiten Welle ebenso in die erwartete Richtung, fällt jedoch recht schwach aus (Differenz -2,81) und ist zudem nicht signifikant (auf den konventionellen 1 %-, 5 %-bzw. 10 %-Niveaus). Tabelle 3 visualisiert diese Befunde. Tabelle 3 Differenzen der Mittelwerte der subjektiven Ent de ckungswahr scheinlichkeit in Abhängigkeit des Skalenformats, der Welle und Befragtengruppe Auffällig ist die Differenz (37,44 -41,81 = -4,37) bei der subjektiven Entdeckungswahrscheinlichkeit mit jeweils vorgeschaltetem Prozentanker zwischen den Grup-pen. 29 Befragte der Gruppe 2, denen der Prozentanker in Welle 2 vorgelegt wurde, zeigen eine geringere subjektive Entdeckungswahrscheinlichkeit (nicht signifikant: einseitiger T-Test; p=0,16) verglichen mit Befragten der Gruppe 1, denen der Prozen tanker bereits in Welle 1 vorgelegt wurde. Somit kann ein Kontexteffekt von Welle 1 auf Welle 2 nicht ausgeschlossen werden: Es besteht die Vermutung, dass in Gruppe 2 durch die Benutzung des Häufigkeitsankers und der sich daraus ergebenden geringen subjektiven Entdeckungswahrscheinlichkeit in Welle 1, diese auch in Welle 2 -trotz Prozentanker -nach unten korrigiert wurde. Solch ein Reihenfolgeeffekt (Häufigkeiten in Welle 1 und Prozente in Welle 2) wäre eine mögliche Erklärung des nur schwachen Kontexteffektes in Gruppe 2. Innerhalb der Gruppen zeigen alle Vergleiche der subjektiven Wahrscheinlichkeiten ebenso in die erwartete Richtung (Intra-Gruppenvergleich), wobei auch hier die angenommenen Effekte (verglichen mit Hypothese 1) schwächer ausfallen. Befragte der Gruppe 1, welche die Ankerfrage im Häufigkeits-statt Prozentformat beantwortet haben, zeigen eine geringere subjektive Entdeckungswahrscheinlichkeit 18) . Auch bei Befragten der Gruppe 2 zeigt sich der Effekt in die erwartete Richtung, allerdings schwächer (Differenz -4,48) und nicht signifikant (p=0,14). Erneut drängt sich die Vermutung auf, dass ein Reihenfolgeeffekt (Gruppe 1: Prozente in Welle 1 und Häufigkeiten in Welle 2; Gruppe 2: Häufigkeiten in Welle 1 und Prozente in Welle 2) den Kontexteffekt der Anker-auf die Zielfrage moderiert
(xsd:string)
|