PropertyValue
?:linkContext
  • zentraler Aspekt dieser Erfassung ist die Häufigkeit, mit der ein Verhalten oder ein Symptom auftxitt. Zu diesem Zweck werden die Klienten meist gebeten, entsprechende Selbstberichte abzugeben, in der Regel, indem sie einen Fragebogen ausfüllen. Während allgemeine Selbstberichte in der Geschichte psychologischer Forschungsmethoden schon alle Höhen und Tiefen der Wertschätzung durchlaufen haben (vgl. , sind quantitative Häufigkeitsberichte über gut definierte Verhal tensweisen auch im Bereich des "behavioral assessment" wenig umstritten . Als Voraussetzung für die Erhebung dieser Berichte wird empfohlen, "(that) questions must be written with explicitly defined terms and with discrete, objective (e. g., quantitative) response choices if accurate responses are to be secured" . Sofern diese Voraussetzungen gegeben sind, gelten fehlerhafte Erinnerung und intentionale Falschdarstellung als primäre Fehlerquellen. Ein systemati scher Einfluß von Merkmalen des Erhebungsinstrumentes wird hingegen unter diesen Bedingungen nicht erwartet. Untersuchungen im Bereich der empirischen Sozialforschung (vgl. , zum Überblick) zeigten hingegen, daß die von Bellack und Hersen (1977) empfohlenen quan titativen Antwortalternativen ("response choices") Berichte über die Häufigkeit gut defi nierter Verhaltensweisen nachhaltig beeinflussen können und darüber hinaus die Antworten auf nachfolgende Fragen verändern. Eine Analyse der kognitiven und kom munikativen Prozesse, die Befunden dieser Art zugrunde liegen, erlaubt es, Einflüsse der Fragebogengestaltung auf die erhaltenen Berichte a priori zu spezifizieren und lenkt die Aufmerksamkeit auf "Nebenwirkungen" und Randbedingungen, die in der bisherigen Forschung zu Verhaltens-und Symptominventaren nicht dokumentiert wurden. Bei diesen Verfahren wird den Befragten eine Liste von Symptomen oder Verhaltens weisen nebst Häufigkeitsangaben vorgelegt, und sie werden gebeten, die jeweils auf sie zutreffende Antwortalternative anzukreuzen. Es lassen sich dabei zwei Arten von Ant wortvorgaben unterscheiden: Einerseits vage Quantißzierungen, z. B.: "selten", "manch mal", oder "häufig", und andererseits numerische Quantißzierungen, wie z. B. "1 x pro Woche" oder "2 x im Monat". Beide Arten von Antwortvorgaben werfen spezifische Probleme auf. Vage Quantifizierungen finden sich z. B. in dem Beschwerdenerfassungsbogen von oder der Beschwerdenliste von v. Zerssen und Koeller (1975). Sie werden häufig mit der Begründung verwendet, daß sie für die Befragten ein facher zu handhaben seien und präzisere numerische Fragen ohnehin das Erinnerungs vermögen der Befragten überforderten (vgl. , was lediglich in Scheinpräzision resultiere. Allerdings überläßt es der Forscher bei der Verwendung vager Quantifizierungen, wie "selten" oder "häufig", den Befragten, zu definieren, welche absolute Häufigkeit sie als "selten" oder "häufig" bezeichnen wollen. Seit frühen Arbeiten von . Dies hat zur Folge, daß Befragte bei unterschiedlichen Symptomen den gleichen Begriff zur Benennung unterschiedlicher absoluter Auftretens häufigkeiten verwenden. So bezeichnet z. B. bei den meisten Befragten die Aussage, daß sie "häufig" Kopfschmerzen haben, eine höhere absolute Auftretenshäufigkeit als die Aussage, daß sie "häufig" an Herzanfällen leiden. Dies spiegelt wider, daß Befragte bei der Wahl vager Antwortkategorien ihre implizite Theorie über die "normale" Auf tretenshäufigkeit eines Symptoms heranziehen. Demgemäß gibt ein Begriff wie "häufig" primär die Häufigkeit relativ zu einem subjektiven Standard wieder, nicht aber die objek tive Frequenz. Aus dem gleichen Grund verwenden unterschiedliche Befragte, mit unter schiedlichen subjektiven Standards, den gleichen vagen Häufigkeits begriff zur Bezeichnung unterschiedlicher realer Frequenzen, selbst beim gleichen Symptom. Es ist weiterhin zu vermuten, wenn auch noch nicht empirisch überprüft, daß sich während des Therapieverlaufs die subjetiven Standards für das Verhalten ändern können, und somit reale Frequenzänderungen innerhalb des Therapieprozesses fehlerhaft abgebildet werden. Demgemäß Stunden pro Tag, wenn ihnen eine Skala mit Werten von "bis zu 2x/i Stunden" bis " 4 V 2 und mehr" vorlag. Reichte der Wertebereich der Skala hingegen von "bis zu V 2 Stunde" bis "mehr als 2 V2 Stunden", war dies nur bei 16,2 % der Befragten der Fall. Ebenso berichteten Studenten eine höhere Masturbationsfrequenz, wenn ihnen eine Skala mit hohen statt mit geringen HäufigkeitsVorgaben vorgelegt wurde . In der folgenden Studie soll geprüft werden, inwiefern Befragte beim Bericht von Häufigkeiten psychosomatischer Beschwerden den Wertebereich der Skala als Bezugs rahmen heranziehen. Wie erwartet, berichteten die Be* fragten auf Skalen mit hohen Häu figkeitsvorgaben eine höhere Symptombelastung als auf Skalen mit geringen Häufigkeitsvorgaben. Von den 340 Berichten, die auf einer Skala mit hohen Antwortvorgaben abgegeben wur den (je 17 Symptomberichte von 20 Befragten), beinhalteten 211 Berichte (62 %) eine Symptomhäufigkeit von mehr als 2 x im Monat. Dies war nur bei 131 (39 %) von 336 Berichten der Fall, die auf einer Skala mit geringen Häufigkeitsvorgaben abgegeben wur den, und bei 85 (25 %) von 337 Berichten auf einer Skala, die der Standardform der FBL entsprach.3 Statistisch unterscheidet sich der Befund bei hohen Antwortvorgaben von den beiden anderen Bedingungen (z = 2.3, p < .02; z-Test auf Proportionen, . Dieses Muster trat bei allen 17 Einzelsymptomen konsistent auf, war jedoch um so aus geprägter, je mehrdeutiger die erfragten Symptome waren. Die größten Unterschiede traten bei der Frage "Reagiert Ihr Körper auf Wetteränderungen?" auf. In diesem Fall berichteten 15 von 20 Befragten (75 %) mit hohen Antwortvorgaben und 4 von 19 Be fragten (21 %) mit den Standardvorgaben der FBL eine Frequenz von mehr als 2 x im Monat. Die Bedingung mit hohen Antwortvorgaben unterscheidet sich wiederum von den anderen Bedingungen, z = 3,93m p < .001. Die geringsten Unterschiede traten mit 50 % (10 von 20 Antworten), 47 % (9 von 19 Antworten) und 42 % (8 von 19 Ant worten) bei der Frage "Schwitzen Sie so gar an kühlen Tagen?" auf, alle p > .30. Der geringere Einfluß der Antwortvor gaben bei gut definierten Symptomen ent spricht anderen Befunden, die zeigen, daß der Einfluß der Skalenvorgabe mit zu nehmendem Wissen über das erfragte Ver halten abnimmt . Dies läßt zugleich vermuten, daß der Wertebereich der Antwortvorgaben Berichte über die für die jeweilige Dia gnose zentralen Symptome weniger beein flußt als Berichte über periphere Symptome, die in geringerem Maße Ge genstand der Aufmerksamkeit der Patien ten sind. Dies impliziert, daß die relative Häufigkeit zentraler und peripherer Symptome verzerrt abgebildet würde, da letztere in höherem Maße von der Skala beeinflußt werden als erstere. Diese Möglichkeit bedarf noch der empirischen Überprüfung. Die Nutzung numerischer Antwortvorgaben als Bezugsrahmen zur Schätzung von Verhaltenshäufigkeit hat außerdem zur Folge, daß die Berichte die reale Varianz des Ver haltens in der Population unzureichend wiedergeben. Da alle Probanden den gleichen Bezugsrahmen zur Schätzung heranziehen, fallen die Berichte homogener aus, als dies in einem offenen Antwortformat der Fall ist (vgl. . Dies resultiert insbesondere in einer ungenügenden Abbildung extrem hoher oder extrem geringer Häufigkeiten, deren adäquate Erfassung jedoch besonders von klinischem Interesse wäre. Wenn Befragte den Antwortvorgaben Information über die Verteilung des Merkmals in der Population entnehmen und davon ausgehen, daß das durchschnittliche Verhalten durch Werte im Mittelbereich der Skala repräsentiert wird, läßt dies vermuten, daß Ant wortvorgaben nicht nur die Verhaltensbericht selbst, sondern auch nachfolgende Urteile beeinflussen. Dies ist insbesondere zu vermuten, wenn nachfolgende Fragen implizit oder explizit einen Vergleich mit anderen erfordern. In diesem Fall können die Befrag ten ihrer eigenen Plazierung auf der Skala Information über ihre Plazierung in der Ver teilung des Merkmals entnehmen. Befragte, die einen Wert im oberen Bereich der Antwortvorgaben wählen, könnten z. B. folgern, daß sie das entsprechende Verhal ten häufiger zeigen als im Durchschnitt der Population "üblich" ist. Mehrere Unter suchungen unterstützen diese Annahme in verschiedenen Inhaltsbereichen . In einer bereits erwähnten Untersuchung wurden z. B. Studenten gebeten, ihre Masturbationshäufigkeit zu berichten. Wenn ihnen dazu eine Skala mit geringen Antwortvorgaben vorlag, berichteten sie eine geringere Frequenz als wenn ihnen eine Skala mit hohen Antwortvorgaben vorlag. Zugleich legte ihnen aber die Skala mit geringen Häufigkeitsvorgaben nahe, daß sie häufiger masturbieren als "üblich". Dementsprechend berichteten sie anschließend, mit ihrer derzeitigen intimen Beziehung weniger zufrieden und an anderen Partnerinnen stärker interessiert zu sein als Studenten, die ihren Verhaltensbericht auf einer Skala mit hohen Häufigkeitsalter nativen abgaben, was ihnen nahelegte, daß sie seltener masturbieren als üblich. Diese Befunde zeigen, daß der Wertebereich der Antwortvorgaben Vergleichsinformation be reitstellt, die die Befragten aktiv in ihrer Urteilsbildung nutzen. Dies trifft auch für Berichte über die Häufigkeit psychosomatischer Symptome zu. Wir baten die befragten Patienten, auf einer 11-stufigen Skala einzuschätzen, wie zufrieden sie mit ihrem derzeitigen Gesundheitszustand sind und wie zufrieden sie glauben, "näch stes Jahr um diese Zeit" mit ihrer Gesundheit zu sein (1 = sehr unzufrieden; 11 = sehr zufrieden). Die Einschätzung der derzeitigen Gesundheitszufriedenheit zeigte keinen signifikanten Einfluß der Antwortvorgaben (alle p > .20), was die "reality constraints" des Klinikaufenthaltes widerspiegeln dürfte. Die Erwartungen über die künftige Gesund heitszufriedenheit wurden hingegen von den Antwortvorgaben beeinflußt: Befragte, denen geringe Häufigkeitsvorgaben nahelegten, daß ihre Symptomhäufigkeit überdurch schnittlich ist, erwarteten, in einem Jahr w eniger zufrieden zu sein (M = 7.2) als Befragte der beiden anderen Bedingungen (t(53) = 1.92), p < .03, einseitig, für den geplanten Kontrast; s. , die sich nicht voneinander unterschieden (M = 8.3 für hohe Vorgaben und 8.8 für die Standardvorgaben, t(53) = .67, für den geplanten Kontrast). Auch in dieser Untersuchung entnahmen die Befragten somit ihrer eigenen Plazierung auf der Skala Vergleichsinformation, die sie zur Einschätzung ihrer Gesundheitssituation heranzogen. Die Verwendung von Antwortvorgaben zur Erfassung von Symptom häufigkeiten beeinflußt daher nicht nur die erhaltenen Häufigkeitsberichte, sondern auch nachfolgende subjektive Beurteilungen. Darüber hinaus ist der Einfluß der Antwortvorgaben auf komparative Urteile nicht auf die Befragten selbst beschränkt. Vielmehr ziehen auch die Benutzer der von den Befragten abgegebenen Verhaltensberichte die Antwortvorgaben als Bezugsrahmen zur Urteilsbildung heran 2), wie eine Untersuchung im Bereich der medizinischen Diagnostik zeigt. In dieser Un tersuchung sollten praktizierende Arzte die Bedenklichkeit körperlicher Symptome beurteilen, die ein Patient auf einem Symptomfragebogen angekreuzt hatte. Dabei be richtete der Patient eine konstante Symptomhäufigkeit von zweimal pro Woche, jedoch wurde dieser Bericht entweder auf einer Skala mit geringen oder hohen Antwortvor gaben angekreuzt. Wie erwartet, beurteilten die Arzte zweimal die Woche auftretende Rückenschmerzen oder Energiemangel als bedenklicher, und empfahlen nachdrücklicher eine eingehende Untersuchung, wenn die gleiche absolute Symptomhäufigkeit vom Patienten auf einer Liste mit geringen Häufigkeitsvorgaben statt auf einer Liste mit hohen Häufigkeitsvor gaben angekreuzt wurde. Dabei erwies sich die Expertise des Diagnostikers nicht als Schutz vor dem Einfluß der Skala: Arzte mit mindestens fünf Jahren Berufserfahrung wurden von den Skalenvorgaben ebenso beeinflußt wie Medizinstudenten. Beide Grup pen unterschieden sich lediglich dadurch, daß die Medizinstudenten alle Angaben als bedenklicher beurteilten als Experten. Numerische Antwortalternativen beeinflussen daher nicht nur die Verhaltensberichte der Patienten, sondern auch die Folgerungen, die Diagnostiker aus einem gegebenen Verhaltensbericht ziehen. Darüber hinaus können numerische Antwortvorgaben die Definition des erfragten Ver haltens beeinflussen. Dies ist insbesondere dann zu erwarten, wenn sich die Frage auf Verhaltensweisen oder Symptome bezieht, deren Definition einen großen subjekti ven Spielraum aufweist. Will der Diagnostiker z. B. wissen, wie oft ein Befragter sich "ärgert", steht der Befragte vor der Aufgabe zu bestimmen, was mit "sich ärgern" ge meint ist. Bezieht sich die Frage auf kleine alltägliche Ärgernisse oder auf große Ausein andersetzungen? In einem solchen Fall kann der Befragte wiederum den Antwortvor gaben Informationen entnehmen, die eine Klärung des Fragegegenstandes erlaubt. Rei chen die Antwortvorgaben bei einer Frage nach der Ärgerhäufigkeit z. B. von "weniger als zweimal die Woche" bis "mehrmals täglich", könnten die Befragten schließen, daß wohl kleinere Ärgernisse gemeint sein müssen, da bedeutsamere Ärgernisse nicht so häu fig Vorkommen. Andererseits würden Vorgaben von "weniger als einmal im Jahr" bis "mehrmals im Monat" nahelegen, daß große Ärgernisse Gegenstand der Frage sind. In einem Experiment zur Prüfung dieser Überlegungen wurden Pro banden gebeten, auf einer Skala mit hohen oder geringen Häufigkeitsvorgaben zu berichten, wie häufig sie sich ärgern . Anschließend beschrieben sie ein typisches Beispiel ihres Ärgers. Die Analyse dieser Beschreibungen durch unab hängige Beurteiler ergab, daß Befragte denen geringe Häufigkeits vorgaben Vorlagen, an extremere Ärgernisse dachten als Befragte, denen hohe Häufigkeitsvorlagen Vorlagen. Die Definition des Fragegegenstandes durch die Befragten selbst ist somit nicht nur eine Funktion der Frageformulierung, sondern auch eine Funktion der vorgelegten quantita tiven Antwortalternativen. Demgemäß erfassen identisch formulierte Fragen bei unter schiedlichen Häufigkeits vorgaben unterschiedliche Erfahrungen. Die berichteten Befunde unterstützen die Hypothese, daß Befragte bei numerischen Antwortvorgaben annehmen, daß das Verhalten eines "durchschnittlichen" Befragten durch Werte im Mittelbereich der Skala abgebildet wird, und daß die Extreme der Skala die Extreme der Verteilung des Verhaltens in der Population wiedergeben. Die Befragten nutzen diese aus dem Wertebereich der Skala erschlossene Verteilungsinformation in vielfältiger Weise in ihrer eigenen Urteilsbildung. -Erstens, ziehen Befragte den Wertebereich als Bezugsrahmen zur Einschätzung ih rer eigenen Verhaltenshäufigkeit heran und berichten höhere Häufigkeiten auf Skalen mit hohen als auf Skalen mit geringen Vorgaben. Die berichteten absoluten Werte sind daher nicht interpretierbar und Verhaltensberichte, die auf verschiedenen Skalen abge geben wurden, sind nicht vergleichbar. Zugleich reduziert die Nutzung des gleichen Bezugsrahmens durch Probanden mit unterschiedlicher Verhaltenshäufigkeit die Varianz in den Berichten, was in einer unangemessenen Abbildung der Verhaltensvarianz in der Population resultiert. -Zweitens, entnehmen Befragte ihrer eigenen Plazierung auf der Skala Information über die relative Häufigkeit ihres Verhaltens verglichen mit anderen und berücksichtigen diese Vergleichsinformation in komparativen Urteilen. Ist man an solchen komparativen Urteilen, z. B. in Form subjektiver Einschätzungen der eigenen Befindlichkeit, inter essiert, sollten sie vor den Verhaltensberichten erhoben werden. -Drittens, ziehen Befragte bei mehrdeutigen Fragen die Liste der Antwortalternati ven als Interpretationshilfe heran, so daß die gleiche Frage in Verbindung mit unter schiedlichen Häufigkeitsvorgaben unterschiedliche Verhaltensweisen erfaßt. Es ist daher erforderlich, stets sowohl die Frageformulierung wie den Wertebereich der Antwortvor gaben zu beachten, wenn man nicht Gefahr laufen will, unterschiedliche Verhaltens weisen zu vergleichen. Darüberhinaus werden auch Diagnostiker selbst vom Wertebereich der Antwortvor gaben beeinflußt: Sie interpretieren die gleiche Verhaltenshäufigkeit als problematischer, wenn die Skala nahelegt, daß sie über-statt unterdurchschnittlich ist. Während diese Einflüsse im Kontext der hier angenommenen informativen Funktion von Fragebögen gut konzeptualisierbar sind, können konkurrierende Prozeßannahmen jeweils nur Teile der Befunde erklären. So erlaubt etwa die von vorgetragene Verankerungshypothese die Vorhersage eines Einflusses des Werte bereiches auf Verhaltensberichte, ohne den Einfluß auf komparative Urteile und die Definition des Fragegegenstandes fassen zu können. Andererseits erlaubt Perspektiventheorie der Urteilsbildung eine Vorhersage des Einflusses auf komparative Urteile, jedoch nicht eine Erklärung des Einflusses auf die Fragendefini tion und die Häufigkeitsberichte selbst. Welche Implikationen haben diese Überlegungen für die Erfassung von Symptom-und Verhaltenshäufigkeiten in der klinischen Psychologie? In erster Linie zeigen die berichte ten Befunde, daß das Auftreten von psychosomatischen Symptomen, wie das Auftreten anderer Verhaltensweisen von hoher Frequenz, im Gedächtnis nicht gut repräsentiert ist. Häufig wiederkehrende Erfahrungen sind kaum als einzelne Episoden abrufbar, deren Auftreten gezählt werden könnte. Vielmehr verschwimmen solche Erfahrungen in einer generischen Repräsentation, die den Zugriff auf individuelle Episoden erschwert. Die Befragten sind daher auf eine Schätzstrategie angewiesen (vgl. , für eine ausführlichere Diskussion). W ill man den Einfluß solcher Schätzstrategien reduzieren, bietet sich primär eine Verkürzung der Referenzperiode an. Untersuchungen im Bereich Zweifellos sind auch die so erhobenen Berichte mit zahlreichen Erinnerungsfehlern belastet, die nur zum Teil durch geeignete Befragungsstrategien reduziert werden können (vgl. . Die Verwendung numerischer Antwortvor gaben fügt diesen Erinnerungsfehlern jedoch systematische Verzerrungen hinzu, die zu dem nicht auf die Verhaltensberichte selbst beschränkt sind. Es ist deshalb empfehlens wert, den nur geringfügig höheren Aufwand der Kodierung offener numerischer Berich te bei der Datenauswertung in Kauf zu nehmen. Answering autobiographical questions: The impact of memory and inference on surveys Science Systems and theories of psychology Essentials of psychological resting Die Freiburger Beschwerdenliste FBL Zeitschrift fiir Klinische Psychologie Effects of attitude and experience on the selection of frequency adverbs Journal of Verbal Learning and Verbal Behavior Social information processing and survey methodology The sampling of experiences in situ Journal of Personality Besch werden erfassungsbogen The communicative functions of quantifiers and their use in attitude research Psychological perspective and attitude change Psychological foundations of attitudes Problems in the quantification of frequency expressions Pro blems with language imprecision (New Directions for Methodology of Social and Behavioral Science Sometimes frequently means seldom: Context effects in the interpreta tion of quantitative expressions Journal of Research in Personality Contrast analysis Mai) Selbstberichtete Verhaltens-und Symptomhäufigkeiten: Was Befragte aus Antwortvorgaben lernen. 7. Symposium für klinisch-psychologische Forschung, Ruhr-Uni versität Assessing frequency reports of mudane behaviors: Contributions of cognitive psychology to questionnaire construction Research methods in personality and social psychology What mediates the impact to response alternatives on frequency reports of mundane behaviors? Applied Cognitive Psychology Response scales as frames of references: The impact of frequency range on diagnostic judgment Applied Cognitive Psychology What response scales may tell your respondents: Informative functions of response alternatives Social information processing and survey methodology Response scales: Effects of category range on reported behavior and subsequent judgments Public Opinion Quarterly Judgments of relationship satisfaction: Inter-and intraindividual comparison strategies as a function of questionnaire structure European Journal of Social Psychology The range of response alternatives may determine the meaning of the question: Further evidence on informative functions of response alternatives Social Cognition Autobiographical memory and the validity of retrospective reports im Druck) The specific meanings of certain terms indicating different degrees of frequency Quarterly Journal of Speech Answering survey questions: The role of memory Social information processing and survey methodology Contributions of cognitive psychology to advertising research Journal of Advertising Research Judgment under uncertainty: Heuristics and biases Science Die Beschwerdenliste Schuessler Methoden der Analyse zeitbezogener Daten. Vortragsskripten der ZUMA-Arbeitstagung vom 25 ALLBUS Manfred Küchler Verallgemeinerte Lineare Modelle in der empirischen Sozialforschung Glenn R. Carroll Dynamic analysis of discrete dependent variables: A didactic essay Manfred Küchler Zur Messung der Stabilität von Wählerpotentialen Manfred Küchler Zur Konstanz der Recallfrage Rolf Porst " ALLBUS 1982" -Systematische Variablenübersicht und erste Ansätze zu einer Kritik des Fragenprogramms Peter Ph. Mohler SAR -Simple AND Retrieval mit dem Siemens-EDT-Textmanipulationsprogramm Cornelia Krauth Vergleichsstudien zum "ALLBUS 1980 Rolf Porst Mohler Qualshop (ZUMA-Arbeitstagung zum Datenmanagement bei qualitativen Erhebungsverfahren"} -Sammlung von Arbeitspapieren und -berichten, Teil I + II Bernd Wegener Gibt es Sozialprestige? Konstruktion und Validität der Magnitude-Prestige-Skala Scheuring (sub.) Judgments of relationship satisfaction: Inter-and intraindividual Michael Schneid Datenerhebung am PC -Vergleich der Interviewprogramme "interv " und "THIS" Norbert Schwarz, Bettina Scheuring Die Vergleichsrichtung bestimmt das Ergebnis von Vergleichsprozessen: Ist -Idealdiskrepanzen in der Partnerwahrnehmung Norbert Allgemeine Bevölkerungsumfrage der Sozialwissenschaften -ALLBUS 1988 -Norbert Schwarz Feelings as Information: Informational and Motivational Functions of Affective States Günter Rothe Jackknife and Bootstrap: Resampling-Verfahren zur Genauigkeitsschätzung von Parameterschätzungen Herbert Bless, Gerd Bohner, Norbert Schwarz und Fritz Strack Happy and Mindless? Moods and the Processing of Persuasive Communications Gerd Bohner Dominance and Cooperation Robert Huckfeldt Noncompliance and the Limits of Coercion: The Problematic Enforcement of Unpopular Laws Peter Ph. Mohler, Katja Frehsen und Ute Hauck CUI -Computerunterstützte Inhaltsanalyse Grundzüge und Auswahlbibliographie zu neueren Anwendungen Cornelia Züll, Peter Ph Rainer Mathes Modulsystem und Netzwerktechnik. Neuere inhaltsanalytische Verfahren zur Analyse von Kommunikationsinhalten Margrit Rexroth Der Interviewer im Pretest. Evaluation der Interviewerleistung und Entwurf eines neuen Pretestkonzepts Henrik Tham Crime as a Social Indicator Elisabeth Noelle-Neumann Response Order Effects in Dichotomous Questions: The Impact of Administration Mode Norbert Schwarz Thomas Münkel Response Order Effects in Long Lists: Primacy, Recency, and Asymmetric Contrast Effects Wolfgang Meyer Umweltberichterstattung in der Bundesrepublik Deutschland Michael Braun Günter Rothe Gewichtungen zur Anpassung an Statusvariablen. Eine Untersuchung am ALLBUS 1986 Andreas Bayer Variationen der Fragenreihenfolge als Instrument der Kausalitätsprüfung: Eine Untersuchung zur Neu tralisationstheorie devianten Verhaltens Norbert Schwarz, Fritz Strack, Hans-Peter Mai Assimilation and Contrast Effects in Part-Whole Question Sequences: A Conversational Logic Analysis Norbert Schwarz, Fritz Strack, Hans-J. Hippier, George Bishop The Impact of Administration Mode on Response Effects in Survey Measurement Norbert Schwarz, Herbert Bless, Gerd Bohner Mood and Persuasion: Affective States Influence the Processing of Persuasive Communications Michael Braun Contrast Effects as a Function of the Dimension Tapped by Preceding Questions Norbert Schwarz Umfrageforschung: Themen und Befunde eines interdisziplinären Forschungsgebietes Norbert Schwarz, Hans-J. Hippler Response Alternatives: The Impact of their Choice and Presentation Order Achim Koch Externe Vergleichsdaten zum ALLBUS Fritz Strack Context Effects in Attitude Surveys: Applying Cognitive Theory to Social Research Norbert Schwarz Numeric Values May Change the Meaning of Scale Labels Denis J. Hilton Conversational Inference and Rational Judgment Herbert Bless Constructing Reality and Its Alternatives: An Inclusion / Exclusion Model of Assimilation and Contrast Effects in Social Judgment Herbert Bless Conversational Model of Causal Explanation Joseph P. Forgas Mood Effects on Interpersonal Preferences: Evidence for Motivated Processing Strategies Joseph P. Forgas Affective Influences on Interpersonal Perception Norbert Schwarz Selbstberichtete Verhaltens-und Symptomhäufigkeiten: Was Befragte aus Antwortvorgaben des Fragebogens lernen1 Norbert Schwarz Methoden und Analysen (ZUMA, Mannheim) Zentrum für Umfragen Universität Heidelberg Frequency Reports of Behaviors and Symptoms Bettina Scheuring Methoden und Analysen (ZUMA, Mannheim) Zentrum für Umfragen Universität Heidelberg Frequency Reports of Behaviors and Symptoms Dr Norbert Pd ZUMA Postfach 12 21 55 D -6800 Mannheim 1 Schwarz ZUMA Postfach 12 21 55 D -6800 Mannheim 1 Selbstberichtete Verhaltens-und Symptomhäufigkeiten: Was Befragte aus Antwortvorgaben des Fragebogens lernen1 GROBID - A machine learning software for extracting information from scholarly documents The impact of response alternatives on behavioral frequency repons and related judgments is explored. Respondents assume that the range of the response alternatives presented to them reflects the researcher's knowledge about the distribution of the behavior in the population, with values in the middle range of the scale representing "average" frequencies, and extreme values representing the extremes of the distribution. They use these assumptions in estimating their own behavioral frequencies. Accordingly, 60 patients of a psychosomatic clinic reported higher symptom frequencies on a scale with high rather than low frequency response alternatives. In addition, they reported more optimistic expectations regarding future health when the range of response alternatives indicated that their own symptom frequency is below rather than above the presumed average in the population. Additional studies indicated that respondents use the frequency range of the scale in interpreting the meaning of ambiguous questions, and that diagnosticians' interpretation of a frequency report is also influenced by the range of the scale on which it was provided. Implications for clinical research and psychological testing are discussed. Zusammenfassung. Der Einfluß von Antwortvorgaben auf Berichte von Symptom-und Verhaltenshäufig keiten wird untersucht. Befragte nehmen an, daß das Verhalten eines "durchschnittlichen" Befragten durch Werte im Mittelbereich der Skala abgebildet wird, und daß die Extreme der Skala die Extreme der Verteilung des Verhaltens in der Population wiedergeben. Sie ziehen demgemäß den Wertebereich als Bezugsrahmen zur Einschätzung ihrer eigenen Verhaltenshäufigkeit heran. In der vorliegenden Untersuchung mit modifi zierten Items der FBL berichteten 60 Patienten einer psychosomatischen Klinik eine höhere Symptombela stung auf Skalen mit hohen statt geringen Häufigkeitsvorgaben. Sie entnahmen außerdem ihrer eigenen Plazierung auf der Skala Information über die vermeintlich "typische" Symptombelastung und berichteten positivere Gesundheitserwartungen, wenn ihnen die Skala eine unter-statt überdurchschnittliche Symptombelastung nahelegte. Weitere Untersuchungen zeigten, daß Befragte bei mehrdeutigen Fragen die Antwortalternativen als Interpretationshilfe heranziehen, so daß die gleiche Frage in Verbindung mit unterschiedlichen Häufigkeitsvorgaben unterschiedliche Verhaltensweisen erfaßt, und daß der Wertebereich der Antwortvorgagen die Interpretation der Berichte durch Diagnostiker beeinflußt. Implikationen für die klinische Forschung und Diagnostik werden diskutiert. Von der anfänglichen Diagnose bis zur Evaluation des Therapieerfolges stehen klinische Psychologen als Therapeuten wie als Forscher häufig vor der Notwendigkeit, Symptome und Verhaltensweisen von therapeutischem Interesse möglichst genau zu erfassen. Ein zentraler Aspekt dieser Erfassung ist die Häufigkeit, mit der ein Verhalten oder ein Symptom auftxitt. Zu diesem Zweck werden die Klienten meist gebeten, entsprechende Selbstberichte abzugeben, in der Regel, indem sie einen Fragebogen ausfüllen. Während allgemeine Selbstberichte in der Geschichte psychologischer Forschungsmethoden schon alle Höhen und Tiefen der Wertschätzung durchlaufen haben (vgl. Chaplin & Krawiec, 1960; Cronbach, I960) , sind quantitative Häufigkeitsberichte über gut definierte Verhal tensweisen auch im Bereich des "behavioral assessment" wenig umstritten (vgl. Beilack & Hersen, 1977) . Als Voraussetzung für die Erhebung dieser Berichte wird empfohlen, "(that) questions must be written with explicitly defined terms and with discrete, objective (e. g., quantitative) response choices if accurate responses are to be secured" (Bellack & Hersen, 1977, S. 56) . Sofern diese Voraussetzungen gegeben sind, gelten fehlerhafte Erinnerung und intentionale Falschdarstellung als primäre Fehlerquellen. Ein systemati scher Einfluß von Merkmalen des Erhebungsinstrumentes wird hingegen unter diesen Bedingungen nicht erwartet. Untersuchungen im Bereich der empirischen Sozialforschung (vgl. Schwarz, 1990 , zum Überblick) zeigten hingegen, daß die von Bellack und Hersen (1977) empfohlenen quan titativen Antwortalternativen ("response choices") Berichte über die Häufigkeit gut defi nierter Verhaltensweisen nachhaltig beeinflussen können und darüber hinaus die Antworten auf nachfolgende Fragen verändern. Eine Analyse der kognitiven und kom munikativen Prozesse, die Befunden dieser Art zugrunde liegen, erlaubt es, Einflüsse der Fragebogengestaltung auf die erhaltenen Berichte a priori zu spezifizieren und lenkt die Aufmerksamkeit auf "Nebenwirkungen" und Randbedingungen, die in der bisherigen Forschung zu Verhaltens-und Symptominventaren nicht dokumentiert wurden. Bei diesen Verfahren wird den Befragten eine Liste von Symptomen oder Verhaltens weisen nebst Häufigkeitsangaben vorgelegt, und sie werden gebeten, die jeweils auf sie zutreffende Antwortalternative anzukreuzen. Es lassen sich dabei zwei Arten von Ant wortvorgaben unterscheiden: Einerseits vage Quantißzierungen, z. B.: "selten", "manch mal", oder "häufig", und andererseits numerische Quantißzierungen, wie z. B. "1 x pro Woche" oder "2 x im Monat". Beide Arten von Antwortvorgaben werfen spezifische Probleme auf. Vage Quantifizierungen Vage Quantifizierungen finden sich z. B. in dem Beschwerdenerfassungsbogen von Kassielke und Hänsgen (1982) oder der Beschwerdenliste von v. Zerssen und Koeller (1975). Sie werden häufig mit der Begründung verwendet, daß sie für die Befragten ein facher zu handhaben seien und präzisere numerische Fragen ohnehin das Erinnerungs vermögen der Befragten überforderten (vgl. Bradburn & Miles, 1979) , was lediglich in Scheinpräzision resultiere. Allerdings überläßt es der Forscher bei der Verwendung vager Quantifizierungen, wie "selten" oder "häufig", den Befragten, zu definieren, welche absolute Häufigkeit sie als "selten" oder "häufig" bezeichnen wollen. Seit frühen Arbeiten von Simpson (1944) Goocher, 1965) . Dies hat zur Folge, daß Befragte bei unterschiedlichen Symptomen den gleichen Begriff zur Benennung unterschiedlicher absoluter Auftretens häufigkeiten verwenden. So bezeichnet z. B. bei den meisten Befragten die Aussage, daß sie "häufig" Kopfschmerzen haben, eine höhere absolute Auftretenshäufigkeit als die Aussage, daß sie "häufig" an Herzanfällen leiden. Dies spiegelt wider, daß Befragte bei der Wahl vager Antwortkategorien ihre implizite Theorie über die "normale" Auf tretenshäufigkeit eines Symptoms heranziehen. Demgemäß gibt ein Begriff wie "häufig" primär die Häufigkeit relativ zu einem subjektiven Standard wieder, nicht aber die objek tive Frequenz. Aus dem gleichen Grund verwenden unterschiedliche Befragte, mit unter schiedlichen subjektiven Standards, den gleichen vagen Häufigkeits begriff zur Bezeichnung unterschiedlicher realer Frequenzen, selbst beim gleichen Symptom. Es ist weiterhin zu vermuten, wenn auch noch nicht empirisch überprüft, daß sich während des Therapieverlaufs die subjetiven Standards für das Verhalten ändern können, und somit reale Frequenzänderungen innerhalb des Therapieprozesses fehlerhaft abgebildet werden. Demgemäß Stunden pro Tag, wenn ihnen eine Skala mit Werten von "bis zu 2x/i Stunden" bis " 4 V 2 und mehr" vorlag. Reichte der Wertebereich der Skala hingegen von "bis zu V 2 Stunde" bis "mehr als 2 V2 Stunden", war dies nur bei 16,2 % der Befragten der Fall. Ebenso berichteten Studenten eine höhere Masturbationsfrequenz, wenn ihnen eine Skala mit hohen statt mit geringen HäufigkeitsVorgaben vorgelegt wurde (Schwarz & Scheuring, 1988) . In der folgenden Studie soll geprüft werden, inwiefern Befragte beim Bericht von Häufigkeiten psychosomatischer Beschwerden den Wertebereich der Skala als Bezugs rahmen heranziehen. Wie erwartet, berichteten die Be* fragten auf Skalen mit hohen Häu figkeitsvorgaben eine höhere Symptombelastung als auf Skalen mit geringen Häufigkeitsvorgaben. Von den 340 Berichten, die auf einer Skala mit hohen Antwortvorgaben abgegeben wur den (je 17 Symptomberichte von 20 Befragten), beinhalteten 211 Berichte (62 %) eine Symptomhäufigkeit von mehr als 2 x im Monat. Dies war nur bei 131 (39 %) von 336 Berichten der Fall, die auf einer Skala mit geringen Häufigkeitsvorgaben abgegeben wur den, und bei 85 (25 %) von 337 Berichten auf einer Skala, die der Standardform der FBL entsprach.3 Statistisch unterscheidet sich der Befund bei hohen Antwortvorgaben von den beiden anderen Bedingungen (z = 2.3, p < .02; z-Test auf Proportionen, Rosenthal & Rosnow, 1985) . Methode Dieses Muster trat bei allen 17 Einzelsymptomen konsistent auf, war jedoch um so aus geprägter, je mehrdeutiger die erfragten Symptome waren. Die größten Unterschiede traten bei der Frage "Reagiert Ihr Körper auf Wetteränderungen?" auf. In diesem Fall berichteten 15 von 20 Befragten (75 %) mit hohen Antwortvorgaben und 4 von 19 Be fragten (21 %) mit den Standardvorgaben der FBL eine Frequenz von mehr als 2 x im Monat. Die Bedingung mit hohen Antwortvorgaben unterscheidet sich wiederum von den anderen Bedingungen, z = 3,93m p < .001. Die geringsten Unterschiede traten mit 50 % (10 von 20 Antworten), 47 % (9 von 19 Antworten) und 42 % (8 von 19 Ant worten) bei der Frage "Schwitzen Sie so gar an kühlen Tagen?" auf, alle p > .30. Der geringere Einfluß der Antwortvor gaben bei gut definierten Symptomen ent spricht anderen Befunden, die zeigen, daß der Einfluß der Skalenvorgabe mit zu nehmendem Wissen über das erfragte Ver halten abnimmt (Schwarz & Bienieas, 1990) . Dies läßt zugleich vermuten, daß der Wertebereich der Antwortvorgaben Berichte über die für die jeweilige Dia gnose zentralen Symptome weniger beein flußt als Berichte über periphere Symptome, die in geringerem Maße Ge genstand der Aufmerksamkeit der Patien ten sind. Dies impliziert, daß die relative Häufigkeit zentraler und peripherer Symptome verzerrt abgebildet würde, da letztere in höherem Maße von der Skala beeinflußt werden als erstere. Diese Möglichkeit bedarf noch der empirischen Überprüfung. Die Nutzung numerischer Antwortvorgaben als Bezugsrahmen zur Schätzung von Verhaltenshäufigkeit hat außerdem zur Folge, daß die Berichte die reale Varianz des Ver haltens in der Population unzureichend wiedergeben. Da alle Probanden den gleichen Bezugsrahmen zur Schätzung heranziehen, fallen die Berichte homogener aus, als dies in einem offenen Antwortformat der Fall ist (vgl. Schwarz & Hippler, 1987) . Dies resultiert insbesondere in einer ungenügenden Abbildung extrem hoher oder extrem geringer Häufigkeiten, deren adäquate Erfassung jedoch besonders von klinischem Interesse wäre. Antwortvorgaben beeinflussen komparative Urteile Wenn Befragte den Antwortvorgaben Information über die Verteilung des Merkmals in der Population entnehmen und davon ausgehen, daß das durchschnittliche Verhalten durch Werte im Mittelbereich der Skala repräsentiert wird, läßt dies vermuten, daß Ant wortvorgaben nicht nur die Verhaltensbericht selbst, sondern auch nachfolgende Urteile beeinflussen. Dies ist insbesondere zu vermuten, wenn nachfolgende Fragen implizit oder explizit einen Vergleich mit anderen erfordern. In diesem Fall können die Befrag ten ihrer eigenen Plazierung auf der Skala Information über ihre Plazierung in der Ver teilung des Merkmals entnehmen. Befragte, die einen Wert im oberen Bereich der Antwortvorgaben wählen, könnten z. B. folgern, daß sie das entsprechende Verhal ten häufiger zeigen als im Durchschnitt der Population "üblich" ist. Mehrere Unter suchungen unterstützen diese Annahme in verschiedenen Inhaltsbereichen (Schwarz et al., 1985; Schwarz & Scheuring, 1988) . In einer bereits erwähnten Untersuchung (Schwarz & Scheuring, 1988) wurden z. B. Studenten gebeten, ihre Masturbationshäufigkeit zu berichten. Wenn ihnen dazu eine Skala mit geringen Antwortvorgaben vorlag, berichteten sie eine geringere Frequenz als wenn ihnen eine Skala mit hohen Antwortvorgaben vorlag. Zugleich legte ihnen aber die Skala mit geringen Häufigkeitsvorgaben nahe, daß sie häufiger masturbieren als "üblich". Dementsprechend berichteten sie anschließend, mit ihrer derzeitigen intimen Beziehung weniger zufrieden und an anderen Partnerinnen stärker interessiert zu sein als Studenten, die ihren Verhaltensbericht auf einer Skala mit hohen Häufigkeitsalter nativen abgaben, was ihnen nahelegte, daß sie seltener masturbieren als üblich. Diese Befunde zeigen, daß der Wertebereich der Antwortvorgaben Vergleichsinformation be reitstellt, die die Befragten aktiv in ihrer Urteilsbildung nutzen. Dies trifft auch für Berichte über die Häufigkeit psychosomatischer Symptome zu. Wir baten die befragten Patienten, auf einer 11-stufigen Skala einzuschätzen, wie zufrieden sie mit ihrem derzeitigen Gesundheitszustand sind und wie zufrieden sie glauben, "näch stes Jahr um diese Zeit" mit ihrer Gesundheit zu sein (1 = sehr unzufrieden; 11 = sehr zufrieden). Die Einschätzung der derzeitigen Gesundheitszufriedenheit zeigte keinen signifikanten Einfluß der Antwortvorgaben (alle p > .20), was die "reality constraints" des Klinikaufenthaltes widerspiegeln dürfte. Die Erwartungen über die künftige Gesund heitszufriedenheit wurden hingegen von den Antwortvorgaben beeinflußt: Befragte, denen geringe Häufigkeitsvorgaben nahelegten, daß ihre Symptomhäufigkeit überdurch schnittlich ist, erwarteten, in einem Jahr w eniger zufrieden zu sein (M = 7.2) als Befragte der beiden anderen Bedingungen (t(53) = 1.92), p < .03, einseitig, für den geplanten Kontrast; s. Rosenthal & Rosnow, 1985) , die sich nicht voneinander unterschieden (M = 8.3 für hohe Vorgaben und 8.8 für die Standardvorgaben, t(53) = .67, für den geplanten Kontrast). Auch in dieser Untersuchung entnahmen die Befragten somit ihrer eigenen Plazierung auf der Skala Vergleichsinformation, die sie zur Einschätzung ihrer Gesundheitssituation heranzogen. Die Verwendung von Antwortvorgaben zur Erfassung von Symptom häufigkeiten beeinflußt daher nicht nur die erhaltenen Häufigkeitsberichte, sondern auch nachfolgende subjektive Beurteilungen. Darüber hinaus ist der Einfluß der Antwortvorgaben auf komparative Urteile nicht auf die Befragten selbst beschränkt. Vielmehr ziehen auch die Benutzer der von den Befragten abgegebenen Verhaltensberichte die Antwortvorgaben als Bezugsrahmen zur Urteilsbildung heran (Schwarz, Bless, Bohner, Harlacher & Kellenbenz, 1991, Exp. 2), wie eine Untersuchung im Bereich der medizinischen Diagnostik zeigt. In dieser Un tersuchung sollten praktizierende Arzte die Bedenklichkeit körperlicher Symptome beurteilen, die ein Patient auf einem Symptomfragebogen angekreuzt hatte. Dabei be richtete der Patient eine konstante Symptomhäufigkeit von zweimal pro Woche, jedoch wurde dieser Bericht entweder auf einer Skala mit geringen oder hohen Antwortvor gaben angekreuzt. Wie erwartet, beurteilten die Arzte zweimal die Woche auftretende Rückenschmerzen oder Energiemangel als bedenklicher, und empfahlen nachdrücklicher eine eingehende Untersuchung, wenn die gleiche absolute Symptomhäufigkeit vom Patienten auf einer Liste mit geringen Häufigkeitsvorgaben statt auf einer Liste mit hohen Häufigkeitsvor gaben angekreuzt wurde. Dabei erwies sich die Expertise des Diagnostikers nicht als Schutz vor dem Einfluß der Skala: Arzte mit mindestens fünf Jahren Berufserfahrung wurden von den Skalenvorgaben ebenso beeinflußt wie Medizinstudenten. Beide Grup pen unterschieden sich lediglich dadurch, daß die Medizinstudenten alle Angaben als bedenklicher beurteilten als Experten. Numerische Antwortalternativen beeinflussen daher nicht nur die Verhaltensberichte der Patienten, sondern auch die Folgerungen, die Diagnostiker aus einem gegebenen Verhaltensbericht ziehen. Antwortvorgaben definieren den Fragegegenstand Darüber hinaus können numerische Antwortvorgaben die Definition des erfragten Ver haltens beeinflussen. Dies ist insbesondere dann zu erwarten, wenn sich die Frage auf Verhaltensweisen oder Symptome bezieht, deren Definition einen großen subjekti ven Spielraum aufweist. Will der Diagnostiker z. B. wissen, wie oft ein Befragter sich "ärgert", steht der Befragte vor der Aufgabe zu bestimmen, was mit "sich ärgern" ge meint ist. Bezieht sich die Frage auf kleine alltägliche Ärgernisse oder auf große Ausein andersetzungen? In einem solchen Fall kann der Befragte wiederum den Antwortvor gaben Informationen entnehmen, die eine Klärung des Fragegegenstandes erlaubt. Rei chen die Antwortvorgaben bei einer Frage nach der Ärgerhäufigkeit z. B. von "weniger als zweimal die Woche" bis "mehrmals täglich", könnten die Befragten schließen, daß wohl kleinere Ärgernisse gemeint sein müssen, da bedeutsamere Ärgernisse nicht so häu fig Vorkommen. Andererseits würden Vorgaben von "weniger als einmal im Jahr" bis "mehrmals im Monat" nahelegen, daß große Ärgernisse Gegenstand der Frage sind. In einem Experiment zur Prüfung dieser Überlegungen wurden Pro banden gebeten, auf einer Skala mit hohen oder geringen Häufigkeitsvorgaben zu berichten, wie häufig sie sich ärgern (Schwarz, Strack, Müller & Chassein, 1988) . Anschließend beschrieben sie ein typisches Beispiel ihres Ärgers. Die Analyse dieser Beschreibungen durch unab hängige Beurteiler ergab, daß Befragte denen geringe Häufigkeits vorgaben Vorlagen, an extremere Ärgernisse dachten als Befragte, denen hohe Häufigkeitsvorlagen Vorlagen. Die Definition des Fragegegenstandes durch die Befragten selbst ist somit nicht nur eine Funktion der Frageformulierung, sondern auch eine Funktion der vorgelegten quantita tiven Antwortalternativen. Demgemäß erfassen identisch formulierte Fragen bei unter schiedlichen Häufigkeits vorgaben unterschiedliche Erfahrungen. Diskussion Die berichteten Befunde unterstützen die Hypothese, daß Befragte bei numerischen Antwortvorgaben annehmen, daß das Verhalten eines "durchschnittlichen" Befragten durch Werte im Mittelbereich der Skala abgebildet wird, und daß die Extreme der Skala die Extreme der Verteilung des Verhaltens in der Population wiedergeben. Die Befragten nutzen diese aus dem Wertebereich der Skala erschlossene Verteilungsinformation in vielfältiger Weise in ihrer eigenen Urteilsbildung. -Erstens, ziehen Befragte den Wertebereich als Bezugsrahmen zur Einschätzung ih rer eigenen Verhaltenshäufigkeit heran und berichten höhere Häufigkeiten auf Skalen mit hohen als auf Skalen mit geringen Vorgaben. Die berichteten absoluten Werte sind daher nicht interpretierbar und Verhaltensberichte, die auf verschiedenen Skalen abge geben wurden, sind nicht vergleichbar. Zugleich reduziert die Nutzung des gleichen Bezugsrahmens durch Probanden mit unterschiedlicher Verhaltenshäufigkeit die Varianz in den Berichten, was in einer unangemessenen Abbildung der Verhaltensvarianz in der Population resultiert. -Zweitens, entnehmen Befragte ihrer eigenen Plazierung auf der Skala Information über die relative Häufigkeit ihres Verhaltens verglichen mit anderen und berücksichtigen diese Vergleichsinformation in komparativen Urteilen. Ist man an solchen komparativen Urteilen, z. B. in Form subjektiver Einschätzungen der eigenen Befindlichkeit, inter essiert, sollten sie vor den Verhaltensberichten erhoben werden. -Drittens, ziehen Befragte bei mehrdeutigen Fragen die Liste der Antwortalternati ven als Interpretationshilfe heran, so daß die gleiche Frage in Verbindung mit unter schiedlichen Häufigkeitsvorgaben unterschiedliche Verhaltensweisen erfaßt. Es ist daher erforderlich, stets sowohl die Frageformulierung wie den Wertebereich der Antwortvor gaben zu beachten, wenn man nicht Gefahr laufen will, unterschiedliche Verhaltens weisen zu vergleichen. Darüberhinaus werden auch Diagnostiker selbst vom Wertebereich der Antwortvor gaben beeinflußt: Sie interpretieren die gleiche Verhaltenshäufigkeit als problematischer, wenn die Skala nahelegt, daß sie über-statt unterdurchschnittlich ist. Während diese Einflüsse im Kontext der hier angenommenen informativen Funktion von Fragebögen gut konzeptualisierbar sind, können konkurrierende Prozeßannahmen jeweils nur Teile der Befunde erklären. So erlaubt etwa die von Tversky und Kahneman (1974) vorgetragene Verankerungshypothese die Vorhersage eines Einflusses des Werte bereiches auf Verhaltensberichte, ohne den Einfluß auf komparative Urteile und die Definition des Fragegegenstandes fassen zu können. Andererseits erlaubt Ostrom und Upshaws (1968) Perspektiventheorie der Urteilsbildung eine Vorhersage des Einflusses auf komparative Urteile, jedoch nicht eine Erklärung des Einflusses auf die Fragendefini tion und die Häufigkeitsberichte selbst. Implikationen Welche Implikationen haben diese Überlegungen für die Erfassung von Symptom-und Verhaltenshäufigkeiten in der klinischen Psychologie? In erster Linie zeigen die berichte ten Befunde, daß das Auftreten von psychosomatischen Symptomen, wie das Auftreten anderer Verhaltensweisen von hoher Frequenz, im Gedächtnis nicht gut repräsentiert ist. Häufig wiederkehrende Erfahrungen sind kaum als einzelne Episoden abrufbar, deren Auftreten gezählt werden könnte. Vielmehr verschwimmen solche Erfahrungen in einer generischen Repräsentation, die den Zugriff auf individuelle Episoden erschwert. Die Befragten sind daher auf eine Schätzstrategie angewiesen (vgl. Schwarz, 1990 , für eine ausführlichere Diskussion). W ill man den Einfluß solcher Schätzstrategien reduzieren, bietet sich primär eine Verkürzung der Referenzperiode an. Untersuchungen im Bereich Zweifellos sind auch die so erhobenen Berichte mit zahlreichen Erinnerungsfehlern belastet, die nur zum Teil durch geeignete Befragungsstrategien reduziert werden können (vgl. Bradburn et al., 1987; Schwarz, 1990) . Die Verwendung numerischer Antwortvor gaben fügt diesen Erinnerungsfehlern jedoch systematische Verzerrungen hinzu, die zu dem nicht auf die Verhaltensberichte selbst beschränkt sind. Es ist deshalb empfehlens wert, den nur geringfügig höheren Aufwand der Kodierung offener numerischer Berich te bei der Datenauswertung in Kauf zu nehmen. Ziel des vorliegenden Beitrages ist es daher, einige neuere Befunde aus der Kooperation von Umfrageforschern und Kognitionspsychologen zu Problemen der Fragebogengestaltung (vgl. Hippler, Schwarz & Sudman, 1987; Schwarz & Sudman, im Druck) für die klini sche Forschung und Diagnose fruchtbar zu machen. Dabei konzentrieren wir uns auf kognitive und kommunikative Aspekte der Erfassung von Verhaltens-und Symptom häufigkeiten mittels standardisierter Befragungsinstrumente. sind Berichte auf der Basis vager Quantifizierungen weder über Sym ptome, noch über Befragte, und wahrscheinlich nicht einmal für den gleichen Begragten über die Zeit, vergleichbar. Insgesamt folgt aus diesen und verwandten Befunden (vgl. Pepper, 1981; Moxey & Sanford, im Druck), daß vage Quantifizierungen eher zur Erfas sung subjektiv erlebter Belastung als zur Erfassung realer Frequenzen geeignet sind. Will man jedoch subjektive Belastung erfassen, bieten sich direktere Zugänge an als ihre Er schließung aus scheinbaren Frequenzberichten. Dementsprechend folgert Pepper (1981, S. 38), in Übereinstimmung mit Beilack und Hersen (1977), "if it is important to have numerical information about the occurence of some event, it would seem more precise to ask directly for numerical estimates.viele der Probleme vermeiden, die vage Quantifizierungen mit sich bringen, werfen sie andererseits neue Probleme auf. Insbesondere haben Unter suchungen im Bereich der empirischen Sozialforschung gezeigt (zum Überblick vgl. Schwarz, 1990; Schwarz & Hippler, 1987), daß Befragte annehmen, daß der Werte bereich einer vom Forscher vorgelegten Skala sein Wissen über die Verteilung des erfrag ten Verhaltens widerspiegelt. Demgemäß vermuten Befragte, daß das Verhalten eines "durchschnittlichen" Befragten durch Werte im Mittelbereich der Skala abgebildet wird, und daß die Extreme der Skala den Extremen der Verteilung des Verhaltens in der Popu lation entsprechen. Diese Annahme beeinflußt sowohl ihre Häufigkeitsberichte wie nachfolgende komparative Urteile und die Frageinterpretation in systematischer Weise. Antwortvorgaben beeinflussen Häufigkeitsberichte Wie zahlreiche Untersuchungen im Bereich des autobiographischen Gedächtnisses zei gen, sind häufig auftretende Verhaltensweisen oder Erfahrungen im Gedächtnis nicht ge trennt repräsentiert. Vielmehr verschwimmt die Vielzahl ähnlicher Einzelepisoden zu einer generischen Repräsentation des betreffenden Verhaltens (vgl. Bradburn, Rips & Shevell, 1987; Strube, 1987; Schwarz, 1990). Demgemäß ist es für Befragte schwer, die Häufigkeit des betreffenden Verhaltens auf der Basis der Erinnerung an Einzelepisoden zu beurteilen. Sie sind vielmehr auf eine Schätzstrategie angewiesen, bei der sie alle Infor mation nutzen, die eine sinnvolle Bearbeitung der Aufgabe erlaubt. Eine besonders augenfällige Informationsquelle ist dabei die Skala, die ihnen der For scher vorlegt. Da Befragte annehmen, daß diese Skala das Wissen des Forschers über die Häufigkeitsverteilung des Verhaltens wiedergibt, können sie den Wertebereich der Skala als Bezugsrahmen zur Schätzung ihrer eigenen Verhaltenshäufigkeit heranziehen. Dem entsprechend zeigte sich in einer Reihe von Untersuchungen in unterschiedlichen In haltsbereichen, daß Befragte auf Antwortskalen mit hohen Häufigkeitsvorgaben auch in der Tat höhere Häufigkeiten berichten, als auf Skalen mit geringen Häufigkeitsvorgaben. So berichteten z. B. 37,5 % der Befragten einer Untersuchung zum Freizeitverhalten (Schwarz, Hippler, Deutsch & Strack, 1985) einen Fernsehkonsum von mindestens 2 V2 Eine erste experimentelle Überprüfung dieses allgemeinen Befundes im Bereich der klinischen Diagnostik wurde an einer Gelegenheitsstichprobe von N = 60 Patienten (28 Männer und 32 Frauen) einer deut schen psychosomatischen Klinik vorgenommen (Scheuring 8C Schwarz, 1989). Die Altersspanne reichte von 21 bis 58 Jahre, M = 36.9, Median = 37.5. Als Hauptdiagnosen wurden von der Klinik angegeben: Erschöpfungszustände/Nervosität (N = 18), Angstzustände (N = 12), Schmerzen (JV = 10), Depression (N = 9), Adipositas {N = 7) und Eßstörung (N = 4). Die Patienten wurden zufällig einer von drei ex perimentellen Bedingungen zugewiesen und in Anlehnung an die Freiburger Beschwerdeliste (Fahren Selbstberichtete Verhaltens-und Symptomhäufigkeiten 201 berg, 1975) gebeten, die Auftretenshäufigkeit von 17 Beschwerden, wie z. B. Kopfschmerzen, Schwindel oder Übelkeit, zu berichten. Dabei wurde der Wertebereich der Antwoitvorgaben variiert. Abbildung 1 zeigt die drei Skalenvariationen (N = > 20 je Bedingung). Während die Standard form der FBL bis "fast täglich" reicht, umfaßt die Form mit hohen Antwortvorgaben Werte von "die Form mit geringen Antwort vorgaben Werte von "nie" bis "häufiger als zweimal im Monat". Angaben auf diesen Skalen sind vergleichbar, indem man Be fragte danach unterscheidet, ob sie Häufig keiten von mehr oder weniger als zweimal im Monat berichten. Die Durchführung er folgte in vier Gruppensitzungen, wobei in jecfer Sitzung alle Skalenversionen ausge teilt wurden. Durch ein neutrales Deck blatt war dem Versuchsleiter die spezifi sche Zuteilung eines Patienten zu einer Skalenversion nicht bekannt. g e s a m t W e t t e r f ü h lig k e it S c h w it z e n Abbildung 2. Berichtete Symptomhäufigkeit: Eine Funktion der Annvorrvorgaben. des Konsumentenverhaltens (Blair &C Burton, 1987; Sudman & Schwarz, 1989) zeigten, daß Befragte um so eher eine episodische Erinnerungsstrategie wählen, je geringer die Auftretenshäufigkeit des relevanten Verhaltens im Befragungszeitraum ist. Demgemäß sollten häufige Verhaltensweisen nur für kurze Zeiträume erfragt werden, während für seltene Verhaltensweisen auch längere Zeiträume angemessen sind. Für standardisierte Symptominventare, die für den Einsatz mit heterogenen Populationen konzipiert sind, ist diese Strategie jedoch wenig praktikabel, da unterschiedliche Referenzperioden für Symptome unterschiedlicher Häufigkeit erforderlich wären, und die jeweiligen Referenz perioden zudem nach Diagnosen differenziert werden müßten. In diesem Zusammen hang ist leider festzustellen, daß der Wunsch nach standardisierten Instrumenten für heterogene Populationen und die Nutzung von Erhebungsstrategien, die veridikale auto biographische Erinnerungen fördern, nur begrenzt vereinbar sind (vgl. die Beiträge in Schwarz & Sudman, im Druck). Ist man ernsthaft an der veridikalen Erfassung von Symptom-und Verhaltenshäufig keiten interessiert, erweisen sich retrospektive Selbstberichte beim derzeitigen For schungsstand stets als unzureichend, insbesondere, wenn längere Referenzperioden abgedeckt werden sollen. In diesen Fällen muß auf die aufwendigere Erhebung mittels Tagebuch oder Erfahrungsstichprobe (Hormuth, 1986) zurückgegriffen werden. Eine ökonomische Alternative zu retrospektiven Selbstberichten ist somit nicht verfügbar. Man muß daher davon ausgehen, daß retrospektive Selbstberichte auch in Zukunft das meistbenutzte Verfahren zur Erhebung von Verhaltenshäufigkeiten darstellen werden. Allerdings sollte dabei auf die Vorgabe von Antwortalternativen verzichtet werden. Es ist vielmehr zu empfehlen, die Häufigkeit eines möglichst genau spezifizierten Verhaltens für eine überschaubare und eindeutig verankerte Referenzperiode in einem Format zu erheben, in dem die Probanden eine freie numerische Antwort geben. Untersuchungen im Bereich des Konsumentenverhaltens (z. B. Blair & Burton, 1987; Sudman & Schwarz, 1989) zeigen, daß dies bei geeigneter Instruktion ("Since Thanksgiving, how frequently did you eat at a Chinese restaurant? Please enter the number in this space:______.") problemlos möglich ist. Behavioral assessment: N ew directions in clinical psychology (pp. 52-76). New York: Brunner 8c Mazel. Blair, E. & Burton, S. (1987). Cognitive processes used by survey respondents to answer behavioral fre quency questions. Journal o f Consumer Research, 14, 280-288. Bradburn, N. M. & Miles, C. (1979). Vague quantifiers. Public Opinion Quarterly, 43, 92-101. ist jedoch bekannt, daß über die Zuordnung von realen Häufigkeiten zu vagen Häufigkeitsbegriffen wenig Konsens besteht (siehe Pepper, 1981; Moxey & Sanford, im Druck, zum Überblick). Insbesondere variiert die Verwendung von Häufigkeitsbegriffen als Funktion des Verhaltens, auf das sich die Frage bezieht (z. B. Pepper & Prytulak, 1974) und als Funktion der Erfahrungen des Befragten (z. B. Um den Datenschutzansprüchen der Klinik gerecht zu werden, konnten keine Daten erhoben werden, die eine Identifikation der Patienten ermöglichen würden. Die Zufallszuweisung zu Bedingungen garantiert jedoch eine weitgehende Vergleichbarkeit der Experimenialgruppen. 3 Abweichungen von den 340 zu erwartenden Berichten je Bedingung ergeben sich durch unvollständig ausgefüllte Fragebögen. Answering autobiographical questions: The impact of memory and inference on surveys N M Bradburn L J Rips S K Shevell Science 236 Systems and theories of psychology J P Chaplin T S Krawiec Holt, Rinehart, and Winston. * New York L J Cronbach Essentials of psychological resting New York Harper & Row 2rd ed. Die Freiburger Beschwerdenliste FBL J Fahrenberg Zeitschrift fiir Klinische Psychologie 4 Effects of attitude and experience on the selection of frequency adverbs B E Goocher Journal of Verbal Learning and Verbal Behavior 4 Social information processing and survey methodology H J Hippier N Schwarz & Sudman, S. Springer Verlag New York The sampling of experiences in situ S E Hormuth Journal of Personality 54 Besch werden erfassungsbogen E Kassielke K.-P Hänsgen Psychodiagnostisches Zentrum Berlin The communicative functions of quantifiers and their use in attitude research L Moxey A Sanford N. Schwarz & S. Sudman Springer Verlag New York Context effects in social and psychological research Psychological perspective and attitude change T M Ostrom H S Upshaw Psychological foundations of attitudes A. C. Greenwald, T. C. Brock & T. M. Ostrom New York Academic Press Problems in the quantification of frequency expressions S C Pepper Pro blems with language imprecision (New Directions for Methodology of Social and Behavioral Science D. W. Fiske San Francisco Jossey-Bass 9 Sometimes frequently means seldom: Context effects in the interpreta tion of quantitative expressions S Pepper L S Prytulak Journal of Research in Personality 8 R Rosenthal R L Rosnow Contrast analysis Cambridge Cambridge University Press Mai) B Scheuring N Schwarz Selbstberichtete Verhaltens-und Symptomhäufigkeiten: Was Befragte aus Antwortvorgaben lernen. 7. Symposium für klinisch-psychologische Forschung, Ruhr-Uni versität Bochum Assessing frequency reports of mudane behaviors: Contributions of cognitive psychology to questionnaire construction N Schwarz Research methods in personality and social psychology C. Hendrick & M. S. Clark Beverly Hills, CA Sage 11 What mediates the impact to response alternatives on frequency reports of mundane behaviors? N Schwarz J Bienias Applied Cognitive Psychology 4 Response scales as frames of references: The impact of frequency range on diagnostic judgment N Schwarz H Bless G Bohner U Harlacher M Kellenbenz Applied Cognitive Psychology 5 What response scales may tell your respondents: Informative functions of response alternatives N Schwarz H J Hippier Social information processing and survey methodology H. J. Hippier, N. Schwarz & S. Sudman New York Springer Verlag Response scales: Effects of category range on reported behavior and subsequent judgments N Schwarz H J Hippier B Deutsch F Strack Public Opinion Quarterly 49 Judgments of relationship satisfaction: Inter-and intraindividual comparison strategies as a function of questionnaire structure N Schwarz B Scheuring European Journal of Social Psychology 18 The range of response alternatives may determine the meaning of the question: Further evidence on informative functions of response alternatives N Schwarz F Strack G Müller B Chassein Social Cognition 6 Autobiographical memory and the validity of retrospective reports im Druck) Schwarz, N. & Sudman, S. New York Springer Verlag The specific meanings of certain terms indicating different degrees of frequency R H Simpson Quarterly Journal of Speech 30 Answering survey questions: The role of memory G Stmbe Social information processing and survey methodology H. J. Hippier, N. Schwarz & S. Sudman New York Springer Verlag Contributions of cognitive psychology to advertising research S Sudman N Schwarz Journal of Advertising Research 29 Judgment under uncertainty: Heuristics and biases A Tversky D Kahneman Science 85 Die Beschwerdenliste D Von Zerssen D M Koeller Beltz Weinheim Schuessler Methoden der Analyse zeitbezogener Daten. Vortragsskripten der ZUMA-Arbeitstagung vom 25 Gerhard Arminger Willibald Nagl F Karl 09. -05.10.79 Erika Brückner Hans-Peter Kirschner Rolf Porst Peter Prüfer ALLBUS Peter Schmidt Methodenbericht zum Manfred Küchler Verallgemeinerte Lineare Modelle in der empirischen Sozialforschung Glenn R. Carroll Dynamic analysis of discrete dependent variables: A didactic essay Manfred Küchler Zur Messung der Stabilität von Wählerpotentialen Manfred Küchler Zur Konstanz der Recallfrage Rolf Porst "ALLBUS 1982" -Systematische Variablenübersicht und erste Ansätze zu einer Kritik des Fragenprogramms Peter Ph. Mohler SAR -Simple AND Retrieval mit dem Siemens-EDT-Textmanipulationsprogramm Cornelia Krauth Vergleichsstudien zum "ALLBUS 1980 Manfred Küchler Thomas P Wilson Don H Zimmerman Integration Von Qualitativen Und Quantitativen Forschungsansätzen Gerhard Arminger Horst Busse Rolf Porst Werner Hagstotz Peter Prüfer Methodenbericht zum "ALLBUS 1982 " Bernd Wegener Two approaches to the analysis of judgments of prestige: Interindividual differences and the general scale Rolf Porst Synopse der ALLBUS-Variablen Mohler Qualshop (ZUMA-Arbeitstagung zum Manfred Küchler Peter Ph Datenmanagement bei qualitativen Erhebungsverfahren"} -Sammlung von Arbeitspapieren und -berichten, Teil I + II Bernd Wegener Gibt es Sozialprestige? Konstruktion und Validität der Magnitude-Prestige-Skala Scheuring (sub.) Judgments of relationship satisfaction: Inter-and intraindividual Norbert Schwarz B Michael Schneid Datenerhebung am PC -Vergleich der Interviewprogramme "interv " und "THIS" Norbert Schwarz, Bettina Scheuring Die Vergleichsrichtung bestimmt das Ergebnis von Vergleichsprozessen: Ist -Idealdiskrepanzen in der Partnerwahrnehmung Norbert Schwarz, George F. Bishop, Hans-J. Hippler Fritz Strack Psychological Sources Of Response Effects in Self-Administered And Telephone Surveys Allgemeine Bevölkerungsumfrage der Sozialwissenschaften -ALLBUS 1988 -Norbert Schwarz Feelings as Information: Informational and Motivational Functions of Affective States Günter Rothe Jackknife and Bootstrap: Resampling-Verfahren zur Genauigkeitsschätzung von Parameterschätzungen Herbert Bless, Gerd Bohner, Norbert Schwarz und Fritz Strack Happy and Mindless? Moods and the Processing of Persuasive Communications Gerd Bohner Michael Braun Reiner Trometer Michael Wiedenbeck Methodenbericht Norbert Schwarz und Stefan E. Hormuth Die Stimmungs-Skala: Eine deutsche Version des "Mood Survey Dominance and Cooperation Robert Huckfeldt Noncompliance and the Limits of Coercion: The Problematic Enforcement of Unpopular Laws Peter Ph. Mohler, Katja Frehsen und Ute Hauck CUI -Computerunterstützte Inhaltsanalyse Grundzüge und Auswahlbibliographie zu neueren Anwendungen Cornelia Züll, Peter Ph Ulrich Mueller Evolutionary Fundamentals of Social Inequality Norbert Schwarz, Brigitte Chassein, Dieter Kern Rolf Porst Methodische Probleme bei der Durchführung telefonischer Befragungen: Stichprobenziehung und Ermittlung von Zielpersonen, Ausschöpfung und Nonresponse Dirk Wagner The Salience of Comparison Standards and the Activation of Social Norms: Consequences for Judgments of Happiness and their Communication Jutta Kreiselmaier. Qualität der Daten Rainer Mathes Modulsystem und Netzwerktechnik. Neuere inhaltsanalytische Verfahren zur Analyse von Kommunikationsinhalten Margrit Rexroth Der Interviewer im Pretest. Evaluation der Interviewerleistung und Entwurf eines neuen Pretestkonzepts Jutta Kreiselmaier Peter Prüfer Henrik Tham Crime as a Social Indicator Elisabeth Noelle-Neumann Response Order Effects in Dichotomous Questions: The Impact of Administration Mode Norbert Schwarz Thomas Münkel Response Order Effects in Long Lists: Primacy, Recency, and Asymmetric Contrast Effects Wolfgang Meyer Umweltberichterstattung in der Bundesrepublik Deutschland Michael Braun Hans-J. Hippier, Elisabeth Noelle-Neumann Reiner Trometer ALLBUS Bibliographie (8. Fassung, Stand: 30.6. 1989 Günter Rothe Gewichtungen zur Anpassung an Statusvariablen. Eine Untersuchung am ALLBUS 1986 Andreas Bayer Variationen der Fragenreihenfolge als Instrument der Kausalitätsprüfung: Eine Untersuchung zur Neu tralisationstheorie devianten Verhaltens Norbert Schwarz, Fritz Strack, Hans-Peter Mai Assimilation and Contrast Effects in Part-Whole Question Sequences: A Conversational Logic Analysis Norbert Schwarz, Fritz Strack, Hans-J. Hippier, George Bishop The Impact of Administration Mode on Response Effects in Survey Measurement Norbert Schwarz, Herbert Bless, Gerd Bohner Mood and Persuasion: Affective States Influence the Processing of Persuasive Communications Michael Braun Norbert Schwarz Thomas Münkel -J Hans Reiner Trometer ALLBUS-Bibliographie 90 Contrast Effects as a Function of the Dimension Tapped by Preceding Questions Norbert Schwarz Hippler What determines a "Perspective Umfrageforschung: Themen und Befunde eines interdisziplinären Forschungsgebietes Norbert Schwarz, Hans-J. Hippler Response Alternatives: The Impact of their Choice and Presentation Order Achim Koch Externe Vergleichsdaten zum ALLBUS Norbert Schwarz Fritz Strack Context Effects in Attitude Surveys: Applying Cognitive Theory to Social Research Norbert Schwarz Herbert Bless, Fritz Strack, Gisela Klumpp; Fritz Strack, Hans-J. Hippier Kognitionspsychologie und Annette Simons Ease of Retrieval as Information: Another Look at the Availability Heuristic Norbert Schwarz Norbert Schwarz Bärbel Knäuper -J Hans Elisabeth Hippler Noelle-Neumann Numeric Values May Change the Meaning of Scale Labels Denis J. Hilton Conversational Inference and Rational Judgment Leslie Clark Rating Scales Herbert Bless Constructing Reality and Its Alternatives: An Inclusion / Exclusion Model of Assimilation and Contrast Effects in Social Judgment Herbert Bless J Denis F Hilton A ; Roland Gerd Fellhauer Bohner Conversational Model of Causal Explanation Joseph P. Forgas Mood Effects on Interpersonal Preferences: Evidence for Motivated Processing Strategies Joseph P. Forgas Affective Influences on Interpersonal Perception Norbert Schwarz Norbert Schwarz Need for Cognition: Eine Skala zur Erfassung von Engagement und Freude bei Denkaufgaben Norbert Schwarz, Bärbel Knäuper, E. Tory Higgins Der Einfluß von Rangordnungsaufgaben auf nachfolgende Denkprozesse: Zur Aktivierung prozeduraler Sets (xsd:string)
?:linkScore
  • 7.26397 (xsd:float)
?:linkSource
  • GEFUREX pipeline (xsd:string)
?:linkingMethod
  • automatic (xsd:string)
?:mainEntity
?:name
  • ALLBUS 1982 (xsd:string)
is ?:referenceMetadata of
?:toSource
  • gesis (xsd:string)
rdf:type