1. VL1 Evaluationsmodelle und Evaluationsstandards Folgende Evaluationen zählen zu Evaluationen im wissenschaftlichen Sinn A) Filmbesprechungen im Stadtmagazin B) Standardisierte Kundenbefragungen C) Doppelblindversuch zur Prüfung von Medikamentenwirkungen Lösung: c 2. Welches sind wissenschaftliche Standards bei der Evaluation als Bewertung im engeren Sinne? A) Orientierung an psychometrischen Messgütekriterien B) Nachweis, dass psychometrische Gütekriterien gegeben bzw. erfüllt sind C) Versuch, Bewertungen über allgemeine Sachverhalte anzustellen, die über den Einzelfall hinausweisen D) Begründung jeder einzelnen methodischen Entscheidung E) Sicherung der internen Validität F) Kosten-Nutzen-Analyse Lösung: bdef 3. Zu Evaluationen, die auf einzelne Komponenten einer Maßnahme ausgerichtet sind, zählen A) Globale summative Evaluation B) Analytische Qualitätskontrolle C) Globales Qualitätsmanagement D) Analytische formative Evaluation Lösung: bd 4. Das Evaluationsmodell, welches den Prozess der Operationalisierung von Zielerreichungskriterien beschreibt, stammt von A) Owens B) Kirkpatrick&Schenkel C) Stufflbeam D) Tyler E) Posavac&Carey Lösung: d 5. Welcher Zuordnungen im Rahmen verschiedener Evaluationsmodelle stimmen? A) Tyler – Operationalisierung von Zielerreichungskriterien, 5-stufiges Modell B) Stufflebeam – "Adversary Evaluation" Nutzung der Expertise von Evaluatoren, um komplexen Evaluationsgegenstand ohne Statistik optimal zu bewerten/beurteilen C) Owens/Wolf – CIPP-Modell, Context, Input, Prozess, Produkt, Welche Zielsetzung steht im Vordergrund und wie muss die Evaluation geartet sein, um diese optimal zu erfüllen? D) Kirkpatrick/Schenkel – Hierarchie von Wirksamkeitsebenen im Rahmen einer Evaluation E) Posavac/Carey – P&C-Modell, integrativ, starker methodischer Fokus und Anwendungsfokus, Lösung: 6. Was zählt nicht zu den Evaluationsstandards der DeGEval? A) Nützlichkeitsstandards B) Bewertungsstandards C) Durchführbarkeitsstandards D) Fairnesstandards E) Genauigkeitsstandards Lösung: b 7. Unter Genauigkeitsstandards versteht man A) Die Evaluation soll ethischen Richtlinien und moralisch relevanten Bedürfnissen der Betroffenen entsprechen B) Die Evaluation soll den Informationsbedürfnissen der Stakeholder auch tatsächlich Rechnung tragen C) Die Evaluation soll adäquate Informationen über den Evaluationsgegenstand erbringen und methodisch "state of the art" sein D) Die Evaluation soll realistisch, besonnen, ausgewogen, diplomatisch und einfach sein Lösung: c 8. VL2 Wirkung und Wirksamkeit Was verstehen Hager&Hasselhorn unter Wirksamkeit? A) modelltheoretisch angenommene Ursachen für Veränderungen B) beobachtbare Veränderungen Lösung: b 9. Negative Folgen unterwünschten Verhaltens verringern zählt zur A) Primärprävention B) Sekundärprävention C) Tertiärprävention Lösung: c 10. Sexuelle Aufklärung in Schulen zählt zur A) Indizierten Prävention B) Universellen Prävention C) Selektiven Prävention Lösung: c 11. Können noch Wochen nach dem Ernähungscoaching Zuhause gesunde Essgewohnheiten bei adipösen Erwachsenen im Kochalltag Zuhause festgestellt werden, handelt es sich um A) Persistenz B) Situations-Transfer C) Anforderungs-Transfer Lösung: a 12. VL3 Nutzen und Effizienz Was widerspricht der Annahme, dass der objektivierbare Anteil einer Entscheidung so groß wie möglich sein soll? A) Es ist empirisch belegbar, dass ein "statistisches Urteil" einem "klinischen Urteil" in den meisten Fällen überlegen ist B) Meist sind ohne Hilsmittel intuitiv getroffene Urteile besser als vermeintlich rational getroffene Urteile C) Subjektive Urteile sind oft durch irrelevante Faktoren und systematische Verzerrungen wie z.B. Primacy- und Recency-Effekte beeinflusst Lösung: b 13. Unter systematischer Rückkopplung der Struktur subjektiver Urteile zum Zwecke der Reflexion des eigenen Urteilsverhaltens wird folgende diagnostische Entscheidungsstrategie verstanden A) Multimodale und multimethodale Diagnostik B) GAS – Global-Attainment-Scaling C) SJT – Social Judgment Technique D) Delphi-Studie E) MAUT – Multiattributive Nutzentechnologie Lösung: c 14. Welche Diagnostische Entscheidungsstrategie beinhaltet das Problem, dass Kosten kaum oder gar nicht berücksichtig werden? A) MAUT B) GAS C) Delphi Lösung: a 15. Wenn Kosten als auch Nutzen in Geldeinheiten überführt und auf einer gemeinsamen Skala abgetragen werden, spricht man von einer A) Kosten-Effektivitäts-Analyse B) Kosten-Nutzen-Analyse Lösung: b 16. Welche Informationen werden in der Kosten-Nutzen-Analyse nach Brogden (1949) benötigt? A) Standardabweichung der Produktivität B) Nebenkosten pro Intervention C) Wirkungsdauer des Effekts D) Proportionale Überlappung der Effektvariable mit der Produktivität E) Anzahl der Trainierten F) Gesamtkosten pro Intervention G) Effektgrößenmaße für die Intervention Lösung: acdefg 17. VL4 Prospektive und formative Evaluation Unter prospektiver Evaluation versteht man: A) Verbesserung und Optimierung des Programms unter den gegebenen Praxisbedingungen B) Überprüfung, ob die Intervention die größtmögliche Chance hat, wirksam zu sein, VOR der Implementation einer Maßnahme Lösung: b 18. Zur Überprüfung ob die Intervention die größtmögliche Chance hat, wirksam zu sein, sind vor der Implementation einer Maßnahme im Rahmen der Prospektiven Evaluation folgende Inhalte zu klären A) Programmoptimierung B) Konzeptionsanalyse C) Problembestimmung und Bedarfsprüfung D) Implementationskontrolle E) Definition der Zielpopulation F) Definition der Ziele G) Bedingungsanalyse H) Ausschöpfung der Akzeptanz und Monitoring Lösung: bcefg 19. Zur Problembestimmung im Rahmen der prospektiven Evaluation gehören folgende Inhalte: A) Problemlösung B) Problemdefinition C) Problemdiagnose D) Problembewertung Lösung: bcd 20. Fehler, die bei der Problembestimmung auftreten können sind: A) mangelnde Akzeptanz der Betroffenen B) Problemdichte wird falsch eingeschätzt C) Lokalisation des Problems wird falsch eingeschätzt D) Bodeneffekte treten auf E) Problemindikation wird falsch eingeschätzt Lösung: abcde 21. Für die Definition der Ziele im Rahmen der prospektiven Evaluation sind folgende Begrifflichkeiten relevant: A) Ungefähre Definition der Zielzustände B) Konsens über die Zielerreichung C) Zielhierarchien D) Zielzustände als Ausmaß der Verbesserung E) Zielzustände als Ausmaß der Zielverfehlung F) Goal Attainment Scaling (GAS) G) Consensus Panel Lösung: bcdfg 22. Was muss im Rahmen von Konzeptionsanalysen geklärt werden? A) Sind die Ziele der Maßnahme eindeutig definiert und operationalisierbar? B) Ist die Zielerreichung empirisch erfassbar? C) Ist eine Supervision vorgesehen? D) Sind Wirkmechanismen theoretisch gut begründet und empirisch gestützt? E) Sind Teilnehmer über die Ziele der Maßnahme informiert und motiviert? F) Verfügen die Personen, die für die Durchführung der Maßnahme zuständig sind über die nötigen Voraussetzungen? G) Sind die einzelnen Komponenten der Maßnahme, ihre Funktion sowie die notwendigen Arbeitsschritte hinreichend definiert? Lösung: abdg 23. Was muss ihm Rahmen von Bedingungsanalysen geklärt werden? A) Sind die angestrebten Ziele realistisch? B) Liegen alle Materialien vor, die für die Durchführung der Maßnahme benötigt werden? C) Verfügt die Maßnahme über die nötige Akzeptanz? D) Ist hinreichend gut geklärt, wie die Zielgruppe identifiziert werden kann? E) Verfügen die Teilnehmer über die nötigen Entwicklungs- und Persönlichkeitsvoraussetzungen? F) Sind die personellen, räumlichen, zeitlichen, rechtlichen und finanziellen Voraussetzungen gegeben? Lösung: bcef 24. Was versteht man unter Underinclusion? A) Falsche Positive (ist nicht betroffen, nimmt aber Teil) B) Richtig Positive (ist betroffen und nimmt Teil) C) Falsche Negative (ist betroffen, nimmt aber nicht Teil) D) Richtig Negative (ist nicht betroffen und nimmt nicht Teil) Lösung: c 25. Den Austausch von Stakeholdergruppen im Rahmen der Konsensfeststellung über die Zielerreichung nennt man A) Goal Attainment Scaling B) Return on Investment C) Consensus Panel D) Overinclusion Lösung: c 26. Wichtige Bestandteile der formativen Evaluation sind: A) Programmoptimierung B) Bedingungsanalyse C) Implementationskontrolle D) treatment fidelity E) program monitoring F) Konzeptionsanalyse Lösung: acde 27. Leitfragen zur formativen Evaluation betreffen die Bereiche A) Bedarfsprüfung B) Ausschöpfung und Akzeptanz C) Konzeptionsanalyse D) Kontextbedingungen E) Monitoring F) Ziele und Wirksamkeit Lösung: bdef 28. Welche Leitfragen prüfen den Bereich Ausschöpfung und Akzeptanz der formativen Evaluation? A) Gibt es "Underinclusion" oder "Overinclusion"? B) Ist das Programm unter den gegebenen Kontextbedingungen machbar? C) Zeichnet sich ein systematischer "Drop-out" im Programmverlauf ab? D) Wird das Programm wie vorgesehen durchgeführt? E) Erweisen sich Programmziele als revisions- oder präzisionsbedürftig? F) Wurde die Zielgruppe erreicht? G) Wie hoch ist die Akzeptanz des Programms seitens der Beteiligten? Lösung: acfg 29. Welche methodischen Ansätze werden bei der prospektiven/formativen Evaluation u.a. häufig angewandt? A) Längsschnittstudien B) Diskussion in Fokusgruppen C) Interview D) Feedback-Runde E) Beobachtungen Lösung: bcde 30. Was kennzeichnet Kommunikationspläne im Rahmen von Evaluationen? A) Sie werden während dem Evaluationsprozess erstellt B) Sie werden nach dem Evaluationsprozess erstellt C) Sie werden vor Beginn des Evaluationsprozesses erstellt Lösung: c 31. VL5 Operationalisierung von Wirksamkeitskriterien Welcher Ablauf zur Überführung eines Interventionsziels in einen beobachtbaren Wert ist korrekt? A) Indikatoren --> Kriterien --> Zielzustand --> Oberziel B) Kriterien --> Oberziel --> Indikatoren --> Zielzustand C) Oberziel --> Zielzustand --> Kriterien --> Indikatoren D) Oberziel --> Kriterien --> Zielzustand --> Indikatoren Lösung: c 32. Welche Begriffe sind nicht Inhalt der Fragestellung zum Zweck der Operationalisierung? A) Dienstleister und Evaluationskonzept B) Datenquellen und Datenerhebungsmethoden C) Ebenen, auf welchen das Wirksamkeitskriterium variiert D) Oberziel, Teilziele und Zielzustände E) Definition und Messung des Wirksamkeitskriteriums Lösung: a 33. Wenn das Kriterium auf einer höheren Generalitätsebene angesiedelt ist als der Zielzustand ist dies auf das Problem zurückzuführen, dass A) das Kriterium nicht reliabel und/oder konstruktvalide erfasst wird B) es in der Evaluationsstichprobe overinclusion oder underinclusion gibt C) das Messinstrument nicht den Voraussetzungen der Teilnehmenden entspricht D) das Kriterium den Zielzustand nur unzureichend abbildet Lösung: d 34. Ist die Datenerfassung mit starken Messfehlern behaftet oder misst das Messinstrument nicht das, was es messen soll, ist dies ein Hinweis darauf, dass A) es keine Passung zwischen der Intervention und dem angestrebten Zielzustand gibt B) das Kriterium nicht reliabel und und/oder konstruktvalide erfasst wird C) es in der Evaluationsstichprobe overinclusion oder underinclusion gibt D) die Wirksamkeit zu einem Zeitpunkt gemessen wird, zu dem die Wirkung noch gar nicht eingetreten ist Lösung: b 35. Unter Multimodaler Diagnostik versteht man A) die Nutzung unterschiedlicher Herangehensweisen oder Datenquellen zur Erhöhung der Reliabilität und der Konstruktvalidität B) die Messung unterschiedlicher Facetten eines Konstrukts C) die Kombination quantitativer und qualitativer Methoden D) das Messen von Verhaltensbereitschaften und Einstellungen Lösung: bd 36. Welche Zuordnung von Methoden zu den vier Wirksamkeitsebenen im Rahmen der multimethodalen Diagnostik nach Kirkpatrick ist richtig? A) Verhalten --> Feedback-Gespräche B) Reaktion --> Fragebogen C) Verhalten --> Fremdeinschätzungen D) Lernen --> Wissens-Tests E) Outcome --> Verhaltensbeobachtung Lösung: bcd 37. Welche Nachteile haben Selbstauskünfte (Fragebögen) als Methode der Datengewinnung? A) keine direkte Messung möglich B) Verankerungseffekte können auftreten C) sie sind nicht ökonomisch D) Subjektive Theorien mindern die Konstruktvalidität E) Personen können evt. invalide oder gar keine kognitiven Repräsentationen von dem zu messenden Konstrukt haben Lösung: bde 38. Verhaltensmaße als Methode der Datengewinnung basieren auf der Annahme, dass A) Fremde das fragliche Verhalten besser und verzerrungsfreier einschätzen können als man selbst B) eine Person selbst am besten über sich Bescheid weiß C) je verhaltensnäher die Messung ist, desto valider ist der jeweilige Indikator D) Eigenschaften gemessen werden können, ohne dass die Messung verfälscht ist und ohne dass die Probanden ein explizites Selbstkonzept haben brauchen Lösung: c 39. Welche Verfahren werden zur Datengewinnung reaktiver Verhaltensmaße verwendet? A) CRTT B) Hot Sauce Paradigm C) BAV D) BAVIS E) IAT Lösung: ab 40. Welche Verfahren kommen bei Fremdeinschätzungen zum Tragen? A) Rollenspiel B) Peer-Nominations-Verfahren C) Soziometrische Verfahren D) Word Completion Task E) CBCL-4-18 Lösung: bce 41. Lexikalische Entscheidungsaufgabe und Story-Stems zählen zu A) Projektiven Verfahren B) Verfahren zur Fremdeinschätzung C) Verfahren für Verhaltensmaße D) Selbstauskunftsverfahren E) Indirekte/implizite Verfahren Lösung: e 42. Zu den Methoden projektiver Verfahren gehören A) PFT B) TAT C) AMG D) CRTT E) IAT Lösung: abc 43. Quasi-indirekte Veränderungsmessung bedeutet A) Person wird direkt gefragt, wie sehr sie sich verändert hat B) Beteiligte werden zum Zeitpunkt des Posttests danach befragt, wie die Merkmalsausprägung zum Zeitpunkt des Prätests gewesen war (Retrospective Pretest) C) Messung vor und nach der Intervention Lösung: b 44. Was sind Nachteile Indirekter Veränderungsmessung? A) Confirmation bias, selektive Gedächtniseffekte, Assimilations- oder Kontrasteffekte B) Aufforderungscharakter C) Positionseffekte (Ermüdung, Erinnerung, Testübung) D) demand Charakteristics E) Übertragungseffekte (carry over Effekte, Priming) F) Zwischenzeitliches Geschehen G) Kontrolle von response shifts Lösung: cefg 45. VL6 Evaluationsdesigns Wenn in einem Experiment die zur AV erhobenen Messwerte eindeutig – also "artefaktfrei" – auf die als UV manipulierten Versuchsbedingungen zurückzuführen sind, dass also keine wissenschaftlich plausiblen alternativen Erklärungen für das Zustandekommen dieses Effekts angeführt werden können, spricht man von A) Konstruktvalidität B) Externer Validität C) Interner Validität D) Valdidität des statistischen Schlusses Lösung: c 46. Eine Gefahr für die interne Validität kann darin liegen, dass sich die zu vergleichenden Gruppen in Merkmalen unterscheiden, die mit der AV korreliert sind. Diesen bedrohenden Einfluss nennt man: A) selection B) maturation C) history Lösung: a 47. Unter welchen Voraussetzungen kann ein Einschluss einer Kontrollgruppe zur Kontrolle von Geschichts- und Reifungseinflüssen vorgenommen werden? A) KG muss sich von der TG (Treatmentgruppe) unterscheiden B) KG muss mit der TG identisch sein C) KG muss mit der TG vergleichbar sein D) KG und TG müssen aus der gleichen Population stammen Lösung: cd 48. Welche Zuweisungsarten von Personen zu Treatment- vs. Kontrollgruppe zählen zu Quasi- Experimenten? A) keine Zuweisung, bereits vorher festgelegte Gruppenzugehörigkeit B) Randomisierung C) Parallelisierung D) Selbstselektion Lösung: acd 49. Welches Quasi-experimentelle Design mit Kontrollgruppen wird in der Praxis am Häufigsten verwendet? A) Zwei-Gruppen-Design mit vertauschter Replikation B) Zwei-Gruppen-Design mit multiplen Prätests C) Zwei-Gruppen-Prä-Posttest-Design D) Zwei-Gruppen-Posttest-Design Lösung: c (laut Vorlesung) 50. Welches Design ohne Kontrollgruppen ist ein Beispiel für ein Prinzip zur Erhöhung der internen Validität, indem abhängige Variablen, für die keine Treatment-Wirksamkeit erwartet wird, in das Design hinzugenommen werden und damit den Komplexitätsgrad erhöhen? A) Design mit Treatment-Wiederholung B) Ein-Gruppen-Design mit multiplen Prätests C) Design mit Treatment-Entfernung Lösung: c 51. Welche Prinzipien zur Erhöhung der internen Validität quasi-experimenteller Designs schlagen Shadish et.al vor? A) Kontrolle potentieller Störvariablen mit Hilfe eines geeigneten Designs oder statistischer Kontrolle B) Erhöhung der Änderungssensitivität der Messinstrumente C) Identifikation und Überprüfung potentieller Faktoren, die die interne Validität bedrohen D) Erhöhung des Komplexitätsgrad eines Designs zur Testung differentieller Befundmuster Lösung: acd 52. Richtig oder Falsch? Bei Quasi-Experimenten ist die Vergleichbarkeit der Prätestwerte eine notwendige, aber keine hinreichende Bedingung für die Voraussetzung, dass KG und TG vergleichbar sind. Die beiden Stichproben könnten sich auch noch in anderen Merkmalen (welche ihrerseits mit der Veränderung korreliert sind) systematisch voneinander unterscheiden. A) Richtig B) Falsch Lösung: a 53. Welche Vorteile hat die Parallelisierung? (Art der Zuweisung von Personen zu Treatment- vs. Kontrollgruppe) A) die Störvariable muss nicht bekannt sein B) bei organismischen Störvariablen geeignet C) im Idealfall ist die Störvariable dadurch in allen Bedingungen ungleich verteilt D) ist auch bei kleinen Stichproben effektiv E) ist nicht aufwändig Lösung: bd 54. Unter Simpson-Paradox versteht man A) Nicht-Äquivalenten in anderen Störvariablen B) Nach Subgruppen (Geschlecht) getrennt, zeigen sich in der TG höhere Werte als in der KG. Über die Subgruppen hinweg verkehrt sich dieser Effekt D) Äquivalenten in anderen Störvariablen Lösung: ab 55. Welche Tipps für die Parallelisierung sind zu empfehlen? A) Univariate Parallelisierung B) Geringere Kontrolleinheiten pro Treatmenteinheit C) Parallelisierung nach Störvariablen die instabil bleiben und reliabel gemessen werden können D) Stichproben sollten von vornherein auf möglichst vielen Merkmalen vergleichbar sein E) Personen als Kontrollgruppe wählen, die sich zu spät für die Maßnahme angemeldet haben F) Propensity Score Matching (vorhergesagte Wahrscheinlichkeit für die Zugehörigkeit zu KG oder TG auf der Basis einer multiplen logistischen Regression) Lösung: def 56. Welcher Vergleich von Gruppen bietet sich im Schulkontext besonders an? A) Propensity Score Matching B) Kohorten-Kontrollgruppen C) Solomon-Vier-Gruppen-Plan Lösung: b 57. Was versteht man unter Differenzieller Attrition als Gefahr für die interne Validität bei Kontrollgruppendesign? A) Unterschiedliche "natürliche" Veränderungsverläufe in den verschiedenen Gruppen B) Unterschiedliche Geschehnisse in den verschiedenen Gruppen C) Die drop-out-Rate unterscheidet sich zwischen den Gruppen (und korreliert mit der AV) D) Die Messinstrumente sind in verschiedenen Gruppen durch unterschiedliche validitätsgefährdende Faktoren beeinflusst E) Statistische (messfehlerbedingte) Artefakte beeinflussen die Ergebnisse in verschiedenen Gruppen unterschiedlich Lösung: c 58. Mit der Frage, ob sich im Rahmen eines Kontrollgruppendesigns das Befundmuster auch auf Variablen zeigt, die weniger sensitiv für Veränderungen sind, kann man was überprüfen? A) Validitätsunterschiede B) differenzielle Regressionseffekte C) differenzielle Reifungseffekte Lösung: c 59. Welche Aspekte Randomisierter Evaluationsdesigns sind korrekt? A) Der Erwartungswert aller Variablen unterscheidet sich zum Prätest zwischen den Gruppen B) Sie ist auch bei kleinen Stichproben effektiv C) Konfundierungen werden unwahrscheinlich, die interne Validität des Designs ist daher meist höher D) Randomisierung ist ethisch unproblematisch E) Randomisierung ist sehr leicht durchführbar F) Die Residualvarianz innerhalb der Gruppen ist ein konsistenter Schätzer der Populationsresidualvarianz Lösung: cf 60. VL7 Testung von Veränderungshypothesen Als "Split-plot design" bezeichnet man eine A) Regressionsanalyse B) Kovarianzanalyse C) Zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor Lösung: c 61. In einern zweifaktoriellen Varianzanalyse (VA) mit Faktor A: Bedingung: Kontroll- vs. Treatmentgruppe und Faktor B: Messzeitpunkt: vorher, nachher, follow-up ist der "between-subject- faktor" A) der Bedingungsfaktor B) der Messwiederholungsfaktor C) der Gesamtmittelwert D) der unverzerrte Schätzer der Populationsvarianz Lösung: a 62. Die inferenzstatistische Abischerung im Modell der zweifaktoriellen VA mit Messwiederholung besagt, dass A) Für jeden zu testenden Effekt ein Quotient (mit der MQS des jeweiligen Effekts im Nenner) gebildet werden muss, für den gilt, dass sich Zähler und Nenner unter Gültigkeit der jeweiligen Nullhypothese nur durch Zufall unterscheiden dürften B) Für jeden zu testenden Effekt ein Quotient (mit der MQS des jeweiligen Effekts im Zähler) gebildet werden muss, für den gilt, dass sich Zähler und Nenner unter Gültigkeit der jeweiligen Nullhypothese nur durch Zufall unterscheiden dürften C) Für jeden zu testenden Effekt ein Quotient (mit der MQS des jeweiligen Effekts im Zähler) gebildet werden muss, für den gilt, dass sich Zähler und Nenner unter Gültigkeit der jeweiligen Nullhypothese nur systematisch unterscheiden dürften Lösung: b 63. Folgende Formel ist zur Testung der statistischen Bedeutsamkeit der Interaktion zwischen Zeit und Bedingungen (Wechselwirkung) richtig: A) FA = MQSA / MQS Pers inn A B) FAxB = MQSAxB / MQSRes C) FB = MQSB / MQSRes Lösung: b 64. Folgende Annahmen und Voraussetzungen sind im Rahmen der zweifaktoriellen VA mit Messwiederholung relevant A) Stochastischeh Abhängigkeit der Beobachtungen B) Sphärizität bzw. Zirkularität der Varianz-Kovarianz-Matrix der Stufen des messwiederholten Faktors (B) C) Homogenität der Varianz-Kovarianz-Matrizen zwischen den Stufen des nicht-messwiederholten Faktors (A) D) Multivariate Normalverteilung der Variablen Lösung: bcd 65. Wird die Voraussetzung der Sphärizität verletzt, (besagt, dass die Varianzen aller möglichen Differenzvariablen homogen sein müssen) führt hat dies folgende Konsequenzen: A) der F-Test wird zu liberal B) das Risiko des alpha-Fehlers wird gesenkt C) man kommt zu schnell zu der Aussage, dass die Intervention wirkt, d.h. dass es differenzielle Veränderungen gibt Lösung: ac 66. Die Sphärizitätsannahme ist meist dann verletzt, wenn A) es multiple Posttests gibt B) jede Person in gleicher Weise auf das Treatment reagiert C) es differenzielle Treatment-Effekte gibt D) es multiple Pretests gibt Lösung: cd 67. Welche Verfahren werden zur Überprüfung der Sphärizitätsannahme eingesetzt? A) Greenhouse-Geisser-Epsilon B) Mauchly-Test C) Autoregressormodell D) Test auf Homogenität der Varianz-Kovarianz-Matrizen des nicht-messwiederholten Faktors A Lösung: ab 68. Was zählt zu möglichen Strategien bei Verletzung der Sphärizitätsannahme? A) Analyse der Daten mit Regressionsmodellen, die keine Sphärizität voraussetzen B) Multivariate Kontrastanalyse C) Univariate Kontrastanalyse D) Korrektur der Freiheitsgrade des entsprechenden F-Tests durch Multiplikation mit dem Schätzer für Epsilon (nach Greenhouse-Geisser oder Huynh-Feldt) Lösung: abd 69. Ist man an interindividuellen Unterschieden zwischen Treatment- und Kontrollgruppe interessiert, sollte man welches Effektstärkemaß verwenden? A) δV, welches angibt, um wie viele Einheiten die an der Streuung des Merkmals standardisierte Veränderung zwischen t1 und t2 in der TG höher ist als in der KG B) δTK, welches angibt, um wie viele Einheiten die an der Streuung des Merkmals standardisierte Veränderung zwischen t1 und t2 in der TG höher ist als in der KG C) δV, welches angibt, um wieviele Einheiten die ander Streuung der Differenz standardisierte Veränderung zwischen t1 und t2 in der TG höher ist, als in der KG Lösung: c 70. Als Alternative zur ANOVA kann auch folgendes Modell gewählt werden: A) Kovarianzanalyse (ANCOVA) mit Prätestwerten als Kovariate B) Kovarianzanalyse (ANCOVA) mit Posttestwerten als Kovariate C) Auoregressormodell D) Kovarianzanalyse (ANCOVA) mit Prätestwerten als abhängige Variable Lösung: ac 71. Kovarianzanalysen werden vor allem aufgrund folgender Aspekte typischerweise bei quasi- experimentellen Designs verwendet: A) Erhöhung der Power B) Verringerung der Fehlervarianz C) Ausschluss potenzieller Alternativerklärungen D) wenn es zwischen den Gruppen Vortestunterschiede gibt Lösung: cd 72. Welche Voraussetzungen sollten bei der Kovarianzanalyse mit Prätestwerten als Kovariate gegeben sein? A) Die Kovariate muss messfehlerfrei gemessen sein B) Homskedastizität C) Inkonstante bedingte Residualvarianzen D) Es darf keine Interaktion zwischen der Kovariate und der dichotomen UV auf die AV geben Lösung: abd 73. Vorhandene differenzielle Treatment-Effekte führen dazu, dass A) eine Interaktion zwischen der Kovariate und der dichotomen UV auf die AV plausibel ausgeschlossen werden kann B) eine nicht-vorhandene Interaktion als unplausibel anzusehen ist Lösung: b 74. Unrealibilität (Messungenauigkeit) der Prätest-Variablen (T1) hat folgenden Einfluss auf die Schätzung der Regressionsgewichte: A) die (Auto-)Korrelation zwischen Prätest und Posttest ist (fast) immer größer als 1, sie wird durch den Messfehler überschätzt B) Je geringer die Reliabilität der Prätest- und der Posttestvariable, desto größer ist die Autokorrelation C) die erwartete Mittelwertsdifferenz zwischen der TG und KG zum Posttest wird überschätzt Lösung: c 75. Wenn ist eine ANCOVA, in der die Prätestvariable als Kovariate eingeht sinnvoll? Wenn A) die Korrelation zwischen Prä- und Posttest in beiden Gruppen gleich ist B) die Prätestvariable eine sehr geringe Reliabilität aufweist C) die Hypothese, dass das Ausmaß der Veränderung systematisch vom Ausgangswert abhängt, plausibel oder empirisch anzunehmen ist D) die Homoskedastizitätsannahme nicht allzu sehr verletzt ist Lösung: ad 76. Kennzeichen von Regressionsmodellen zur Modellierung und Testung von Veränderungen sind A) Differenzielle Veränderungen, die auf unterschiedliche Treatment-Bedingungen zurückgehen, werden als Interaktionseffekte (Zeit x Bedingung) modelliert B) die zentrale Prädiktorvariable ist die Zeit, die nur als kontinuierliche Variable betrachtet werden kann C) es handelt sich formal um Mehrebenenmodelle D) die Kriteriumsvariable ist die Ausprägung unterschiedlicher Personen zu unterschiedlichen Messzeitpunkten Lösung: acd 77. Wird der Faktor Zeit als kontinulierliche Variable in einem Wachstumskurvenmodell ohne Veränderungsprädiktor aufgenommen, A) wird angenommen, dass die Veränderung nicht linear ist. Jede Person bekommt ein gemeinsames Intercept und einen gemeinsamen Slope B) wird angenommen, dass die Veränderung linear ist, jede Person bekommt ein eigenes Intercept und einen eigenen Slope C) gilt als Voraussetzung, dass die Messungen keine gleichen Abstände haben müssen D) gilt als Voraussetzung, dass die Zeit sinnvoll codiert sein muss E) gilt als Voraussetzung, dass Äquidistanz gegeben sein muss Lösung: bde 78. Im Wachstumskurvenmodell ohne Veränderungsprädiktor weist eine Positive Kovarianz zwischen Random Intercept (u0) und Random Slope (u1) darauf hin, dass A) Je höher die Merkmalsausprägung einer Person bei t = 0 (Intercept), desto stärker positiv ist der Anstieg über die Zeit hinweg (Slope) B) Je höher die Merkmalsausprägung einer Person bei t = 0 (Intercept), desto schwächer positiv ist der Anstieg über die Zeit hinweg (Slope) C) Je höher die Merkmalsausprägung einer Person bei t = 0 (Intercept), desto schwächer negativ ist der Anstieg über die Zeit hinweg (Slope) D) Je höher die Merkmalsausprägung einer Person bei t = 0 (Intercept), desto stärker negativ ist der Anstieg über die Zeit hinweg (Slope) Lösung: ac 79. Wird ein Veränderungsprädiktor in ein Wachstumskurvenmodell aufgenommen, gilt als logische Annahme, dass A) das Intercept einer Person sowie der Slope einer Person nicht davon abhängt, ob die Person in der TG oder der KG war B) das Intercept einer Person sowie der Slope einer Person davon abhängt, ob die Person in der TG oder der KG war C) die Merkmalsausprägung einer Person zu t = 1 und die Veränderung in der Ausprägung einer Person zwischen zwei Messzeitpunkten davon abhängt, ob die Person in der TG oder der KG war D) die Merkmalsausprägung einer Person zu t = 0 und die Veränderung in der Ausprägung einer Person zwischen zwei Messzeitpunkten davon abhängt, ob die Person in der TG oder der KG war Lösung: bd 80. Wird der Faktor Zeit in einem Multivariaten Multilevel-Modell ohne Veränderungsprädiktor als kategoriale Variable aufgenommen, A) gibt es keinen Residualterm emj B) beschreibt das Modell die Daten vollständig C) ist das Modell als eine Tautologie anzusehen D) muss das Modell getestet werden E) können als kategoriale Variablen Dummyvariablen verwendet werden Lösung: abce