Therapeuten unterscheiden sich hinsichtlich der Therapieergebnisse ihrer Patienten. Von zentraler Bedeutung für diesen sog. Therapeuteneffekt sind wahrscheinlich die allgemeinen interpersonellen Fähigkeiten des Therapeuten. Eines der wenigen Instrumente, die Aspekte dieser Fähigkeiten messen, ist die Facilitative-interpersonal-skills(FIS)-Übung. In der FIS-Übung reagieren die Teilnehmenden verbal auf herausfordernde Therapiesituationen, die in Videoclips nachgestellt wurden. Die audioaufgezeichneten Reaktionen werden von geschulten Ratern beurteilt.

Grundlagen

Der Therapeuteneffekt und Therapeutenfaktoren

Therapeuten unterscheiden sich hinsichtlich der Therapieergebnisse ihrer Patienten. Ungefähr 5–9 % der Varianz des Therapieerfolgs können auf den mittlerweile gut belegten sog. Therapeuteneffekt zurückgeführt werden (Baldwin und Imel 2013; Crits-Christoph et al. 1991). Neben der Veränderung in der Symptomatik zeigt sich ein solcher Therapeuteneffekt auch für die Wahrscheinlichkeit eines Therapieabbruchs (Gries et al. 2020; Zimmermann et al. 2017) und die Qualität der therapeutischen Allianz (Del Re et al. 2012). Auch wenn der generelle Therapeuteneffekt als gut nachgewiesen gilt, fehlt es bisher noch an Kenntnissen, welche Therapeutenfaktoren im Detail diese Unterschiede zwischen Therapeuten begründen (Gries et al. 2020; Heinonen und Nissen-Lie 2020a). Kenntnisse hierzu sind jedoch entscheidend für die Auswahl sowie für die Aus- und Weiterbildung von Psychotherapeuten und damit langfristig für erfolgreichere Psychotherapien.

Es ist ein zentrales Anliegen der Psychotherapie- und Ausbildungsforschung, Kenntnisse zu Therapeutenfaktoren, die den Therapeuteneffekt erklären, systematisch zu erfassen. Die bislang stärksten empirischen Hinweise zu Therapeutenfaktoren deuten auf die Bedeutsamkeit von allgemeinen interpersonellen Fähigkeiten und Eigenschaften wie Empathie und positive Wertschätzung hin (Heinonen und Nissen-Lie 2020b; Norcross und Lambert 2018).

Binder und Strupp (1997) arbeiteten heraus, dass es für Therapeuten schwierig sein kann, eine gute Therapiebeziehung aufrechtzuerhalten, v. a., wenn es zu feindseligen Interaktionen mit Patienten kommt („negative therapeutic process“). Eine aktuelle Metaanalyse (Eubanks et al. 2018) zeigte, welche Bedeutung ein gelingender Umgang mit derartigen Verwicklungen in der Therapiebeziehung hat. Die Autoren fassten die Ergebnisse von bisher 11 vorliegenden Studien zum Effekt der Auflösung von Spannungen und Krisen in der Therapiebeziehung („alliance ruptures“) auf das Therapieergebnis zusammen. Der insgesamt moderate Zusammenhang bestand unabhängig von der therapeutischen Vorerfahrung, der Therapiedauer, der Therapiemethode, der Methode, „alliance ruptures“ zu erfassen, und auch unabhängig davon, ob die Patienten eine diagnostizierte Persönlichkeitsstörung aufwiesen. Weitere Übersichtsarbeiten weisen darauf hin, dass der erfolgreiche Umgang mit schwierigen Gegenübertragungsreaktionen sowohl auf verbaler als auch nonverbaler Ebene zu besseren Therapieergebnissen beiträgt (Benecke et al. 2005; Hayes et al. 2018).

Einige Autoren konnten eine direkte Verbindung zwischen interpersonellen Fähigkeiten von Therapeuten, die von unabhängigen Ratern beurteilt wurden, und dem Therapieergebnis herstellen (Anderson et al. 2016a, 2016b; Schöttke et al. 2017).

Messen interpersoneller Fähigkeiten von Therapeuten

Für eine standardisierte (vom individuellen Patienten unabhängige) Erhebung von Therapeutenfaktoren sind geeignete Messinstrumente erforderlich. Solche Instrumente sind nicht nur zur weiteren Forschung auf diesem Gebiet notwendig und nützlich. Auch für Auswahlverfahren sowie für die psychotherapeutische Aus- und Weiterbildung haben sie hohe praktische Relevanz. Die Reform der Psychotherapieausbildung verlangt eine deutlich stärkere berufspraktische Orientierung im Studium. Hierdurch werden solche Instrumente gefragter denn je sein. So sieht die neue Approbationsordnung u. a. vor, dass psychotherapeutische Kompetenzen im Rahmen von „objective structured clinical examinations“ erfasst werden (OSCE; Bundesministerium für Gesundheit 2019). Dieses Prüfungsformat sowie generell die Arbeit mit simulierten und virtuellen Patienten kommt im Medizinstudium bereits langjährig zum Einsatz. Untersuchungen in diesem Kontext zeigen, dass die Arbeit mit simulierten und virtuellen Patienten eine nützliche und effektive Lernmethode sowohl als additive Ressource als auch im Vergleich zu herkömmlichen didaktischen Konzepten darstellt (Consorti et al. 2012). Allerdings deuten metaanalytische Ergebnisse (k = 39 Einzelstudien) auch darauf, dass OSCE-Bewertungen oft nicht reliabel sind und insbesondere die zwischen Prüfern übereinstimmende Erfassung von interpersonellen Fähigkeiten (vs. praktisch-medizinischen Kompetenzen) eine Schwierigkeit darstellt (Brannick et al. 2011).

Dem Wissen der Autoren des vorliegenden Beitrags nach existieren momentan nur 2 empirisch fundierte Instrumente zur Erhebung von interpersonellen Therapeutenfaktoren: 1. „therapy-related Interpersonal behaviors“ (TRIB; Schöttke et al. 2017) und 2. FIS (Anderson et al. 2009; Gumz et al. 2018). Beim TRIB (Schöttke et al. 2017) wird die interpersonelle Kompetenz von Therapeuten erfasst, indem unabhängige Rater das Verhalten der Therapeuten in einer Gruppendiskussion beurteilen. Die FIS-Übung (Anderson et al. 2009; Gumz et al. 2018) steht im Zentrum vorliegender Studie.

Die Facilitative-interpersonal-skills-Übung

Anderson et al. (2009) entwickelten eine Methode, interpersonelle Fähigkeiten von Therapeuten zu messen, um die individuelle Bedeutung des Therapeuten und allgemeine therapeutische Wirkfaktoren therapieschulenunabhängig näher erforschen zu können. Mit diesen interpersonellen Fähigkeiten sind erlernte emotionale und interpersonelle Verhaltensmuster gemeint, die dazu verhelfen, mit schwierigen und komplexen interpersonellen Situationen effektiver umzugehen. Personen mit diesen Fähigkeiten sind in der Lage, ein breites Spektrum interpersoneller Botschaften wahrzunehmen, zu verstehen und zu vermitteln, und können gut zu Problemlösungen und neuen Verhaltensmustern motivieren (Anderson et al. 2009). Gemessen werden die interpersonellen Fähigkeiten in einer Übung mit simulierten Patienten ähnlich den OSCE. Bei der FIS-Übung reagieren die Testteilnehmer verbal auf simulierte herausfordernde Therapiesituationen, die in Videoclips nachgestellt wurden. Die audioaufgezeichneten Reaktionen werden von geschulten Ratern im Hinblick auf folgende 8 interpersonelle Fähigkeiten beurteilt: die verbale Ausdrucksfähigkeit, die Fähigkeit, Hoffnung und positive Erwartungen zu vermitteln, die Fähigkeit, glaubwürdig und überzeugend zu sein, die emotionale Ausdrucksfähigkeit, die Fähigkeit, Wärme, Akzeptanz und Verständnis zu vermitteln, die Fähigkeit empathisch zu reagieren, die Bündnisfähigkeit sowie die Fähigkeit, vorhandene Spannungen und Krisen aufzugreifen (Gumz et al. 2018).

In weiterführenden Studien konnte die Autorengruppe zeigen, dass die mithilfe der FIS-Übung gemessenen interpersonellen Fähigkeiten von Therapeuten das Therapieergebnis der Patienten vorhersagen (Anderson et al. 2016a, 2016b).

Die Forschungsgruppe der Autoren des vorliegenden Beitrags entwickelte in Kooperation mit den Originalautoren eine deutschsprachige Version der FIS-Übung. Dies umfasste die Produktion von 13 Videoclips sowie die Übersetzung und psychometrische Prüfung des zugehörigen FIS-Manuals (Gumz et al. 2018; Munder et al. 2019). In der ersten Untersuchung von 39 Ausbildungskandidaten konnten eine hohe Interrater-Reliabilität und interne Konsistenz gezeigt werden (Munder et al. 2019).

Ziele

  1. 1.

    Die deutschsprachige Version der FIS-Übung vorzustellen,

  2. 2.

    psychometrische und deskriptive Eigenschaften an einer größeren Stichprobe zu prüfen (Gesamtwert, Item-Werte, Interrater-Reliabilität, interne Konsistenz, Item-Schwierigkeiten und Mittwertunterschiede zwischen Clips und Clippositionen),

  3. 3.

    Zusammenhänge des FIS-Gesamtwerts mit Alter, Geschlecht und Ausbildungsstand der Durchführenden der FIS-Übung zu untersuchen.

Aus den Befunden werden Empfehlungen für den Einsatz der FIS-Übung in Forschung, Aus- und Weiterbildung abgeleitet.

Material und Methoden

Studiendesign

Die vorliegende Querschnittsuntersuchung ist Teil eines größeren Forschungsprojekts, das sich mit der deutschsprachigen Version der FIS-Übung beschäftigt. Neben den vorliegenden Auswertungen verfolgt das Projekt perspektivisch das Ziel, interpersonell kompetentes Verhalten näher zu charakterisieren sowie Zusammenhänge zwischen hilfreichen interpersonellen Fähigkeiten, anderen Merkmalen und Eigenschaften von Therapeuten sowie den Therapieergebnissen ihrer Patienten zu untersuchen.

Ein- und Ausschlusskriterien und Rekrutierung

An der Studie konnten Psychologiestudierende (Bachelor, Master) und Psychologen in psychotherapeutischer Ausbildung teilnehmen. Ausgeschlossen wurden Personen, die über Vorwissen zur FIS-Übung verfügten. Die Rekrutierung der Studienteilnehmer fand über institutsinterne E‑Mail-Verteiler der Psychologischen Hochschule Berlin (PHB) und der Berliner Akademie für Psychotherapie (BAP) sowie über Werbung für die Teilnahme in Seminaren und Vorlesungen und über Mundpropaganda statt.

Datenerhebung

Die Datenerhebung gliederte sich jeweils in 2 Abschnitte: 1. Beantwortung von Fragebogen (online, einschließlich soziodemografischer Informationen) und 2. FIS-Übung, einschließlich anschließender Selbsteinschätzung. Bei Interesse erhielten die Teilnehmer nach Abschluss ihrer Teilnahme Informationsmaterial zu den theoretischen und empirischen Hintergründen sowie eine individuelle Rückmeldung zu den Ergebnissen ihrer FIS-Übung und ihrer Fragebogenantworten.

Facilitative-interpersonal-skills-Übung

Aufbau und Ablauf

Die FIS-Übung ist eine therapieschulenunabhängige Simulation, bei der die Teilnehmer spontan auf Äußerungen von Patienten so reagieren sollen, als wenn sie der Therapeut wären. Die Patientenäußerungen sind in kurzen Videoclips dargestellt. Zum Zeitpunkt der Entwicklung der deutschsprachigen Version der FIS-Übung existierten insgesamt 9 englischsprachige FIS-Clips. Diese 9 Clips wurden möglichst originalgetreu übersetzt und nachgedreht. Das Set wurde um zusätzliche 4 Clips mit typischen Szenen aus dem deutschsprachigen Therapiealltag erweitertet, um kulturspezifische Unterschiede zu berücksichtigen. Die deutschsprachige Version der FIS-Übung besteht somit aus 13 Videoclips. Weitere Details zur Entwicklung finden sich in einer Vorarbeit (Munder et al. 2019).

Die Videoclips sind an reale, für Therapeuten besonders herausfordernde Therapiesituationen angelehnt. Die meisten der Schauspielpatienten sind Kollegen, deren psychotherapeutische Kompetenz und Erfahrung es ermöglichte, sich hervorragend in die Patienten einfühlen zu können, einige sind professionelle Schauspieler. Vor jeder Patientenäußerung stellt ein Sprecher im Videoclip den jeweiligen Patienten kurz vor. In der aktuellen Untersuchung wurden alle 13 deutschsprachigen FIS-Videoclips (Frau Sel, Frau Klein, Frau Kaufmann, Herr König, Herr Dietz, Herr Busch, Herr Huth, Herr Beck, Herr Schneider, Frau Ziegler, Frau Schuhmann, Frau Bergmann, Herr Walther) in jeweils zufälliger Reihenfolge eingesetzt. Die Dauer der einzelnen Clips (Sprecher- und Patientenäußerung) beträgt zwischen 1:00 min und 2:19 min. Die Bearbeitung der gesamten FIS-Übung mit 13 Clips dauert ca. 30–50 min (je nach Ausführlichkeit der Teilnehmerantworten). Während der Übung befindet sich der Teilnehmer allein und unbeobachtet in einem ruhigen Raum. Die Reaktionen des Teilnehmers auf die jeweiligen Patientenäußerungen werden audioaufgezeichnet und im entsprechend nachfolgend beschriebenem Vorgehen ausgewertet.

Den Ablauf der FIS-Übung veranschaulicht Abb. 1 an einem Beispiel. Das in Abb. 1 gezeigte Beispiel gehört nicht zu den 13 originalen FIS-Clips. Diese werden nicht publik gemacht, um für wissenschaftliche und Prüfungszwecke nutzbar zu bleiben.

Abb. 1
figure 1

Ablauf der Facilitative-interpersonal-skills(FIS)-Übung

Auswertung

Die Auswertung der audioaufgezeichneten Therapeutenreaktionen basiert auf dem FIS-Manual (Gumz et al. 2018). Darin werden die folgenden 8 FIS-Items unterschieden: 1. verbale Ausdrucksfähigkeit, 2. Hoffnung und positive Erwartungen, 3. Fähigkeit, glaubwürdig und überzeugend zu sein, 4. emotionale Ausdrucksfähigkeit, 5. Wärme, Akzeptanz und Verständnis, 6. Empathie, 7. Bündnisfähigkeit und 8. Aufgreifen von Spannungen und Krisen. Jede Therapeutenreaktion wird hinsichtlich dieser 8 Items auf einer 5‑stufigen Likert-Skala (1–5) bewertet, wobei die 3 für einen mittleren Ausgangswert steht. Ausgehend davon werden niedrigere bzw. höhere Ausprägungen unter Berücksichtigung von verbalen Ankern für die Maximalwerte 1 und 5, die im Detail im Manual beschrieben sind, herunter- bzw. heraufgestuft. Dies stellt eine Modifikation zur amerikanischen Originalversion dar, in der verbale Anker für alle Werteausprägungen verwendet werden. Ziel dieser Modifikation war die Erreichung einer kontinuierlichen Skala. Aus dem Mittelwert über alle 8 FIS-Items wird ein FIS-Gesamtwert gebildet. Die Eindimensionalität der Skala wurde in Vorarbeiten nachgewiesen (Munder et al. 2019). Alle FIS-Audioaufzeichnungen wurden von 3 geschulten Ratern unabhängig voneinander und ohne Kenntnis der Fragebogendaten oder soziodemografischen Informationen bewertet.

Das in Abb. 1 gezeigte Beispiel wurde von drei geschulten Ratern wie folgt beurteilt: 1. verbale Ausdrucksfähigkeit (3, 4, 3), 2. Hoffnung und positive Erwartungen (3, 3, 3), 3. Fähigkeit, glaubwürdig und überzeugend zu sein (4, 3, 3), 4. emotionale Ausdrucksfähigkeit (3, 3, 3), 5. Wärme, Akzeptanz und Verständnis (3, 3, 2), 6. Empathie (3, 3, 4), 7. Bündnisfähigkeit (2, 2, 2) und 8. Aufgreifen von Spannungen und Krisen (2, 2, 3).

Rater und Rater-Schulung

Die Schulung neuer Rater und fortlaufende Treffen des Rater-Teams fanden im wöchentlichen bis monatlichen Rhythmus statt. Die Rater-Schulung zielte auf ein genaues Verständnis des FIS-Manuals und der dargestellten Patientenfälle durch die Besprechung von diskrepanten Bewertungen in Übung-Ratings und die Arbeit mit Ankerbeispielen ab. Insgesamt waren 15 Rater (n = 12 weiblich, n = 3 männlich) beteiligt, bei denen es sich um Psychologiestudierende (n = 2), Psychologen in psychotherapeutischer Ausbildung (n = 9) oder approbierte Psychotherapeuten (n = 1) handelte. In einem Fall wurden Ratings sowohl während des Studiums als auch in Ausbildung durchgeführt und in 2 Fällen sowohl in Ausbildung als auch nach der Approbation. Dabei waren sowohl psychodynamisch als auch verhaltenstherapeutisch orientierte Rater vertreten. Für die vorliegenden Auswertungen schätzte ein Rater im Mittel die Audioaufnahmen von 23 Teilnehmern ein.

Datenanalyse

In der Auswertung wurden zunächst deskriptive Maße zur Beschreibung der Stichprobe und der FIS-Werte ermittelt. Für die Interrater-Reliabilität wurden die Intraklassen-Korrelationskoeffizienten(ICC)1 und 2 nach Bliese (2000) sowie 95 %-Konfidenzintervalle mithilfe des R‑Pakets psychometric berechnet. Der ICC1 kann als Reliabilität der Gruppenmittelwerte (d. h. die mittlere Rater-Einschätzung für eine Versuchsperson) für einen zufällig gezogenen Rater angesehen werden. Der ICC2 gibt die Reliabilität der Gruppenmittelwerte, gemittelt über alle zufällig gezogenen Rater, an. Die ermittelten ICC wurden auf Basis der aggregierten (d. h. gemittelten) Werte über alle Clips berechnet. Für die 13 FIS-Clips wurde deskriptiv jeweils die Item-Schwierigkeiten berechnet. Der Schwierigkeitsindex weist einen Wertebereich von 0 bis 100 auf, wobei höhere Werte für einfachere Clips stehen. Um anschließend potenzielle Unterschiede zwischen den Clips sowie Unterschiede zwischen Clippositionen (Reihenfolgeeffekte) zu untersuchen, wurden „analyses of variance“ (ANOVA) mit Messwiederholung gerechnet. Zur Ermittlung der internen Konsistenz wurde Cronbachs α verwendet. Zusammenhänge zwischen der abhängigen Variable FIS-Gesamtwert und den unabhängigen Variablen Alter, Geschlecht und Ausbildungsstand des Therapeuten wurden mithilfe linearer Regressionsanalysen untersucht. Die Analysen wurden mit R und SPSS vorgenommen.

Ergebnisse

Stichprobencharakteristika

Die 115 Studienteilnehmer waren im Mittel 31,97 Jahre (SD ± 7,94 Jahre, Range: 19 bis 59 Jahre) und mit 78,3 % (n = 90) überwiegend weiblich (männlich: n = 25, 21,7 %). Die Mehrheit der Teilnehmer befand sich aktuell in einer Partnerschaft (n = 54, 47,0 %) oder war verheiratet (n = 21, 18,3 %); etwa ein Drittel war alleinstehend (n = 38, 33,0 %), und 2 Teilnehmer waren geschieden (1,7 %). Der Großteil der Studienteilnehmer war bereits in psychotherapeutischer Ausbildung (n = 54, 47,0 % psychodynamisch orientiert; n = 22, 19,1 % verhaltenstherapeutisch). Etwas weniger als ein Drittel befanden sich im Psychologiestudium (n = 19, 16,5 % Master, n = 16, 13,9 % Bachelor; n = 4 fehlende Werte zur Ausbildung). Etwas mehr als die Hälfte der Teilnehmer (n = 59, 51,3 %) gaben an, über therapeutische Vorerfahrung zu verfügen (n = 50, 43,5 % keine Vorerfahrung; n = 6, 5,2 % fehlende Werte). Dabei waren diese erfahrenen Teilnehmer im Mittel bereits 1,95 Jahre klinisch-psychologisch tätig (SD ± 2,25 Jahre, Range: 1 bis 15 Jahre, einschließlich der praktischen Tätigkeit).

FIS-Gesamtwert, FIS-Item-Werte und Interrater-Reliabilität

Der durchschnittliche FIS-Gesamtwert in der untersuchten Stichprobe betrug 3,24 (SD ± 0,42, Range: 1,97–4,09). Die Durchschnittswerte in den FIS-Items schwankten zwischen 2,97 (SD ± 0,58, Range: 1,31–4,19) in dem Item „Aufgreifen von Spannungen und Krisen“ und 3,36 (SD ± 0,46, Range: 1,824,28) in der „emotionalen Ausdrucksfähigkeit“.

Die Interrater-Reliabilität für alle FIS-Item-Werte und für den FIS-Gesamtwert lag im guten bis exzellenten Bereich (Tab. 1).

Tab. 1 Deskriptive Statistik und Interrater-Reliabilität für den FIS-Gesamtwert und die FIS-Items

Interne Konsistenz

Die interne Konsistenz über alle FIS-Clips betrug Cronbachs α = 0,958. Wie Tab. 2 zu entnehmen ist, wird ab einer Anzahl von 3 Clips mit einer 95 %igen Wahrscheinlichkeit eine interne Konsistenz über 0,80 erreicht.

Tab. 2 Interne Konsistenz für eine unterschiedliche Anzahl von FIS-Clips

Item-Schwierigkeit und Mittelwertunterschiede für die FIS-Clips

Für alle 13 FIS-Clips ergab sich eine mittlere Item-Schwierigkeit, wobei der leichteste Clip (Herr Busch) eine Item-Schwierigkeit von 60,14 (SD ± 11,66) und der schwierigste Clip (Herr Huth) eine Item-Schwierigkeit von 53,22 (SD ± 14,45) aufwies. Die FIS-Gesamtwerte in den einzelnen FIS-Clips unterschieden sich signifikant voneinander (F(12, 1224) = 11,362; p < 0,001; partielles η2 = 0,100; n = 103). Der Effekt der Clips betrug Cohens f = 0,33 und entspricht einem mittleren Effekt. Die Bonferroni-korrigierten Post-hoc-Tests deuten auf 3 besonders leichte FIS-Clips und 4 besonders schwierige FIS-Clips hin. Der leichteste Clip (Herr Busch) unterschied sich im FIS-Gesamtwert signifikant von 8 anderen FIS-Clips; für den zweitleichtesten Clip (Frau Kaufmann) ergaben sich 6 und für den drittleichtesten Clip (Frau Ziegler) 5 signifikante Unterschiede. Die Werte in den 4 schwierigsten Clips (Herr Huth, Herr Schneider, Herr Beck, Herr Dietz) lagen übereinstimmend unter den Werten in 5 anderen FIS-Clips (Frau Klein, Frau Kaufmann, Herr Busch, Frau Ziegler, Frau Schuhmann). Für die übrigen Clips ergaben sich keine signifikanten Unterschiede.

Reihenfolgeeffekte der FIS-Clips

Da die einzelnen FIS-Clips in zufälliger Reihenfolge präsentiert wurden, ist es ebenfalls möglich, Reihenfolgeeffekte zu untersuchen. Entsprechend dem allgemeinen linearen Modells zeigte sich auch ein signifikanter Effekt der Clipposition (F(12, 1224) = 4,003; p > 0,001; partielles η2 = 0,038; n = 103). Die Effektstärke beträgt Cohens f = 0,20 und spricht für einen schwachen Effekt. Betrachtet man jedoch die Kennwerte für den quadratischen Trend (F(12,1224) = 21,686; p < 0,001; partielles η2 = 0,175) ergibt sich eine Effektstärke von Cohens f = 0,46, die auf einen starken Effekt deutet. Der quadratische Trend und die Bonferroni-korrigierten paarweise Vergleiche deuten sowohl auf einen Lern- als auch auf einen Ermüdungseffekt über die 13 Videoclips hinweg hin (Abb. 2). So war das Ergebnis im ersten FIS-Clip signifikant schlechter als das Ergebnis im 4., 5. und 7. Clip. Die Leistung im 10. und 13. Clip war wiederum signifikant schlechter als im 5. Clip.

Abb. 2
figure 2

Reihenfolgeeffekte der FIS-Clips

Zusammenhang mit Alter, Geschlecht und Ausbildungsstand der Durchführenden

In der Regressionsanalyse (Tab. 3) zeigte sich, dass Alter und Geschlecht keinen bedeutsamen Einfluss auf den FIS-Gesamtwert haben. Im Gegensatz dazu erwies sich jedoch die Ausbildung als relevant. Studienteilnehmer, die aktuell im Bachelor- oder im Masterstudiengang Psychologie sind, weisen signifikant niedrigere FIS-Gesamtwerte im Vergleich zu den bereits graduierten Ausbildungsteilnehmern in tiefenpsychologischer Psychotherapie auf. Dabei erzielen Ausbildungsteilnehmer in Verhaltenstherapie fast identische FIS-Gesamtwerte wie ihre tiefenpsychologisch orientierten Kollegen. Das Gesamtmodell war signifikant und konnte etwa ein Viertel der Varianz (24,9 %) am FIS-Gesamtwert aufklären.

Tab. 3 Lineare Regressionsanalyse auf den FIS-Gesamtwert

Diskussion

Zusammenfassung der Ergebnisse

Die vorliegende Untersuchung hatte die Ziele, psychometrische Eigenschaften der deutschsprachigen Version der FIS-Übung an einer größeren Stichprobe zu prüfen sowie Zusammenhänge zwischen dem FIS-Gesamtwert sowie dem Alter, Geschlecht und Ausbildungsstand zu untersuchen. Die Untersuchung ergab bei konservativer Schätzung gute bis exzellente Interrater-Reliabilitäten für den FIS-Gesamtwert und für alle FIS-Item-Werte sowie eine sehr hohe interne Konsistenz. Bei einer insgesamt mittleren Item-Schwierigkeit für alle Clips unterschieden sich die erzielten FIS-Gesamtwerte in einigen Clips signifikant voneinander. Die Ergebnisse deuten auf 3 besonders leichte und 4 besonders schwierige FIS-Clips hin (signifikant höhere bzw. niedrigere FIS-Gesamtwerte). Darüber hinaus konnte ein Effekt der Clipposition verzeichnet werden, wobei über den Verlauf der Übung hinweg sowohl ein Lern- als auch ein Ermüdungseffekt ersichtlich wurde. Abschließend zeigte sich ein bedeutsamer Zusammenhang des FIS-Gesamtwerts mit dem aktuellen Ausbildungsstand.

Psychometrische Güte

Im Rahmen der OSCE ergeben sich oft keine hohen Übereinstimmungen zwischen unabhängigen Ratern bei der Bewertung von interpersonellen Fähigkeiten (Brannick et al. 2011). Im Gegensatz dazu konnte für die FIS-Übung bei einer sehr konservativen Berechnung (d. h. vorherige Aggregation der Beurteilungen über alle Clips) eine gute bis sehr gute Übereinstimmung erzielt werden. Die vorliegenden Ergebnisse bieten damit erste wichtige Anhaltspunkte dafür, dass die FIS-Übung für den Einsatz im Rahmen von Prüfungen gut geeignet ist. Tendenziell eher niedrigere Rater-Übereinstimmungen und breitere Konfidenzintervalle fanden sich für die Item-Werte zur „verbalen Ausdrucksfähigkeit“ und zur „Fähigkeit, glaubwürdig und überzeugend zu sein“. Für die „verbale Ausdrucksfähigkeit“ könnte überprüft werden, inwieweit objektive phonetische Marker eine reliablere und validere Alternative zur Rater-Einschätzung darstellen könnten. Das Item zur Glaubwürdigkeit wurde auch vom klinischen Eindruck der Rater her kritisch diskutiert und könnte perspektivisch konzeptuell weiterentwickelt werden. Mit Hinblick auf die erzielte Interrater-Reliabilität ist der Aufwand der Ratings zu berücksichtigen. Jeder Teilnehmer wurde von 3 Ratern eingeschätzt, und alle Rater absolvierten die zuvor beschriebene umfangreiche Rater-Schulung. Interessant wäre hierbei zu betrachten, inwieweit Rater-Charakteristika die dyadische Interrater-Reliabilität beeinflussen. Für OSCE zu Kommunikationsfähigkeiten konnte ein solcher Effekt gezeigt werden (Mortsiefer et al. 2017). Signifikant höhere Interrater-Reliabilitäten wurden in Dyaden desselben Geschlechts, in Dyaden von 2 klinisch tätigen Ratern und in Dyaden mit viel OSCE-Erfahrung gefunden. Bei einer eher kleinen Rater-Gruppe (n = 15) und einer eher geringen Streuung in den interessierenden Variablen (z. B. Geschlecht, Ausbildungsstand) konnten in der aktuellen Untersuchung diese Einflüsse nicht betrachtet werden. Zukünftige Untersuchungen sollten dieser Fragestellung nachgehen, um weitere Empfehlungen für die Anwendung ableiten zu können.

Anzahl von FIS-Clips

Des Weiteren legen die Ergebnisse eine Kürzung der FIS-Übung nahe. Für diese Schlussfolgerung spricht einerseits der beobachtete Ermüdungseffekt, andererseits deutet die sehr hohe interne Konsistenz für den Gesamttest auf eine gewisse Redundanz hin. In der Studie wurden jedem Studienteilnehmer jeweils alle 13 existierenden FIS-Clips präsentiert.

Die Zahl der Clips könnte bei einem zukünftigen Einsatz reduziert werden. Für die amerikanische Version wurden zu Forschungszwecken 8 Clips verwendet (Anderson et al. 2016a; 2009). Die aktuellen Befunde zeigen, dass bereits ab einer Zahl von 3 FIS-Clips mit einer hohen Wahrscheinlichkeit eine gute interne Konsistenz erreicht wird. Dabei ist zu berücksichtigen, dass die Leistung im allerersten FIS-Clip schlechter als in den darauffolgenden Clips ist. Dies wird als Lerneffekt interpretiert, der beispielsweise durch eine Gewöhnung an das Format der Übung eintritt. Der Lerneffekt wäre bei einem Einsatz für Prüfungen in dem Sinne zu beachten, dass jeder Prüfling vorab im Rahmen des Unterrichts mindestens einmal üben können sollte. Ab dem 10. aufeinander folgend absolvierten Clip muss von einem Abfall der Leistung ausgegangen werden. Es wird daher empfohlen, mindestens 3 und höchstens 9 Clips einzusetzen, um verlässliche Ergebnisse zu erzielen.

Auswahl der FIS-Clips

Um eine Vergleichbarkeit der Gesamtwerte bei der Verwendung von gekürzten FIS-Übungen zu gewährleisten, müssen die berichteten signifikanten Unterschiede zwischen den Clips beachtet werden. Dieser Befund widerspricht früheren, auf einer geringeren Stichprobengröße basierenden Beobachtungen (Munder et al. 2019). Dies betrifft im Forschungskontext beispielweise die Auswahl von Clips für wiederholte Messungen (z. B. Prä-post-Messungen). Bezogen auf eine Anwendung im Ausbildungskontext wird empfohlen, für Bachelorstudierende leichtere Clips und für fortgeschrittene Ausbildungskandidaten schwierigere Clips einzusetzen. Obwohl prinzipiell mittlere Item-Schwierigkeiten (Wert von ca. 50), wie sie für alle FIS-Clips vorlagen, zu bevorzugen sind, erscheint es sinnvoll, weitere deutlich leichtere bzw. schwierigere Clips (Item-Schwierigkeit: <20 schwer, >80 leicht) zu entwickeln, um im unteren und oberen Bereich noch genauer differenzieren zu können.

In zukünftigen Studien kann die Frage, welchen Teilnehmern welche Clips besonders schwer- oder leichtfallen, vertieft aufgegriffen werden. Hierzu gehört z. B. die Untersuchung von möglichen Unterschieden zwischen gleich- und gegengeschlechtlichen FIS-Patient-Therapeut-Dyaden. Im psychotherapeutischen Kontext existieren uneindeutige Befunde zum Einfluss der geschlechtlichen Passung von Patient und Therapeut (Gries et al. 2020). In der aktuellen Untersuchung zeigte sich jedoch, dass signifikant niedrigere Werte v. a. in Clips, die männliche Patienten zeigten, erzielt wurden. Da die Stichprobe der Studienteilnehmer überwiegend weiblich war (78,3 %), kann über einen Effekt der geschlechtlichen Passung spekuliert werden. Inwieweit dieser tatsächlich vorliegt oder eine Konfundierung mit anderen Variablen (z. B. feindseligeres, weniger zugewandtes Interaktionsangebot der dargestellten männlichen Patienten) hierfür ursächlich ist, sollte in weiteren Untersuchungen analysiert werden.

Ethische Gesichtspunkte und Limitationen

Der Einsatz der FIS-Übung erfordert, sich mit ethischen Fragen im Umgang mit den Teilnehmern vorab umfassend auseinanderzusetzen. Dies betrifft individuelle Rückmeldungen im Allgemeinen, die im Rahmen von Studien durch Pseudonymisierung, Passwortschutz und Involvierung mehrerer Studienmitarbeiter so gegeben werden sollten, dass keiner der Forschenden eine Zuordnung von FIS-Werten und identifizierenden Informationen (insbesondere Namen) vornehmen kann. Im Besonderen betrifft es Rückmeldungen von Kompetenzdefiziten. Das Erzielen vergleichsweise niedriger Werte in der FIS-Übung ist für die Teilnehmer u. U. emotional nicht leicht zu verarbeiten. Eine solche negative Rückmeldung berührt unmittelbar die berufliche Identität und den beruflichen Selbstwert und kann die Teilnehmer entmutigen. Dies spricht aus Sicht der Autoren dafür, die FIS-Übung relativ früh im Ausbildungsverlauf einzusetzen oder sie unterstützend für die Auswahl geeigneter Studierender zu nutzen. Allerdings ist zu berücksichtigen, dass positive individuelle Entwicklungen möglich und mit fortschreitender Ausbildung wahrscheinlich sind, und dass die Übung nicht das vollständige Potenzial bzw. alle Aspekte der therapeutischen Kompetenz abbildet. So fokussiert die FIS-Übung in der Auswertung möglicherweise tendenziell stärker auf die verbale im Vergleich zur nonverbalen Kommunikation. Explizit und vorrangig wird die nonverbale Kommunikation im FIS durch die 2 Items zur verbalen und zur emotionalen Ausdrucksfähigkeit gemessen. Die anderen Items beziehen nonverbale Aspekte ein, erfassen jedoch in der Tendenz stärker verbale Aspekte, wobei beide Aspekte letztlich untrennbar miteinander verflochten sind (Pawelczyk 2011). Aufgrund der Verwendung von Audio- statt Videoaufzeichnungen bleiben des Weiteren potenziell bedeutsame Faktoren wie Mimik und Gestik (Benecke et al. 2005; Datz et al. 2019) bisher unberücksichtigt. Diese könnten jedoch theoretisch unter Abwägung der vorhandenen datenschutzrechtlichen Nachteile integriert werden.

Darüber hinaus ist Psychotherapie stets ein interaktionelles Geschehen. In der FIS-Übung wird dies zugunsten der Standardisierung aufgehoben (Anderson et al. 2020). Dies ist eine wesentliche Grenze des Formats. Das FIS-Ergebnis könnte nicht nur von der therapeutischen Kompetenz, sondern auch von der Gewöhnung an dieses spezielle Testformat ohne unmittelbares Feedback von einem Gegenüber und von Ängsten vor Prüfungssituationen beeinflusst sein.

Bezogen auf die vorliegende Auswertung muss einschränkend erwähnt werden, dass es sich um eine Querschnittsuntersuchung handelt. Basierend auf den Ergebnissen erscheint es lohnenswert, längsschnittliche Untersuchungen über den Ausbildungsverlauf hinweg mit der FIS-Übung anzustellen, um mögliche Kompetenzzuwächse zu beobachten. Eine weitere Einschränkung der aktuellen Untersuchung liegt darin, dass ein Selektionsbias nicht ausgeschlossen werden kann. Die OSCE sind für die gesamte Kohorte verpflichtend, und die Ausschöpfung im Rahmen von Studien ist höchstwahrscheinlich hoch. Im Gegensatz dazu basierte die Teilnahme an der FIS-Übung auf Freiwilligkeit und könnte von individuellen Faktoren wie der Offenheit für neue Erfahrungen beeinflusst sein.

Schlussfolgerung und Ausblick

Die Entwicklung der Fähigkeiten von Therapeuten, interpersonell hilfreich mit herausfordernden Therapiesituationen umgehen zu können, ist therapieschulenunabhängig eine zentrale Aufgabe der Psychotherapieausbildung (Gumz 2020). Diesen Fähigkeiten wird künftig ein hoher und prüfungsrelevanter Stellenwert eingeräumt werden. Ausbildungsteilnehmern und auch rückblickend befragten Psychotherapeuten ist das praktische Lernen für die Entwicklung professioneller Fertigkeiten besonders wichtig (Nikendei et al. 2018; Orlinsky et al. 2001; Sonntag et al. 2009).

Die Ergebnisse der vorliegenden Untersuchung indizieren, dass die FIS-Übung für den Einsatz in Forschung, Aus- und Weiterbildung geeignet ist. Die Übung bietet die Möglichkeit, interpersonelle Fähigkeiten standardisiert und empirisch fundiert zu beurteilen. Dies kann dazu dienen, Therapeuteneffekte in der Forschung systematisch zu untersuchen und den Studierenden und Ausbildungsteilnehmern perspektivisch nach weiteren Analysen, z. B. Ermittlung von Bestehens- und Notengrenzen, Rückmeldungen zu ihrem aktuellen Leistungsstand zu geben oder Fähigkeiten im Rahmen von Prüfungen (z. B. OSCE) zu ermitteln.

Die deutschsprachige FIS-Übung kann ab Oktober 2020 auch online durchgeführt werden (www.psychotherapy-lab.de).

Fazit für die Praxis

  • Die „Facilitative-interpersonal-skills“(FIS)-Übung eignet sich, interpersonelle Fähigkeiten von Therapeuten standardisiert und empirisch fundiert zu beurteilen. Testteilnehmer reagieren verbal auf herausfordernde Therapiesituationen, die auf Videoclips nachgestellt wurden. Die Reaktionen werden audioaufgezeichnet und von geschulten Ratern eingeschätzt.

  • Die FIS-Übung ist prinzipiell für den Einsatz in Forschung und Lehre geeignet. Im Hinblick auf die Psychotherapieausbildung könnte sie perspektivisch zur Auswahl von Studienbewerbern, für die „objective structured clinical examination“ (OSCE) oder für Rückmeldungen zum individuellen Stand eingesetzt werden.

  • Es wird empfohlen, für Bachelorstudierende leichtere Clips und für fortgeschrittene Ausbildungskandidaten schwierigere Clips einzusetzen.

  • Mindestens 3 und maximal 9 Clips sollten genutzt werden. Bei der Auswahl der Clips sind die unterschiedlichen Schwierigkeitsgrade der Clips zu beachten.