Frequenzanalyse Quanti (Wintersemester 2021/22)

R
Analysis
DE
Published

June 11, 2023

Beispiel für eine Frequenzanalyse

In der Lehrveranstaltung “Einführung in die quantitative empirische Sozialforschung” geben wir den Studierenden unter anderem einen Überlick über viele empirische Verfahren, die bei der Beantwortung von Forschungsfragen zur Anwendung kommen können. Zu diesen Verfahren gehören auch Algorithmen aus der computer-gestützten Textanalyse. In der Vorlesung explizit genannt werden Frequenzanalysen, Valenz- und Intensitätsanalysen und Kontingenzanalysen. Ich hatte bereits im Jahr zuvor überlegt, ob und wie ich diese Begriffe mit einem praktischen kleinen Beispiel veranschaulichen kann. Bei meinen Recherchen nach einem interessanten aktuellen Datensatz bin ich auf den damals sehr populären Corona-Podcast des NDR gestoßen. Dankenswerterweise hat der NDR die Podcasts bereits transkribiert, so dass ich die Daten nur noch scrapen musste. Und mit diesen Daten konnte ich dann die Begriffe mit Leben füllen. An dieser Stelle möchte ich darauf hinweisen, dass die Analysen nur einem illustrativen Zweck dienen; ich habe keine Forschungsfrage damit beantworten wollen.

Frequenzanalyse

Als Beispiel für eine Frequenzanalyse habe ich mit dem hervorragenden R-Paket quanteda zuerst eine Wortwolke erstellt, die die häufigsten Wörter von Prof. Dr. Drosten und Prof. Dr. Ciesek vergleichend darstellt. Hier sieht man bereits gut, welche inhaltlichen Schwerpunkte beide gesetzt haben. Natürlich auch weil Frau Ciesek erst zu einem späteren Zeitpunkt den Podcast mit übernommen hat. Diese zeitliche Entwicklung wird besonders gut deutlich, wenn die Monate als relevante Einheiten herangezogen werden, nach denen die Worthäufigkeiten sortiert sind: Die Gesprächsthemen orientieren sich am zeitlichen Verlauf der Pandemie.

Valenz- und Intensitätsanalyse

Logo of the VisArgue project. Um einen Einblick in die Funktionsweise einer Valenz- bzw. Intensitätsanalyse zu geben, habe ich eine relativ einfache Wörterbuch-basierte Sentimentanalyse gerechnet. Rückblickend fällt es mir schwer, den in der Abbildung ausgegebenen Verlauf der Kurve in Einklang mit den Ereignissen von vor 2-3 Jahren zu bringen. Was ich aber auf jeden Fall in der Vorlesung gemacht habe, ist darauf hinzuweisen, dass die Wahl des Wörterbuchs als auch die Gewichtungsfunktion einen entscheidenden Einfluss auf den Verlauf haben kann (aber nicht unbedingt haben muss)!

Kontingenzanalysen

Als Beispiel für eine Kontingenzanalyse habe ich das Verfahren Keyword-in-Context (KWIC) aufgeführt. Einigen Analysen könnten zum Beispiel darauf abzielen, den Kontext, in dem das Wort “Corona” vorkommt, zu erfassen. Mit dem angesprochenen Verfahren KWIC lässt sich das bewerkstelligen:

Weitere Verfahren

Im Anschluss an diese drei Standardverfahren habe ich noch weitere Verfahren angesprochen und auch hierfür aktuelle Beispiele aus der Forschung (z.B. VisArgue und ADD-up) aufgeführt.

|