Excel CORREL-Funktion - Statistische Korrelation berechnen

Beispielarbeitsbuch herunterladen

Laden Sie die Beispielarbeitsmappe herunter

Dieses Tutorial zeigt, wie Sie das Excel CORREL-Funktion in Excel, um die Korrelation zu berechnen.

Überblick über die CORREL-Funktion

Die CORREL-Funktion berechnet die Korrelation zweier Zahlenreihen.

Um die CORREL Excel-Arbeitsblattfunktion zu verwenden, wählen Sie eine Zelle aus und geben Sie Folgendes ein:

(Beachten Sie, wie die Formeleingaben angezeigt werden)

CORREL-Funktion Syntax und Eingaben:

1 =KORREL(array1,array2)

Array1 - Zahlenreihen.

Was ist die CORREL-Funktion?

Die Excel CORREL-Funktion gibt den Korrelationskoeffizienten (Pearsons R) von zwei Datenbereichen.

Was ist der Korrelationskoeffizient?

Der Korrelationskoeffizient, üblicherweise als Pearson’s bezeichnet R (benannt nach Karl Pearson, der Person, die sie entwickelt hat) ist eine Statistik, die Ihnen sagt, wie stark zwei Variablen miteinander verbunden sind.

Pearsons R ist eine Zahl zwischen -1 und 1, die zu drei möglichen Interpretationen führen kann: eine positive Korrelation, eine negative Korrelation und keine Korrelation.

Positive Korrelation

Ein positiver Zusammenhang (R > 0) bedeutet, dass, wenn die beiden Variablen gleichzeitig vorliegen – wenn Sie eine hohe Punktzahl bei einer Variablen beobachten, Sie dazu neigen, auch eine hohe Punktzahl bei der anderen zu beobachten. Wenn eine Variable niedrig ist, neigt auch die andere dazu, niedrig zu sein.

Größe und Gewicht korrelieren beispielsweise positiv. Sehen Sie sich die folgende Tabelle an, die die Größe und das Gewicht einer kleinen Stichprobe von Baseballspielern darstellt:

Die R dieser kleinen Stichprobe beträgt 0,73 - eine sehr starke positive Korrelation. Dies ist logisch sinnvoll – größere Menschen sind im Durchschnitt tendenziell schwerer, da diese zusätzliche Größe aus Knochen, Muskeln und anderem Gewebe besteht, die alle etwas wiegen.

Aber die Korrelation ist nicht perfekt (in einer perfekten Korrelation mit an R von 1 würden alle Werte auf die Trendlinie fallen). Einige kleinere Menschen können schwerer sein – vielleicht tragen sie etwas mehr Fett oder trainieren im Fitnessstudio. Ebenso können einige große Menschen sehr dünn sein und tatsächlich weniger wiegen als viele kleinere Menschen.

Die Korrelation ist hier wahrscheinlich so hoch, weil wir es mit Sportlern zu tun haben, in der Gesamtbevölkerung wäre sie niedriger. Denken Sie daran, wenn Sie CORREL verwenden - das R Sie erhalten, ist nicht endgültig - Sie müssen bei Ihren Interpretationen darüber nachdenken, was Ihre Daten sind und wie Sie sie erhalten haben.

Negative Korrelation

Eine negative Korrelation (R < 0) bedeutet, dass Sie bei einer hohen Punktzahl in einer Variablen eher eine niedrige Punktzahl in der anderen Variablen beobachten und umgekehrt.

Beispielsweise korrelieren die Testergebnisse der Schüler und die Anzahl ihrer Fehlzeiten von der Schule negativ. Das heißt, je mehr Tage sie verpassen, desto niedriger sind ihre Werte. Je weniger Tage sie verpassen, desto höher sind die Werte in der Regel:

Auch hier ist die Korrelation nicht perfekt (wie sie es fast nie sind). Wir haben hier einen Schüler, der 5 Tage verpasst hat, aber trotzdem 85% erreicht hat. Wir haben auch einen, der 52 % erreicht hat, obwohl er nur zwei Tage fehlt.

Wir haben immer noch einen klaren negativen Trend. Aber es gibt immer noch viele Unterschiede bei den Testergebnissen, die nicht allein durch Abwesenheit erklärt werden können. Dies kann auf andere Variablen wie Eignung, Motivation, Gesundheit und viele andere potenzielle Faktoren zurückzuführen sein.

Denken Sie also bei der Verwendung von CORREL daran, dass es ein größeres Bild gibt, das Ihre Daten möglicherweise nicht vollständig erklären.

Keine Korrelation

Keine Korrelation (R = 0 oder nahe 0 bedeutet, dass Sie die Punktzahl einer Variablen nicht basierend auf einer anderen vorhersagen können. Wenn Sie die Daten grafisch darstellen, sehen Sie keinen erkennbaren Trend und die Trendlinie ist flach oder nahezu flach.

Hier einige Daten zu Ringfingerlänge und IQ:

Wie Sie sehen, gibt es in diesem Beispiel keine Verbindung zwischen diesen beiden Variablen, sodass wir davon ausgehen können, dass sie nicht miteinander verbunden sind.

In der Praxis ist es unwahrscheinlich, dass Sie eine R von genau 0. Denken Sie daran, dass es beim Sammeln von Daten oft zu Abweichungen aufgrund von Fehlern kommt, möglicherweise bei der Messung oder der Berichterstellung. Also nur weil du R ist nicht genau 0, bedeutet nicht, dass Sie etwas gefunden haben.

Korrelation ist keine Kausalität

Es ist wichtig zu bedenken, dass CORREL Ihnen nicht sagen kann, welche Variable die andere beeinflusst – oder ob es überhaupt einen kausalen Zusammenhang zwischen Variablen gibt. Beispielsweise wurde eine Korrelation zwischen den folgenden Variablen gefunden:

  • Die Menge an verkauftem Eis und die Menge an Gewaltverbrechen
  • Wie glücklich du bist und wie erfolgreich du in deiner Karriere bist
  • Die Anzahl der Menschen, die in einem Pool ertrunken sind und die Anzahl der Filme, in denen Nicolas Cage pro Jahr mitspielte

Das erste Beispiel ist das drittes Variablenproblem. Natürlich macht Eis weder gewalttätig, noch löst die Ausübung von Gewalt das Verlangen nach gefrorener Milch und Zucker aus. Die dritte Variable ist das Wetter. Bei heißem Wetter gehen die Leute einfach mehr aus - es gibt mehr Kontakt zwischen den Menschen und somit eine größere Chance, dass sich ein Konflikt zusammenbraut. Bei heißem Wetter kaufen die Leute auch mehr Eis. Eisverkäufe und Gewaltkriminalität korrelieren also nur deshalb, weil sie beide mit einer dritten Variablen verknüpft sind.

Das zweite könnte ein Beispiel für sein doppelte Kausalität. Erfolgreich bei der Arbeit zu sein kann gut für Ihr Glück sein - Sie verdienen mehr Geld und haben im Allgemeinen mehr Kontrolle darüber, was Sie tun und mit wem Sie es tun. Aber Glück kann auch für den Erfolg von Vorteil sein, vielleicht sind glücklichere Menschen leichter zu verstehen und entwickeln stärkere Arbeitsbeziehungen, oder vielleicht sind sie mental widerstandsfähiger gegenüber Rückschlägen. In diesem Fall beeinflussen sich beide Variablen gegenseitig.

Der dritte ist einfach a falsche Korrelation. Nur weil zwei Variablen in Ihren Daten korrelieren, heißt das nicht, dass sie im wirklichen Leben irgendwie interagieren.

Unterm Strich kann eine Korrelation nicht sagen, ob zwei Variablen kausal zusammenhängen.

So verwenden Sie CORREL®

Verwenden Sie die Excel CORREL-Funktion wie folgt:

1 =KORREL(B3:B15,C3:C15)

Mit CORREL definieren Sie zwei Argumente - die beiden Datenbereiche, die Sie korrelieren möchten.

Hier sind ein paar wichtige Punkte, die Sie bei CORREL beachten sollten:

  • Text, Boolean (TRUE/FALSE) und leere Zellen werden ignoriert.
  • Beide Datenbereiche müssen die gleiche Anzahl von Datenpunkten haben, andernfalls erhalten Sie einen #N/A-Fehler
  • Wenn einer der Datenbereiche leer ist oder überhaupt keine Abweichung in den Daten vorliegt (d. h. wenn alle Datenpunkte die gleiche Nummer haben), erhalten Sie ein #DIV/0! Fehler

CORREL-Funktion in Google Tabellen

Die CORREL-Funktion funktioniert in Google Sheets genauso wie in Excel:

Zusätzliche Bemerkungen

CORREL-Beispiele in VBA

Sie können auch die CORREL-Funktion in VBA verwenden. Typ:
application.worksheetfunction.correl(array1,array2)
Für die Funktionsargumente (array1 usw.) können Sie diese entweder direkt in die Funktion eingeben oder stattdessen Variablen definieren.

Zurück zur Liste aller Funktionen in Excel

wave wave wave wave wave