Statistik im Studium anwenden, statt verzweifeln: So findest du den richtigen Einstieg – mit Daniela Keller
Statistik gilt als Angstfach vieler Studierender – dabei ist sie in Wahrheit ein mächtiges Werkzeug, um mit Daten fundierte Entscheidungen zu treffen. In dieser Episode spricht Christian mit Daniela Keller, Statistik-Expertin und Gründerin der Statistik-Akademie, über ihren Weg zur Statistik, häufige Vorbehalte und konkrete Strategien, wie Statistik verständlich, praxisnah und angstfrei vermittelt werden kann.
Daniela zeigt, warum man weder Mathegenie noch Technikprofi sein muss, um Statistik erfolgreich im Studium oder Beruf anzuwenden – und warum gerade auch Führungskräfte und Marketing-Profis statistische Grundkenntnisse brauchen.
Inhalt:
00:00 Schönen guten Tag
02:40 Daniela über sich
11:05 Typische Vorbehalte gegenüber Statistik
18:25 Praktische Anwendung von Statistik in Alltag & Beruf
22:39 Kernkonzepte & Methodenauswahl
30:56 Wichtige Methoden in der Statistik
33:48 Welche ist die richtige Methode für meine Forschungsfrage
38:27 Tools für Statistik (SPSS, R, Python, Excel)
45:03 Wie wichtig ist Datenbereinigung
48:05 Interpretation meiner Daten
53:51 Wie formuliere ich statistische Befunde v erständlich
55:53 Wie visualisiere ich die Daten?
57:22 Daniela über die Statistik Akademie
Daniela im Internet:
➡️ Website: https://www.statistik-akademie.de
➡️ Youtube: https://www.youtube.com/@StatistikAkademie
➡️ Instagram: @daniela_keller_statistik
Abonniert uns als Podcast:
🎙️ Podcast auf fernstudi.net: https://www.fernstudi.net/podcast
🎙️ Podcast auf Spotify: https://open.spotify.com/show/5kRQqyyccQA4YtXU39vh6i
🎙️ Podcast bei Apple: https://podcasts.apple.com/de/podcast/fernstudi-fm/id1627889342
🎙️ Podcast bei Google Play: https://podcasts.google.com/feed/aHR0cHM6Ly93d3cuZmVybnN0dWRpLm5ldC9wb2RjYXN0L3Jzcw
☝️ Tipp: Über unsere App habt ihr immer Zugriff auf all unsere Podcast-Folgen: https://www.fernstudi.net/app
#podcast #interview #folge51
Christian: Daniela, herzlich willkommen hier im Podcast. Ich freue mich total, dass wir jetzt über Statistik reden können. Du hast mich eigentlich angeschrieben und gefragt, ob ich nicht Lust hätte, einen Podcast mit dir zusammen zu machen. Und dann habe ich zurückgeschrieben, eigentlich hatte ich dich auch schon länger auf dem Schirm, wollte ich auch schon länger anschreiben. Deswegen war das ein lustiger Zufall und so sind wir jetzt zusammengekommen, über Statistik zu reden. Ich habe es jetzt schon im Einstieg gesagt, dass ich selber voll der Statistik-Noob bin. Ich habe noch nie ein Statistikmodul oder irgendwas absolviert und deswegen hoffe ich, dass du mir, nicht nur unseren Zuhörern und Zuhörerinnen, sondern auch mir ganz viel über Statistik erklären kannst und uns auch zeigen kannst, was für ein spannendes Thema das eigentlich ist. Vielleicht stellst du dich einfach erstmal selber ganz kurz vor.
Daniela: Ja, sehr gern. Danke erstmal, dass ich hier dabei sein darf. Ich freue mich sehr auf unser Gespräch. Ich bin Daniela Keller. Ich lebe in der Nähe von Würzburg. Ich habe zwei Teenagerkinder, einen Mann und einen Hund. Ich habe Mathe studiert vor einigen Jahren, Diplom war das noch, und habe in dem Mathestudium schon so eine Statistikberatung gegründet mit ein paar Kommilitonen, und die ist mir einfach geblieben. So habe ich mich dann später damit selbstständig gemacht und helfe jetzt Leuten, die Statistikunterstützung brauchen, dabei die Statistik richtig umzusetzen. Das sind hauptsächlich Studierende, Promovierende, Wissenschaftler, aber ab und zu auch Leute im Unternehmen, die in Forschungsprojekten arbeiten. Und ich mache dann nicht selber die Datenanalyse, sondern ich unterstütze dabei, dass sie es selber schaffen, so wie das ja meistens auch für die Arbeiten geplant ist.
Christian: Mathematikstudium hast du jetzt schon selber angesprochen. Das fiel mir auch als allererstes ins Auge, als ich deine Bio angeguckt habe. Erzähl mal, wie kommt man denn dazu, Mathematik zu studieren?
Daniela: Also ich war in Mathe nicht immer gut in der Schule, muss ich dazu sagen. Ich hatte auch wirklich richtig schlechte Noten und richtig zu kämpfen. Das war so siebte, achte Klasse. Ich bin auch sehr schlecht im Kopfrechnen. Selbst als ich dann später besser war in Mathe und dann auch tatsächlich Nachhilfe gegeben habe für andere Schüler, waren oft meine Nachhilfeschüler schneller im Kopfrechnen als ich. Aber was ich gut kann oder schon immer gut konnte, ist so ein bisschen analytisches Denken und sich in diese Systeme reindenken. Das hat dann einfach zum Ende der Schulzeit dazu geführt, mit ein bisschen mehr Fleiß wahrscheinlich, dass ich einfach durchgestiegen bin durch die Sachen und mir das auch gut selber aneignen konnte, auch wenn die Lehrer es nicht gut erklären konnten. Deswegen hatte ich am Ende meiner Schulzeit gute Mathenoten, hatte Mathe-Leistungskurs und dann war es tatsächlich so, dass ich nicht wusste, was ich studieren soll, und einfach meine Schulnoten angeschaut habe und dann gedacht habe, okay, Mathe kann ich ja.
Dann habe ich mich schon ein bisschen damit beschäftigt, was macht man mit Mathe? Ich habe niemanden gekannt, der Mathe studiert hat, habe dann ein bisschen gelesen. Es ist recht flexibel, man kann sehr unterschiedliche Dinge machen nach so einem Mathestudium. Also viele landen auch wirklich in ganz anderen Bereichen, gar nicht mehr in der Mathematik. Das habe ich dann einfach so genommen und gesagt, gut, dann mache ich halt einfach mal, dann schauen wir mal, was wird. Es war schon schwer. Also Mathestudium ist schon hart, gerade am Anfang, aber ich habe mich da durchgekämpft. Das Schöne ist, dass man dann gleich am Anfang schon merkt, ob man es schafft oder nicht. Es fängt gleich schwierig an. Das haben uns auch die Tutoren damals zum Glück gleich gesagt. Dann haben wir uns einfach durchgebissen und sind dabei geblieben, und dann war es wirklich gut.
Christian: An den Matheunterricht habe ich auch noch ganz schlimme Erinnerungen irgendwie in meiner Schulzeit. Das war für den Großteil der Klassen, in denen ich war, auch sehr, sehr schwierig, und ich habe dann irgendwann bestimmt auch eine Fünf oder so in Mathe auf dem Zeugnis gehabt. Das war einer der Gründe, warum ich dann das Abitur abgebrochen hatte. Und als ich das dann nachgeholt habe, musste ich mir das auch, so wie du das gesagt hast, ganz viel selber aneignen. Und da habe ich auch eine gewisse Freude dann empfunden, das war irgendwie mal ein cooles Gefühl, wenn ich die Aufgabe dann geschafft hatte und den Lösungsweg dann auch so nachvollziehen konnte. Ganz viel auch mal mit Lösungswegen gearbeitet, die man in so Lösungsbüchern findet, um das einfach zu verstehen, wie das jetzt funktioniert. Und habe gemerkt, okay, eigentlich kann man es ja alles verstehen, wenn man es Schritt für Schritt versucht zu verstehen.
Das war halt immer im Matheunterricht so das große Problem für mich, dass ich einfach diese Zwischenschritte, wenn ich da was nicht verstanden habe, nicht hinterhergekommen bin. Und dann waren die weg, dann habe ich irgendeinen Zwischenschritt nicht verstanden und den ganzen Rest dann auch nicht mehr so richtig. Aber wenn man das so systematisch rangeht, und ich denke mal, so ähnlich ist es auch mit Statistik, wenn man da versucht, Freude dran zu empfinden und versucht das auch zu verstehen, dann wird einem das im Studium auch sehr viel leichter fallen, als wenn man da schon so mit dem Mindset rangeht, von wegen, ich bin schlecht in Mathe und habe keine Lust zu verstehen.
Und vielleicht noch mal ganz kurz zu deiner Biografie: Du hast Mathe studiert, Mathe abgeschlossen, hast schon gesagt, wusstest eigentlich selber erstmal gar nicht so richtig, was soll ich jetzt damit machen. Aber du hast ja eigentlich was aufgebaut, eine Selbstständigkeit, ein kleines Unternehmen kann man eigentlich sagen. Wie kam es dann dazu?
Daniela: Genau. Also zu Beginn erstmal, wir haben im Studium so eine studentische statistische Beratung angeboten. Also waren am Anfang nur drei Studierende, dann später kam mehr dazu, und da konnten andere Studierende einfach zu uns kommen. Da waren dann Biologen, Soziologen, die einfach mit ihren tatsächlichen Statistikproblemen zu uns kamen, und da haben wir erstmal überhaupt verstanden, was das ist, Statistikberatung zu machen. Das ist doch noch mal ganz anders als eine Statistikvorlesung mit Übungsaufgaben. Da habe ich aber einfach gemerkt, dass mir das Spaß macht und dass ich das gut kann und auch gut anderen das vermitteln kann.
Und das ist mir dann erstmal einfach geblieben. Ich wollte mich nicht gleich selbstständig machen, sondern hatte erst ein Kind bekommen, das erste Kind direkt am Ende des Studiums, war ein bisschen in anderen Projekten involviert, wo ich auch ein bisschen Gründungserfahrung schnuppern konnte. Dann wieder zurück an der Uni, zweites Kind bekommen und dann war es einfach so: Okay, ich brauche einen familienfreundlichen Job, der mich aber trotzdem herausfordert und Spaß macht. Und dann habe ich tatsächlich gesagt, okay, ich probiere das, ich mache mich selbstständig. Und davor war es aber so, dass ich gedacht habe, es ist nichts für mich, weil ich einfach gedacht habe, ich bin kein Unternehmertyp. Aber das war einfach ein falscher Glaubenssatz, ich habe es mir einfach falsch vorgestellt.
Dann habe ich mir auch selber die Erlaubnis gegeben, dass es langsam wachsen darf. Das war, glaube ich, ganz gut. Und dann ist es eben langsam gewachsen. Ich habe auch zu Beginn noch keine Vorstellung davon gehabt, wie ich jetzt arbeite. Natürlich hat sich die Welt verändert, wir haben jetzt die ganzen Online-Tools, das war damals auch noch nicht so. Aber ich habe mir auch das nicht so geplant, sondern habe immer wieder geguckt, okay, in welche Richtung will ich gehen, was macht mir Spaß, und dann auch verschiedenes ausprobiert. So mache ich das auch immer noch.
Christian: Darf ich mal fragen, in welchem Jahr das war, wo du so angefangen hast oder gemerkt hast, okay, das ist was, wo ich auch von leben kann?
Daniela: Also angefangen, dass ich gesagt habe, ich bin jetzt Vollzeit selbstständig, also raus aus der Uni, wo ich vorher noch eine Stelle hatte, das müsste 2012 gewesen sein. Und da war aber wirklich noch Beratung entweder vor Ort oder per E-Mail und Telefon. Ich habe noch nicht mit Online-Tools da gearbeitet, dann kam irgendwann Webinar-Tools und so dazu. Aber das war noch lange, bevor jeder Zoom benutzt oder so und dass es auch stabil läuft wie jetzt. Das war schon noch anders.
Christian: Das war noch eine ganz andere Zeit. Da war ich in der Zeit war ich auch selbstständig als Lektor und im Online-Marketing tätig. Ich glaube, da war alles auch noch ein bisschen einfacher. Facebook gab's da auch schon, aber das war noch nicht so groß und Instagram noch nicht so wichtig wie heute. Und da war es irgendwie auch ein bisschen einfacher, sich so eine Selbstständigkeit aufzubauen. Heute ist es wahrscheinlich auch einfach, aber auf eine andere Art und Weise. Da fängt man zum Beispiel häufig an, sich auf Instagram erstmal eine Followerschaft aufzubauen und dann guckt man, was daraus entsteht. Das war damals noch nicht so.
Dann lass uns doch mal ein bisschen an das Thema einsteigen. Wir haben uns überlegt, dass wir erstmal gucken wollen, was sind so die ganz typischen Vorbehalte, die ganz viele Menschen haben, die ein Statistikmodul zum Beispiel absolvieren müssen. Ich will mal ein Extrembeispiel vorab nennen. Das habe ich jetzt vor ein paar Tagen eigentlich erst gelesen. Das war eine Studierende, die hat gesagt, sie hat sich ihren Studiengang so ausgesucht, dass der extra so ist, dass da keine Statistik und Mathematik und so enthalten ist. Und das finde ich eigentlich schon krass, weil da jemand sich so ein bisschen auch eine Zukunft eigentlich verbaut durch so eine Entscheidung. Deswegen kann ich das Studium jetzt leider nicht machen, weil warum auch immer. Da waren jetzt keine Gründe genannt, aber diese Gründe, die können wir vielleicht so ein bisschen aufdröseln. Was sind so ganz typische Vorbehalte, die du so kennst aus deiner Beratung?
Daniela: Also im Grunde hatten wir das vorhin auch schon, nämlich dieses In Mathe kann ich einfach nicht, in Mathe war ich immer schlecht. Das ist einfach was, das die Leute davor abhält, es überhaupt zu tun, oder dass sie dann wirklich richtige Ängste entwickeln, wenn sie es dann tun müssen, oder vielleicht dann auch in der Abschlussarbeit sagen, nee, dann arbeite ich doch lieber qualitativ, weil Statistik kann ich nicht. Und dann finden sie vielleicht auch einen schweren Weg. Das stimmt einfach nicht. Also bei Mathe und bei Statistik, klar muss nicht jeder Mathe studieren und hat wahrscheinlich auch nicht jeder Spaß dran, da drin gut zu werden. Aber die Mathematik und gerade die Statistik, wie wir es jetzt hier benutzen, ist ja einfach nur ein Werkzeug, ein Tool, und das kann wirklich jeder lernen. Jeder, der ganz normal in der Schule war, kann das auf jeden Fall verstehen. Auch das wissenschaftliche Arbeiten, das sind alles einfach nur Handwerksdinge, die kann man sich beibringen. Das schafft jeder. Da braucht man keine gute Mathenote zu haben.
Christian: Ist das denn überhaupt so viel Mathe, wie sich da manche vorstellen? Also ich hatte in der Schule Integralrechnung, ich weiß heute gar nicht mehr, wie das irgendwie funktioniert. Und Differentialrechnung. Braucht man da irgendwie sowas?
Daniela: Braucht man nicht, also davon braucht man gar nichts in Statistik. Es kommt drauf an, wie die Professoren ihre Vorlesungen gestalten, ob man dann viel selber rechnen muss, Formeln auswendig kennen muss oder so. Das macht natürlich jeder Dozent anders. Aber in der angewandten Statistik, wenn man jetzt vor den eigenen Daten sitzt und eine eigene Forschungsfrage auswerten will für die Master- oder Bachelorarbeit, da muss man selber gar nichts rechnen, weil das wird ja alles mit der Software gemacht. Man muss auch keine Formeln auswendig können. Selbst wenn die vielleicht in der Vorlesung kamen, kann man die im Grunde vergessen.
Ich versuche, meine ganzen Inhalte ohne Formeln zu machen. Es gibt Ausnahmen, also es gibt wirklich komplexe Sachen, wo ich sage, okay, jetzt ist es besser, wir schauen uns wirklich eine Formel an, dann kann ich es besser erklären. Aber für die meisten Sachen braucht man es gar nicht. Es gibt natürlich auch Leute, die lernen gut mit Formeln, die können ein statistisches Konzept besser verstehen, wenn sie sich die Formel dazu anschauen. Dann ist das natürlich super, aber man braucht's auf jeden Fall nicht, um selber eine Datenanalyse zu rechnen oder die eigenen Ergebnisse dann auch zu verstehen.
Christian: Okay, also mit meinem Abiturmathematik-Verständnis komme ich dann auch gut rein in das Thema. Also ich kann verstehen, wie eine Formel funktioniert, kann vielleicht Formeln umstellen und kann einigermaßen einen Taschenrechner bedienen. Das reicht eigentlich völlig aus, um sich dem Thema anzunähern.
Gut. Ich habe auch noch ein paar Vorbehalte recherchiert, die so typisch sind. Einer, den würde ich mal nennen, ist so die Technik, die man braucht. Also zum Beispiel muss man Software irgendwie bedienen können. Ist das typisch oder gibt's da vielleicht auch Unterschiede zwischen Männern und Frauen?
Daniela: Ja, also es ist schon so, dass man eine Software braucht und es macht auch wirklich Sinn, dass man sich mit einer Statistiksoftware auseinandersetzt und das nicht versucht, in Excel zum Beispiel zu machen, zumindest für die meisten Dinge. Aber auch da gibt's ja sehr unterschiedliche Arten von Software und da kann man sich auch eine suchen, mit der man gut klarkommt. Kommt immer drauf an, was man natürlich für Vorgaben hat, aber da gibt's auch wirklich Software, durch die man sich einfach durchklicken kann. Zum Beispiel bei SPSS ist es so, natürlich ist es dann trotzdem noch viel, was es da gibt, und da braucht man vielleicht trotzdem noch ein Tutorial, das ein bisschen hilft, oder man muss was recherchieren. Aber es ist nicht so, dass man da total technik- oder computeraffin sein muss. Alles, was man da braucht, ist das, was wir alle nutzen. Wir sitzen ja alle am Computer und benutzen das. Da keine Angst davor haben, das kann man auf jeden Fall lernen.
Christian: Ich denke mal, das ist heute auch sehr viel einfacher geworden als noch vor 20 Jahren. Es gibt Angebote wie deine Statistik-Akademie, wo man sicherlich auch gezeigt bekommt, wie man die Software bedient. Es gibt Tutorials ohne Ende auf YouTube und ganz viele Möglichkeiten, sich auch schnell in eine Software einzuarbeiten. SPSS kenne ich jetzt persönlich natürlich nicht, ich hatte ja schon gesagt, ich habe nie ein Statistikmodul absolviert. Aber ich kenne das von Kommilitonen zum Beispiel aus anderen Studiengängen, irgendwas im Bereich der Sozialwissenschaften zum Beispiel. Dann konnte ich das immer so ein bisschen beobachten. Vor 20 Jahren gab's diese Software auch schon und die sind auch damals durchgekommen. Das war halt natürlich auch mal so ein bisschen Gemecker, ja, das ist schwierig und kompliziert, aber die sind trotzdem durch ihre Module dann durchgekommen, weil die sich halt einfach damit auseinandergesetzt haben. Also bitte auch keine Angst vor der Technik. Vom Computer hat ja sowieso keiner mehr Angst heutzutage und auch nicht vor dieser Software. Das kann man dann alles lernen. Hast du noch irgendeinen Vorbehalt, der dir so häufig unterkommt?
Daniela: Spontan fällt mir eigentlich gerade keiner mehr ein. Meistens ist einfach diese Angst. Natürlich kommt immer dazu, wenn es eine Abschlussarbeit ist oder so, die Angst zu versagen oder es nicht gut genug zu können. Das hat man natürlich immer, gerade vielleicht auch, wenn man von zu Hause keine Unterstützung in die Richtung hat oder vielleicht eine schlechte Betreuung hat. Das kommt auch sehr oft vor, dass die Betreuungsperson entweder keine Zeit hat oder sich keine Zeit nehmen will, und dann ist natürlich die Ausgangssituation schwieriger. Aber wie gesagt, es kann wirklich jeder schaffen. Es ist wirklich nicht so, dass nur irgendwelche Brains wissenschaftlich arbeiten können oder Statistik verstehen können.
Christian: Das war auch was, was mir noch notiert hatte, so in meiner Recherche, einfach so eine Angst davor, Fehler zu machen. Aber ich glaube, die sollte eigentlich noch viel geringer sein, als wenn man jetzt qualitativ arbeitet, weil die Ergebnisse hier einfach ganz eindeutig sind in dem Sinne. Und wir wollen dann auch noch mal über Interpretation reden und da vielleicht auch noch mal diesen Vorbehalt etwas entgegnen, dass man einfach seine Daten hat und dann guckt man: Wenn da jetzt ein Ergebnis zustandekommt, mit dem man nicht gerechnet hatte, dann gehört das eben auch zur wissenschaftlichen Arbeit dazu.
Vielleicht machen wir den Bogen mal kurzzeitig ein kleines bisschen höher als über das Studium hinaus. Viele brauchen das halt im Studium, weil das irgendwie zum Studiengang gehört, und dann muss man ein Modul absolvieren und vielleicht braucht man es dann auch für seine Abschlussarbeit. Vielleicht gucken wir aber erstmal zusammen, wie man das im Alltag und im Berufsleben anwenden kann. Bei mir zum Beispiel, ich bin im Online-Marketing tätig, da braucht man das häufig. Im Online-Marketing macht man zum Beispiel häufig so Split-Tests, man stellt verschiedene Versionen von der Webseite gegenüber und wertet dann Nutzerdaten oder Nutzerverhalten aus und dann guckt man, gibt's da jetzt zum Beispiel signifikant mehr Klicks auf die eine Version der Seite als auf die andere. Das ist eigentlich was, wo ich zumindest unbewusst im Alltag Statistik anwende. Hast du noch so ein paar Sachen, wo man das im Alltag oder auch im Berufsleben anwendet?
Daniela: Ja, also im Berufsleben glaube ich total oft. Auch wenn man jetzt eigentlich denkt, ich bin hier nicht auf einer Stelle, wo ich Statistik brauche, aber du wirst ja sicher auch einfach mit Daten oder mit Ergebnissen arbeiten. Zum Beispiel wenn du irgendwie Controlling-Ergebnisse im Unternehmen dir anschaust, dann musst du auch diese Zahlen einschätzen können. Wenn dir die Marketingabteilung was hinlegt, dann wirst du vielleicht auch einschätzen können, wie valide ist es. Haben die da zehn Leute befragt oder 1000? Also das ist einfach so ein bisschen gesunder Menschenverstand, mit Statistik gefüttert sozusagen, den man einfach bekommt, wenn man mal quantitativ gearbeitet hat. Dann bekommt man einfach ein Gefühl dafür, ist es jetzt eine valide Aussage, kann ich mich darauf berufen? Oder man hinterfragt auch direkt, okay, wie haben die die Daten erhoben?
Das ist auch dann im Alltag, unabhängig vom Beruf: Wenn man Schlagzeilen liest und dann steht, eine neue Studie hat ergeben das und das, dann schaue ich da sofort, okay, wie haben die die Daten erhoben? Was steckt da wohl dahinter? Wie transparent ist es überhaupt berichtet? Meistens findet man nicht viel raus, aber dann kann man sich halt denken, okay, warum haben sie es nicht gesagt, wie sie es gemacht haben? Man bekommt einfach ein viel besseres Gefühl dafür, auch solche Studienergebnisse, die man vielleicht privat nutzen würde für Entscheidungen, gut einzuschätzen.
Christian: Okay, also auch im Management zum Beispiel lohnt sich das, sich mal damit auseinanderzusetzen. Man wird da jetzt keine Tests entwerfen in der Regel, sondern guckt sich halt häufig mal die Ergebnisse an. Aber um dann einfach das auch zu hinterfragen, da kritisch zu sein, lohnt sich selbst als Manager oder Managerin, sich auch mal mit Statistik auseinanderzusetzen. Marketing hatte ich auch schon genannt, so auch ein ganz typischer Bereich, wo man viel mit Daten zu tun hat und auch viele Tests entwirft. Und ich denke, dass sehr viele, die im Marketing tätig sind, sich im Studium schon mit Statistik auseinandergesetzt haben. Finanzwesen, ja, auch so ein ganz typischer Bereich, wo man ganz viel mit Zahlen und Daten zu tun hat.
Ich hätte noch einen Alltagsbereich, der ist vielleicht auf den ersten Blick nicht so offensichtlich, und das ist der Bereich Sport. Ich mache selber relativ viel Sport und ich tracke auch viele Sachen gerne. Viele tracken ja gerne, wenn sie laufen gehen. Ich versuche, so mein Herzkreislaufsystem ein bisschen zu beobachten, aus gesundheitlichen Gründen, und da messe ich zum Beispiel jeden Tag aktuell zumindest die sogenannte Herzfrequenzvariabilität. Ich gucke mir den Herzschlag an, ich will da nicht zu sehr ins Detail gehen, aber man guckt, wie sind die Abstände zwischen den einzelnen Herzschlägen. Kann man mit so Fitnesstrackern machen. Und die App, die ich benutze, die ist da sehr wissenschaftlich eigentlich. Da stehen dann alle möglichen Werte und dann kann man versuchen, diese Werte zu korrelieren mit Dingen, die man so subjektiv angibt, zum Beispiel wie gut habe ich geschlafen, wie gut war mein Training, wie fit war ich im Training. Und dann versucht diese App, Korrelationen herzustellen, wenn man da genug Daten hat. Das ist eigentlich was, wo ich das auch im Alltag anwende und beobachte. Für Leistungssportler ist es vielleicht auch ganz sinnvoll, sich damit zu beschäftigen.
Ein anderes Thema, über das wir reden wollen, um noch tiefer in das Thema einzusteigen, sind die Methoden und Kernkonzepte. Kannst du uns erstmal sagen, was muss ich eigentlich ganz konkret wissen, bevor ich überhaupt loslege mit statistischer Arbeit?
Daniela: Also wichtig ist schon mal, und das ist vielleicht auch noch so ein Fallstrick zu Beginn, dass man nicht glauben sollte, dass man alles können muss, weil es gibt einfach extrem viele Statistikmethoden. Je tiefer man einsteigt, umso größer und komplizierter wird das. Aber kein Mensch braucht die alle und ich brauche auch nicht mal die zu kennen, die ich am Ende meines Projekts vielleicht brauche, wenn ich mit dem Projekt starte.
Aber was ich auf jeden Fall brauche, ist so ein Grundverständnis, wie statistische Datenanalyse und quantitative Forschung funktioniert. Wenn ich nämlich ganz blank reingehe, sagen wir mal, ich habe eine Abschlussarbeit geplant und soll einen Fragebogen entwerfen, damit Daten erheben, und habe noch überhaupt keine Idee, was am Ende mit Statistik möglich ist und was da vielleicht dann gemacht wird, dann ist der Fragebogen wahrscheinlich ziemlich schlecht, den ich entwickelt habe. Es fehlen vielleicht Themen, die ich eigentlich untersuchen wollte, oder die Fragen sind so formuliert, dass ich mit den Antworten gar nichts anfangen kann.
Das heißt, man braucht schon ein bisschen eine Idee: Wie erhebt man gute Daten, was ist eine Grundgesamtheit, was ist die Stichprobe, wie stelle ich sicher, dass es alles valide ist, wie funktioniert so eine Datenanalyse grob, wie ist die aufgebaut, was bedeutet Signifikanz, was ist eine Hypothese? Also mit diesen ganzen Grundbegriffen sollte man sich schon ein bisschen auskennen, aber man muss jetzt nicht alle Methoden im Detail kennen oder genau die Software schon komplett wissen.
Christian: Okay, vielleicht können wir ein paar kleine Begriffe mal kurz klären. Zum Beispiel die Grundgesamtheit. Was ist das eigentlich?
Daniela: Genau. Wenn ich eine Forschungsfrage habe, die habe ich bekommen oder mir selber ausgedacht, dann gilt diese Forschungsfrage für eine Grundgesamtheit, auch wenn ich das nicht so formuliere. Aber wenn ich jetzt zum Beispiel sage, sind Studierende, die mehr lernen, besser in ihrer Abschlussprüfung, dann meine ich damit Studierende. Das steht jetzt schon drin. Und dann muss ich mir überlegen, okay, welche genau meine ich jetzt? Meine ich nur Fernstudierende, meine ich alle deutschsprachigen Studierenden, meine ich alle Studierenden der ganzen Welt, meine ich die in einem bestimmten Fach? Und das, was ich hier meine, das ist dann die Grundgesamtheit.
Wenn ich jetzt zum Beispiel sage, es geht um alle deutschsprachigen Fernstudierenden, dann ist das die Grundgesamtheit, und über diese Grundgesamtheit soll dann am Ende meine Aussage gelten. Und dann ziehe ich eine Stichprobe, das heißt Leute, die ich befrage: Wie viel hast du gelernt, wie war deine Abschlussprüfung? Diese Stichprobe ziehe ich aus der Grundgesamtheit raus. Und die Idee ist eigentlich theoretisch, haben wir aber nie in der Praxis so, dass diese Stichprobe zufällig gezogen wird aus der Grundgesamtheit. Das heißt, die theoretische Idee ist, jedes Element aus der Grundgesamtheit, also jeder deutschsprachige Fernstudierende, hat die gleiche Wahrscheinlichkeit, in meiner Stichprobe zu landen. Das haben wir nie, aber so ist die Theorie. Und wenn ich auf dieser Stichprobe dann diese Befragung durchführe und da was ausrechne, dann sind die Ergebnisse verallgemeinerbar auf die Grundgesamtheit.
Deswegen ist es total wichtig zu wissen, was ist eigentlich meine Grundgesamtheit und wie bin ich an die Stichprobe gekommen. Wenn ich das so formuliere, allgemein für Fernstudierende, und dann frage ich aber nur Psychologiestudentinnen, dann gilt mein Ergebnis für Psychologiestudentinnen und nicht allgemein für Fernstudierende. Das muss ich einfach klar haben. Für mich, es ändert nichts an der Statistik, aber es ändert was an der Interpretation der Ergebnisse am Ende.
Christian: Ist auch ganz praktisch zu verstehen für mich. Ich programmiere auch sehr viel und da muss ich ganz viel mit Datenbanken arbeiten. Dann habe ich in so einer Datenbank eine Masse an Nutzern und dann filtere ich mir da erstmal bestimmte Nutzer raus. Und das ist als Studiengang angegeben hat und so weiter. Und dann, gut zu wissen, ich brauche eigentlich auch nicht alle, die jetzt Psychologie studieren, sondern kann mir da auch Stichproben raussuchen, um zum Beispiel Daten zu sparen oder Rechenkapazität zu sparen. Das ist ja ganz praktisch.
Anderer Begriff, das ist der Begriff der Signifikanz. Und da möchte ich noch mal einen kleinen Tipp mit dazu geben. Ich habe in der Vorbereitung ChatGPT benutzt, um mir ein paar Begriffe erklären zu lassen, und habe gesagt, versuch mir das mal bitte so zu erklären, als bin ich 6 Jahre alt. Das war ganz praktisch, auch mal so als Tipp für diejenigen von unseren Zuhörerinnen und Zuhörern, die trotzdem bisschen Schwierigkeiten haben, schwierige Begriffe zu verstehen: Lasst euch das mal einfach so auf diese Art und Weise erklären. Was bedeutet Signifikanz?
Daniela: Ja, also das ist wichtig, dass wir dann hier von der statistischen Signifikanz sprechen. Also immer wenn ich signifikant sage, meine ich immer statistisch signifikant. Ich hole ein bisschen aus. Wir haben ja unsere Forschungsfrage und aus dieser Forschungsfrage formulieren wir Hypothesen, meistens mehrere. So eine Hypothese wäre dann, was ich vorhin schon angedeutet habe, zum Beispiel: Jemand, der mehr Lernzeit hat, hat am Ende eine bessere Note. Dann muss man dazu eine statistische Nullhypothese formulieren, die heißt dann, die Lernzeit korreliert nicht mit der Note. Das wäre die Nullhypothese. Und die wird dann versucht abzulehnen. Also dann rechnen wir den Signifikanztest und der versucht, diese abzulehnen. Das heißt, der versucht nachzuweisen, dass diese Nullhypothese, es gibt keinen Zusammenhang, dass die nicht stimmt. Und wenn das passiert, dann sagen wir, das Ergebnis ist signifikant. Und dann können wir sagen, es gibt einen signifikanten Zusammenhang zwischen Lernzeit und Ergebnis in der Prüfung.
Das einzige, was signifikant hier dann bedeutet, ist, dass dieser Zusammenhang, den wir hier messen in den Daten, überzufällig ist. Das heißt, dass der nicht nur zufällig hier in dieser Stichprobe entstanden ist, sondern dass der so bedeutsam und so groß ist, basierend auf dieser Stichprobe, dass wir ihn verallgemeinern dürfen auf die Grundgesamtheit. Das ist alles, was signifikant heißt. Das heißt aber eben nicht, dass es ein inhaltlich bedeutsamer Zusammenhang ist. Es könnte sein, dass zum Beispiel rauskommt, wenn ich zwei Stunden länger lerne, dann habe ich einen Punkt von 60 mehr in meiner Prüfung am Ende. Dann würden wir vielleicht sagen, gut, dann ist es aber gar nicht bedeutsam, aber vielleicht trotzdem statistisch signifikant. Das muss man immer auseinanderhalten.
Christian: Und woher weiß ich dann, dass es kein Zufall mehr ist?
Daniela: Dass es kein Zufall ist, weißt du, wenn es eben signifikant ist, und dafür kriegen wir eine Kennzahl. Das ist der sogenannte p-Wert. Der wird ausgerechnet. Du rechnest einen Test mit einer bestimmten Formel, die Software macht das für dich. Da kommen paar Zahlen raus und eine Zahl davon ist der p-Wert. Und wenn der kleiner ist als 0,05, dann sagen wir, das ist signifikant, also überzufällig. Und diese 0,05 ist aber auch wieder eine Grenze, die wir uns selber geben beziehungsweise die mal ein Herr Fisher aufgeschrieben hat und die alle benutzen. Man könnte auch eine andere nehmen. Das heißt einfach, dass wir eine Fehlentscheidung in maximal 5 % der Fälle uns erlauben. Und da hört man auch gleich wieder raus, dass es auch gar nicht so wahnsinnig sicher ist, was wir da als Ergebnis haben. Wir erlauben uns einfach nur eine kleine Fehlerwahrscheinlichkeit.
Christian: Also diese Grundbegriffe sollte man natürlich im ersten Schritt mal verstehen und sich damit auseinandersetzen. Das machen natürlich die meisten Studierenden auch, wenn die ihr Statistikmodul bearbeiten, da ist es halt so, dass man erstmal die Begriffe klärt. So kann man sich natürlich auch schon mal vorab angucken, wenn man dieses Modul noch nicht absolviert hat, einfach um es dann noch leichter zu haben, in das Thema reinzukommen.
Methoden, das war jetzt noch so mit das Oberthema, worüber wir gerade reden wollten. Du hast gesagt, es gibt wirklich ganz viele Methoden. Das ist mir auch bei der Recherche aufgefallen, da habe ich glaube ich erstmal 15 verschiedene Methoden oder so gefunden. Ich habe mir jetzt ein paar rausgesucht. Zum Beispiel deskriptive Statistik. Ist das eine Methode?
Daniela: Ja, es ist eigentlich ein Methodenpool. Das sind die ganzen beschreibenden Methoden, also deskriptiv gleich beschreibend, alle Methoden, mit denen man Zusammenhänge und Unterschiede beschreibt. Wenn man das hört, deskriptive Statistik, dann denkt man, oh Gott, wie kompliziert. Aber das sind Dinge, die wir sowieso die ganze Zeit machen, auch im Alltag. Beschreibende Statistik ist zum Beispiel, wenn ich einfach nur zähle, wie viele Schuhe habe ich zu Hause, dann ist das eine Häufigkeit. Oder wenn du deinen Blutdruck trackst oder vielleicht einen Mittelwert vom Blutdruck über die ganze Woche dir ausrechnest, dann ist dieser Mittelwert auch schon beschreibende Statistik. Also mit solchen einfachen Kennzahlen arbeitet man in den deskriptiven Methoden.
Oft kommen dann auch noch die Grafiken dazu. Die würde ich da auch immer mit dazu ergänzen, weil die auch beschreibend sind, weil ich da auch nur was beschreibe. In den Grafiken visualisieren wir oft genau diese Kennwerte wie Häufigkeiten, Mittelwerte oder so. Und das ist auch wichtig, dass man damit loslegt. Also dieser Block deskriptive Methoden, damit sollte man auch immer anfangen, wenn man vor den eigenen Daten sitzt und mit der Statistik anfangen will. Das ist immer der erste Schritt, die erstmal deskriptiv zu analysieren.
Christian: Hast du noch eine ganz typische, auch häufig vorkommende Methode für uns?
Daniela: Also was schon wichtig ist, ich habe gerade den Mittelwert genannt. Der Mittelwert ist ein Lagemaß und da sollte man beachten, dass man, wenn man den angibt, immer auch ein Streumaß dazu angibt. Das vergessen wir leider oft, weil wir immer denken, ja, ich wollte ja nur den Durchschnitt wissen, dann habe ich den Mittelwert. Aber es ist total wichtig, dass man immer eine Streuung mit angibt, um zu sehen, wie unterschiedlich die Daten sind. Wir berichten am Ende ja nicht mehr die Daten. Die Leute, die das Paper lesen, die unsere Arbeit lesen, gucken ja nicht in den Datensatz rein, sondern die haben dann nur noch diesen einen Mittelwert, und der kann gleich sein, egal ob die Daten sehr nah beieinander lagen oder sehr unterschiedlich. Diese Information fehlt. Deswegen muss auf jeden Fall immer noch ein Streumaß dazu. Das wäre zum Beispiel die Standardabweichung.
Christian: Ja, Standardabweichung, auch so ein Begriff. Ich hatte vorhin schon mal gesagt, ich habe als Lektor gearbeitet. Da habe ich viele Dissertationen gelesen. Standardabweichung, typischer Begriff, den ich da nicht 100.000 Mal gelesen habe in den Abschlussarbeiten.
Also es gibt ganz viele Methoden. Für mich jetzt die Frage als Laie: Wie finde ich denn jetzt die richtige, die irgendwie passt zu meiner Forschungsfrage?
Daniela: Ja, da muss man so einen Prozess durchgehen. Was du schon gesagt hast, passend zur Forschungsfrage, das ist total wichtig, dass man wirklich an der Forschungsfrage anfängt und dann zu den Hypothesen geht. Man hat die Forschungsfrage, die ist meistens ein bisschen größer und offener formuliert, und aus dieser Forschungsfrage muss man dann spezifische Hypothesen formulieren, die sehr klar und präzise sind. Es ist manchmal auch ein bisschen schwierig, dass man wirklich bei jeder einzelnen Hypothese nur auf einen Punkt kommt, aber das ist wirklich wichtig.
Dann nimmt man diese eine Hypothese und macht das dann später für die anderen auch und geht dann mit der durch einen Prozess. Da muss man zuerst schauen, was ist in dieser Hypothese formuliert, welche Variablen. Das ist auch wieder so ein Grundbegriff. Variablen sind alles, was wir quasi gemessen haben. Das kann zum Beispiel das Geschlecht sein, die Studienzeit, das Gewicht. Ich schaue, welche Variablen stecken jetzt in dieser Hypothese drin. Und für diese Variablen muss ich dann noch rausfinden, was die für einen Variablentyp haben. Da hat man entweder metrische Daten wie beim Alter oder beim Gewicht, oder man hat nominale Daten wie beim Geschlecht, oder man hat ordinale Daten wie zum Beispiel eine Schulnote 1 bis 6, das wäre ordinal.
Was ich auch noch auf dem Schirm haben muss, ist, wie ich die Daten erhoben habe, ob ich eine Messung an einem Zeitpunkt habe oder an mehreren, weil manchmal geht's ja auch über den Zeitverlauf, und die Situationen, wo man den Zeitverlauf untersucht, brauchen ganz andere Statistikmethoden. Da muss man sehr drauf aufpassen. Und wenn ich das habe, also Variablen, Variablentypen und ob es Messwiederholung ist oder nicht, dann ist eigentlich schon relativ klar, welche Methode passt, ob es eine Korrelation ist oder ANOVA oder ein t-Test.
Aber dann kommt leider noch was. Dann weiß ich nämlich diese Methode, okay, die würde jetzt passen von meinem Design her. Dann muss ich aber doch noch mal in die Daten reinschauen, weil diese Methoden haben meistens mehrere Voraussetzungen und die muss ich dann tatsächlich in meinen Daten prüfen. Manche brauchen zum Beispiel, dass die Daten normalverteilt sind. Manche dürfen keine Ausreißer in den Daten haben. Manche brauchen eine gleiche Varianz in verschiedenen Gruppen. Manche brauchen Linearität. Da kann ich aber wirklich einfach in dem Statistikbuch nachgucken, okay, die Methode, was sind die Voraussetzungen, und dann muss ich wirklich in die Daten reingehen und das erstmal untersuchen, um dann zu entscheiden, ob ich die auch benutzen darf.
Christian: Da hat man so ganz viele Methoden. Und wenn ich jetzt so eine Bachelorarbeit anfange, dann werde ich da ja nicht einfach ins kalte Wasser geschmissen, oder möchte ich zumindest nicht. Aber ich habe den Eindruck, bei so vielen Methoden habe ich in so einem einzelnen Modul im Studium gar keine Zeit, jede erstmal einzuüben. Wie gehe ich denn da ran? Ich habe jetzt eine Methode, die habe ich vielleicht noch nie verwendet. Kann ich das irgendwie trotzdem noch mal üben?
Daniela: Ja, also auf jeden Fall in dem Statistikbuch einfach nachgucken. Es gibt ein paar gute angewandte Statistikbücher, also nicht die, die Statistikstudierende haben, sondern wirklich die angewandten sich anschauen, wo man gut erklärt findet, was die Voraussetzungen sind. Das ist eigentlich immer das Wichtigste. Und dann am besten ein Tutorial suchen für die eigene Software. Wenn ich jetzt weiß, ich arbeite mit SPSS, und ich weiß, ich brauche die ANOVA, dann würde ich vielleicht einfach bei YouTube gucken, wie geht die ANOVA mit SPSS, und dann finde ich dort eine Anleitung, dass ich wirklich sehe, wie es jemand mir vormacht, wie funktioniert es. Dann im Idealfall habe ich auch noch gleich einen Beispieldatensatz dazu, so dass ich mich selber mal durchklicken kann. Und dann muss man einfach gucken, wie weit kann ich das jetzt übertragen auf meine Situation? Ist es wirklich genauso oder muss ich es ein bisschen anpassen? Aber das kann man schon auch tatsächlich vorher ein bisschen üben, also auch bevor man die eigenen Daten hat. Das lohnt sich auch, weil dann wird man einfach ein bisschen warm und ist dann mit den eigenen Daten später schneller.
Christian: Okay, ich denke, was auch Sinn macht, ist immer viel Forschungsliteratur zu lesen und zu gucken, was haben die anderen eigentlich genau gemacht und benutzt, dass man dann ein Gefühl dafür kriegt: Okay, ich habe diese Daten und dann würde ich so wahrscheinlich vorgehen. Die anderen machen das ja auch so.
Daniela: Genau. Und das ist vor allem auch dann sinnvoll, wenn man sich fragt, wie schreibe ich denn jetzt auf? Weil mit der Software bekommt man ja meistens viel, also unstrukturiert und viel zu viel Information. Dann muss man es ja in eine bestimmte Form packen und da kann man sich auch dran orientieren, was andere dann davon tatsächlich genutzt haben zum Aufschreiben. Wie haben die das formuliert, dass man auch so ein bisschen in den Sprech reinkommt.
Christian: So, gehen wir mal einen Schritt weiter in der Praxis. Ich habe jetzt die Daten, ich habe eine Methode oder Methoden gefunden und wir wollen die Daten jetzt analysieren und aufbereiten. Wir haben schon ganz viel über Tools gesprochen. SPSS fiel jetzt schon sehr häufig als Name. Was gibt's denn generell so für Tools? Können wir vielleicht erstmal so eine ganz grobe Übersicht schaffen? Excel fällt mir so ganz spontan als erstes ein.
Daniela: Ja, genau, mit Excel kann man ein bisschen was machen. SPSS ist halt ein sehr weit verbreitetes Tool, das an vielen Hochschulen auch verwendet wird, auch in verschiedenen Fachbereichen. Da muss man einfach gucken, ob man den Zugang bekommt von der Hochschule beziehungsweise wenn man als Student eingeschrieben ist, dann bekommt man auch anderswo im Internet eine Studierendenlizenz, die dann auch bezahlbar ist. Ansonsten gibt's aber auch noch Stata oder SAS. Das sind auch alles Programme, die sehr viele Methoden drin haben.
Und wenn man ein bisschen flexibler sein will und sich auch ein bisschen traut zu programmieren, dann kann man auch zum Beispiel mit Python oder mit R arbeiten. Mit R arbeite ich total gern und ich habe auch wirklich viele Kunden, die mit R arbeiten wollen oder müssen. Da ist es aber auch wieder so, dass man sich das ruhig trauen soll. Egal ob jetzt Python oder R, man muss dann programmieren, aber es heißt nicht, dass ich die komplette Programmiersprache können muss, sondern man nutzt dann auch einfach Bausteine. Man schaut dann in dem Forum oder in dem Buch oder in dem Kurs nach dem Code, benutzt den dann für sich selber, passt den an. Es gibt eine super Hilfe, wo man viel rauskopieren kann, und da kann man sich auch wirklich super einarbeiten. Aber es ist schon so, dass Software, wo man programmieren muss, natürlich mehr Einarbeitungszeit braucht, als wenn ich SPSS aufmache und mich durchklicke. Der Vorteil ist aber, dass es halt wirklich super flexibel ist, wenn man mit diesen Programmen arbeitet.
Christian: Empfiehlt sich dann wahrscheinlich, wenn man tatsächlich auch in die Forschung geht, wenn man promoviert und auch wirklich komplexe Projekte zu bearbeiten hat.
Bei Programmiersprachen vielleicht auch mein Tipp: Ich programmiere auch selber sehr viel. Da ist eigentlich in den letzten Monaten und letzten ein, zwei Jahren eine riesige Erleichterung durch KI entstanden. Du hast gerade gesagt, da guckt man in Foren und sucht sich die Snippets raus. So lief das auch alles noch vor zwei, drei Jahren auch für mich. Jedes Mal, wenn ich auf irgendein Problem gestoßen bin, musste ich einfach erstmal eine halbe Stunde lang googeln, in irgendwelchen Foren lesen, gucken, ob andere Leute dasselbe Problem haben. Das mache ich fast gar nicht mehr, seit ich ein Problem einfach in ChatGPT eingeben kann, dann ein gutes Beispiel bekomme oder mir einfach auch Snippets ergänzen lassen kann.
Aber ich denke mal, das ist dann eben auch was für diejenigen, die zum Beispiel Informatik studieren oder Wirtschaftsinformatik, auch so ein typisches Fach, wo man dann auch mit Statistik zu tun hat. Da kann man sich dann R oder Python angucken und für alle anderen ist wahrscheinlich SPSS der Klassiker.
Und Excel als Tool hast du auch schon mal ganz kurz angesprochen, jetzt nicht unbedingt empfehlenswert.
Daniela: Also Excel schon auf jeden Fall für die Dateneingabe, gar keine Frage. Auch Daten sammeln, wenn man sie von jemand anders bekommt als Excel-Datei, gar kein Ding. Das Problem ist, man kann in Excel, es gibt so Statistik-Addons, die man dazu installieren kann, dann kann man auch wirklich nicht nur die allereinfachsten Sachen machen, sondern auch ein bisschen fortgeschrittenere Sachen. Aber Excel ist halt nicht dafür gebaut. Es ist halt einfach keine Statistiksoftware, und deswegen ist es erstens nicht so umfangreich, was man tun kann, und überhaupt nicht flexibel. Und es passieren in Excel halt auch Dinge, die normalerweise in einer Statistiksoftware nicht passieren dürfen. Zum Beispiel, dass man Zeilen falsch sortiert oder so. Das kann es einfach nicht geben, aber in Excel gibt's das halt, weil es eine Tabellenkalkulation ist. Deswegen würde ich gar nicht mit Excel arbeiten, wenn es nicht unbedingt sein muss. Es gibt wirklich bessere und auch leichtere Wege.
Christian: Auch nicht jetzt für so kleinere Bachelorarbeiten, wo man wirklich nur einen ganz kleinen Teil hat?
Daniela: Eigentlich nie. Ich habe auch schon Projekte betreut, wo es jemand wirklich machen wollte oder musste, aber es ist wirklich nicht schön. Da lohnt sich dann einfach, woanders hinzugehen. Es gibt auch noch ein paar Online-Rechner, die man dann vielleicht eher noch nutzen kann. Das sind teilweise Tools, wo man einfach nur einen Teil der Daten eingibt. Also jetzt nicht die ganze Datenanalyse rechnet, aber sagt, ich habe jetzt, es gibt zum Beispiel Tools, um Effektstärkemaße zu berechnen. Da gibt man einfach ein paar Kennzahlen rein und kriegt dann was raus. Sowas kann man nutzen. Oder ein Online-Tool, mit dem man einen richtig kompletten Datensatz analysieren kann: Das heißt DataTab, das ist super einfach. Also wenn man sagt, ich brauche nicht so viel, ich brauche es einfach, würde ich dann eher so ein Tool suchen, anstatt in Excel zu basteln.
Was auch noch wichtig ist, weil ich auch immer wieder von Leuten höre, die mit SPSS arbeiten, dass sie sagen, sie brauchen dann trotzdem noch Excel, um ihre Grafiken zu basteln. Das ist aber eigentlich auch Quatsch, weil SPSS kann Grafiken auf jeden Fall. Natürlich nicht alles, was man sich vorstellen kann, aber man kann da sehr viel machen und man kann da auch sehr viel anpassen. Wenn man das erstmal irgendeine Grafik in SPSS erstellt, ist sie immer ziemlich hässlich mit komischen Farben und so, aber man kann da schon reingehen und das alles ordentlich machen. Muss man halt einfach machen. Das würde ich jetzt auch nicht machen, während ich die Datenanalyse durchrechne, weil es einfach viel Zeit braucht. Aber das kann ich mir für später aufheben und sagen, okay, ich brauche jetzt diese drei Grafiken in meiner Arbeit und dann setze ich mich hin und bearbeite die halt schön. Andere sagen, sie gehen dann eben in Excel zurück und geben ihre Daten noch mal in Excel ein und basteln sich das dann. Wenn man da super schnell ist, kann man das vielleicht in der gleichen Zeit schaffen, aber es ist halt super fehleranfällig, weil es keine Statistiksoftware ist.
Christian: Ja, Excel hatte ich häufiger auch in Dissertationen, und zwar aus dem Grund, weil sich das ganz gut mit Word verbinden lässt. Wenn man da im Nachhinein noch mal ein bisschen was ändern muss an den Daten, dann klickt man glaube ich einfach nur auf das Diagramm oder die Grafik drauf und dann kann man in Excel noch mal die Zahlen so ein bisschen anpassen. Das war eigentlich mal ganz praktisch, andererseits ein bisschen nachteilig beim Formatieren. Aber okay, du sagst Excel eigentlich besser nicht. Wenn man sich gut auskennt, dann kann man es vielleicht hier und da benutzen, aber ansonsten nicht.
Datenbereinigung, auch noch so ein Thema, wenn es um die Datenaufbereitung und die Analyse geht. Kannst du uns da was dazu sagen?
Daniela: Ja, genau. Zu Beginn ist es immer wichtig, dass man sich mit dem Thema befasst, dass man nicht die Daten, die man jetzt hat, wo auch immer die herkommen, einfach so nimmt und direkt losrechnet. Wenn das ein sehr kleiner Datensatz ist, dann ist es vielleicht übersichtlich, dann wäre es vielleicht kein Problem. Aber die meisten arbeiten ja mit Datensätzen, wo man nicht auf den ersten Blick sieht, dass alles okay ist. Das heißt, das muss man sich erstmal anschauen, einfach einen Datencheck machen und dann eventuell Daten bereinigen, das heißt eventuell noch was rauslöschen und so weiter.
Da nutzt man auch statistische Methoden, das macht man auch in der Statistiksoftware. Das sind im Grunde wieder deskriptive Methoden. Ich schaue an, was ist Minimum, was ist Maximum, was ist Mittelwert, wie ist die Streuung und so. Da kann ich dann Ausreißer finden. Einerseits ja, statistische Methoden, andererseits gibt's aber keine statistischen Regeln. Ich kann jetzt nicht sagen, ich schaue mir drei Kennwerte an und dann weiß ich, welche zwei Zahlen ich rausschmeißen muss. Sondern ich muss da wirklich reinschauen und dann, wenn ich beispielsweise die Altersvariable mir anschaue und sehe, das Maximum ist 123, dann weiß ich, das stimmt was nicht. Aber das sagt mir nicht die Statistik, sondern das sagt mir mein gesunder Menschenverstand. Dann schaue ich in die Zeile rein, wo jemand 123 eingegeben hat, und gucke, hat er sich vertippt, war der eigentlich 23, oder ist es jemand, der nur Quatsch eingegeben hat im Fragebogen, dann nehme ich ihn vielleicht komplett raus. Das heißt, es sind alles kleine Entscheidungen, die man aber nur als Forscher selber machen kann. Da gibt's jetzt keinen Knopf, wo ich sage, jetzt ist es statistisch alles bereinigt, sondern da muss man wirklich reingehen.
Christian: Das ist viel Arbeit, kenne ich auch aus dem Marketingbereich, wenn man da Daten vorliegen hat. Am besten versucht man schon, so sauber wie möglich ein Formular zum Beispiel zu designen, dass da gar keine Möglichkeit gibt, dass man da irgendwelchen Quatsch eingibt, richtig?
Daniela: Ja, das ist heute wahrscheinlich noch ein bisschen einfacher, weil die Formulare eben auch online gestaltet werden. Da kann man einfach Dinge verbieten. Das war auf dem Zettel vielleicht früher noch anders. Aber es wird trotzdem nicht immer gemacht. Es denken nicht alle dran, wenn sie eine Online-Umfrage gestalten, dass sie wirklich beim Alter eben nur Zahlen erlauben oder so. Und dann schreibt jemand demnächst werde ich 50 oder so. Und dann hat man da Text drin stehen und muss überlegen, was macht man damit?
Christian: Manchmal ist es eben auch schwer, die Daten da zu strukturieren. Im Online-Bereich haben wir zum Beispiel so ein Formular, da fragt man das Alter ab und dann fragt man ab, was jemand für einen Beruf hat, und wenn man dann nichts vorgibt, schreiben die Leute natürlich alles Mögliche rein als Beruf. Und das dann im Nachhinein per Software zu strukturieren, kann man eigentlich kaum. Das kann man vielleicht KI-mäßig dann irgendwie hinbekommen, aber da hat man jetzt auch nicht unbedingt die verlässlichsten Daten, wenn man da noch mal eine KI reinlässt. Da muss man gucken, ob man da erstmal sich eine riesige Liste an Jobs besorgt oder möglichen Auswahlvorschlägen.
Kommen wir mal zum nächsten und damit eigentlich auch zum letzten größeren Thema für dieses Gespräch, und das ist: Ich habe jetzt meine Daten aufbereitet, und es geht dann um die Interpretation der Daten und auch darum, wie kommuniziere ich das dann? Was schreibe ich dann letztendlich auch auf in meiner Arbeit, in meinem Paper oder was auch immer?
Erste Frage dazu wäre: Woran erkenne ich denn jetzt überhaupt genau, ein bisschen hatten wir es auch schon angesprochen, dass meine Daten oder meine Resultate überhaupt valide und letztendlich auch belastbar sind?
Daniela: Ja, also im Grunde weißt du das selbst, wenn du selber die Datenanalyse durchgeführt hast, ob du gut gearbeitet hast. Da fängt es schon an mit: Wenn du einen Fragebogen hast, welches Messinstrument habe ich verwendet? Ist es ein Messinstrument, das in der psychologischen Forschung ständig eingesetzt wird, wo man weiß, das liefert, also das misst das, was ich messen will? Das ist ja die Definition von valide. Das ist schon die Voraussetzung, dass dann die Ergebnisse, die du berechnest, überhaupt sinnvoll sind. Oder auch, wie bist du zu deiner Stichprobe gekommen? Wie groß ist die Stichprobe? Auch das hat natürlich Aussagekraft dafür, wie verlässlich deine Ergebnisse sind.
Also im Grunde weißt du es dadurch, dass du selber gut gearbeitet hast, und dadurch, wenn du es dann auch so aufschreibst, also auch so transparent berichtest: Wie bist du vorgegangen, was hast du gemacht, wie hast du dich entschieden? Und auch vielleicht bei Punkten, wo man vielleicht anderer Meinung sein könnte, das auch begründest, warum du so gemacht hast. Dann kann es auch jemand anders nachvollziehen und dann auch bewerten, ob es eben belastbar ist oder nicht.
Und dann ist es so, dass du die meistens mit diesen Signifikanztests arbeitest, wo die p-Werte rauskommen. Dann hast du diesen p-Wert raus und mit diesem p-Wert kannst du dann sagen, ob dein Test signifikant war oder nicht und ob du diese Nullhypothese ablehnen kannst oder nicht. Da muss man auch total gut aufpassen, weil alle wollen immer einen signifikanten p-Wert. Wenn der sehr klein ist, kleiner 0,05, dann ist er signifikant und dann darf ich die Nullhypothese ablehnen. In unserem Beispiel hätten wir dann den Zusammenhang nachgewiesen.
Dann musst du noch auf zwei Sachen aufpassen. Das eine hatte ich vorhin schon angekündigt. Erstens: Wie groß ist denn dieser Zusammenhang? Ist der dann auch inhaltlich bedeutsam? Er kann nämlich signifikant sein, aber inhaltlich gar keine Bedeutung haben. Dann ist er natürlich trotzdem signifikant, das war dann alles richtig, aber dann musst du das so einordnen. Du musst dann schreiben: Ist zwar signifikant, aber der Effekt ist so klein, dass er in unserem Zusammenhang keine Bedeutung hat.
Die andere Version ist, dass der p-Wert nicht signifikant war. Dann darfst du nicht sagen, es gibt keinen Zusammenhang. Da muss man gut aufpassen, weil nicht signifikant heißt einfach nur, ich kann diese Nullhypothese nicht ablehnen, und das heißt nicht, dass sie stimmt. Du musst dann nur sagen, nicht signifikant. Im Grunde müsste man dann sagen, wir können keine Aussage treffen. Aber natürlich sagt man dann, wir können keinen signifikanten Zusammenhang nachweisen, und dann schaut man auch wieder, wie groß ist der Zusammenhang, wäre der denn schon bedeutsam in unserem Bereich. Das muss man alles noch einordnen und es ist dann schon wichtig, dass man transparent macht, damit der Leser auch wirklich nachvollziehen kann, ob das so okay war, was man gemacht hat. Und dann ist es wirklich auch Interpretation.
Christian: Also wenn ich jetzt nichts Signifikantes herausbekomme, oder das Ergebnis ist, dass das Ganze nicht signifikant ist, das ist nicht schlimm in dem Sinne. Das ist jetzt auch nichts, wovor ich Angst haben müsste vorher, sondern das ist absolut okay. Das ist dann halt ein valides Ergebnis.
Daniela: Ist ein Ergebnis. Genau. Ich habe das sehr oft in den Beratungen, dass die Leute dann sagen, bei mir kommt nichts raus. Aber es kann ja nicht sein, dass nichts rauskommt. Ich weiß dann schon, die meinen immer, es ist nicht signifikant. Aber das ist ja auch ein Ergebnis. Das ist natürlich nicht so schön, weil man dann sagen muss, ich kann die Nullhypothese nicht ablehnen und wir können keinen Zusammenhang nachweisen. Aber erstens ist es ein Ergebnis, das man einordnen kann. Und dann, gerade für eine Abschlussarbeit, ist die Aufgabe ja trotzdem erledigt. Es war ja die Aufgabe, den Zusammenhang zu untersuchen, und dann kommt es halt raus und man ist damit dann einfach fertig. Man muss es dann interpretieren und diskutieren und das gehört ja auch zur Arbeit dazu. Und es ist sogar schön, weil gerade wenn so Dinge passieren in der Datenanalyse, wo man denkt, oh, das ist aber blöd, oder ich kann den Test nicht nehmen, das alles kann man dann wunderbar diskutieren. Da hat man auf jeden Fall dann genug Futter für die Diskussion.
Christian: Transparenz hattest du jetzt auch schon angesprochen. Das ist auch ganz wichtig, dass man immer ganz transparent offenlegt.
Daniela: Ja, genau. Das merkt man auch, wenn man selber mal Literatur liest. Gerade wenn man für die eigene Arbeit lesen muss und dann denkt man sich immer, wie haben die das gemacht? Wieso haben die das gemacht? Anfänger denken dann oft, ich verstehe es halt nicht. Aber es ist einfach oft nicht gut berichtet. Und teilweise ist es sicher auch absichtlich nicht transparent, damit man halt nicht merkt, was sie falsch gemacht haben. Also das ist sehr oft wirklich ein Problem. Natürlich liegt's auch dran, dass diese Paper immer sehr kurz sein müssen, die Forscher haben da wirklich ein Problem, alle Infos reinzupacken. Aber man selber sollte es halt einfach besser machen. Und auch wenn man denkt, ja, ist es jetzt so wichtig, warum ich jetzt welchen Ausreißer rausgeschmissen habe: Doch, das sollte man einfach irgendwo in der Arbeit stehen haben, damit wenn jemand kommt, den es genau interessiert, dass der einfach die Infos sich holen kann.
Christian: Ja, zur Not schreibt man so eine Fußnote, kleinere Schriftart, da kann man ein bisschen mehr reinschreiben.
Und jetzt habe ich so komplexe statistische Befunde. Ich hatte eben schon mal ChatGPT angesprochen. Da kann ich einfach sagen, erklär mir mal bitte irgendeinen Begriff, als sei ich ein Sechsjähriger. Wie mache ich denn das in so einer wissenschaftlichen Arbeit? Muss ich das dann auch so ganz komplex erklären oder wie bekomme ich das hin, dass ich das so runterbreche, dass das auch jemand versteht, der jetzt nicht so sehr in dem Thema drin ist wie ich?
Daniela: Ja, also erstmal: Das Statistikergebnis formuliert man meist sehr formal nach so standardisierten Vorgaben, die sich dann auch ein bisschen langweilig anhören. Da gibt's zum Beispiel die APA-Styles, an denen kann man sich orientieren. Das heißt, da muss man sich auch davon frei machen, dass sich das jetzt besonders spannend anhört. Das ist halt wirklich sehr nüchtern. Und dann, wenn man es aber interpretiert und diskutiert, da würde ich einfach versuchen, wieder zurückzugehen zur Forschungsfrage: Wie habe ich denn am Anfang geschrieben und gesprochen? Dann ist man normalerweise ja auch in dem Bereich, wo es auch Kommilitonen und Betreuer verstehen. Und dann stellt man eben den Bezug wieder zur Wirklichkeit und zur Realität her und kommuniziert das dann so.
Noch ganz allgemein als Tipp: Sich einfach vorstellen, zum Beispiel eine Erstsemester-Kommilitonin sitzt vor mir und ich soll ihr erklären, woran arbeite ich in meiner Arbeit und was kam da jetzt raus. Oder man überlegt sich, man erzählt der Tante am Sommerfest, was man eigentlich macht. Das ist dann nicht mehr genau das, was in die Arbeit kommt, aber dann kommt man auch ein bisschen auf die Idee, wie man es übertragen kann.
Christian: Ja, super guter Tipp. Überhaupt für Lerninhalte, die vielleicht auch ein bisschen komplizierter sind, das einfach mal versuchen, jemandem zu erklären, und dann findet man da viel bessere Wege, um das auch gut verständlich in seiner Arbeit wiederzugeben. Ich meine, wissenschaftliches Schreiben hin und her, ich finde, es muss auch immer so verständlich sein, dass wirklich eine möglichst große Community das auch versteht und lesen kann.
Ein Faktor dafür ist auch Visualisierung. Ich liebe auch Grafiken, dann verstehe ich Dinge auch gleich viel besser, wenn ein Diagramm drin ist. Woher weiß ich denn zum Beispiel, was ich jetzt aus meinem Ergebnis für Grafiken nutze, oder sollte ich Grafiken vielleicht einfach völlig weglassen?
Daniela: Nee, also auf jeden Fall Grafiken nutzen, schon bei der Datenanalyse. Da macht man auch viel mehr, als man dann am Ende wirklich für die Arbeit nutzt, weil man teilweise Grafiken auch baut, um selber die Daten zu verstehen, um auch zu sehen, ist es jetzt ein deutlicher Effekt und so weiter. Auch für einen Datencheck kann man super Grafiken nehmen. Das heißt, im Prozess der Datenanalyse ganz, ganz viele Grafiken machen, und dann für die Arbeit selber würde ich einfach schauen, ob die Grafik einen Mehrwert hat.
Meistens ist es so, und es gibt auch so ein paar Empfehlungen vom Schreiben: Wenn ich mein ganzes Statistikergebnis in Text fassen würde und da wären ultra viele Zahlen drin und man wird es trotzdem nicht verstehen, dann ist es besser, ich mache eine Grafik dazu und dann schreibe ich einen kurzen Text dazu und muss auf jeden Fall auf diese Grafik verweisen. Das ist auch ein Tipp: Wenn man eine Grafik in seine Arbeit reinbaut und aber merkt, man hat nirgends im Text drauf verwiesen, dann ist sie auf jeden Fall überflüssig.
Was ich überhaupt nicht machen würde, weil es überhaupt keinen Mehrwert bietet, aber total oft gemacht wird, ist zum Beispiel gleich in der deskriptiven Statistik am Anfang in so einer Stichprobenbeschreibung, wenn man eine Umfrage gemacht hat: Man will zeigen, wie viel Männer, wie viel Frauen, dann machen viele einfach ein Balkendiagramm mit Prozent Männer, Frauen. Das kann man schon machen, aber die gleiche Information habe ich auch, wenn ich einfach nur die Prozentzahlen in den Text schreibe, in viel weniger Platz. Viele machen es einfach, weil sie denken, dann habe ich mal was Buntes, ist immer ein bisschen schöner, aber das ist eigentlich völlig überflüssig. Da sollte man wirklich bei den Grafiken eher nach den Themen schauen, wo man sagt, das ist zu kompliziert, nur im Text zu verstehen, oder es wird deutlicher, wenn ich es in der Grafik zeige, oder es ist mein Hauptergebnis. Dann auf jeden Fall Grafik nutzen.
Christian: Okay. Und die verschiedenen Formen von Grafiken und Darstellungsmöglichkeiten, die es so gibt, die lerne ich dann aber auch in meinem Statistikmodul wahrscheinlich?
Daniela: Genau, das ist im Grunde in diesem Prozess der Methodenauswahl dann mit dabei.
Christian: Super. Ich glaube, wir haben die wichtigsten Themen durch. Wir können jetzt natürlich nicht zu sehr in die Tiefe gehen, wir wollen jetzt auch nicht unsere Zuhörerinnen und Zuhörer verschrecken. Die sollen sich natürlich auch über ihre Module mit Statistik auseinandersetzen. Aber ich hoffe, wir haben so ein bisschen zeigen können, und du vor allem, dass es auch Spaß machen kann, dass es ein ganz spannendes Thema ist und ganz spannende Themengebiete, die wirklich wissenschaftlich weiterbringen und dabei helfen, eine super Bachelorarbeit zum Beispiel zu schreiben, und dann eben auch im Berufsleben.
Wenn man möchte, kann man dir natürlich folgen auch auf Instagram. Wir haben uns über Instagram kennengelernt. Aber du hast ja noch die Statistik-Akademie. Kannst du uns da noch ein bisschen darüber erzählen, was kann ich da eigentlich genau machen? Wie kann ich da lernen? Wie kann ich mir das vorstellen?
Daniela: Ja, also die Statistik-Akademie ist mein Mitgliederbereich. Da kann man reinkommen und da gibt's ultra viel Material zum Statistik lernen. Es ist aber kein Kurs, sondern die Materialien liegen da und man nimmt sich die, die man braucht. Es gibt zwei kleine Kurse, die man so als Rahmen nutzen kann, um sich da durchführen zu lassen. Aber so wie ich vorhin schon gesagt habe, keiner muss alles wissen. Man pickt sich wirklich die Themen raus. Das meiste Material sind einfach Videos, wo ich entweder mit Slides ein bestimmtes Konzept erkläre, eine bestimmte Methode erkläre, oder auch Video-Tutorials, wo ich dann zeige, wie funktioniert's mit der Software. Da habe ich dann einen Beispieldatensatz dabei, klicke quasi durch oder programmiere oder zeige den R-Code, und dann kann man sich diese Videos in Ruhe anschauen.
Es gibt dann meistens noch die Slides dazu, noch ein Cheat Sheet zum Runterladen als Zusammenfassung. Man kann die Daten selber sich runterladen, meine Beispieldaten, und das selber mir nachmachen. So lernt man dann einfach die Statistik wirklich nur angewandt. Also wie gesagt, in den allermeisten Fällen ganz ohne Formeln, sondern ich erkläre wirklich: Wann brauchst du das, wie setzt du es ein, was sind die Voraussetzungen, wie machst du es dann?
Es gibt dazu auch noch ein FAQ, wo ich glaube schon an die 1000 Fragen beantwortet wurden. Da kann man auch Fragen einreichen. Man kann schauen, ob die eigene Frage schon beantwortet wurde, mit einer Quellenangabe dazu, und kann das dann einfach sich zusammensuchen fürs eigene Projekt.
Und daneben habe ich auch noch Kurse. Die Akademie ist eben so ein Mitgliederbereich, wo man einfach reinkommt im Abo-Modell ohne Mindestlaufzeit und sich einfach bedient, was man braucht. Und es gibt auch noch Kurse, wenn man lieber durchgeführt werden möchte durch den ganzen Prozess. Ich habe einen großen SPSS-Kurs und einen kleineren R-Kurs zum Beispiel, die man dann auch buchen könnte.
Christian: Okay. Und das finde ich alles über statistik-akademie.de. Wir verlinken das natürlich auch in der Beschreibung für dieses Video. Klingt übrigens auch ziemlich interessant für jemanden, der jetzt nicht studiert, zum Beispiel, der vielleicht als Teamleiter für ein Marketingteam tätig ist und mal ein bisschen wirklich in das Thema Statistik eintauchen will, um bessere Umfragen zu gestalten oder bessere Split-Tests zu gestalten.
Eine letzte Frage habe ich noch. Sport, du hast im Hintergrund einen Boxsack. Sieht man jetzt auf dem Video. Wer den Podcast hört, sieht das nicht, dem sage ich das hier. Machst du da, lässt du dich da einfach aus, wenn du keine Puste mehr hast, am Bildschirm zu sitzen?
Daniela: Ja, genau. Ich mache Kickboxen, da gehe ich auch zum Training normalerweise zweimal die Woche. Und ansonsten für zu Hause, wenn ich mich mal kurz auspowern will. Das ist wirklich, da bin ich in 5 bis 10 Minuten wirklich platt und das ist schon krass.
Christian: Boxen oder Kickboxen habe ich neulich gelernt beim Zuschauen von so einer Kindergruppe. Immer aus der Kampflinie raus und dann Kick von der Seite und zack.
Daniela: Ja, genau. Also so richtig kämpfen mache ich gar nicht. Ich mach's wirklich für Fitness, also immer dann halt Pratzen, die anderen schlagen und so oder eben gegen den Sack. Aber es macht so richtig Spaß.
Christian: Okay, super. Ja, dann wirklich herzlichen Dank fürs Mitmachen in diesem Podcast und für die vielen Infos, die du uns hier mitgegeben hast. Ich hoffe wirklich sehr, dass wir ein bisschen Spaß zeigen konnten an Statistik. Vielen Dank und ich wünsche dir noch einen schönen Tag.
Daniela: Sehr gerne. Wünsche ich dir auch. Tschüss.

Kommentare