Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Diskussion #65

Open
jonasmolsbeck opened this issue Feb 28, 2023 · 21 comments
Open

Diskussion #65

jonasmolsbeck opened this issue Feb 28, 2023 · 21 comments
Assignees
Labels
discussion Diskussion wie in Aufgabe 5 vorgegeben

Comments

@jonasmolsbeck
Copy link
Collaborator

Hier können wir die Diskussion führen, sobald die Analyse fertig ist.

@fynn-oldenburg
Copy link
Owner

Die Analyse einiger Kategorien hat folgendes ergeben:

## Kategorisierung ordinaler Variablen

categorize_ordinal(data, by = 'Mathe', bins = 3, in_place=TRUE) %>%
    group_by(Mathe) %>%
    summarize(n = sum(MatheLK == 'ja'))
# Wenn niedriges Interesse an Mathe vorliegt, dann wird eher nicht der MatheLK gewählt

categorize_ordinal(data, by = 'Mathe', bins = 3, in_place=TRUE) %>%
    group_by(Mathe) %>%
    summarize(n = sum(Studienfach == 'Mathe'))
# Wenn niedriges Interesse an Mathe vorliegt, dann wird gar nicht das Studienfach Mathe gewählt?

categorize_ordinal(data, by = 'Programmieren', bins = 3, in_place=TRUE) %>%
    group_by(Programmieren) %>%
    summarize(n = sum(Studienfach == 'Informatik'))
# bei höherem Interesse am Programmieren wird eher der Studiengang Informatik gewählt

categorize_ordinal(data, by = 'Programmieren', bins = 3, in_place=TRUE) %>%
    group_by(Programmieren) %>%
    summarize(n = sum(Studienfach == 'Data Science'))
# Interesse an Programmieren scheint einen positiven Einfluss auf die Wahl von Data Science als Studienfach zu haben.

categorize_ordinal(data, by = 'Programmieren', bins = 3, in_place=TRUE) %>%
    group_by(Programmieren) %>%
    summarize(n = sum(Studienfach == 'Statistik'))
# Interesse am Programmieren ist nicht ausschlaggebend für die Wahl des Statistik-Studiums.
# Eher ein gegenteiliger Effekt ist zu vermerken. Vermutlich wählen die Personen dann eher Data Science?

@jonasmolsbeck @danfleon stimmen die vermuteten Zusammenhänge mit der Simulation überein?

@jonasmolsbeck
Copy link
Collaborator Author

Wenn niedriges Interesse an Mathe vorliegt, dann wird eher nicht der MatheLK gewählt
-> Korrekt, allgemein erhöht ein hohes Mathe-Interesse die Wahrscheinlichkeit, dass die Person im Mathe LK war

@jonasmolsbeck
Copy link
Collaborator Author

Die genaue Wahrscheinlichkeiten geben wir zum Schluss bekannt @danfleon und ich habe schon etwas dafür vorbereitet

@fynn-oldenburg
Copy link
Owner

Ist es richtig, dass ein niedriges Mathe-Interesse dazu führt, dass niemals Mathe als Studienfach gewählt wird? Also gibt es da einen cut-off Punkt?

@fynn-oldenburg
Copy link
Owner

Oder liegt das nur an der Stichprobe, dass in der Kategorie niemand Mathe studiert?

@jonasmolsbeck
Copy link
Collaborator Author

Ist es richtig, dass ein niedriges Mathe-Interesse dazu führt, dass niemals Mathe als Studienfach gewählt wird? Also gibt es da einen cut-off Punkt?
Ja, genau. Die Wkeit, dass ein Mathestudent ein Matheinteresse >=5 hat beträgt 98%

@jonasmolsbeck
Copy link
Collaborator Author

bei höherem Interesse am Programmieren wird eher der Studiengang Informatik gewählt
Interesse an Programmieren scheint einen positiven Einfluss auf die Wahl von Data Science als Studienfach zu
Auch das ist richtig, Die Studierenden der Studiengänge Informatik und Data Science haben eine deutlich höhere Wahrscheinlichkeit, dass sie ein großes bzw. größeres Interesse an Programmieren haben.

@danfleon
Copy link
Collaborator

@fynn-oldenburg, meiner Meinung nach waren die Ergebnisse deiner Analyse einiger Kategorien schon in der Richtung für die gewählten Wahrscheinlichkeiten der Interesse pro Studienfach. Es sieht gut aus.

@WlanNergady
Copy link
Collaborator

Anwendung der Funktion stats_bivariate_metric_dichotom ergibt, dass zwischen Alter und Mathe-LK kein großer Unterschied zwischen den Gruppen "ja" und "nein", also kein Zusammenhang erkennbar ist (was auch der
Aufgabenstellung entspricht)

@jonasmolsbeck
Copy link
Collaborator Author

Anwendung der Funktion stats_bivariate_metric_dichotom ergibt, dass zwischen Alter und Mathe-LK kein großer Unterschied zwischen den Gruppen "ja" und "nein", also kein Zusammenhang erkennbar ist (was auch der Aufgabenstellung entspricht)

Das Alter haben wir tatsächlich in der Simulation für die anderen Variablen nicht miteinbezogen.

@fynn-oldenburg fynn-oldenburg added the discussion Diskussion wie in Aufgabe 5 vorgegeben label Feb 28, 2023
@PhilippSL
Copy link
Collaborator

PhilippSL commented Feb 28, 2023

 Wenn niedriges Interesse an Mathe vorliegt, dann wird eher nicht der MatheLK gewählt
 Wenn niedriges Interesse an Mathe vorliegt, dann wird gar nicht das Studienfach Mathe gewählt?

durch den Aufruf von
bivariate_stats_categorical(data, "Mathe", "MatheLK") ergibt sich ein Cramer's V von ca. 0,77.

Ein Cramer's V von über 0.7 spricht für einen starken Zusammenhang
von dem Interesse an Mathe und der Wahl für oder gegen den Mathe-Leistungskurs.

bivariate_stats_categorical(data, "Programmieren", "MatheLK")
# Ein Cramer's V von über 0.7 spricht für einen starken Zusammenhang
# von dem Interesse an Mathe und der Wahl für oder gegen den Mathe-Leistungskurs

@jonasmolsbeck
Copy link
Collaborator Author

@fynn-oldenburg @PhilippSL @PhilippSL Ihr findet jetzt auch in der readme eine Übersicht der Sample-Wahrscheinlichkeiten, die wir für die Simulation verwendet haben.

@danfleon
Copy link
Collaborator

Warum wurde den Mathe-Leistungskurs eine Role spielen? Gibt es Vermutungen? (Persönlich habe ich keine Ahnung, weil ich das nicht kenne)

@WlanNergady
Copy link
Collaborator

Es ergibt Sinn, dass die Wahl des Mathe-LK die Wahl des Studienfachs Mathe begünstigt (bzw. umgekehrt), da tendenziell die Schüler im Mathe-LK gut in Mathe sind bzw. ein gewisses Interesse daran haben (und dann auch Mathe als Studienfach wählen).

@PhilippSL
Copy link
Collaborator

Die erste Übersicht zeigte:

## Ein großer Teil der Personen studiert Statistik, 
## ein besonders geringer Teil der Personen studiert Mathe
## Ein Großteil (70%) der Befragten hat einen Mathe-Leistungskurs belegt

@jonasmolsbeck
Copy link
Collaborator Author

jonasmolsbeck commented Feb 28, 2023

Ein großer Teil der Personen studiert Statistik

Das liegt an dem sample, theoretisch haben Statistik und Data Science beide eine Wahrscheinlichkeit von 35%

@WlanNergady
Copy link
Collaborator

Zur Simulation vom Mathe-LK finde ich interessant, dass ihr das Interesse am Programmieren als Faktor einbezogen habt (es stand in der Aufgabenstellung, aber war ja als optional angegeben)... hätte ich wahrscheinlich nicht gemacht

@jonasmolsbeck
Copy link
Collaborator Author

jonasmolsbeck commented Feb 28, 2023

Ein besonders geringer Teil der Personen studiert Mathe

Das Studienfach Mathe hatte in unserer Simulation eine Wkeit von 10%

@WlanNergady
Copy link
Collaborator

Ich habe auch gesehen, dass das Interesse am Programmieren immerhin nicht so einen großen Einfluss auf die Wahl des Mathe-LKs hat... Warum habt ihr da als Cutoff-Wert eigentlich >4 gewählt?

@danfleon
Copy link
Collaborator

@WlanNergady, weil >4 ist überdurchschnittlich.

@jonasmolsbeck
Copy link
Collaborator Author

jonasmolsbeck commented Feb 28, 2023

Ein Großteil (70%) der Befragten hat einen Mathe-Leistungskurs belegt.

Das liegt daran, dass Mathe-LK mit dem Interesse an Mathematik und Programmieren zusammenhängt und das Interesse an Mathe und Programmieren im allgemeinen für alle relativ groß ist. Zudem haben wir insbesondere für Mathe-Studierende eine hohe Grund-Wahrscheinlichkeit für Mathe LK.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
discussion Diskussion wie in Aufgabe 5 vorgegeben
Projects
None yet
Development

No branches or pull requests

5 participants