Skip to content

Commit

Permalink
Anpassungen nach Komplettdurchlauf in Rücksprache mit @MGehrke.
Browse files Browse the repository at this point in the history
  • Loading branch information
luebby committed Jan 10, 2023
1 parent 86737ae commit f2310b1
Show file tree
Hide file tree
Showing 4 changed files with 33 additions and 23 deletions.
12 changes: 0 additions & 12 deletions data/film.csv
Original file line number Diff line number Diff line change
Expand Up @@ -299,15 +299,3 @@
"Nein";"Nein";"Ja";"Nein";"Ja";"Ja";"Nein";"Nein";"Nein";"Ja";"weiblich";24
"Ja";"Nein";"Nein";"Nein";"Nein";"Ja";"Nein";"Nein";"Nein";"Nein";"maennlich";26
"Nein";"Nein";"Ja";"Nein";"Nein";"Ja";"Ja";"Nein";"Nein";"Ja";"weiblich";26
"Ja";"Nein";"Nein";"Nein";"Nein";"Ja";"Nein";"Nein";"Nein";"Ja";"maennlich";24
"Ja";"Nein";"Ja";"Ja";"Nein";"Ja";"Ja";"Nein";"Ja";"Nein";"weiblich";24
"Nein";"Ja";"Nein";"Nein";"Nein";"Nein";"Nein";"Nein";"Nein";"Ja";"weiblich";24
"Ja";"Nein";"Nein";"Nein";"Ja";"Ja";"Ja";"Nein";"Nein";"Nein";"weiblich";22
"Nein";"Nein";"Nein";"Nein";"Nein";"Ja";"Ja";"Nein";"Nein";"Ja";"weiblich";21
"Nein";"Ja";"Nein";"Nein";"Ja";"Nein";"Ja";"Nein";"Nein";"Nein";"weiblich";36
"Nein";"Nein";"Nein";"Ja";"Nein";"Nein";"Nein";"Nein";"Nein";"Nein";"weiblich";23
"Ja";"Nein";"Nein";"Nein";"Nein";"Ja";"Ja";"Ja";"Nein";"Ja";"maennlich";28
"Nein";"Ja";"Nein";"Nein";"Ja";"Ja";"Nein";"Nein";"Nein";"Nein";"weiblich";27
"Nein";"Nein";"Nein";"Nein";"Nein";"Ja";"Ja";"Ja";"Ja";"Ja";"weiblich";23
"Ja";"Ja";"Ja";"Nein";"Ja";"Ja";"Nein";"Nein";"Nein";"Nein";"maennlich";26
"Ja";"Nein";"Ja";"Ja";"Ja";"Nein";"Ja";"Nein";"Nein";"Nein";"weiblich";23
4 changes: 2 additions & 2 deletions eda/Filmgenre.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -144,9 +144,9 @@ Pr(Drama = Ja | Action = Ja) \cdot P(Action = Ja) + Pr(Drama = Ja | Action = Nei
$$

```{r}
prop(E_Drama ~ E_Action, data = film, success = "Ja")[1] *
prop( ~ E_Drama | E_Action, data = film, success = "Ja")[1] *
prop( ~ E_Action, data = film, success = "Ja") +
prop(E_Drama ~ E_Action, data = film, success = "Ja")[2] *
prop(~ E_Drama | E_Action, data = film, success = "Ja")[2] *

This comment has been minimized.

Copy link
@NMarkgraf

NMarkgraf May 22, 2023

Contributor

Halte ich immer noch für einen Fehler! Stört das Konzept UV ~ AV unnötig!

prop( ~ E_Action, data = film, success = "Nein")
```

Expand Down
15 changes: 13 additions & 2 deletions inferenzstatistik/Lotto.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -85,14 +85,25 @@ pi_gewinn

#### Fragen

- Welche Annahme muss erfüllt sein, damit obige Berechnung der (theoretischen) Gewinnwahrscheinlichkeit so funktioniert?

- Hätten Sie - in der Vergangenheit - mit Ihren Zahlen, bezogen auf den Anteil Ziehungen mit einem Gewinn, eher Glück oder Pech gehabt?

- Wenn wir davon ausgehen, dass die Gewinnwahrscheinlichkeit bei $\pi = `r pi_gewinn`$ liegt. Muss dann der Anteil der Gewinne $p$ auch bei $`r pi_gewinn`$ liegen?

- Welche Annahme muss erfüllt sein, damit obige Berechnung der (theoretischen) Gewinnwahrscheinlichkeit so funktioniert?

## Zufallssimulation

Eine einfache Möglichkeit, eine Erfolgswahrscheinlichkeit von $\pi=0.5$ zu simulieren ist der Münzwurf. Werfen Sie bitte $8\times$ eine Münze und tragen Sie unter [https://forms.gle/dXdhzL5YqttY46wu5](https://forms.gle/dXdhzL5YqttY46wu5) ein, wie oft Sie Kopf (Wappen) geworfen haben.


#### Fragen

- Was ist bei acht Würfen wahrscheinlicher: $4\times$ Kopf oder $8\times$ Kopf?

- Was müssen wir beachten, wenn wir die Gewinnwahrscheinlichkeit beim Lotto simulieren wollen?

***

Simulieren wir $3\times$ (`do(3)*`) $n = `r n`$ Ziehungen mit einer Gewinnwahrscheinlichkeit von $\pi = `r pi_gewinn`$ (`(rflip()`):

```{r simu1}
Expand Down
25 changes: 18 additions & 7 deletions regression/LEGO-Modellierung.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -75,7 +75,7 @@ str(lego_sub)
### Lineares Modell

Angenommen (**!**) es gibt einen *linearen* Zusammenhang zwischen der Komplexität, gemessen durch die Anzahl Bausteine (`Pieces`), und dem Preis (`Amazon_Price`).
Dann wird mathematisch folgendes Modell angenommen:
Dann wird mathematisch folgendes Modell für die Population angenommen:

$$y_i = \beta_0 + \beta_1 \cdot x_i + \epsilon_i$$

Expand All @@ -87,15 +87,15 @@ $$y_i = \beta_0 + \beta_1 \cdot x_i + \epsilon_i$$

- Welche Variable (`Pieces`, `Amazon_Price`) ist die abhängige Variable $y$?

### Schätzung lineares Modell
### Lineares Modell der Stikchprobe

Visuell:
```{r streu}
gf_point(Amazon_Price ~ Pieces, data = lego_sub) %>%
gf_lm()
```

This comment has been minimized.

Copy link
@Bia-Ka

Bia-Ka May 17, 2023

Contributor

Ich erhalte hier eine Warnung:

Warning: Using the size aesthetic with geom_line was deprecated in ggplot2 3.4.0.
Please use the linewidth aesthetic instead.
This warning is displayed once every 8 hours.
Call lifecycle::last_lifecycle_warnings() to see where this warning was generated.

Da das immer unnötige Fragen in den VO aufwirft: Können wir das abstellen?

This comment has been minimized.

Copy link
@NMarkgraf

NMarkgraf May 22, 2023

Contributor

Gar nicht! Das Problem ist gf_* die haben den Feher.
Workaround: {r streu, warning = FALSE}

This comment has been minimized.

Copy link
@Bia-Ka

Bia-Ka May 24, 2023

Contributor

Danke für die Aufklärung.

This comment has been minimized.

Copy link
@luebby

luebby May 24, 2023

Author Collaborator

Muss ich denn alles immer selber machen ;-) ProjectMOSAIC/ggformula#163

This comment has been minimized.

Copy link
@NMarkgraf

NMarkgraf May 25, 2023

Contributor

Nun ja, da Du bei der FOM kürzer trittst, musst Du halt wo anderes ... :-P

This comment has been minimized.

Copy link
@Bia-Ka

Bia-Ka May 26, 2023

Contributor

... wer die Kontakte hat. ;-) Danke schön!! Bin gespannt, ob es gefixed wird.

Die unbekannten Parameter $\beta_0, \beta_1$ können anhand des *Kleinste-Quadrate-Kriteriums* für diese Daten über die Funktion `lm()` optimal geschätzt werden:
Anhand des *Kleinste-Quadrate-Kriteriums* für diese Daten ergeben sich über die Funktion `lm()` folgende Werte:

```{r lm1}
erg <- lm(Amazon_Price ~ Pieces, data = lego_sub)
Expand All @@ -104,8 +104,8 @@ betadach <- coef(erg) %>% round(2)
betadach
```

Für
$$\hat{y}_i = \hat{\beta}_0 + \hat{\beta}_1 \cdot x_i$$
Für das Modell der Stichprobe
$$\hat{y}_i = b_0 + b_1 \cdot x_i$$
ergibt sich:
$$\hat{y}_i = `r betadach[1]` + `r betadach[2]` \cdot x_i$$

Expand All @@ -119,6 +119,8 @@ $$\hat{y}_i = `r betadach[1]` + `r betadach[2]` \cdot x_i$$

### Bestimmtheitsmaß

Wie gut die gefundene Gerade die vorliegenden Daten beschreibt, kann mit Hilfe des Bestimmtheitsmaßes $R^2$ bestimmt werden:

$$R^2= 1-\frac{\sum_{i=1}^n (y_i-\hat{y}_i)^2}{\sum_{i=1}^n (y_i-\bar{y})^2}$$

```{r rquadrat}
Expand All @@ -134,6 +136,10 @@ $$R^2 = `r r2`$$

### Schätzunsicherheit

Die anhand der Stichprobe berechneten Werte für Achsenabschnitt und Steigung, $b_0, b_1$, können als Schätzwerte für die unbekannten Modellparameter $\beta_0, \beta_1$ im Modell der Population verwendet werden:

$$\hat{\beta}_0=b_0,\,\hat{\beta}_1=b_1.$$

```{r resample}
# Zufallszahlengenerator setzen
set.seed(1896)
Expand Down Expand Up @@ -187,6 +193,8 @@ se

- Würde der Standardfehler durch mehr Bootstrap-Stichproben kleiner werden?

- Wann würde der Standardfehler kleiner werden, d.h., die Präszision der Schätzung steigen?

***

**Konfidenzintervall**:
Expand Down Expand Up @@ -227,7 +235,7 @@ gf_point(Amazon_Price ~ Pieces, data = lego_sub) %>%

***

```{r}
```{r shuffle}
# Zufallszahlengenerator setzen
set.seed(1896)
# Streudiagramm inkl. Regressionsgerade bei permutierten (shuffle()) x
Expand Down Expand Up @@ -323,6 +331,7 @@ summary(erg1)
#### Fragen

- Bei welcher Serie ist der Mittelwert des Preises am größten?

- Wie groß is der durchschnittliche Preisunterschied zwischen `Friends` und `City`?

## Preismodellierung mit mehr als einer erklärenden Variable
Expand All @@ -339,6 +348,7 @@ summary(erg2)
#### Fragen

- Bei welcher Serie ist der Achsenabschnitt am größten?

- Welches *Problem* dieses Modells sehen Sie?

## Preismodellierung mit Wechselwirkung
Expand All @@ -358,4 +368,5 @@ summary(erg3)
```

- Erweitern Sie den Code so, dass Sie die Wechselwirkung zwischen `Pieces`und `Theme` ins Modell integrieren.
- Bein welcher Serie ist die Steigung am größten?

- Bein welcher Serie ist die Steigung am größten?

This comment has been minimized.

Copy link
@NMarkgraf

NMarkgraf May 22, 2023

Contributor

"Bei" nicht "Bein"! ;-)

0 comments on commit f2310b1

Please sign in to comment.