diff --git a/01-exploratorio.md b/01-exploratorio.md index bb3d997..dd50215 100644 --- a/01-exploratorio.md +++ b/01-exploratorio.md @@ -67,23 +67,23 @@ slice_sample(propinas, n = 10) |> gt() ``` ```{=html} -
Y vemos una muestra
slice_sample(propinas, n = 10) |> gt()
En la práctica, es más conveniente usar \(f_i= \frac{i - 0.5}{N}\). La gráfica de cuantiles no cambia mucho comparado con la difinición anterior, y esto nos permitirá comparar de mejor manera con @@ -1625,9 +1625,10 @@
|>
casas group_by(nombre_zona) |>
summarise(mediana_zona = median(precio_m2), .groups = "drop") |>
- pull(mediana_zona) |>
- quantile() |>
- round()
## 0% 25% 50% 75% 100%
## 963 1219 1298 1420 1725
Por otro lado, las variaciones con respecto a las medianas dentro de @@ -1647,19 +1648,20 @@
<- median(casas$precio_m2)
mediana <- casas |>
- resumen group_by(nombre_zona) |>
- mutate(mediana_zona = median(precio_m2)) |>
- mutate(residual = precio_m2 - mediana_zona) |>
- ungroup() |>
- mutate(mediana_zona = mediana_zona - mediana) |>
- select(nombre_zona, mediana_zona, residual) |>
- pivot_longer(mediana_zona:residual, names_to = "tipo", values_to = "valor")
- ggplot(resumen, aes(sample = valor)) +
-geom_qq(distribution = stats::qunif) +
- facet_wrap(~ tipo) +
- ylab("Precio por m2") + xlab("f") +
- labs(subtitle = "Precio por m2 por zona",
- caption = paste0("Mediana total de ", round(mediana)))
Vemos que la mayor parte de la variación del precio por metro cuadrado ocurre dentro de cada zona, una vez que controlamos por el tamaño de las diff --git a/index.html b/index.html index b4e57c7..e89e0ce 100644 --- a/index.html +++ b/index.html @@ -258,7 +258,7 @@