Skip to content

Commit

Permalink
Ajustes a las soluciones
Browse files Browse the repository at this point in the history
  • Loading branch information
felipegonzalez committed Oct 16, 2023
1 parent 9f73a01 commit 272935c
Show file tree
Hide file tree
Showing 2 changed files with 3 additions and 18 deletions.
9 changes: 2 additions & 7 deletions tareas/tarea-10/soluciones/modelo-lineal-ingenieria.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -220,12 +220,6 @@ write_csv(submission, "entregas/modelo-base.csv")
```


Este modelo pasa el benchmark con scores 0.22662, 0.23703 en público y privado.
Notamos sin
embargo que nuestro score de validación es muy distinto al que obtenemos
en el leaderboard. La razón, como vimos antes, probablemente
tiene que ver con las fechas para las que estamos haciendo
predicción.

## Precisión de estimación de error

Expand All @@ -237,7 +231,8 @@ map_df(1:100, function(rep){
hoteles_val_boot <- slice_sample(hoteles_val, prop = 1, replace = TRUE)
preds_val <- predict(ajustado, hoteles_val_boot, type = "prob") |>
bind_cols(hoteles_val_boot)
preds_val |> mn_log_loss(factor(children), .pred_children)
preds_val$children <- factor(preds_val$children)
preds_val |> mn_log_loss(children, .pred_children)
}) |>
ggplot(aes(x = .estimate)) + geom_histogram()
```
Expand Down
12 changes: 1 addition & 11 deletions tareas/tarea-10/soluciones/modelo-xgboost.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -31,18 +31,8 @@ nrow(hoteles_val)
```


## Modelo base
## Xgboost

Comenzamos con regresión logística con baja regularización para obtener un
modelo base. Incluimos además:

- otras variables categóricas,
- intracciones lead time y average_daily_rate
- interacción average_daily_rate y room type
- interacción país y semana del año (diferentes vacaciones)
-

Vamos a afinar también la regularización:

```{r}
Expand Down

0 comments on commit 272935c

Please sign in to comment.