mosaicml · dakinggg · Nov 7, 2023 · Nov 7, 2023 · Nov 7, 2023 · Nov 7, 2023
@@ -400,6 +400,13 @@ def _build_collate_fn(
         packing_ratio = auto_packing_ratio(dataloader_cfg, tokenizer,
                                            device_batch_size)
 
+    if isinstance(packing_ratio, str):
+        raise ValueError(
+            'dataset.packing_ratio must be a float or "auto", but it was set to '
+            + f'{packing_ratio}.')
+
+    log.info(f'Using packing ratio {packing_ratio}')
+
     if packing_ratio == 1.0:
         return collate_fn, device_batch_size
     elif packing_ratio < 1.0:

@@ -348,6 +348,7 @@ def profile_packing(
     dataloader_cfg.drop_last = False
     dataloader_cfg.num_workers = 0
     dataloader_cfg.prefetch_factor = None
+    dataloader_cfg.persistent_workers = False
 
     # Determine the packing_ratio values we'll try
     packing_ratios, raw_batch_sizes = [], []