CarperAI · nikhilpinnaparaju · Jul 8, 2023 · Jul 9, 2023 · Jul 9, 2023 · Jul 11, 2023
diff --git a/train.py b/train.py
@@ -8,6 +8,7 @@
 import pufferlib.emulation
 import pufferlib.frameworks.cleanrl
 import pufferlib.registry.nmmo
+from nmmo.task.task_api import make_team_tasks
 import torch
 
 import clean_pufferl
@@ -30,7 +31,7 @@
     help="path to model to load (default: None)")
   parser.add_argument(
     "--model.type",
-    dest="model_type", type=str, default="realikun",
+    dest="model_type", type=str, default="basic",
     help="model type (default: realikun)")
 
   parser.add_argument(
@@ -60,7 +61,7 @@
     action="store_true", default=False,
     help="reset on death (default: False)")
   parser.add_argument(
-    "--env.num_maps", dest="num_maps", type=int, default=128,
+    "--env.num_maps", dest="num_maps", type=int, default=1,
     help="number of maps to use for training (default: 1)")
   parser.add_argument(
     "--env.maps_path", dest="maps_path", type=str, default="maps/train/",
@@ -99,7 +100,7 @@
     "--rollout.num_cores", dest="num_cores", type=int, default=None,
       help="number of cores to use for training (default: num_envs)")
   parser.add_argument(
-    "--rollout.num_envs", dest="num_envs", type=int, default=4,
+    "--rollout.num_envs", dest="num_envs", type=int, default=1,
     help="number of environments to use for training (default: 1)")
   parser.add_argument(
     "--rollout.num_buffers", dest="num_buffers", type=int, default=4,
@@ -140,7 +141,7 @@
       help="wandb entity name (default: None)")
 
   parser.add_argument(
-    "--ppo.bptt_horizon", dest="bptt_horizon", type=int, default=8,
+    "--ppo.bptt_horizon", dest="bptt_horizon", type=int, default=16,
     help="train on bptt_horizon steps of a rollout at a time. "
      "use this to reduce GPU memory (default: 16)")
 
@@ -198,7 +199,37 @@
   )
 
   def make_env():
-    return nmmo.Env(config)
+    import pickle as pkl
+    import numpy as np
+    import random
+
+    import os
+    print('cwd', os.getcwd())
+    with open('./pickled_task_with_embs.pkl', 'rb') as f:
+      task_spec = pkl.load(f)
+
+    # tasks = [d[1] for d in task_spec]
+    num_tasks = len(task_spec)
+    teams = team_helper.teams
+    single_task = task_spec[0]
+
+    # make_task_fn = lambda: tasks
+    # task_spec_sampled =np.random.choice(task_spec, size=len(teams), replace=False)
+    task_spec_sampled = random.sample(task_spec, len(teams))
+    tasks = make_team_tasks(teams, task_spec_sampled)
+    make_task_fn = lambda: tasks
+
+    # env =  nmmo.Env(config)
+    class MyNMMO(nmmo.Env):
+      def __init__(self, config):
+        super().__init__(config)
+
+      def reset(self, *args, **kwargs):
+        return super().reset(*args, make_task_fn=make_task_fn, **kwargs)
+
+    env = MyNMMO(config)
+
+    return env
     # if args.model_type in ["realikun", "realikun-simplified"]:
     #   env = NMMOTeamEnv(
     #     config, team_helper, rewards_config, moves_only=args.moves_only)