instadeepai · arnupretorius · Jul 28, 2021 · Jul 28, 2021 · Jul 28, 2021 · Jul 28, 2021
@@ -42,7 +42,7 @@ class Renderer:
     Adapted from https://github.com/oxwhirl/smac/pull/71.
     """
 
-    def __init__(self, env: StarCraft2Env, mode: str):
+    def __init__(self, env: "StarCraft2Env", mode: str):
         os.environ["PYGAME_HIDE_SUPPORT_PROMPT"] = "hide"
 
         self.env = env

@@ -26,7 +26,7 @@
 from mava.wrappers import SMACEnvWrapper  # type:ignore
 
 
-def load_smac_env(env_config: Dict[str, Any]) -> StarCraft2Env:
+def load_smac_env(env_config: Dict[str, Any]) -> "StarCraft2Env":
     """Loads a smac environment given a config dict. Also, the possible agents in the
     environment are set"""
 

@@ -46,7 +46,7 @@ class SMACEnvWrapper(ParallelEnvWrapper):
     Based on RLlib wrapper provided by SMAC.
     """
 
-    def __init__(self, environment: StarCraft2Env) -> None:
+    def __init__(self, environment: "StarCraft2Env") -> None:
         """Create a new multi-agent StarCraft env compatible with RLlib.
         Arguments:
             smac_args (dict): Arguments to pass to the underlying

@@ -50,7 +50,7 @@ def test_recurrent_dial_on_debugging_env(self) -> None:
         system = dial.DIAL(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             min_replay_size=16,
             max_replay_size=1000,
             batch_size=16,

@@ -50,7 +50,7 @@ def test_mad4pg_on_debugging_env(self) -> None:
         system = mad4pg.MAD4PG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=32,
             min_replay_size=32,
             max_replay_size=1000,
@@ -103,7 +103,7 @@ def test_recurrent_mad4pg_on_debugging_env(self) -> None:
         system = mad4pg.MAD4PG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=16,
             min_replay_size=16,
             max_replay_size=1000,
@@ -160,7 +160,7 @@ def test_centralised_mad4pg_on_debugging_env(self) -> None:
         system = mad4pg.MAD4PG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=16,
             min_replay_size=16,
             max_replay_size=1000,
@@ -216,7 +216,7 @@ def test_state_based_mad4pg_on_debugging_env(self) -> None:
         system = mad4pg.MAD4PG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=16,
             min_replay_size=16,
             max_replay_size=1000,

@@ -52,7 +52,7 @@ def test_maddpg_on_debugging_env(self) -> None:
         system = maddpg.MADDPG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=32,
             min_replay_size=32,
             max_replay_size=1000,
@@ -105,7 +105,7 @@ def test_recurrent_maddpg_on_debugging_env(self) -> None:
         system = maddpg.MADDPG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=16,
             min_replay_size=16,
             max_replay_size=1000,
@@ -162,7 +162,7 @@ def test_centralised_maddpg_on_debugging_env(self) -> None:
         system = maddpg.MADDPG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=16,
             min_replay_size=16,
             max_replay_size=1000,
@@ -217,7 +217,7 @@ def test_networked_maddpg_on_debugging_env(self) -> None:
         system = maddpg.MADDPG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=16,
             min_replay_size=16,
             max_replay_size=1000,
@@ -274,7 +274,7 @@ def test_state_based_maddpg_on_debugging_env(self) -> None:
         system = maddpg.MADDPG(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=16,
             min_replay_size=16,
             max_replay_size=1000,

@@ -49,7 +49,7 @@ def test_madqn_on_debugging_env(self) -> None:
         system = madqn.MADQN(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=32,
             min_replay_size=32,
             max_replay_size=1000,
@@ -101,7 +101,7 @@ def test_recurrent_madqn_on_debugging_env(self) -> None:
         system = madqn.MADQN(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=16,
             min_replay_size=16,
             max_replay_size=1000,

@@ -48,7 +48,7 @@ def test_mappo_on_debugging_env(self) -> None:
         system = mappo.MAPPO(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=32,
             max_queue_size=1000,
             policy_optimizer=snt.optimizers.Adam(learning_rate=1e-3),

@@ -49,7 +49,7 @@ def test_qmix_on_debugging_env(self) -> None:
         system = qmix.QMIX(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=32,
             min_replay_size=32,
             max_replay_size=1000,

@@ -49,7 +49,7 @@ def test_vdn_on_debugging_env(self) -> None:
         system = vdn.VDN(
             environment_factory=environment_factory,
             network_factory=network_factory,
-            num_executors=2,
+            num_executors=1,
             batch_size=32,
             min_replay_size=32,
             max_replay_size=1000,