dask · gjoseph92 · Sep 17, 2021 · Sep 17, 2021 · Sep 17, 2021 · May 4, 2022
@@ -3304,7 +3304,8 @@ def get_comm_cost(self, ts: TaskState, ws: WorkerState) -> double:
         nbytes: Py_ssize_t = 0
         for dts in deps:
             nbytes += dts._nbytes
-        return nbytes / self._bandwidth
+        # Add a fixed 10ms penalty per transfer. See distributed#5324
+        return nbytes / self._bandwidth + 0.01 * len(deps)
 
     @ccall
     def get_task_duration(self, ts: TaskState, default: double = -1) -> double:
@@ -3415,14 +3416,17 @@ def worker_objective(self, ts: TaskState, ws: WorkerState) -> tuple:
         """
         dts: TaskState
         nbytes: Py_ssize_t
-        comm_bytes: Py_ssize_t = 0
+        comm_bytes: double = 0
+        xfers: Py_ssize_t = 0
         for dts in ts._dependencies:
             if ws not in dts._who_has:
                 nbytes = dts.get_nbytes()
-                comm_bytes += nbytes
+                # amortize transfer cost over all waiters
+                comm_bytes += nbytes / len(dts._waiters)
+                xfers += 1
 
         stack_time: double = ws._occupancy / ws._nthreads
-        start_time: double = stack_time + comm_bytes / self._bandwidth
+        start_time: double = stack_time + comm_bytes / self._bandwidth + xfers * 0.01
 
         if ts._actor:
             return (len(ws._actors), start_time, ws._nbytes)