neuralmagic · dbogunowicz · Nov 3, 2023 · May 26, 2023 · May 29, 2023 · Oct 31, 2023
diff --git a/src/sparseml/exporters/transforms/kv_cache/configs.py b/src/sparseml/exporters/transforms/kv_cache/configs.py
@@ -113,8 +113,8 @@ class Config:
     additional_transforms=AdditionalTransformsMPT,
     key_num_attention_heads="n_heads",
     key_num_embedding_hidden_size="d_model",
-    transpose_value_input=None,
-    transpose_key_input=(0, 1, 3, 2),
+    transpose_value_input=(0, 2, 1, 3),
+    transpose_key_input=(0, 2, 1, 3),
     multiply_batch_by_num_att_heads=False,
 )