axolotl-ai-cloud · winglian · Oct 22, 2023 · Oct 22, 2023
diff --git a/src/axolotl/monkeypatch/fused_modules.py b/src/axolotl/monkeypatch/fused_modules.py
diff --git a/src/axolotl/monkeypatch/llama_attn_hijack_flash.py b/src/axolotl/monkeypatch/llama_attn_hijack_flash.py
@@ -152,6 +152,7 @@ def _post_training(self, model, name):
         new_attn.q_proj.weight.data = q_proj
         new_attn.k_proj.weight.data = k_proj
         new_attn.v_proj.weight.data = v_proj
+        new_attn.o_proj.weight.data = self.o_proj.weight.data
 
         set_module_name(model, name, new_attn)