From 58133318c8eaff254f6a56222fb339cd770c9ffc Mon Sep 17 00:00:00 2001
From: Benjamin <ben@neuralmagic.com>
Date: Tue, 3 Oct 2023 15:42:19 -0400
Subject: [PATCH] update tests

---
 .../test_conv_to_convinteger_add_cast_mul.py  |  2 +-
 .../transforms/test_conv_to_qlinearconv.py    |  2 +-
 .../transforms/test_delete_repeated_qdq.py    |  2 +-
 .../transforms/test_flatten_qparams.py        |  2 +-
 .../transforms/test_fold_relu_quants.py       |  2 +-
 ...test_gemm_to_matmulinteger_add_cast_mul.py |  2 +-
 .../transforms/test_gemm_to_qlinearmatmul.py  |  7 ++++-
 ...atmul_add_to_matmulinteger_add_cast_mul.py |  3 +-
 .../test_matmul_to_qlinearmatmul.py           |  2 +-
 .../test_propagate_embedding_quantization.py  |  2 +-
 .../test_remove_duplicate_qconv_weights.py    | 28 +++++++++++++++++--
 .../test_remove_duplicate_quantize_ops.py     |  9 ++++--
 12 files changed, 47 insertions(+), 16 deletions(-)

diff --git a/tests/sparseml/exporters/transforms/test_conv_to_convinteger_add_cast_mul.py b/tests/sparseml/exporters/transforms/test_conv_to_convinteger_add_cast_mul.py
index 47adef69f13..7af52a43c93 100644
--- a/tests/sparseml/exporters/transforms/test_conv_to_convinteger_add_cast_mul.py
+++ b/tests/sparseml/exporters/transforms/test_conv_to_convinteger_add_cast_mul.py
@@ -76,7 +76,7 @@ def _create_test_model():
     conv_node = onnx.helper.make_node(
         "Conv",
         inputs=["dequant_linear_0_output", "dequant_linear_1_output", "bias"],
-        outputs=["conv_node_output"],
+        outputs=["output"],
         kernel_shape=[3, 3],
         name="conv_node",
     )
diff --git a/tests/sparseml/exporters/transforms/test_conv_to_qlinearconv.py b/tests/sparseml/exporters/transforms/test_conv_to_qlinearconv.py
index e187097504a..fb833671a09 100644
--- a/tests/sparseml/exporters/transforms/test_conv_to_qlinearconv.py
+++ b/tests/sparseml/exporters/transforms/test_conv_to_qlinearconv.py
@@ -63,7 +63,7 @@ def onnx_model() -> onnx.ModelProto:
     output_quant = helper.make_node(
         "QuantizeLinear",
         ["conv_output", "y_scale", "zero_point"],
-        ["output_quant_output"],
+        ["output"],
         name="output_quant",
     )
 
diff --git a/tests/sparseml/exporters/transforms/test_delete_repeated_qdq.py b/tests/sparseml/exporters/transforms/test_delete_repeated_qdq.py
index 6df3535b3c3..8aadd572c78 100644
--- a/tests/sparseml/exporters/transforms/test_delete_repeated_qdq.py
+++ b/tests/sparseml/exporters/transforms/test_delete_repeated_qdq.py
@@ -44,7 +44,7 @@ def onnx_model():
     dequant2 = onnx.helper.make_node(
         "DequantizeLinear",
         ["quant2_output", "scale"],
-        ["dequant2_output"],
+        ["output"],
         name="dequant2",
     )
 
diff --git a/tests/sparseml/exporters/transforms/test_flatten_qparams.py b/tests/sparseml/exporters/transforms/test_flatten_qparams.py
index 0ab389d5d4d..5f324edeaae 100644
--- a/tests/sparseml/exporters/transforms/test_flatten_qparams.py
+++ b/tests/sparseml/exporters/transforms/test_flatten_qparams.py
@@ -47,7 +47,7 @@ def onnx_model():
         name="scale", data_type=onnx.TensorProto.FLOAT, dims=(1,), vals=[1.0]
     )
     quantize = onnx.helper.make_node(
-        "QuantizeLinear", ["input", "scale", "zero_point"], ["id1_output"], name="id1"
+        "QuantizeLinear", ["input", "scale", "zero_point"], ["output"], name="id1"
     )
 
     graph = onnx.helper.make_graph(
diff --git a/tests/sparseml/exporters/transforms/test_fold_relu_quants.py b/tests/sparseml/exporters/transforms/test_fold_relu_quants.py
index 6c0efd87dc6..e4a27a6ef32 100644
--- a/tests/sparseml/exporters/transforms/test_fold_relu_quants.py
+++ b/tests/sparseml/exporters/transforms/test_fold_relu_quants.py
@@ -32,7 +32,7 @@ def onnx_model():
     scale = onnx.helper.make_tensor("scale", onnx.TensorProto.FLOAT, (1,), [1])
     relu = onnx.helper.make_node("Relu", ["input"], ["relu_output"], name="relu")
     quant = onnx.helper.make_node(
-        "QuantizeLinear", ["relu_output", "scale"], ["quant_output"], name="quant"
+        "QuantizeLinear", ["relu_output", "scale"], ["output"], name="quant"
     )
 
     graph = onnx.helper.make_graph(
diff --git a/tests/sparseml/exporters/transforms/test_gemm_to_matmulinteger_add_cast_mul.py b/tests/sparseml/exporters/transforms/test_gemm_to_matmulinteger_add_cast_mul.py
index 3f9a46b7029..3a9231f2804 100644
--- a/tests/sparseml/exporters/transforms/test_gemm_to_matmulinteger_add_cast_mul.py
+++ b/tests/sparseml/exporters/transforms/test_gemm_to_matmulinteger_add_cast_mul.py
@@ -62,7 +62,7 @@ def onnx_model() -> onnx.ModelProto:
     gemm = helper.make_node(
         "Gemm",
         ["input_dequant_output", "weight_dequant_output", "bias"],
-        ["gemm_output"],
+        ["output"],
         name="gemm",
     )
 
diff --git a/tests/sparseml/exporters/transforms/test_gemm_to_qlinearmatmul.py b/tests/sparseml/exporters/transforms/test_gemm_to_qlinearmatmul.py
index 2c6f116bc0d..2329019d1c2 100644
--- a/tests/sparseml/exporters/transforms/test_gemm_to_qlinearmatmul.py
+++ b/tests/sparseml/exporters/transforms/test_gemm_to_qlinearmatmul.py
@@ -36,7 +36,9 @@ def onnx_model() -> onnx.ModelProto:
     model_input_1 = helper.make_tensor_value_info(
         "input_1", onnx.TensorProto.FLOAT, (1,)
     )
-    model_output = helper.make_tensor_value_info("output", onnx.TensorProto.FLOAT, (1,))
+    model_output = helper.make_tensor_value_info(
+        "output_quant_output", onnx.TensorProto.FLOAT, (1,)
+    )
 
     input_dequant = helper.make_node(
         "DequantizeLinear",
@@ -159,6 +161,7 @@ def test_gemm_with_bias_dequant_after(onnx_model: onnx.ModelProto):
             name="output_dequant",
         )
     )
+    onnx_model.graph.output[0].name = "output_dequant_output"
     validate_onnx(onnx_model)
 
     onnx_model = GemmToQLinearMatMul().apply(onnx_model)
@@ -201,6 +204,7 @@ def test_gemm_after_changes_nothing(onnx_model: onnx.ModelProto):
             name="gemm2",
         )
     )
+    onnx_model.graph.output[0].name = "gemm2_output"  # update graph output
     validate_onnx(onnx_model)
     onnx_model = GemmToQLinearMatMul().apply(onnx_model)
     validate_onnx(onnx_model)
@@ -224,6 +228,7 @@ def test_gemm_after_changes_nothing(onnx_model: onnx.ModelProto):
 
     # remove the gemm2 node and now things should change
     onnx_model.graph.node.pop()
+    onnx_model.graph.output[0].name = "output_dequant_output"  # update graph output
     validate_onnx(onnx_model)
     onnx_model = GemmToQLinearMatMul().apply(onnx_model)
 
diff --git a/tests/sparseml/exporters/transforms/test_matmul_add_to_matmulinteger_add_cast_mul.py b/tests/sparseml/exporters/transforms/test_matmul_add_to_matmulinteger_add_cast_mul.py
index f8f32e5d3b8..4d5d7633de2 100644
--- a/tests/sparseml/exporters/transforms/test_matmul_add_to_matmulinteger_add_cast_mul.py
+++ b/tests/sparseml/exporters/transforms/test_matmul_add_to_matmulinteger_add_cast_mul.py
@@ -68,7 +68,7 @@ def onnx_model() -> onnx.ModelProto:
         ["matmul_output"],
         name="matmul",
     )
-    add = helper.make_node("Add", ["matmul_output", "bias"], ["add_output"], name="add")
+    add = helper.make_node("Add", ["matmul_output", "bias"], ["output"], name="add")
 
     graph = helper.make_graph(
         nodes=[input_dequant, weight_quant, weight_dequant, transpose, matmul, add],
@@ -150,6 +150,7 @@ def test_matmul_no_bias_converts(onnx_model: onnx.ModelProto):
     # remove "bias" initializer and "add" node
     assert onnx_model.graph.initializer.pop().name == "bias"
     assert onnx_model.graph.node.pop().name == "add"
+    onnx_model.graph.output[0].name = "matmul_output"  # update graph output name
     validate_onnx(onnx_model)
 
     onnx_model = MatMulAddToMatMulIntegerAddCastMul().apply(onnx_model)
diff --git a/tests/sparseml/exporters/transforms/test_matmul_to_qlinearmatmul.py b/tests/sparseml/exporters/transforms/test_matmul_to_qlinearmatmul.py
index 609c2459a63..6167b0217df 100644
--- a/tests/sparseml/exporters/transforms/test_matmul_to_qlinearmatmul.py
+++ b/tests/sparseml/exporters/transforms/test_matmul_to_qlinearmatmul.py
@@ -116,7 +116,7 @@ def _create_test_model(with_transpose=False, with_reshape=False):
     dequantize_linear_node_2 = onnx.helper.make_node(
         "DequantizeLinear",
         ["quant_linear_2_output", "x_scale", "zero_point"],
-        ["dequant_linear_2_output"],
+        ["output"],
         name="dequantize_linear_node_2",
     )
 
diff --git a/tests/sparseml/exporters/transforms/test_propagate_embedding_quantization.py b/tests/sparseml/exporters/transforms/test_propagate_embedding_quantization.py
index e2c8c308c1d..49754cf1273 100644
--- a/tests/sparseml/exporters/transforms/test_propagate_embedding_quantization.py
+++ b/tests/sparseml/exporters/transforms/test_propagate_embedding_quantization.py
@@ -72,7 +72,7 @@ def onnx_model():
     concat = onnx.helper.make_node(
         "Concat",
         ["pad1_output", "pad2_output", "dequant_output"],
-        ["concat_output"],
+        ["output"],
         name="concat",
         axis=0,
     )
diff --git a/tests/sparseml/exporters/transforms/test_remove_duplicate_qconv_weights.py b/tests/sparseml/exporters/transforms/test_remove_duplicate_qconv_weights.py
index d85a20da0ee..95653cc4729 100644
--- a/tests/sparseml/exporters/transforms/test_remove_duplicate_qconv_weights.py
+++ b/tests/sparseml/exporters/transforms/test_remove_duplicate_qconv_weights.py
@@ -27,8 +27,23 @@ def onnx_model():
     model_input = onnx.helper.make_tensor_value_info(
         "input", onnx.TensorProto.FLOAT, (1,)
     )
-    model_output = onnx.helper.make_tensor_value_info(
-        "output", onnx.TensorProto.FLOAT, (1,)
+    model_output_1 = onnx.helper.make_tensor_value_info(
+        "add1_output", onnx.TensorProto.FLOAT, (1,)
+    )
+    model_output_2 = onnx.helper.make_tensor_value_info(
+        "add2_output", onnx.TensorProto.FLOAT, (1,)
+    )
+    model_output_3 = onnx.helper.make_tensor_value_info(
+        "add3_output", onnx.TensorProto.FLOAT, (1,)
+    )
+    model_output_4 = onnx.helper.make_tensor_value_info(
+        "conv4_output", onnx.TensorProto.FLOAT, (1,)
+    )
+    model_output_5 = onnx.helper.make_tensor_value_info(
+        "conv5_output", onnx.TensorProto.FLOAT, (1,)
+    )
+    model_output_6 = onnx.helper.make_tensor_value_info(
+        "conv6_output", onnx.TensorProto.FLOAT, (1,)
     )
     zp = onnx.helper.make_tensor("zp", onnx.TensorProto.UINT8, (1,), [0])
     scale = onnx.helper.make_tensor("scale", onnx.TensorProto.FLOAT, (1,), [1.0])
@@ -90,7 +105,14 @@ def onnx_model():
         nodes=[conv1, conv2, conv3, conv4, conv5, conv6, add1, add2, add3],
         name="g",
         inputs=[model_input],
-        outputs=[model_output],
+        outputs=[
+            model_output_1,
+            model_output_2,
+            model_output_3,
+            model_output_4,
+            model_output_5,
+            model_output_6,
+        ],
         initializer=[
             weight1_a,
             weight1_b,
diff --git a/tests/sparseml/exporters/transforms/test_remove_duplicate_quantize_ops.py b/tests/sparseml/exporters/transforms/test_remove_duplicate_quantize_ops.py
index d3f9b24a29c..34be777418b 100644
--- a/tests/sparseml/exporters/transforms/test_remove_duplicate_quantize_ops.py
+++ b/tests/sparseml/exporters/transforms/test_remove_duplicate_quantize_ops.py
@@ -32,8 +32,11 @@ def onnx_model():
     model_input = onnx.helper.make_tensor_value_info(
         "input", onnx.TensorProto.FLOAT, (1,)
     )
-    model_output = onnx.helper.make_tensor_value_info(
-        "output", onnx.TensorProto.FLOAT, (1,)
+    model_output_1 = onnx.helper.make_tensor_value_info(
+        "quant1_output", onnx.TensorProto.FLOAT, (1,)
+    )
+    model_output_2 = onnx.helper.make_tensor_value_info(
+        "quant2_output", onnx.TensorProto.FLOAT, (1,)
     )
     zp = onnx.helper.make_tensor("zp", onnx.TensorProto.UINT8, (1,), [0])
     scale1 = onnx.helper.make_tensor("scale1", onnx.TensorProto.FLOAT, (1,), [1.0])
@@ -50,7 +53,7 @@ def onnx_model():
         nodes=[quant1, quant2],
         name="g",
         inputs=[model_input],
-        outputs=[model_output],
+        outputs=[model_output_1, model_output_2],
         initializer=[scale1, zp],
     )