POC NNCFQuantizer

daniil-lyakhov · Oct 22, 2024 · 46f2a95 · 46f2a95
1 parent 443da30
commit 46f2a95
Show file tree

Hide file tree

Showing 9 changed files with 1,447 additions and 410 deletions.
diff --git a/nncf/experimental/torch/fx/quantization/fx_quantizer.py b/nncf/experimental/torch/fx/quantization/fx_quantizer.py
@@ -0,0 +1,110 @@
+# Copyright (c) 2024 Intel Corporation
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#      http://www.apache.org/licenses/LICENSE-2.0
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+from collections import defaultdict
+from copy import deepcopy
+
+import torch
+import torch.fx
+from torch.ao.quantization.pt2e.prepare import _get_edge_or_node_to_group_id
+from torch.ao.quantization.pt2e.prepare import _get_edge_or_node_to_qspec
+from torch.ao.quantization.pt2e.prepare import _get_obs_or_fq_map
+from torch.ao.quantization.quantizer import Quantizer
+from torch.ao.quantization.quantizer.quantizer import QuantizationSpec
+from torch.ao.quantization.quantizer.quantizer import SharedQuantizationSpec
+
+import nncf
+from nncf.common.graph.graph import NNCFGraph
+from nncf.common.quantization.quantizer_setup import ActivationQuantizationInsertionPoint
+from nncf.common.quantization.quantizer_setup import SingleConfigQuantizationPoint
+from nncf.common.quantization.quantizer_setup import SingleConfigQuantizerSetup
+from nncf.common.quantization.quantizer_setup import WeightQuantizationInsertionPoint
+from nncf.common.quantization.structs import QuantizationScheme as QuantizationMode
+from nncf.common.quantization.structs import QuantizerConfig
+from nncf.quantization.algorithms.min_max.quantizer.quantizer import NNCFQuantizer
+
+
+class NNCFFXQuantizer(NNCFQuantizer):
+    def __init__(self, quantizer: Quantizer):
+        self._quantizer = quantizer
+
+    def get_quantization_setup(self, model: torch.fx.GraphModule, nncf_graph: NNCFGraph) -> SingleConfigQuantizerSetup:
+        anotated_model = deepcopy(model)
+
+        self._quantizer.transform_for_annotation(anotated_model)
+        self._quantizer.annotate(anotated_model)
+        self._quantizer.validate(anotated_model)
+        return self.get_quantizer_config_from_anotated_model(anotated_model)
+
+    @staticmethod
+    def get_quantizer_config_from_anotated_model(anotated_model: torch.fx.GraphModule) -> SingleConfigQuantizerSetup:
+        is_qat = False
+        edge_or_node_to_qspec = _get_edge_or_node_to_qspec(anotated_model)
+        edge_or_node_to_group_id = _get_edge_or_node_to_group_id(edge_or_node_to_qspec)
+        obs_or_fq_map = _get_obs_or_fq_map(edge_or_node_to_group_id, edge_or_node_to_qspec, is_qat)
+        if obs_or_fq_map:
+            pass
+
+        q_map = defaultdict(list)
+        for edge, qspec in edge_or_node_to_qspec.items():
+            if not isinstance(edge, tuple):
+                continue
+            from_n, to_n = edge
+            q_map[from_n].append(to_n)
+
+        q_setup = SingleConfigQuantizerSetup()
+        for from_n, to_nodes in q_map.items():
+            to_n = to_nodes[0]
+            qspec = edge_or_node_to_qspec[(from_n, to_n)]
+            if qspec is None:
+                continue
+            if isinstance(qspec, QuantizationSpec):
+                if qspec.qscheme in [torch.per_channel_affine, torch.per_channel_symmetric]:
+                    per_channel = True
+                elif qspec.qscheme in [torch.per_tensor_affine, torch.per_tensor_symmetric]:
+                    per_channel = False
+                else:
+                    raise nncf.InternalError(f"Unknown qscheme: {qspec.qscheme}")
+                signed = qspec.dtype is torch.uint8
+                mode = (
+                    QuantizationMode.SYMMETRIC
+                    if qspec.qscheme in [torch.per_channel_symmetric, torch.per_tensor_symmetric]
+                    else QuantizationMode.ASYMMETRIC
+                )
+                qconfig = QuantizerConfig(mode=mode, signedness_to_force=signed, per_channel=per_channel)
+                qps = []
+                # If input node is a constant and placed not at activations port (0)
+                if from_n.op == "get_attr" and to_n.args.index(from_n) != 0:
+                    qip = WeightQuantizationInsertionPoint(to_n.name)
+                    qp = SingleConfigQuantizationPoint(qip, qconfig, [x.name for x in to_nodes])
+                    qps.append(qp)
+                else:
+                    if len(from_n.users) == len(to_nodes):
+                        qip = ActivationQuantizationInsertionPoint(from_n.name)
+                        qp = SingleConfigQuantizationPoint(qip, qconfig, [x.name for x in to_nodes])
+                        qps.append(qp)
+                    else:
+                        for to_n_ in to_nodes:
+                            input_port_id = to_n_.args.index(from_n)
+                            qip = ActivationQuantizationInsertionPoint(to_n_.name, input_port_id)
+                            qp = SingleConfigQuantizationPoint(qip, qconfig, [to_n_.name])
+                            qps.append(qp)
+
+                for qp in qps:
+                    q_setup.add_independent_quantization_point(qp)
+
+            elif isinstance(qspec, SharedQuantizationSpec):
+                pass
+            else:
+                raise nncf.InternalError(f"Unknown torch.ao quantization spec: {qspec}")
+
+        return q_setup
diff --git a/...mental/torch/fx/quantization/quantizer.py → ...l/torch/fx/quantization/quantizer_pt2e.py b/...mental/torch/fx/quantization/quantizer.py → ...l/torch/fx/quantization/quantizer_pt2e.py
@@ -13,9 +13,7 @@
 
 os.environ["TORCHINDUCTOR_FREEZING"] = "1"
 
-from collections import defaultdict
 from copy import deepcopy
-from itertools import chain
 from time import time
 from typing import Any, Optional
 
@@ -24,15 +22,10 @@
 from torch._export import capture_pre_autograd_graph
 from torch.ao.quantization.pt2e.duplicate_dq_pass import DuplicateDQPass
 from torch.ao.quantization.pt2e.port_metadata_pass import PortNodeMetaForQDQ
-from torch.ao.quantization.pt2e.prepare import _get_edge_or_node_to_group_id
-from torch.ao.quantization.pt2e.prepare import _get_edge_or_node_to_qspec
-from torch.ao.quantization.pt2e.prepare import _get_obs_or_fq_map
 from torch.ao.quantization.pt2e.qat_utils import _fold_conv_bn_qat
 from torch.ao.quantization.pt2e.utils import _disallow_eval_train
 from torch.ao.quantization.quantize_pt2e import convert_pt2e
 from torch.ao.quantization.quantize_pt2e import prepare_pt2e
-from torch.ao.quantization.quantizer.quantizer import QuantizationSpec
-from torch.ao.quantization.quantizer.quantizer import SharedQuantizationSpec
 from torch.ao.quantization.quantizer.x86_inductor_quantizer import X86InductorQuantizer
 from torch.ao.quantization.quantizer.x86_inductor_quantizer import get_default_x86_inductor_quantization_config
 from torch.fx import GraphModule
@@ -43,15 +36,10 @@
 import nncf.torch
 from nncf.common.factory import NNCFGraphFactory
 from nncf.common.logging import nncf_logger
-from nncf.common.quantization.quantizer_setup import ActivationQuantizationInsertionPoint
-from nncf.common.quantization.quantizer_setup import SingleConfigQuantizationPoint
-from nncf.common.quantization.quantizer_setup import SingleConfigQuantizerSetup
-from nncf.common.quantization.quantizer_setup import WeightQuantizationInsertionPoint
 from nncf.common.quantization.structs import QuantizationPreset
-from nncf.common.quantization.structs import QuantizationScheme
-from nncf.common.quantization.structs import QuantizerConfig
 from nncf.data import Dataset
 from nncf.experimental.torch.fx.constant_folding import constant_fold
+from nncf.experimental.torch.fx.quantization.fx_quantizer import NNCFFXQuantizer
 
 # from nncf.experimental.torch.fx.transformations import apply_quantization_transformations
 from nncf.experimental.torch.fx.transformations import fuse_conv_bn
@@ -115,27 +103,15 @@ def quantize_pt2e(
         model_type=model_type,
         ignored_scope=ignored_scope,
         advanced_parameters=advanced_parameters,
+        quantizer=NNCFFXQuantizer(quantizer),
     )
 
     # To make it easier for bias correction algorithms,
     # biases are being separated by the followng calls.
     anotated_model = deepcopy(copied_model)
     fuse_conv_bn(anotated_model)
 
-    quantizer.transform_for_annotation(anotated_model)
-    quantizer.annotate(anotated_model)
-    quantizer.validate(anotated_model)
-
-    q_setup = get_quantizer_config_from_anotated_model(anotated_model)
-
-    # apply_quantization_transformations(copied_model)
-    fuse_conv_bn(copied_model)
     nncf_graph = NNCFGraphFactory.create(copied_model)
-    for algo in chain(*quantization_algorithm._pipeline.pipeline_steps):
-        if algo.__class__.__name__ != "MinMaxQuantization":
-            continue
-        algo._fill_quantization_points_from_quantizer_setup(q_setup, nncf_graph, copied_model)
-        break
     quantized_model = quantization_algorithm.apply(copied_model, nncf_graph, dataset=calibration_dataset)
 
     # Revert applied transformation to keep original model
@@ -159,70 +135,6 @@ def quantize_pt2e(
     return quantized_model
 
 
-def get_quantizer_config_from_anotated_model(anotated_model: torch.fx.GraphModule) -> SingleConfigQuantizerSetup:
-    is_qat = False
-    edge_or_node_to_qspec = _get_edge_or_node_to_qspec(anotated_model)
-    edge_or_node_to_group_id = _get_edge_or_node_to_group_id(edge_or_node_to_qspec)
-    obs_or_fq_map = _get_obs_or_fq_map(edge_or_node_to_group_id, edge_or_node_to_qspec, is_qat)
-    if obs_or_fq_map:
-        pass
-
-    q_map = defaultdict(list)
-    for edge, qspec in edge_or_node_to_qspec.items():
-        if not isinstance(edge, tuple):
-            continue
-        from_n, to_n = edge
-        q_map[from_n].append(to_n)
-
-    q_setup = SingleConfigQuantizerSetup()
-    for from_n, to_nodes in q_map.items():
-        to_n = to_nodes[0]
-        qspec = edge_or_node_to_qspec[(from_n, to_n)]
-        if qspec is None:
-            continue
-        if isinstance(qspec, QuantizationSpec):
-            if qspec.qscheme in [torch.per_channel_affine, torch.per_channel_symmetric]:
-                per_channel = True
-            elif qspec.qscheme in [torch.per_tensor_affine, torch.per_tensor_symmetric]:
-                per_channel = False
-            else:
-                raise nncf.InternalError(f"Unknown qscheme: {qspec.qscheme}")
-            signed = qspec.dtype is torch.uint8
-            mode = (
-                QuantizationScheme.SYMMETRIC
-                if qspec.qscheme in [torch.per_channel_symmetric, torch.per_tensor_symmetric]
-                else QuantizationScheme.ASYMMETRIC
-            )
-            qconfig = QuantizerConfig(mode=mode, signedness_to_force=signed, per_channel=per_channel)
-            qps = []
-            # If input node is a constant and placed not at activations port (0)
-            if from_n.op == "get_attr" and to_n.args.index(from_n) != 0:
-                qip = WeightQuantizationInsertionPoint(to_n.name)
-                qp = SingleConfigQuantizationPoint(qip, qconfig, [x.name for x in to_nodes])
-                qps.append(qp)
-            else:
-                if len(from_n.users) == len(to_nodes):
-                    qip = ActivationQuantizationInsertionPoint(from_n.name)
-                    qp = SingleConfigQuantizationPoint(qip, qconfig, [x.name for x in to_nodes])
-                    qps.append(qp)
-                else:
-                    for to_n_ in to_nodes:
-                        input_port_id = to_n_.args.index(from_n)
-                        qip = ActivationQuantizationInsertionPoint(to_n_.name, input_port_id)
-                        qp = SingleConfigQuantizationPoint(qip, qconfig, [to_n_.name])
-                        qps.append(qp)
-
-            for qp in qps:
-                q_setup.add_independent_quantization_point(qp)
-
-        elif isinstance(qspec, SharedQuantizationSpec):
-            pass
-        else:
-            raise nncf.InternalError(f"Unknown torch.ao quantization spec: {qspec}")
-
-    return q_setup
-
-
 def main(model_cls):
     model = model_cls()
     example_inputs = torch.ones((1, 3, 224, 224))