Update inc_quantize_model.py

jimmytwei · web-flow · commit 05e7ee7b327d · 2024-06-26T08:31:52.000-07:00
diff --git a/AI-and-Analytics/Getting-Started-Samples/INC-Sample-for-Tensorflow/inc_quantize_model.py b/AI-and-Analytics/Getting-Started-Samples/INC-Sample-for-Tensorflow/inc_quantize_model.py
@@ -1,63 +1,60 @@
+import sys
+
 import neural_compressor as inc
 print("neural_compressor version {}".format(inc.__version__))
 
-import alexnet
-import math
-import yaml
-import mnist_dataset
+import tensorflow as tf
+print("tensorflow {}".format(tf.__version__))
+
+from neural_compressor.config import PostTrainingQuantConfig, AccuracyCriterion, TuningCriterion
+from neural_compressor.data import DataLoader
 from neural_compressor.quantization import fit
-from neural_compressor.config import PostTrainingQuantConfig, TuningCriterion, AccuracyCriterion 
+from neural_compressor import Metric
 
+import mnist_dataset
 
-def save_int8_frezon_pb(q_model, path):
-    from tensorflow.python.platform import gfile
-    f = gfile.GFile(path, 'wb')
-    f.write(q_model.graph.as_graph_def().SerializeToString())
-    print("Save to {}".format(path))
 
+class Dataset(object):
+    def __init__(self):
+        _x_train, _y_train, label_train, x_test, y_test, label_test = mnist_dataset.read_data()
 
-class Dataloader(object):
-    def __init__(self, batch_size):
-        self.batch_size = batch_size
+        self.test_images = x_test
+        self.labels = label_test
 
-    def __iter__(self):
-        x_train, y_train, label_train, x_test, y_test, label_test = mnist_dataset.read_data()
-        batch_nums = math.ceil(len(x_test) / self.batch_size)
+    def __getitem__(self, index):
+        return self.test_images[index], self.labels[index]
 
-        for i in range(batch_nums - 1):
-            begin = i * self.batch_size
-            end = (i + 1) * self.batch_size
-            yield x_test[begin: end], label_test[begin: end]
+    def __len__(self):
+        return len(self.test_images)
 
-        begin = (batch_nums - 1) * self.batch_size
-        yield x_test[begin:], label_test[begin:]
 
+def auto_tune(input_graph_path, batch_size):
+    dataset = Dataset()
+    dataloader = DataLoader(framework='tensorflow', dataset=dataset, batch_size=batch_size)
+    tuning_criterion = TuningCriterion(max_trials=100)
+    config = PostTrainingQuantConfig(approach="static", tuning_criterion=tuning_criterion,
+                                     accuracy_criterion = AccuracyCriterion(
+                                         higher_is_better=True,
+                                         criterion='relative',
+                                         tolerable_loss=0.01  )
+                                    )
+    top1 = Metric(name="topk", k=1)
 
-def auto_tune(input_graph_path, config, batch_size):    
-    fp32_graph = alexnet.load_pb(input_graph_path)
-    dataloader = Dataloader(batch_size)
-    assert(dataloader)
-    
-    tuning_criterion = TuningCriterion(**config["tuning_criterion"])
-    accuracy_criterion = AccuracyCriterion(**config["accuracy_criterion"])
     q_model = fit(
-            model=input_graph_path,
-            conf=PostTrainingQuantConfig(**config["quant_config"],
-                        tuning_criterion=tuning_criterion,
-                        accuracy_criterion=accuracy_criterion,
-                ),
-            calib_dataloader=dataloader,
+        model=input_graph_path,
+        conf=config,
+        calib_dataloader=dataloader,
+        eval_dataloader=dataloader,
+        eval_metric=top1
         )
+
+
     return q_model
 
 
 batch_size = 200
-fp32_frezon_pb_file = "fp32_frezon.pb"
+fp32_frozen_pb_file = "fp32_frozen.pb"
 int8_pb_file = "alexnet_int8_model.pb"
 
-with open("quant_config.yaml") as f:
-    config = yaml.safe_load(f.read())
-config
-
-q_model = auto_tune(fp32_frezon_pb_file, config, batch_size)
-save_int8_frezon_pb(q_model, int8_pb_file)
+q_model = auto_tune(fp32_frozen_pb_file, batch_size)
+q_model.save(int8_pb_file)