update multibackend model load (#104)

fcakyon · Apr 26, 2022 · e06c213 · e06c213
1 parent a569b90
commit e06c213
Showing 1 changed file with 96 additions and 86 deletions.
diff --git a/yolov5/models/common.py b/yolov5/models/common.py
@@ -306,107 +306,117 @@ def __init__(self, weights='yolov5s.pt', device=torch.device('cpu'), dnn=False,
             with open(data, errors='ignore') as f:
                 names = yaml.safe_load(f)['names']  # class names
 
-        with yolov5_in_syspath():
-            if pt:  # PyTorch
-                model = attempt_load(weights if isinstance(weights, list) else w, map_location=device)
-                stride = max(int(model.stride.max()), 32)  # model stride
-                names = model.module.names if hasattr(model, 'module') else model.names  # get class names
-                model.half() if fp16 else model.float()
-                self.model = model  # explicitly assign for to(), cpu(), cuda(), half()
-            elif jit:  # TorchScript
-                LOGGER.info(f'Loading {w} for TorchScript inference...')
-                extra_files = {'config.txt': ''}  # model metadata
+
+        if pt:  # PyTorch
+            model = attempt_load(weights if isinstance(weights, list) else w, map_location=device)
+            stride = max(int(model.stride.max()), 32)  # model stride
+            names = model.module.names if hasattr(model, 'module') else model.names  # get class names
+            model.half() if fp16 else model.float()
+            self.model = model  # explicitly assign for to(), cpu(), cuda(), half()
+        elif jit:  # TorchScript
+            LOGGER.info(f'Loading {w} for TorchScript inference...')
+            extra_files = {'config.txt': ''}  # model metadata
+            with yolov5_in_syspath():
                 model = torch.jit.load(w, _extra_files=extra_files)
-                model.half() if fp16 else model.float()
-                if extra_files['config.txt']:
-                    d = json.loads(extra_files['config.txt'])  # extra_files dict
-                    stride, names = int(d['stride']), d['names']
-            elif dnn:  # ONNX OpenCV DNN
-                LOGGER.info(f'Loading {w} for ONNX OpenCV DNN inference...')
-                check_requirements(('opencv-python>=4.5.4',))
+            model.half() if fp16 else model.float()
+            if extra_files['config.txt']:
+                d = json.loads(extra_files['config.txt'])  # extra_files dict
+                stride, names = int(d['stride']), d['names']
+        elif dnn:  # ONNX OpenCV DNN
+            LOGGER.info(f'Loading {w} for ONNX OpenCV DNN inference...')
+            check_requirements(('opencv-python>=4.5.4',))
+            with yolov5_in_syspath():
                 net = cv2.dnn.readNetFromONNX(w)
-            elif onnx:  # ONNX Runtime
-                LOGGER.info(f'Loading {w} for ONNX Runtime inference...')
-                cuda = torch.cuda.is_available()
-                check_requirements(('onnx', 'onnxruntime-gpu' if cuda else 'onnxruntime'))
-                import onnxruntime
-                providers = ['CUDAExecutionProvider', 'CPUExecutionProvider'] if cuda else ['CPUExecutionProvider']
+        elif onnx:  # ONNX Runtime
+            LOGGER.info(f'Loading {w} for ONNX Runtime inference...')
+            cuda = torch.cuda.is_available()
+            check_requirements(('onnx', 'onnxruntime-gpu' if cuda else 'onnxruntime'))
+            import onnxruntime
+            providers = ['CUDAExecutionProvider', 'CPUExecutionProvider'] if cuda else ['CPUExecutionProvider']
+            with yolov5_in_syspath():
                 session = onnxruntime.InferenceSession(w, providers=providers)
-            elif xml:  # OpenVINO
-                LOGGER.info(f'Loading {w} for OpenVINO inference...')
-                check_requirements(('openvino-dev',))  # requires openvino-dev: https://pypi.org/project/openvino-dev/
-                import openvino.inference_engine as ie
-                core = ie.IECore()
-                if not Path(w).is_file():  # if not *.xml
-                    w = next(Path(w).glob('*.xml'))  # get *.xml file from *_openvino_model dir
+        elif xml:  # OpenVINO
+            LOGGER.info(f'Loading {w} for OpenVINO inference...')
+            check_requirements(('openvino-dev',))  # requires openvino-dev: https://pypi.org/project/openvino-dev/
+            import openvino.inference_engine as ie
+            core = ie.IECore()
+            if not Path(w).is_file():  # if not *.xml
+                w = next(Path(w).glob('*.xml'))  # get *.xml file from *_openvino_model dir
+            with yolov5_in_syspath():
                 network = core.read_network(model=w, weights=Path(w).with_suffix('.bin'))  # *.xml, *.bin paths
                 executable_network = core.load_network(network, device_name='CPU', num_requests=1)
-            elif engine:  # TensorRT
-                LOGGER.info(f'Loading {w} for TensorRT inference...')
-                import tensorrt as trt  # https://developer.nvidia.com/nvidia-tensorrt-download
-                check_version(trt.__version__, '7.0.0', hard=True)  # require tensorrt>=7.0.0
-                Binding = namedtuple('Binding', ('name', 'dtype', 'shape', 'data', 'ptr'))
-                logger = trt.Logger(trt.Logger.INFO)
+        elif engine:  # TensorRT
+            LOGGER.info(f'Loading {w} for TensorRT inference...')
+            import tensorrt as trt  # https://developer.nvidia.com/nvidia-tensorrt-download
+            check_version(trt.__version__, '7.0.0', hard=True)  # require tensorrt>=7.0.0
+            Binding = namedtuple('Binding', ('name', 'dtype', 'shape', 'data', 'ptr'))
+            logger = trt.Logger(trt.Logger.INFO)
+            with yolov5_in_syspath():
                 with open(w, 'rb') as f, trt.Runtime(logger) as runtime:
                     model = runtime.deserialize_cuda_engine(f.read())
-                bindings = OrderedDict()
-                fp16 = False  # default updated below
-                for index in range(model.num_bindings):
-                    name = model.get_binding_name(index)
-                    dtype = trt.nptype(model.get_binding_dtype(index))
-                    shape = tuple(model.get_binding_shape(index))
-                    data = torch.from_numpy(np.empty(shape, dtype=np.dtype(dtype))).to(device)
-                    bindings[name] = Binding(name, dtype, shape, data, int(data.data_ptr()))
-                    if model.binding_is_input(index) and dtype == np.float16:
-                        fp16 = True
-                binding_addrs = OrderedDict((n, d.ptr) for n, d in bindings.items())
-                context = model.create_execution_context()
-                batch_size = bindings['images'].shape[0]
-            elif coreml:  # CoreML
-                LOGGER.info(f'Loading {w} for CoreML inference...')
-                import coremltools as ct
+            bindings = OrderedDict()
+            fp16 = False  # default updated below
+            for index in range(model.num_bindings):
+                name = model.get_binding_name(index)
+                dtype = trt.nptype(model.get_binding_dtype(index))
+                shape = tuple(model.get_binding_shape(index))
+                data = torch.from_numpy(np.empty(shape, dtype=np.dtype(dtype))).to(device)
+                bindings[name] = Binding(name, dtype, shape, data, int(data.data_ptr()))
+                if model.binding_is_input(index) and dtype == np.float16:
+                    fp16 = True
+            binding_addrs = OrderedDict((n, d.ptr) for n, d in bindings.items())
+            context = model.create_execution_context()
+            batch_size = bindings['images'].shape[0]
+        elif coreml:  # CoreML
+            LOGGER.info(f'Loading {w} for CoreML inference...')
+            import coremltools as ct
+            with yolov5_in_syspath():
                 model = ct.models.MLModel(w)
-            else:  # TensorFlow (SavedModel, GraphDef, Lite, Edge TPU)
-                if saved_model:  # SavedModel
-                    LOGGER.info(f'Loading {w} for TensorFlow SavedModel inference...')
-                    import tensorflow as tf
-                    keras = False  # assume TF1 saved_model
+        else:  # TensorFlow (SavedModel, GraphDef, Lite, Edge TPU)
+            if saved_model:  # SavedModel
+                LOGGER.info(f'Loading {w} for TensorFlow SavedModel inference...')
+                import tensorflow as tf
+                keras = False  # assume TF1 saved_model
+                with yolov5_in_syspath():
                     model = tf.keras.models.load_model(w) if keras else tf.saved_model.load(w)
-                elif pb:  # GraphDef https://www.tensorflow.org/guide/migrate#a_graphpb_or_graphpbtxt
-                    LOGGER.info(f'Loading {w} for TensorFlow GraphDef inference...')
-                    import tensorflow as tf
+            elif pb:  # GraphDef https://www.tensorflow.org/guide/migrate#a_graphpb_or_graphpbtxt
+                LOGGER.info(f'Loading {w} for TensorFlow GraphDef inference...')
+                import tensorflow as tf
 
-                    def wrap_frozen_graph(gd, inputs, outputs):
-                        x = tf.compat.v1.wrap_function(lambda: tf.compat.v1.import_graph_def(gd, name=""), [])  # wrapped
-                        ge = x.graph.as_graph_element
-                        return x.prune(tf.nest.map_structure(ge, inputs), tf.nest.map_structure(ge, outputs))
+                def wrap_frozen_graph(gd, inputs, outputs):
+                    x = tf.compat.v1.wrap_function(lambda: tf.compat.v1.import_graph_def(gd, name=""), [])  # wrapped
+                    ge = x.graph.as_graph_element
+                    return x.prune(tf.nest.map_structure(ge, inputs), tf.nest.map_structure(ge, outputs))
 
-                    gd = tf.Graph().as_graph_def()  # graph_def
+                gd = tf.Graph().as_graph_def()  # graph_def
+                with yolov5_in_syspath():
                     gd.ParseFromString(open(w, 'rb').read())
                     frozen_func = wrap_frozen_graph(gd, inputs="x:0", outputs="Identity:0")
-                elif tflite or edgetpu:  # https://www.tensorflow.org/lite/guide/python#install_tensorflow_lite_for_python
-                    try:  # https://coral.ai/docs/edgetpu/tflite-python/#update-existing-tf-lite-code-for-the-edge-tpu
-                        from tflite_runtime.interpreter import (Interpreter,
-                                                                load_delegate)
-                    except ImportError:
-                        import tensorflow as tf
-                        Interpreter, load_delegate = tf.lite.Interpreter, tf.lite.experimental.load_delegate,
-                    if edgetpu:  # Edge TPU https://coral.ai/software/#edgetpu-runtime
-                        LOGGER.info(f'Loading {w} for TensorFlow Lite Edge TPU inference...')
-                        delegate = {
-                            'Linux': 'libedgetpu.so.1',
-                            'Darwin': 'libedgetpu.1.dylib',
-                            'Windows': 'edgetpu.dll'}[platform.system()]
+            elif tflite or edgetpu:  # https://www.tensorflow.org/lite/guide/python#install_tensorflow_lite_for_python
+                try:  # https://coral.ai/docs/edgetpu/tflite-python/#update-existing-tf-lite-code-for-the-edge-tpu
+                    from tflite_runtime.interpreter import (Interpreter,
+                                                            load_delegate)
+                except ImportError:
+                    import tensorflow as tf
+                    Interpreter, load_delegate = tf.lite.Interpreter, tf.lite.experimental.load_delegate,
+                if edgetpu:  # Edge TPU https://coral.ai/software/#edgetpu-runtime
+                    LOGGER.info(f'Loading {w} for TensorFlow Lite Edge TPU inference...')
+                    delegate = {
+                        'Linux': 'libedgetpu.so.1',
+                        'Darwin': 'libedgetpu.1.dylib',
+                        'Windows': 'edgetpu.dll'}[platform.system()]
+                    with yolov5_in_syspath():
                         interpreter = Interpreter(model_path=w, experimental_delegates=[load_delegate(delegate)])
-                    else:  # Lite
-                        LOGGER.info(f'Loading {w} for TensorFlow Lite inference...')
+                else:  # Lite
+                    LOGGER.info(f'Loading {w} for TensorFlow Lite inference...')
+                    with yolov5_in_syspath():
                         interpreter = Interpreter(model_path=w)  # load TFLite model
-                    interpreter.allocate_tensors()  # allocate
-                    input_details = interpreter.get_input_details()  # inputs
-                    output_details = interpreter.get_output_details()  # outputs
-                elif tfjs:
-                    raise Exception('ERROR: YOLOv5 TF.js inference is not supported')
-            self.__dict__.update(locals())  # assign all variables to self
+                interpreter.allocate_tensors()  # allocate
+                input_details = interpreter.get_input_details()  # inputs
+                output_details = interpreter.get_output_details()  # outputs
+            elif tfjs:
+                raise Exception('ERROR: YOLOv5 TF.js inference is not supported')
+        self.__dict__.update(locals())  # assign all variables to self
 
     def forward(self, im, augment=False, visualize=False, val=False):
         # YOLOv5 MultiBackend inference