Improve inference speed on sagemaker serverless while preserving accuracy #106

rbavery · 2023-03-27T21:00:33Z

Goal: get to 2-3 seconds per image.

according to yolov5 benchmarks and our past tests, inference speeds are possible, but with potential requirements to compromise on image size: ultralytics/yolov5#6613

PR: ultralytics/yolov5#6613

nathanielrindlaub · 2023-04-07T17:22:17Z

We got to ~3.5 seconds per image with the ONNX-compiled model deployed on Sagemaker Serverless - so chalking that up to a win for now (see #105). Nice job @rbavery thanks for your persistence on this!!

rbavery mentioned this issue Mar 27, 2023

Run serverless endpoint batch test and record cost and time results #99

Closed

nathanielrindlaub closed this as completed Apr 7, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Improve inference speed on sagemaker serverless while preserving accuracy #106

Improve inference speed on sagemaker serverless while preserving accuracy #106

rbavery commented Mar 27, 2023 •

edited

Loading

nathanielrindlaub commented Apr 7, 2023

Improve inference speed on sagemaker serverless while preserving accuracy #106

Improve inference speed on sagemaker serverless while preserving accuracy #106

Comments

rbavery commented Mar 27, 2023 • edited Loading

nathanielrindlaub commented Apr 7, 2023

rbavery commented Mar 27, 2023 •

edited

Loading