New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Add benchmarks to inference README #393

Merged

sashaDoubov merged 28 commits into mosaicml:main from sashaDoubov:inference_readme

Jun 29, 2023

Contributor

sashaDoubov commented Jun 29, 2023

Include benchmark info

sashaDoubov added 14 commits

June 21, 2023 15:32


          add start

b757fda


          add assets and readme

3b1279d


          add new images

1331bcf


          add more changes

e65a044


          add new pics

dadd825


          update readme

352d4cf


          small fix

874d00f


          updt imgs and give latency explanation

10b8fa9


          add changes

bbd4368


          add TL;DR

7b7a4b0


          update typo

f348a54


          changes

4cd88a7


          improve inference offering description

432f4ab


          add spacing

0abe28b

sashaDoubov requested review from abhi-mosaic and vchiley

June 29, 2023 16:39


          Merge branch 'main' into inference_readme

3a71855

sashaDoubov changed the title ~~Inference readme~~ Add benchmarks to inference README

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

vchiley reviewed

View reviewed changes

scripts/inference/benchmarking/README.md Outdated Show resolved Hide resolved

sashaDoubov and others added 2 commits

June 29, 2023 11:08


          pass linter

b35921d


          Update scripts/inference/benchmarking/README.md

7d9202a

Co-authored-by: Vitaliy Chiley <6439018+vchiley@users.noreply.github.com>

sashaDoubov and others added 8 commits

June 29, 2023 11:08


          Update scripts/inference/benchmarking/README.md

00315a5

Co-authored-by: Vitaliy Chiley <6439018+vchiley@users.noreply.github.com>


          Update scripts/inference/benchmarking/README.md

cab755c

Co-authored-by: Vitaliy Chiley <6439018+vchiley@users.noreply.github.com>


          Merge branch 'inference_readme' of github.com:sashaDoubov/llm-foundry…

1a767de

… into inference_readme


          address review

de1fc7c


          Update scripts/inference/benchmarking/README.md

5ffaa4a

Co-authored-by: Vitaliy Chiley <6439018+vchiley@users.noreply.github.com>


          Update scripts/inference/benchmarking/README.md

21e7b47

Co-authored-by: Vitaliy Chiley <6439018+vchiley@users.noreply.github.com>


          falcon add

0b23e93


          Merge branch 'inference_readme' of github.com:sashaDoubov/llm-foundry…

3d8db3b

… into inference_readme

vchiley approved these changes

View reviewed changes

sashaDoubov added 2 commits

June 29, 2023 11:37


          more accurate output lengths

6eda687


          add spacing

94b86cf

abhi-mosaic reviewed

View reviewed changes

Member

abhi-mosaic left a comment

The colors/linestyles of the MPT-30B latency-throughput curve need to be fixed a bit:

80GB = blue, 40GB = green
1 GPU = dash, 2GPU = dots, 4GPu = solid

this way it will match the 7B plot which looks excellent!

Member

abhi-mosaic commented Jun 29, 2023

If possible I would also recommend standardizing the colors of the plots with latency @ token length. Sometihng like

bs=1 (red)
bs = 2 (blue)
bs = 4 (yellow)
bs = 8 (green)
bs = 16 (orange)
bs = 64 (purple)

so people can quickly look from one plot to the next and compare

Contributor Author

sashaDoubov commented Jun 29, 2023

@abhi-mosaic fixing plots now!


          fix graphs

e03b5ca

sashaDoubov merged commit cc84569 into mosaicml:main

10 checks passed

sashaDoubov mentioned this pull request

Inference Speed Benchmark #375

Closed

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet