Add script for doing bulk generation against an endpoint #765

aspfohl · 2023-11-28T19:35:37Z

As titled. Example usage:

Current limitations:

Could hit oom if too much data loaded
~~Assumes data is pre-loaded locally~~ supports remote data too!
Only supports text completion for now (TODO: use SDK?)

Here's an example mcli yaml that works:

name: mpt7b-generate
image: mosaicml/pytorch:latest
# compute:
#   gpus: 1
#   cluster: TODO
command: |-
  for i in {1..20}; do curl http://0.0.0.0:8080/v2/ping && echo 'endpoint is up' && break || echo 'sleeping' && sleep 10; done
  python llm-foundry/scripts/inference/endpoint_generate.py --prompts "The lazy dog jumped over" "The best banana bread recipe is"

integrations:
- integration_type: git_repo
  git_repo: mosaicml/llm-foundry
  pip_install: .
- integration_type: pip_packages
  packages:
    - aiohttp
    - ratelimit

dependent_deployment:
  model:
    download_parameters:
      hf_path: mosaicml/mpt-7b-instruct
  env_variables:
    - key: MODEL_BACKEND_OVERRIDE
      value: "vllm"

env_variables:
  - key: ENDPOINT_URL
    value: "http://0.0.0.0:8080/v2/completions"

scripts/inference/endpoint_generate.py

linden-li

LGTM, thanks for adding this. This should hopefully be less painful once we add batched inference support.

scripts/inference/endpoint_generate.py

Add script for doing bulk generation against an endpoint

6498aa4

aspfohl requested review from siriuslee, alextrott16 and linden-li November 28, 2023 19:36

aspfohl added 2 commits November 28, 2023 11:56

more logging

f0badd5

warn

4b6543e

alextrott16 reviewed Nov 28, 2023

View reviewed changes

scripts/inference/endpoint_generate.py Outdated Show resolved Hide resolved

aspfohl added 3 commits November 28, 2023 13:00

fix

98a5cfe

format

0f783f1

asdfads

daaa2cb

aspfohl marked this pull request as ready for review November 28, 2023 21:06

Merge branch 'main' into anna/endpoint-generate

17e6d63

aspfohl requested a review from alextrott16 November 28, 2023 21:06

linden-li approved these changes Nov 28, 2023

View reviewed changes

dakinggg reviewed Nov 28, 2023

View reviewed changes

scripts/inference/endpoint_generate.py Show resolved Hide resolved

Add warning

89dc394

dakinggg reviewed Nov 28, 2023

View reviewed changes

scripts/inference/endpoint_generate.py Outdated Show resolved Hide resolved

dakinggg reviewed Nov 28, 2023

View reviewed changes

scripts/inference/endpoint_generate.py Outdated Show resolved Hide resolved

updates

2b482d2

aspfohl requested a review from dakinggg November 29, 2023 00:32

Merge branch 'main' into anna/endpoint-generate

2553e14

dakinggg reviewed Nov 29, 2023

View reviewed changes

scripts/inference/endpoint_generate.py Show resolved Hide resolved

aspfohl added 4 commits November 29, 2023 00:49

folder -> file

16c9307

remove blank line

17d1718

Support remote input

6e5e217

prompts -> inputs

a776cb0

aspfohl merged commit 3a96b69 into main Nov 29, 2023
10 checks passed

aspfohl deleted the anna/endpoint-generate branch November 29, 2023 18:29

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add script for doing bulk generation against an endpoint #765

Add script for doing bulk generation against an endpoint #765

aspfohl commented Nov 28, 2023 •

edited

Loading

linden-li left a comment •

edited

Loading

Add script for doing bulk generation against an endpoint #765

Add script for doing bulk generation against an endpoint #765

Conversation

aspfohl commented Nov 28, 2023 • edited Loading

linden-li left a comment • edited Loading

Choose a reason for hiding this comment

aspfohl commented Nov 28, 2023 •

edited

Loading

linden-li left a comment •

edited

Loading