Change Transformers export default sequence length to max_position_embeddings #1826

mgoin · 2023-11-13T18:19:43Z

Usage

sparseml.transformers.export_onnx --model_path ./TinyLlama-1.1B-Chat-v0.3 --task text-generation --trust_remote_code 
2023-11-13 18:56:23 sparseml.transformers.export INFO     Attempting onnx export for model at /home/mgoin/models/TinyLlama-1.1B-Chat-v0.3 for task text-generation
2023-11-13 18:56:23 sparseml.transformers.export INFO     Using default sequence length of 2048
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.

Reason

Unfortunately I think it is very important to export LLMs with the largest sequence length possible.

For instance I was exporting llama models with a sequence length of 512 for convenience
sparseml.transformers.export_onnx --model_path ./llama2.c-stories15M --task text-generation --sequence_length 512
However due to the PyTorch export and constant folding it seems to produce a cached, fixed rotary embedding of the sequence length used. See it as 512 in this screenshot. The ONNX can still run and compile with a sequence length larger than 512, but the output is unstable and quickly starts to repeat

…beddings

bfineran

LGTM - might want to have a fallback default in case max_position_embeddings is never set, but it may just be the case that HF has a default already

mgoin · 2023-11-13T20:30:20Z

max_position_embeddings

The config class itself has a default value for this, so I'm inclined to leave it be. We could raise ValueError but that will be reflected downstream

…beddings (#1826) * Change Transformers export default sequence length to max_position_embeddings * Fix style

Change Transformers export default sequence length to max_position_em…

85bef0c

…beddings

mgoin requested review from Satrat, bfineran, dsikka, dbogunowicz and anmarques November 13, 2023 18:19

Fix style

32ee4a4

bfineran approved these changes Nov 13, 2023

View reviewed changes

rahul-tuli approved these changes Nov 13, 2023

View reviewed changes

mgoin merged commit 1bcf835 into main Nov 13, 2023
11 checks passed

mgoin deleted the default-sequence-length-config branch November 13, 2023 20:30

bfineran pushed a commit that referenced this pull request Nov 16, 2023

Change Transformers export default sequence length to max_position_em…

95b3ed8

…beddings (#1826) * Change Transformers export default sequence length to max_position_embeddings * Fix style

bfineran pushed a commit that referenced this pull request Nov 16, 2023

Change Transformers export default sequence length to max_position_em…

ec4a11e

…beddings (#1826) * Change Transformers export default sequence length to max_position_embeddings * Fix style

dbogunowicz mentioned this pull request Nov 28, 2023

[Fix] Inferring a default sequence length during transformers export #1856

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Change Transformers export default sequence length to max_position_embeddings #1826

Change Transformers export default sequence length to max_position_embeddings #1826

mgoin commented Nov 13, 2023 •

edited

Loading

bfineran left a comment

mgoin commented Nov 13, 2023

Change Transformers export default sequence length to max_position_embeddings #1826

Change Transformers export default sequence length to max_position_embeddings #1826

Conversation

mgoin commented Nov 13, 2023 • edited Loading

Usage

Reason

bfineran left a comment

Choose a reason for hiding this comment

mgoin commented Nov 13, 2023

mgoin commented Nov 13, 2023 •

edited

Loading