Add progress bar for weight loading #1534

rasbt · 2024-06-27T18:16:41Z

Previously, when someone downloaded a new model via CLI

litgpt download microsoft/phi-2

or

from litgpt import LLM
llm = LLM.load("microsoft/phi-2")

it was very verbose when loading the model weights (which is useful for debugging):

Processing checkpoints/microsoft/phi-2/model-00001-of-00002.bin
Loading 'model.embed_tokens.weight' into RAM
Loading 'model.layers.0.input_layernorm.bias' into RAM
Loading 'model.layers.0.input_layernorm.weight' into RAM
Loading 'model.layers.0.mlp.fc1.bias' into RAM
Loading 'model.layers.0.mlp.fc1.weight' into RAM
Loading 'model.layers.0.mlp.fc2.bias' into RAM
Loading 'model.layers.0.mlp.fc2.weight' into RAM
Loading 'model.layers.0.self_attn.dense.bias' into RAM
Loading 'model.layers.0.self_attn.dense.weight' into RAM
Loading 'model.layers.1.input_layernorm.bias' into RAM
Loading 'model.layers.1.input_layernorm.weight' into RAM
Loading 'model.layers.1.mlp.fc1.bias' into RAM
Loading 'model.layers.1.mlp.fc1.weight' into RAM
Loading 'model.layers.1.mlp.fc2.bias' into RAM
Loading 'model.layers.1.mlp.fc2.weight' into RAM
Loading 'model.layers.1.self_attn.dense.bias' into RAM
Loading 'model.layers.1.self_attn.dense.weight' into RAM
Loading 'model.layers.10.input_layernorm.bias' into RAM
Loading 'model.layers.10.input_layernorm.weight' into RAM
Loading 'model.layers.10.mlp.fc1.bias' into RAM
Loading 'model.layers.10.mlp.fc1.weight' into RAM
Loading 'model.layers.10.mlp.fc2.bias' into RAM
Loading 'model.layers.10.mlp.fc2.weight' into RAM
Loading 'model.layers.10.self_attn.dense.bias' into RAM
Loading 'model.layers.10.self_attn.dense.weight' into RAM
Loading 'model.layers.11.input_layernorm.bias' into RAM
Loading 'model.layers.11.input_layernorm.weight' into RAM
Loading 'model.layers.11.mlp.fc1.bias' into RAM
Loading 'model.layers.11.mlp.fc1.weight' into RAM
Loading 'model.layers.11.mlp.fc2.bias' into RAM
Loading 'model.layers.11.mlp.fc2.weight' into RAM
Loading 'model.layers.11.self_attn.dense.bias' into RAM
Loading 'model.layers.11.self_attn.dense.weight' into RAM
Loading 'model.layers.12.input_layernorm.bias' into RAM
Loading 'model.layers.12.input_layernorm.weight' into RAM
Loading 'model.layers.12.mlp.fc1.bias' into RAM
Loading 'model.layers.12.mlp.fc1.weight' into RAM
Loading 'model.layers.12.mlp.fc2.bias' into RAM
Loading 'model.layers.12.mlp.fc2.weight' into RAM
Loading 'model.layers.12.self_attn.dense.bias' into RAM
Loading 'model.layers.12.self_attn.dense.weight' into RAM
Loading 'model.layers.13.input_layernorm.bias' into RAM
Loading 'model.layers.13.input_layernorm.weight' into RAM
Loading 'model.layers.13.mlp.fc1.bias' into RAM
Loading 'model.layers.13.mlp.fc1.weight' into RAM
Loading 'model.layers.13.mlp.fc2.bias' into RAM
Loading 'model.layers.13.mlp.fc2.weight' into RAM
Loading 'model.layers.13.self_attn.dense.bias' into RAM
Loading 'model.layers.13.self_attn.dense.weight' into RAM
Loading 'model.layers.14.input_layernorm.bias' into RAM
Loading 'model.layers.14.input_layernorm.weight' into RAM
Loading 'model.layers.14.mlp.fc1.bias' into RAM
Loading 'model.layers.14.mlp.fc1.weight' into RAM
Loading 'model.layers.14.mlp.fc2.bias' into RAM
Loading 'model.layers.14.mlp.fc2.weight' into RAM
Loading 'model.layers.14.self_attn.dense.bias' into RAM
Loading 'model.layers.14.self_attn.dense.weight' into RAM
Loading 'model.layers.15.input_layernorm.bias' into RAM
Loading 'model.layers.15.input_layernorm.weight' into RAM
Loading 'model.layers.15.mlp.fc1.bias' into RAM
Loading 'model.layers.15.mlp.fc1.weight' into RAM
Loading 'model.layers.15.mlp.fc2.bias' into RAM
Loading 'model.layers.15.mlp.fc2.weight' into RAM
Loading 'model.layers.15.self_attn.dense.bias' into RAM
Loading 'model.layers.15.self_attn.dense.weight' into RAM
Loading 'model.layers.16.input_layernorm.bias' into RAM
Loading 'model.layers.16.input_layernorm.weight' into RAM
Loading 'model.layers.16.mlp.fc1.bias' into RAM
Loading 'model.layers.16.mlp.fc1.weight' into RAM
Loading 'model.layers.16.mlp.fc2.bias' into RAM
Loading 'model.layers.16.mlp.fc2.weight' into RAM
Loading 'model.layers.16.self_attn.dense.bias' into RAM
Loading 'model.layers.16.self_attn.dense.weight' into RAM
Loading 'model.layers.17.input_layernorm.bias' into RAM
Loading 'model.layers.17.input_layernorm.weight' into RAM
Loading 'model.layers.17.mlp.fc1.bias' into RAM
Loading 'model.layers.17.mlp.fc1.weight' into RAM
Loading 'model.layers.17.mlp.fc2.bias' into RAM
Loading 'model.layers.17.mlp.fc2.weight' into RAM
Loading 'model.layers.17.self_attn.dense.bias' into RAM
Loading 'model.layers.17.self_attn.dense.weight' into RAM
Loading 'model.layers.18.input_layernorm.bias' into RAM
Loading 'model.layers.18.input_layernorm.weight' into RAM
Loading 'model.layers.18.mlp.fc1.bias' into RAM
Loading 'model.layers.18.mlp.fc1.weight' into RAM
Loading 'model.layers.18.mlp.fc2.bias' into RAM
Loading 'model.layers.18.mlp.fc2.weight' into RAM
Loading 'model.layers.18.self_attn.dense.bias' into RAM
Loading 'model.layers.18.self_attn.dense.weight' into RAM
Loading 'model.layers.19.input_layernorm.bias' into RAM
Loading 'model.layers.19.input_layernorm.weight' into RAM
Loading 'model.layers.19.mlp.fc1.bias' into RAM
Loading 'model.layers.19.mlp.fc1.weight' into RAM
Loading 'model.layers.19.mlp.fc2.bias' into RAM
Loading 'model.layers.19.mlp.fc2.weight' into RAM
Loading 'model.layers.19.self_attn.dense.bias' into RAM
Loading 'model.layers.19.self_attn.dense.weight' into RAM
Loading 'model.layers.2.input_layernorm.bias' into RAM
Loading 'model.layers.2.input_layernorm.weight' into RAM
Loading 'model.layers.2.mlp.fc1.bias' into RAM
Loading 'model.layers.2.mlp.fc1.weight' into RAM
Loading 'model.layers.2.mlp.fc2.bias' into RAM
Loading 'model.layers.2.mlp.fc2.weight' into RAM
Loading 'model.layers.2.self_attn.dense.bias' into RAM
Loading 'model.layers.2.self_attn.dense.weight' into RAM
Loading 'model.layers.20.input_layernorm.bias' into RAM
Loading 'model.layers.20.input_layernorm.weight' into RAM
Loading 'model.layers.20.mlp.fc1.bias' into RAM
Loading 'model.layers.20.mlp.fc1.weight' into RAM
Loading 'model.layers.20.mlp.fc2.bias' into RAM
Loading 'model.layers.20.mlp.fc2.weight' into RAM
Loading 'model.layers.20.self_attn.dense.bias' into RAM
Loading 'model.layers.20.self_attn.dense.weight' into RAM
Loading 'model.layers.21.input_layernorm.bias' into RAM
Loading 'model.layers.21.input_layernorm.weight' into RAM
Loading 'model.layers.21.mlp.fc1.bias' into RAM
Loading 'model.layers.21.mlp.fc1.weight' into RAM
Loading 'model.layers.21.mlp.fc2.bias' into RAM
Loading 'model.layers.21.mlp.fc2.weight' into RAM
Loading 'model.layers.21.self_attn.dense.bias' into RAM
Loading 'model.layers.21.self_attn.dense.weight' into RAM
Loading 'model.layers.22.input_layernorm.bias' into RAM
Loading 'model.layers.22.input_layernorm.weight' into RAM
Loading 'model.layers.22.mlp.fc1.bias' into RAM
Loading 'model.layers.22.mlp.fc1.weight' into RAM
Loading 'model.layers.22.mlp.fc2.bias' into RAM
Loading 'model.layers.22.mlp.fc2.weight' into RAM
Loading 'model.layers.22.self_attn.dense.bias' into RAM
Loading 'model.layers.22.self_attn.dense.weight' into RAM
Loading 'model.layers.23.input_layernorm.bias' into RAM
Loading 'model.layers.23.input_layernorm.weight' into RAM
Loading 'model.layers.23.mlp.fc1.bias' into RAM
Loading 'model.layers.23.mlp.fc1.weight' into RAM
Loading 'model.layers.23.mlp.fc2.bias' into RAM
Loading 'model.layers.23.mlp.fc2.weight' into RAM
Loading 'model.layers.23.self_attn.dense.bias' into RAM
Loading 'model.layers.23.self_attn.dense.weight' into RAM
Loading 'model.layers.24.input_layernorm.bias' into RAM
Loading 'model.layers.24.input_layernorm.weight' into RAM
Loading 'model.layers.24.mlp.fc1.bias' into RAM
Loading 'model.layers.24.mlp.fc1.weight' into RAM
Loading 'model.layers.24.mlp.fc2.bias' into RAM
Loading 'model.layers.24.mlp.fc2.weight' into RAM
Loading 'model.layers.24.self_attn.dense.bias' into RAM
Loading 'model.layers.24.self_attn.dense.weight' into RAM
Loading 'model.layers.25.input_layernorm.bias' into RAM
Loading 'model.layers.25.input_layernorm.weight' into RAM
Loading 'model.layers.25.mlp.fc1.bias' into RAM
Loading 'model.layers.25.mlp.fc1.weight' into RAM
Loading 'model.layers.25.mlp.fc2.bias' into RAM
Loading 'model.layers.25.mlp.fc2.weight' into RAM
Loading 'model.layers.25.self_attn.dense.bias' into RAM
Loading 'model.layers.25.self_attn.dense.weight' into RAM
Loading 'model.layers.26.input_layernorm.bias' into RAM
Loading 'model.layers.26.input_layernorm.weight' into RAM
Loading 'model.layers.26.mlp.fc1.bias' into RAM
Loading 'model.layers.26.mlp.fc1.weight' into RAM
Loading 'model.layers.26.mlp.fc2.bias' into RAM
Loading 'model.layers.26.mlp.fc2.weight' into RAM
Loading 'model.layers.26.self_attn.dense.bias' into RAM
Loading 'model.layers.26.self_attn.dense.weight' into RAM
Loading 'model.layers.27.input_layernorm.bias' into RAM
Loading 'model.layers.27.input_layernorm.weight' into RAM
Loading 'model.layers.27.mlp.fc1.bias' into RAM
Loading 'model.layers.27.mlp.fc1.weight' into RAM
Loading 'model.layers.27.mlp.fc2.bias' into RAM
Loading 'model.layers.27.mlp.fc2.weight' into RAM
Loading 'model.layers.27.self_attn.dense.bias' into RAM
Loading 'model.layers.27.self_attn.dense.weight' into RAM
Loading 'model.layers.28.input_layernorm.bias' into RAM
Loading 'model.layers.28.input_layernorm.weight' into RAM
Loading 'model.layers.28.mlp.fc1.bias' into RAM
Loading 'model.layers.28.mlp.fc1.weight' into RAM
Loading 'model.layers.28.mlp.fc2.bias' into RAM
Loading 'model.layers.28.mlp.fc2.weight' into RAM
Loading 'model.layers.28.self_attn.dense.bias' into RAM
Loading 'model.layers.28.self_attn.dense.weight' into RAM
Loading 'model.layers.29.input_layernorm.bias' into RAM
Loading 'model.layers.29.input_layernorm.weight' into RAM
Loading 'model.layers.29.mlp.fc1.bias' into RAM
Loading 'model.layers.29.mlp.fc1.weight' into RAM
Loading 'model.layers.29.mlp.fc2.bias' into RAM
Loading 'model.layers.29.mlp.fc2.weight' into RAM
Loading 'model.layers.29.self_attn.dense.bias' into RAM
Loading 'model.layers.29.self_attn.dense.weight' into RAM
Loading 'model.layers.3.input_layernorm.bias' into RAM
Loading 'model.layers.3.input_layernorm.weight' into RAM
Loading 'model.layers.3.mlp.fc1.bias' into RAM
Loading 'model.layers.3.mlp.fc1.weight' into RAM
Loading 'model.layers.3.mlp.fc2.bias' into RAM
Loading 'model.layers.3.mlp.fc2.weight' into RAM
Loading 'model.layers.3.self_attn.dense.bias' into RAM
Loading 'model.layers.3.self_attn.dense.weight' into RAM
Loading 'model.layers.4.input_layernorm.bias' into RAM
Loading 'model.layers.4.input_layernorm.weight' into RAM
Loading 'model.layers.4.mlp.fc1.bias' into RAM
Loading 'model.layers.4.mlp.fc1.weight' into RAM
Loading 'model.layers.4.mlp.fc2.bias' into RAM
Loading 'model.layers.4.mlp.fc2.weight' into RAM
Loading 'model.layers.4.self_attn.dense.bias' into RAM
Loading 'model.layers.4.self_attn.dense.weight' into RAM
Loading 'model.layers.5.input_layernorm.bias' into RAM
Loading 'model.layers.5.input_layernorm.weight' into RAM
Loading 'model.layers.5.mlp.fc1.bias' into RAM
Loading 'model.layers.5.mlp.fc1.weight' into RAM
Loading 'model.layers.5.mlp.fc2.bias' into RAM
Loading 'model.layers.5.mlp.fc2.weight' into RAM
Loading 'model.layers.5.self_attn.dense.bias' into RAM
Loading 'model.layers.5.self_attn.dense.weight' into RAM
Loading 'model.layers.6.input_layernorm.bias' into RAM
Loading 'model.layers.6.input_layernorm.weight' into RAM
Loading 'model.layers.6.mlp.fc1.bias' into RAM
Loading 'model.layers.6.mlp.fc1.weight' into RAM
Loading 'model.layers.6.mlp.fc2.bias' into RAM
Loading 'model.layers.6.mlp.fc2.weight' into RAM
Loading 'model.layers.6.self_attn.dense.bias' into RAM
Loading 'model.layers.6.self_attn.dense.weight' into RAM
Loading 'model.layers.7.input_layernorm.bias' into RAM
Loading 'model.layers.7.input_layernorm.weight' into RAM
Loading 'model.layers.7.mlp.fc1.bias' into RAM
Loading 'model.layers.7.mlp.fc1.weight' into RAM
Loading 'model.layers.7.mlp.fc2.bias' into RAM
Loading 'model.layers.7.mlp.fc2.weight' into RAM
Loading 'model.layers.7.self_attn.dense.bias' into RAM
Loading 'model.layers.7.self_attn.dense.weight' into RAM
Loading 'model.layers.8.input_layernorm.bias' into RAM
Loading 'model.layers.8.input_layernorm.weight' into RAM
Loading 'model.layers.8.mlp.fc1.bias' into RAM
Loading 'model.layers.8.mlp.fc1.weight' into RAM
Loading 'model.layers.8.mlp.fc2.bias' into RAM
Loading 'model.layers.8.mlp.fc2.weight' into RAM
Loading 'model.layers.8.self_attn.dense.bias' into RAM
Loading 'model.layers.8.self_attn.dense.weight' into RAM
Loading 'model.layers.9.input_layernorm.bias' into RAM
Loading 'model.layers.9.input_layernorm.weight' into RAM
Loading 'model.layers.9.mlp.fc1.bias' into RAM
Loading 'model.layers.9.mlp.fc1.weight' into RAM
Loading 'model.layers.9.mlp.fc2.bias' into RAM
Loading 'model.layers.9.mlp.fc2.weight' into RAM
Loading 'model.layers.9.self_attn.dense.bias' into RAM
Loading 'model.layers.9.self_attn.dense.weight' into RAM
Loading 'layer 0 q bias' into RAM
Loading 'layer 0 k bias' into RAM
Loading 'layer 0 v bias' into RAM
Loading 'layer 0 q weight' into RAM
Loading 'layer 0 k weight' into RAM
Loading 'layer 0 v weight' into RAM
Loading 'layer 1 q bias' into RAM
Loading 'layer 1 k bias' into RAM
Loading 'layer 1 v bias' into RAM
Loading 'layer 1 q weight' into RAM
Loading 'layer 1 k weight' into RAM
Loading 'layer 1 v weight' into RAM
Loading 'layer 10 q bias' into RAM
Loading 'layer 10 k bias' into RAM
Loading 'layer 10 v bias' into RAM
Loading 'layer 10 q weight' into RAM
Loading 'layer 10 k weight' into RAM
Loading 'layer 10 v weight' into RAM
Loading 'layer 11 q bias' into RAM
Loading 'layer 11 k bias' into RAM
Loading 'layer 11 v bias' into RAM
Loading 'layer 11 q weight' into RAM
Loading 'layer 11 k weight' into RAM
Loading 'layer 11 v weight' into RAM
Loading 'layer 12 q bias' into RAM
Loading 'layer 12 k bias' into RAM
Loading 'layer 12 v bias' into RAM
Loading 'layer 12 q weight' into RAM
Loading 'layer 12 k weight' into RAM
Loading 'layer 12 v weight' into RAM
Loading 'layer 13 q bias' into RAM
Loading 'layer 13 k bias' into RAM
Loading 'layer 13 v bias' into RAM
Loading 'layer 13 q weight' into RAM
Loading 'layer 13 k weight' into RAM
Loading 'layer 13 v weight' into RAM
Loading 'layer 14 q bias' into RAM
Loading 'layer 14 k bias' into RAM
Loading 'layer 14 v bias' into RAM
Loading 'layer 14 q weight' into RAM
Loading 'layer 14 k weight' into RAM
Loading 'layer 14 v weight' into RAM
Loading 'layer 15 q bias' into RAM
Loading 'layer 15 k bias' into RAM
Loading 'layer 15 v bias' into RAM
Loading 'layer 15 q weight' into RAM
Loading 'layer 15 k weight' into RAM
Loading 'layer 15 v weight' into RAM
Loading 'layer 16 q bias' into RAM
Loading 'layer 16 k bias' into RAM
Loading 'layer 16 v bias' into RAM
Loading 'layer 16 q weight' into RAM
Loading 'layer 16 k weight' into RAM
Loading 'layer 16 v weight' into RAM
Loading 'layer 17 q bias' into RAM
Loading 'layer 17 k bias' into RAM
Loading 'layer 17 v bias' into RAM
Loading 'layer 17 q weight' into RAM
Loading 'layer 17 k weight' into RAM
Loading 'layer 17 v weight' into RAM
Loading 'layer 18 q bias' into RAM
Loading 'layer 18 k bias' into RAM
Loading 'layer 18 v bias' into RAM
Loading 'layer 18 q weight' into RAM
Loading 'layer 18 k weight' into RAM
Loading 'layer 18 v weight' into RAM
Loading 'layer 19 q bias' into RAM
Loading 'layer 19 k bias' into RAM
Loading 'layer 19 v bias' into RAM
Loading 'layer 19 q weight' into RAM
Loading 'layer 19 k weight' into RAM
Loading 'layer 19 v weight' into RAM
Loading 'layer 2 q bias' into RAM
Loading 'layer 2 k bias' into RAM
Loading 'layer 2 v bias' into RAM
Loading 'layer 2 q weight' into RAM
Loading 'layer 2 k weight' into RAM
Loading 'layer 2 v weight' into RAM
Loading 'layer 20 q bias' into RAM
Loading 'layer 20 k bias' into RAM
Loading 'layer 20 v bias' into RAM
Loading 'layer 20 q weight' into RAM
Loading 'layer 20 k weight' into RAM
Loading 'layer 20 v weight' into RAM
Loading 'layer 21 q bias' into RAM
Loading 'layer 21 k bias' into RAM
Loading 'layer 21 v bias' into RAM
Loading 'layer 21 q weight' into RAM
Loading 'layer 21 k weight' into RAM
Loading 'layer 21 v weight' into RAM
Loading 'layer 22 q bias' into RAM
Loading 'layer 22 k bias' into RAM
Loading 'layer 22 v bias' into RAM
Loading 'layer 22 q weight' into RAM
Loading 'layer 22 k weight' into RAM
Loading 'layer 22 v weight' into RAM
Loading 'layer 23 q bias' into RAM
Loading 'layer 23 k bias' into RAM
Loading 'layer 23 v bias' into RAM
Loading 'layer 23 q weight' into RAM
Loading 'layer 23 k weight' into RAM
Loading 'layer 23 v weight' into RAM
Loading 'layer 24 q bias' into RAM
Loading 'layer 24 k bias' into RAM
Loading 'layer 24 v bias' into RAM
Loading 'layer 24 q weight' into RAM
Loading 'layer 24 k weight' into RAM
Loading 'layer 24 v weight' into RAM
Loading 'layer 25 q bias' into RAM
Loading 'layer 25 k bias' into RAM
Loading 'layer 25 v bias' into RAM
Loading 'layer 25 q weight' into RAM
Loading 'layer 25 k weight' into RAM
Loading 'layer 25 v weight' into RAM
Loading 'layer 26 q bias' into RAM
Loading 'layer 26 k bias' into RAM
Loading 'layer 26 v bias' into RAM
Loading 'layer 26 q weight' into RAM
Loading 'layer 26 k weight' into RAM
Loading 'layer 26 v weight' into RAM
Loading 'layer 27 q bias' into RAM
Loading 'layer 27 k bias' into RAM
Loading 'layer 27 v bias' into RAM
Loading 'layer 27 q weight' into RAM
Loading 'layer 27 k weight' into RAM
Loading 'layer 27 v weight' into RAM
Loading 'layer 28 q bias' into RAM
Loading 'layer 28 k bias' into RAM
Loading 'layer 28 v bias' into RAM
Loading 'layer 28 q weight' into RAM
Loading 'layer 28 k weight' into RAM
Loading 'layer 28 v weight' into RAM
Loading 'layer 29 q bias' into RAM
Loading 'layer 29 k bias' into RAM
Loading 'layer 29 v bias' into RAM
Loading 'layer 29 q weight' into RAM
Loading 'layer 29 k weight' into RAM
Loading 'layer 29 v weight' into RAM
Loading 'layer 3 q bias' into RAM
Loading 'layer 3 k bias' into RAM
Loading 'layer 3 v bias' into RAM
Loading 'layer 3 q weight' into RAM
Loading 'layer 3 k weight' into RAM
Loading 'layer 3 v weight' into RAM
Loading 'layer 4 q bias' into RAM
Loading 'layer 4 k bias' into RAM
Loading 'layer 4 v bias' into RAM
Loading 'layer 4 q weight' into RAM
Loading 'layer 4 k weight' into RAM
Loading 'layer 4 v weight' into RAM
Loading 'layer 5 q bias' into RAM
Loading 'layer 5 k bias' into RAM
Loading 'layer 5 v bias' into RAM
Loading 'layer 5 q weight' into RAM
Loading 'layer 5 k weight' into RAM
Loading 'layer 5 v weight' into RAM
Loading 'layer 6 q bias' into RAM
Loading 'layer 6 k bias' into RAM
Loading 'layer 6 v bias' into RAM
Loading 'layer 6 q weight' into RAM
Loading 'layer 6 k weight' into RAM
Loading 'layer 6 v weight' into RAM
Loading 'layer 7 q bias' into RAM
Loading 'layer 7 k bias' into RAM
Loading 'layer 7 v bias' into RAM
Loading 'layer 7 q weight' into RAM
Loading 'layer 7 k weight' into RAM
Loading 'layer 7 v weight' into RAM
Loading 'layer 8 q bias' into RAM
Loading 'layer 8 k bias' into RAM
Loading 'layer 8 v bias' into RAM
Loading 'layer 8 q weight' into RAM
Loading 'layer 8 k weight' into RAM
Loading 'layer 8 v weight' into RAM
Loading 'layer 9 q bias' into RAM
Loading 'layer 9 k bias' into RAM
Loading 'layer 9 v bias' into RAM
Loading 'layer 9 q weight' into RAM
Loading 'layer 9 k weight' into RAM
Loading 'layer 9 v weight' into RAM
Processing checkpoints/microsoft/phi-2/model-00002-of-00002.bin
Loading 'lm_head.bias' into RAM
Loading 'lm_head.weight' into RAM
Loading 'model.final_layernorm.bias' into RAM
Loading 'model.final_layernorm.weight' into RAM
Loading 'model.layers.30.input_layernorm.bias' into RAM
Loading 'model.layers.30.input_layernorm.weight' into RAM
Loading 'model.layers.30.mlp.fc1.bias' into RAM
Loading 'model.layers.30.mlp.fc1.weight' into RAM
Loading 'model.layers.30.mlp.fc2.bias' into RAM
Loading 'model.layers.30.mlp.fc2.weight' into RAM
Loading 'model.layers.30.self_attn.dense.bias' into RAM
Loading 'model.layers.30.self_attn.dense.weight' into RAM
Loading 'model.layers.31.input_layernorm.bias' into RAM
Loading 'model.layers.31.input_layernorm.weight' into RAM
Loading 'model.layers.31.mlp.fc1.bias' into RAM
Loading 'model.layers.31.mlp.fc1.weight' into RAM
Loading 'model.layers.31.mlp.fc2.bias' into RAM
Loading 'model.layers.31.mlp.fc2.weight' into RAM
Loading 'model.layers.31.self_attn.dense.bias' into RAM
Loading 'model.layers.31.self_attn.dense.weight' into RAM
Loading 'layer 30 q bias' into RAM
Loading 'layer 30 k bias' into RAM
Loading 'layer 30 v bias' into RAM
Loading 'layer 30 q weight' into RAM
Loading 'layer 30 k weight' into RAM
Loading 'layer 30 v weight' into RAM
Loading 'layer 31 q bias' into RAM
Loading 'layer 31 k bias' into RAM
Loading 'layer 31 v bias' into RAM
Loading 'layer 31 q weight' into RAM
Loading 'layer 31 k weight' into RAM
Loading 'layer 31 v weight' into RAM
Saving converted checkpoint to checkpoints/microsoft/phi-2

This PR changes the default behavior to show progress bars instead:

Processing checkpoints/microsoft/phi-2/model-00001-of-00002.bin
Processing weights: 100%|██████████| 423/423 [00:13<00:00, 31.41it/s]
Processing QKV weights: 100%|██████████| 31/31 [00:00<00:00, 59.14it/s]
Processing checkpoints/microsoft/phi-2/model-00002-of-00002.bin
Processing weights: 100%|██████████| 30/30 [00:04<00:00,  7.04it/s]
Processing QKV weights: 100%|██████████| 32/32 [00:00<00:00, 870.16it/s]
Saving converted checkpoint to checkpoints/microsoft/phi-2

The old behavior can still be used via

litgpt download microsoft/phi-2 --verbose true

CC @williamFalcon

williamFalcon · 2024-06-27T19:45:05Z

but why have 5 progress bars?

i'd prefer a single bar that measures ALL the progress but maybe prints a message saying what stage it's at (if needed).

it's like gettting 10 progress bars to start a laptop just because the laptop is doing 10 things under the hood.
you usually get a single progress bar but the message of what it's doing changes.

rasbt · 2024-06-27T20:15:26Z

The problem is that we have n files and each file has m tensors. It's hard to now how many n*m tensors there are for a total progress bar until opening all the files and checking the number of weights. We can check this of course, but that would be adding minutes of extra time for large models.

We can maybe just have a progress bar over the n files instead.

rasbt · 2024-06-27T20:54:41Z

Ok figured out an efficient way to do a global progress bar.

Tests are failing because of a change in EleutherAI's GPTNeoX model in an external repo that we test against. Will investigate and fix in a separate PR and then revisit this.

Andrei-Aksionov · 2024-06-27T22:28:11Z

Maybe we could just retrieve the number of layers from the config file, monitor when the conversion script started working on another layer and use this as a signal to update the progress bar?

rasbt · 2024-07-01T22:31:24Z

There's now one global progress bar for all files and weights that are being loaded:

Loading weights: model-00003-of-00004.bin:  66%|███████████████████▎         | 00:22<00:10,  3.08it/s

…-bar

litgpt/scripts/convert_hf_checkpoint.py

Andrei-Aksionov · 2024-07-02T17:10:36Z

litgpt/scripts/convert_hf_checkpoint.py

+        else:
+            # Handling files without progress bar in debug mode
+            for bin_file in sorted(bin_files):
+                current_file_size = os.path.getsize(bin_file)


This line can be deleted. You don't use current_file_size later on.

Add progress bar for weight loading

0628759

rasbt requested review from awaelchli and lantiga as code owners June 27, 2024 18:16

fix tests

7159063

undo all changes

f56c451

rasbt marked this pull request as draft June 27, 2024 20:26

progress on global progress bar

f89fa39

rasbt added 2 commits July 1, 2024 22:27

calculate global progress bar

8c8b33b

rename to weight loading

9b8d36f

Merge branch 'main' into model-loading-progess-bar

c45ead2

rasbt marked this pull request as ready for review July 1, 2024 22:32

rasbt added 3 commits July 2, 2024 13:53

Merge remote-tracking branch 'origin/main' into model-loading-progess…

c46860d

…-bar

updates

cecfc10

Merge branch 'main' into model-loading-progess-bar

096fc92

rasbt merged commit df50634 into main Jul 2, 2024
9 checks passed

rasbt deleted the model-loading-progess-bar branch July 2, 2024 15:20

Andrei-Aksionov reviewed Jul 2, 2024

View reviewed changes

litgpt/scripts/convert_hf_checkpoint.py Show resolved Hide resolved

Andrei-Aksionov reviewed Jul 2, 2024

View reviewed changes

litgpt/scripts/convert_hf_checkpoint.py Show resolved Hide resolved

Andrei-Aksionov reviewed Jul 2, 2024

View reviewed changes

Andrei-Aksionov mentioned this pull request Jul 3, 2024

Remove redundant code in checkpoint conversion script #1547

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add progress bar for weight loading #1534

Add progress bar for weight loading #1534

rasbt commented Jun 27, 2024

williamFalcon commented Jun 27, 2024 •

edited

Loading

rasbt commented Jun 27, 2024 •

edited

Loading

rasbt commented Jun 27, 2024

Andrei-Aksionov commented Jun 27, 2024

rasbt commented Jul 1, 2024

Andrei-Aksionov Jul 2, 2024 •

edited

Loading

Add progress bar for weight loading #1534

Add progress bar for weight loading #1534

Conversation

rasbt commented Jun 27, 2024

williamFalcon commented Jun 27, 2024 • edited Loading

rasbt commented Jun 27, 2024 • edited Loading

rasbt commented Jun 27, 2024

Andrei-Aksionov commented Jun 27, 2024

rasbt commented Jul 1, 2024

Andrei-Aksionov Jul 2, 2024 • edited Loading

Choose a reason for hiding this comment

williamFalcon commented Jun 27, 2024 •

edited

Loading

rasbt commented Jun 27, 2024 •

edited

Loading

Andrei-Aksionov Jul 2, 2024 •

edited

Loading