New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Triton RMSNorm #1050

Merged

josejg merged 14 commits into mosaicml:main from josejg:triton_rms_norm

Apr 2, 2024

Contributor

josejg commented Mar 21, 2024

This PR adds support for FlashAttention's Triton implementation of RMSnorm (commonly found in LLaMa-like models).

The flag is enabled by setting parameters.model.norm_type to triton_rmsnorm .

Under a LLaMa-2-7b-like workload (displayed below) using this implementation produces a lift of ~1400 tok/s/gpu while preserving the loss. The improvement is so large because the current RMSnorm implementation is done in vanilla PyTorch (see here).

josejg added 2 commits

March 21, 2024 14:50


          Triton RMS Norm

378bda3

fix

627f59d

josejg requested a review from dakinggg

March 21, 2024 23:58

dakinggg reviewed

View reviewed changes

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved

dakinggg reviewed

View reviewed changes

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved

dakinggg reviewed

View reviewed changes

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved

dakinggg reviewed

View reviewed changes

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved

dakinggg reviewed

View reviewed changes

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved

dakinggg reviewed

View reviewed changes

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved

dakinggg reviewed

View reviewed changes

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved

josejg added 2 commits

March 21, 2024 18:35


          refactor

86c6aa9


          Fix test

a13da69

dakinggg reviewed

View reviewed changes

tests/models/test_model.py Outdated Show resolved Hide resolved

llmfoundry/models/layers/norm.py Show resolved Hide resolved

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved

llmfoundry/models/layers/norm.py Outdated Show resolved Hide resolved


          no bias

62dfb9e

dakinggg approved these changes

View reviewed changes

Collaborator

dakinggg left a comment

LGTM, can you add a simple test that checks numerical equivalence to the base rmsnorm impl?

josejg and others added 9 commits

March 21, 2024 21:52


          Update tests/models/test_model.py

8b0a849

Co-authored-by: Daniel King <43149077+dakinggg@users.noreply.github.com>


          fixes

38638bd


          Unittest

782f2a9


          Merge branch 'triton_rms_norm' of github.com:josejg/llm-foundry into …

5f6044c

…triton_rms_norm

fix

cada49a


          fix2

03c9784


          fix3

fa68616


          fix3

667eb7c


          Merge branch 'main' into triton_rms_norm

949eb52

josejg enabled auto-merge (squash)

April 2, 2024 00:02

vchiley approved these changes

View reviewed changes

josejg merged commit b765b47 into mosaicml:main

9 checks passed

KuuCi pushed a commit that referenced this pull request


          Triton RMSNorm (#1050)

18c0ec7

* Triton RMS Norm

* fix

* refactor

* Fix test

* no bias

* Update tests/models/test_model.py

Co-authored-by: Daniel King <43149077+dakinggg@users.noreply.github.com>

* fixes

* Unittest

* fix

* fix2

* fix3

* fix3

---------

Co-authored-by: Daniel King <43149077+dakinggg@users.noreply.github.com>

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment