xiayuqing0622

Yuqing Xia xiayuqing0622

Achievements

customized-flash-attention customized-flash-attention Public

Forked from Dao-AILab/flash-attention

Fast and memory-efficient exact attention

Python 3
microsoft/nnfusion microsoft/nnfusion Public

A flexible and efficient deep neural network (DNN) compiler that generates high-performance executable from a DNN model description.

C++ 951 158
cutlass cutlass Public

Forked from NVIDIA/cutlass

CUDA Templates for Linear Algebra Subroutines

C++