intel · Duyi-Wang · Jun 18, 2024 · Jun 17, 2024
diff --git a/include/abstract_decoder.h b/include/abstract_decoder.h
@@ -36,9 +36,9 @@ class AbstractDecoder {
     //    |               |             |             |||||||||||||||             |          |
     //    v               |_____________|_____________|||||||||||||||_____________|__________|
     //                    |<----------------------- vocabSize  ----------------------------->|
-    virtual std::tuple<float *, int, int> forward(int *ids, int64_t *dims, int step, bool logits_all = false) = 0;
+    virtual std::tuple<float *, int, int> forward(int *ids, int64_t *dims, int step, bool logitsAll = false) = 0;
 
-    virtual std::tuple<float *, int, int> forward(std::vector<xft::SequenceMeta *> &seq, bool logits_all = false) = 0;
+    virtual std::tuple<float *, int, int> forward(std::vector<xft::SequenceMeta *> &seq, bool logitsAll = false) = 0;
 
     // Reorder cached keys and values, size=batchSize*beamSize
     virtual void reorderCache(int *idx, int size) = 0;

diff --git a/include/models.h b/include/models.h
@@ -74,7 +74,7 @@ class Model {
 
     bool isDone();
 
-    std::tuple<float *, int, int> forward(bool logits_all = true);
+    std::tuple<float *, int, int> forward(bool logitsAll = true);
 
     std::vector<int32_t> generate();
 

diff --git a/src/models/hybrid_model.h b/src/models/hybrid_model.h
@@ -72,10 +72,12 @@ class HybridModel : public AbstractDecoder {
         }
     }
 
-    // TODO
-    std::tuple<float *, int, int> forward(std::vector<xft::SequenceMeta *> &seq, bool logits_all = false) {
-        throw std::logic_error("Method not implemented");
-        return std::make_tuple(nullptr, 0, 0);
+    std::tuple<float *, int, int> forward(std::vector<xft::SequenceMeta *> &seq, bool logitsAll = false) {
+        if (seq[0]->getStep() == 0) {
+            return firstModel->forward(seq, logitsAll);
+        } else {
+            return nextModel->forward(seq, logitsAll);
+        }
     }
 
     void reorderCache(int *idx, int size) { return firstModel->reorderCache(idx, size); }

diff --git a/src/models/models.cpp b/src/models/models.cpp
@@ -742,14 +742,14 @@ std::vector<int32_t> Model::finalize() {
     }
 }
 
-std::tuple<float *, int, int> Model::forward(bool logits_all) {
+std::tuple<float *, int, int> Model::forward(bool logitsAll) {
     // This forward will sync and gather all logits.
     // Return is a tuple of (logits, totalSeqSize, VocabSize)
     // TODO: Deprecate the following Path
     // Old path reture is (logits, offset, size)
     if (searcher != nullptr) {
         int64_t dims[3] = {batchSize, 1, seqLen};
-        return decoder->forward(inputIds.data(), dims, 0, logits_all);
+        return decoder->forward(inputIds.data(), dims, 0, logitsAll);
     }
     // TODO: checking waiting queue
     if (workingGroup.empty()) {
@@ -768,10 +768,10 @@ std::tuple<float *, int, int> Model::forward(bool logits_all) {
         }
     }
 
-    std::tuple<float *, int, int> result = decoder->forward(workingSeqs, logits_all);
+    std::tuple<float *, int, int> result = decoder->forward(workingSeqs, logitsAll);
 
     int totalSeqSize = workingSeqs.size();
-    if (logits_all && workingSeqs[0]->getStep() == 0) {
+    if (logitsAll && workingSeqs[0]->getStep() == 0) {
         totalSeqSize = 0;
         for (auto x : workingSeqs) {
             totalSeqSize += x->getInputSeqLen();