zh-cn/stable/qwen_8h_source.html

 #ifndef _NNDEPLOY_LLM_QWEN_H_

 #define _NNDEPLOY_LLM_QWEN_H_


 #include "nndeploy/base/any.h"

 #include "nndeploy/base/common.h"

 #include "nndeploy/base/glic_stl_include.h"

 #include "nndeploy/base/log.h"

 #include "nndeploy/base/macro.h"

 #include "nndeploy/base/object.h"

 #include "nndeploy/base/opencv_include.h"

 #include "nndeploy/base/param.h"

 #include "nndeploy/base/status.h"

 #include "nndeploy/base/string.h"

 #include "nndeploy/dag/composite_node.h"

 #include "nndeploy/dag/edge.h"

 #include "nndeploy/dag/graph.h"

 #include "nndeploy/dag/loop.h"

 #include "nndeploy/dag/node.h"

 #include "nndeploy/device/buffer.h"

 #include "nndeploy/device/device.h"

 #include "nndeploy/device/memory_pool.h"

 #include "nndeploy/device/tensor.h"

 #include "nndeploy/infer/infer.h"

 #include "nndeploy/tokenizer/tokenizer.h"

 #include "nndeploy/tokenizer/tokenizer_cpp/tokenizer_cpp.h"


 namespace nndeploy {

 namespace qwen {


 struct NNDEPLOY_CC_API QwenConfig {

   int layer_nums_;

   int hidden_size_;

   int max_seq_len_;

   std::string model_value_;

   std::string embedding_file_;

   std::string tokenizer_json_, tokenizer_txt_;

   std::string prompt_template_;

   std::string prompt_;

   std::vector<int32_t> kv_init_shape_;

 };


 extern NNDEPLOY_CC_API QwenConfig parseConfig(const std::string& file_path);


 #define NNDEPLOY_LLAMA2 "NNDEPLOY_LLAMA2"

 #define DELETE_POINTER(ptr) \

   if (ptr != nullptr) {     \

     delete ptr;             \

     ptr = nullptr;          \

   }


 class NNDEPLOY_CC_API PromptParam : public base::Param {

  public:

   std::string prompt_template_ =

       "<|im_start|>user\n%s<|im_end|>\n<|im_start|>assistant\n";

   std::string user_content_;


  public:

   base::Status serialize(rapidjson::Value& json,

                          rapidjson::Document::AllocatorType& allocator);

   base::Status deserialize(rapidjson::Value& json);

 };


 class NNDEPLOY_CC_API PrefillEmbeddingParam : public base::Param {

  public:

   int hidden_size_;

   int all_seq_len_ = 0;

   int gen_seq_len_ = 0;

   std::string embedding_file_;


   std::vector<int32_t> kv_init_shape_;

   base::DataType data_type_ = base::dataTypeOf<float>();

   base::DataType posid_data_type_ = base::dataTypeOf<int>();

   base::DataFormat data_format_ = base::DataFormat::kDataFormatS1D;


  public:

   base::Status serialize(rapidjson::Value& json,

                          rapidjson::Document::AllocatorType& allocator);

   base::Status deserialize(rapidjson::Value& json);

 };


 class NNDEPLOY_CC_API PrefillEmbeddingNode : public dag::Node {

  public:

   PrefillEmbeddingNode(const std::string& name, std::vector<dag::Edge*>& inputs,

                        std::vector<dag::Edge*>& outputs)

       : Node(name, inputs, outputs), is_first_(true) {

     key_ = "nndeploy::qwen::PrefillEmbeddingNode";

     desc_ =

         "PrefillEmbeddingNode generates model input embeddings including:\n"

         "1. Token embedding vectors\n"

         "2. Attention mask matrix\n"

         "3. Position ids vector\n"

         "4. Past key values cache\n"

         "\n"

         "Inputs:\n"

         "- inputs[0]: TokenizerIds containing input token sequence\n"

         "Outputs:\n"

         "- outputs[0]: Input token embedding tensor\n"

         "- outputs[1]: Attention mask tensor\n"

         "- outputs[2]: Position ids tensor\n"

         "- outputs[3]: Past key values cache tensor";

     param_ = std::make_shared<PrefillEmbeddingParam>();

     this->setInputTypeInfo<tokenizer::TokenizerIds>();

     this->setOutputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<device::Tensor>();

   }

   virtual ~PrefillEmbeddingNode() {}

   virtual base::Status run();


  protected:

   device::Tensor* genPastKeyValue(const std::vector<int32_t>& kv_init_shape);

   device::Tensor* genEmbedding(const std::vector<int32_t>& input_ids,

                                int seq_len, int hidden_size,

                                base::DataType data_type,

                                base::DataFormat data_format,

                                std::string& embedding_file);


   device::Tensor* genAttentionMask(int seq_len, int all_seq_len,

                                    base::DataType data_type,

                                    base::DataFormat data_format);


   device::Tensor* genPositionIds(int seq_len, int all_seq_len,

                                  base::DataType data_type,

                                  base::DataFormat data_format);


  protected:

   bool is_first_;

   device::Tensor* past_kv_ = nullptr;

 };


 class NNDEPLOY_CC_API DecodeEmbeddingParam : public base::Param {

  public:

   int hidden_size_;

   int all_seq_len_ = 0;

   int gen_seq_len_ = 0;

   std::string embedding_file_;


   base::DataType data_type_ = base::dataTypeOf<float>();

   base::DataType posid_data_type_ = base::dataTypeOf<int>();

   base::DataFormat data_format_ = base::DataFormat::kDataFormatS1D;

   std::vector<std::vector<int32_t>> token_ids_;

   tokenizer::TokenizerIds history_ids_;

   device::Tensor* past_kv_;


  public:

   base::Status serialize(rapidjson::Value& json,

                          rapidjson::Document::AllocatorType& allocator);

   base::Status deserialize(rapidjson::Value& json);

 };


 class NNDEPLOY_CC_API DecodeSampleParam : public base::Param {

  public:

   tokenizer::TokenizerIds history_ids_;

   tokenizer::TokenizerIds stop_tokens_;

 };


 class NNDEPLOY_CC_API DecodeEmbeddingNode : public dag::Node {

  public:

   DecodeEmbeddingNode(const std::string& name, std::vector<dag::Edge*>& inputs,

                       std::vector<dag::Edge*>& outputs)

       : Node(name, inputs, outputs), is_first_(true) {

     key_ = "nndeploy::qwen::DecodeEmbeddingNode";

     desc_ =

         "DecodeEmbeddingNode generates model input embeddings including:\n"

         "1. Token embedding vectors\n"

         "2. Attention mask matrix\n"

         "3. Position ids vector\n"

         "4. Past key values cache\n"

         "\n"

         "Inputs:\n"

         "- inputs[0]: TokenizerIds containing input token sequence\n"

         "- inputs[1]: past kv values\n"

         "- inputs[2]: history input token sequence\n"

         "Outputs:\n"

         "- outputs[0]: Input token embedding tensor\n"

         "- outputs[1]: Attention mask tensor\n"

         "- outputs[2]: Position ids tensor\n"

         "- outputs[3]: Past key values cache tensor";

     param_ = std::make_shared<DecodeEmbeddingParam>();

     this->setInputTypeInfo<tokenizer::TokenizerIds>();

     this->setInputTypeInfo<tokenizer::TokenizerIds>();

     this->setInputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<device::Tensor>();

   }

   virtual ~DecodeEmbeddingNode() {}


   virtual base::Status run();


  protected:

   device::Tensor* genEmbedding(const std::vector<int32_t>& input_ids,

                                int seq_len, int hidden_size,

                                base::DataType data_type,

                                base::DataFormat data_format,

                                std::string& embedding_file);


   device::Tensor* genAttentionMask(int seq_len, int all_seq_len,

                                    base::DataType data_type,

                                    base::DataFormat data_format);


   device::Tensor* genPositionIds(int seq_len, int all_seq_len,

                                  base::DataType data_type,

                                  base::DataFormat data_format);


  protected:

   bool is_first_;

   device::Tensor* past_kv_;

 };


 class NNDEPLOY_CC_API PrefillSampleNode : public dag::Node {

  public:

   PrefillSampleNode(const std::string& name, std::vector<dag::Edge*> inputs,

                     std::vector<dag::Edge*> outputs)

       : Node(name, inputs, outputs), is_first_(true) {

     key_ = "nndeploy::qwen::PrefillSampleNode";

     desc_ = "Sample next token IDs from logits during LLM prefill stage.";

     this->setInputTypeInfo<device::Tensor>();

     this->setInputTypeInfo<tokenizer::TokenizerIds>();

     this->setOutputTypeInfo<tokenizer::TokenizerIds>();

   }

   virtual ~PrefillSampleNode() {}

   virtual base::Status run();


  protected:

   int32_t sample(device::Tensor* logits, const std::vector<int>& pre_ids);


  protected:

   bool is_first_;

 };


 class NNDEPLOY_CC_API DecodeSampleNode : public dag::Node {

  public:

   DecodeSampleNode(const std::string& name, std::vector<dag::Edge*> inputs,

                    std::vector<dag::Edge*> outputs)

       : Node(name, inputs, outputs), is_first_(true) {

     key_ = "nndeploy::qwen::DecodeSampleNode";

     desc_ = "Sample next token IDs from logits during LLM decode stage.";

     param_ = std::make_shared<DecodeSampleParam>();

     this->setInputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<tokenizer::TokenizerIds>();

   }

   virtual ~DecodeSampleNode() {}

   virtual base::Status run();


  protected:

   int32_t sample(device::Tensor* logits, const std::vector<int>& pre_ids);


  protected:

   bool is_first_;

   std::vector<int32_t> history_ids_;

 };


 class NNDEPLOY_CC_API PromptNode : public dag::Node {

  public:

   PromptNode(const std::string& name, std::vector<dag::Edge*> inputs,

              std::vector<dag::Edge*> outputs)

       : Node(name, inputs, outputs) {

     key_ = "nndeploy::qwen::PromptNode";

     desc_ =

         "Generate TokenizerText from prompt string using optional template.";

     param_ = std::make_shared<PromptParam>();

     this->setOutputTypeInfo<tokenizer::TokenizerText>();

     node_type_ = dag::NodeType::kNodeTypeInput;

     this->setIoType(dag::IOType::kIOTypeString);

   }

   virtual ~PromptNode() {}

   virtual base::Status run();


   virtual base::EdgeUpdateFlag updateInput() {

     if (index_ < size_) {

       return base::kEdgeUpdateFlagComplete;

     } else {

       if (size_ == 0) {

         return base::kEdgeUpdateFlagComplete;

       } else {

         return base::kEdgeUpdateFlagTerminate;

       }

     }

   }


   void setSize(int size) {

     if (size > 0) {

       size_ = size;

     }

   }

   int getSize() { return size_; }


  protected:

   std::string applyTemplate(std::string prompt_template,

                             const std::string& content,

                             const std::string& role = "");


  private:

   int index_ = 0;

   int size_ = 1;

 };


 class NNDEPLOY_CC_API PrintNode : public dag::Node {

  public:

   PrintNode(const std::string& name, std::vector<dag::Edge*> inputs,

             std::vector<dag::Edge*> outputs)

       : Node(name, inputs, outputs) {

     key_ = "nndeploy::qwen::PrintNode";

     desc_ = "Print TokenizerText content and save to temporary output file.";

     this->setInputTypeInfo<tokenizer::TokenizerText>();

     node_type_ = dag::NodeType::kNodeTypeOutput;

     this->setIoType(dag::IOType::kIOTypeText);

   }

   virtual ~PrintNode() {}

   virtual base::Status run();


   virtual base::Status serialize(rapidjson::Value& json,

                                  rapidjson::Document::AllocatorType& allocator);

   virtual base::Status deserialize(rapidjson::Value& json);


   void set_path(std::string path) { path_ = path; }


  private:

   std::string path_ = "resources/others/qwen_out.txt";

 };


 class NNDEPLOY_CC_API QwenPrefill : public dag::CompositeNode {

  public:

   QwenPrefill(const std::string& name, std::vector<dag::Edge*> inputs,

               std::vector<dag::Edge*> outputs)

       : CompositeNode(name, inputs, outputs) {

     key_ = "nndeploy::qwen::QwenPrefill";

     desc_ =

         "LLM prefill pipeline: TokenizerText -> token IDs -> embeddings -> "

         "inference -> sampled token IDs with KV cache.";

     this->setInputTypeInfo<tokenizer::TokenizerText>();

     this->setOutputTypeInfo<tokenizer::TokenizerIds>();

     this->setOutputTypeInfo<device::Tensor>();

     this->setOutputTypeInfo<tokenizer::TokenizerIds>();


     prefill_token_node_ = dynamic_cast<tokenizer::TokenizerEncodeCpp*>(

         this->createNode<tokenizer::TokenizerEncodeCpp>("token_node"));

     prefill_embedding_node_ = dynamic_cast<PrefillEmbeddingNode*>(

         this->createNode<PrefillEmbeddingNode>("embedding_node"));

     prefill_infer_node_ = dynamic_cast<infer::Infer*>(

         this->createNode<infer::Infer>("prefill_infer"));

     prefill_sample_node_ = dynamic_cast<PrefillSampleNode*>(

         this->createNode<PrefillSampleNode>("prefill_sample_node"));

   }


   virtual base::Status init();

   virtual base::Status run();

   virtual base::Status deinit();

   virtual base::Status defaultParam();


   void setConfigPath(std::string config_path) { config_path_ = config_path; }


   base::Status setConfigParam();

   base::Status setInferParams(bool is_path, base::ModelType model_type,

                               base::DeviceType device_type);

   base::Status setInferenceType(base::InferenceType inference_type);


   virtual base::Status serialize(rapidjson::Value& json,

                                  rapidjson::Document::AllocatorType& allocator);

   virtual base::Status deserialize(rapidjson::Value& json);


  private:

   dag::Node* prefill_token_node_;

   dag::Node* prefill_embedding_node_;

   infer::Infer* prefill_infer_node_;

   dag::Node* prefill_sample_node_;


   std::string config_path_;

 };


 class NNDEPLOY_CC_API QwenDecode : public dag::CompositeNode {

  public:

   QwenDecode(const std::string& name, std::vector<dag::Edge*> inputs,

              std::vector<dag::Edge*> outputs)

       : CompositeNode(name, inputs, outputs) {

     key_ = "nndeploy::qwen::QwenDecode";

     desc_ =

         "LLM decode pipeline: token IDs + KV cache -> embeddings -> inference "

         "-> sampled tokens -> decoded text.";

     this->setInputTypeInfo<tokenizer::TokenizerIds>();

     this->setInputTypeInfo<device::Tensor>();

     this->setInputTypeInfo<tokenizer::TokenizerIds>();

     this->setOutputTypeInfo<tokenizer::TokenizerText>();


     decode_embedding_node_ = dynamic_cast<DecodeEmbeddingNode*>(

         this->createNode<DecodeEmbeddingNode>("embedding_node"));

     decode_infer_node_ = dynamic_cast<infer::Infer*>(

         this->createNode<infer::Infer>("decode_infer"));

     decode_sample_node_ = dynamic_cast<DecodeSampleNode*>(

         this->createNode<DecodeSampleNode>("sample_node"));

     decode_node_ = dynamic_cast<tokenizer::TokenizerDecodeCpp*>(

         this->createNode<tokenizer::TokenizerDecodeCpp>("decode_node"));

   }


   virtual base::Status init();

   virtual base::Status run();

   virtual base::Status deinit();

   virtual base::Status defaultParam();

   base::Status setInferenceType(base::InferenceType inference_type);


   base::Status setInferParams(bool is_path, base::ModelType model_type,

                               base::DeviceType device_type);

   base::Status setConfigParam();


   void setConfigPath(std::string config_path) { config_path_ = config_path; }


   virtual base::Status serialize(rapidjson::Value& json,

                                  rapidjson::Document::AllocatorType& allocator);

   virtual base::Status deserialize(rapidjson::Value& json);


  protected:

   void getStopTokens(std::string& token_file);

   int loops() { return max_seq_len_; }

   inline bool isStop() {

     tokenizer::TokenizerIds* token_ids;

     if (is_first_) {

       token_ids =

           (tokenizer::TokenizerIds*)(decode_embedding_node_->getInput(0)

                                          ->getParam(decode_embedding_node_));

     } else {

       token_ids =

           (tokenizer::TokenizerIds*)(decode_sample_node_->getOutput(0)

                                          ->getParam(decode_sample_node_));

     }


     int token = token_ids->ids_[0][0];

     return std::find(stop_tokens_.begin(), stop_tokens_.end(), token) !=

            stop_tokens_.end();

   }


  public:

   dag::Node* decode_embedding_node_;

   infer::Infer* decode_infer_node_;

   dag::Node* decode_sample_node_;

   dag::Node* decode_node_;


   int all_seq_len_;

   int max_seq_len_;

   bool is_first_ = true;


   std::vector<int> stop_tokens_;

   std::vector<int> special_tokens_;


   tokenizer::TokenizerIds history_ids_;


   std::string result_;

   std::string config_path_;

 };


 extern NNDEPLOY_CC_API dag::Graph* createQwenGraph(

     const std::string& name, base::InferenceType inference_type,

     base::DeviceType device_type, dag::Edge* input, dag::Edge* output,

     base::ModelType model_type, bool is_path,

     std::vector<std::string> model_value);


 }  // namespace qwen

 }  // namespace nndeploy


 #endif

any.h

buffer.h

nndeploy::base::Param
Definition: param.h:37

nndeploy::base::Status
Definition: status.h:87

nndeploy::dag::CompositeNode
Composite node Composite node is a special type of node in nndeploy that enhances the capabilities of...
Definition: composite_node.h:18

nndeploy::dag::Edge
Edge class in DAG graph for connecting nodes and transferring data.
Definition: edge.h:35

nndeploy::dag::Graph
Directed Acyclic Graph Node.
Definition: graph.h:31

nndeploy::dag::Node
Node base class.
Definition: node.h:171

nndeploy::device::Tensor
Tensor类
Definition: tensor.h:26

nndeploy::infer::Infer
Definition: infer.h:12

nndeploy::qwen::DecodeEmbeddingNode
Definition: qwen.h:171

nndeploy::qwen::DecodeEmbeddingNode::genPositionIds
device::Tensor * genPositionIds(int seq_len, int all_seq_len, base::DataType data_type, base::DataFormat data_format)

nndeploy::qwen::DecodeEmbeddingNode::genAttentionMask
device::Tensor * genAttentionMask(int seq_len, int all_seq_len, base::DataType data_type, base::DataFormat data_format)

nndeploy::qwen::DecodeEmbeddingNode::~DecodeEmbeddingNode
virtual ~DecodeEmbeddingNode()
Definition: qwen.h:202

nndeploy::qwen::DecodeEmbeddingNode::past_kv_
device::Tensor * past_kv_
Definition: qwen.h:223

nndeploy::qwen::DecodeEmbeddingNode::DecodeEmbeddingNode
DecodeEmbeddingNode(const std::string &name, std::vector< dag::Edge * > &inputs, std::vector< dag::Edge * > &outputs)
Definition: qwen.h:173

nndeploy::qwen::DecodeEmbeddingNode::run
virtual base::Status run()
Run node (pure virtual function)

nndeploy::qwen::DecodeEmbeddingNode::genEmbedding
device::Tensor * genEmbedding(const std::vector< int32_t > &input_ids, int seq_len, int hidden_size, base::DataType data_type, base::DataFormat data_format, std::string &embedding_file)

nndeploy::qwen::DecodeEmbeddingNode::is_first_
bool is_first_
Definition: qwen.h:222

nndeploy::qwen::DecodeEmbeddingParam
Definition: qwen.h:139

nndeploy::qwen::DecodeEmbeddingParam::token_ids_
std::vector< std::vector< int32_t > > token_ids_
Definition: qwen.h:155

nndeploy::qwen::DecodeEmbeddingParam::serialize
base::Status serialize(rapidjson::Value &json, rapidjson::Document::AllocatorType &allocator)

nndeploy::qwen::DecodeEmbeddingParam::hidden_size_
int hidden_size_
Definition: qwen.h:144

nndeploy::qwen::DecodeEmbeddingParam::past_kv_
device::Tensor * past_kv_
Definition: qwen.h:157

nndeploy::qwen::DecodeEmbeddingParam::embedding_file_
std::string embedding_file_
Definition: qwen.h:147

nndeploy::qwen::DecodeEmbeddingParam::history_ids_
tokenizer::TokenizerIds history_ids_
Definition: qwen.h:156

nndeploy::qwen::DecodeEmbeddingParam::deserialize
base::Status deserialize(rapidjson::Value &json)

nndeploy::qwen::DecodeSampleNode
Definition: qwen.h:247

nndeploy::qwen::DecodeSampleNode::is_first_
bool is_first_
Definition: qwen.h:265

nndeploy::qwen::DecodeSampleNode::run
virtual base::Status run()
Run node (pure virtual function)

nndeploy::qwen::DecodeSampleNode::~DecodeSampleNode
virtual ~DecodeSampleNode()
Definition: qwen.h:258

nndeploy::qwen::DecodeSampleNode::sample
int32_t sample(device::Tensor *logits, const std::vector< int > &pre_ids)

nndeploy::qwen::DecodeSampleNode::history_ids_
std::vector< int32_t > history_ids_
Definition: qwen.h:266

nndeploy::qwen::DecodeSampleNode::DecodeSampleNode
DecodeSampleNode(const std::string &name, std::vector< dag::Edge * > inputs, std::vector< dag::Edge * > outputs)
Definition: qwen.h:249

nndeploy::qwen::DecodeSampleParam
Definition: qwen.h:165

nndeploy::qwen::DecodeSampleParam::stop_tokens_
tokenizer::TokenizerIds stop_tokens_
Definition: qwen.h:168

nndeploy::qwen::DecodeSampleParam::history_ids_
tokenizer::TokenizerIds history_ids_
Definition: qwen.h:167

nndeploy::qwen::PrefillEmbeddingNode
Definition: qwen.h:88

nndeploy::qwen::PrefillEmbeddingNode::genPastKeyValue
device::Tensor * genPastKeyValue(const std::vector< int32_t > &kv_init_shape)

nndeploy::qwen::PrefillEmbeddingNode::genEmbedding
device::Tensor * genEmbedding(const std::vector< int32_t > &input_ids, int seq_len, int hidden_size, base::DataType data_type, base::DataFormat data_format, std::string &embedding_file)

nndeploy::qwen::PrefillEmbeddingNode::genPositionIds
device::Tensor * genPositionIds(int seq_len, int all_seq_len, base::DataType data_type, base::DataFormat data_format)

nndeploy::qwen::PrefillEmbeddingNode::is_first_
bool is_first_
Definition: qwen.h:135

nndeploy::qwen::PrefillEmbeddingNode::PrefillEmbeddingNode
PrefillEmbeddingNode(const std::string &name, std::vector< dag::Edge * > &inputs, std::vector< dag::Edge * > &outputs)
Definition: qwen.h:90

nndeploy::qwen::PrefillEmbeddingNode::run
virtual base::Status run()
Run node (pure virtual function)

nndeploy::qwen::PrefillEmbeddingNode::genAttentionMask
device::Tensor * genAttentionMask(int seq_len, int all_seq_len, base::DataType data_type, base::DataFormat data_format)

nndeploy::qwen::PrefillEmbeddingNode::~PrefillEmbeddingNode
virtual ~PrefillEmbeddingNode()
Definition: qwen.h:115

nndeploy::qwen::PrefillEmbeddingParam
Definition: qwen.h:64

nndeploy::qwen::PrefillEmbeddingParam::hidden_size_
int hidden_size_
Need to serialize.
Definition: qwen.h:69

nndeploy::qwen::PrefillEmbeddingParam::kv_init_shape_
std::vector< int32_t > kv_init_shape_
Definition: qwen.h:77

nndeploy::qwen::PrefillEmbeddingParam::deserialize
base::Status deserialize(rapidjson::Value &json)

nndeploy::qwen::PrefillEmbeddingParam::embedding_file_
std::string embedding_file_
Definition: qwen.h:72

nndeploy::qwen::PrefillEmbeddingParam::serialize
base::Status serialize(rapidjson::Value &json, rapidjson::Document::AllocatorType &allocator)

nndeploy::qwen::PrefillSampleNode
Definition: qwen.h:226

nndeploy::qwen::PrefillSampleNode::PrefillSampleNode
PrefillSampleNode(const std::string &name, std::vector< dag::Edge * > inputs, std::vector< dag::Edge * > outputs)
Definition: qwen.h:228

nndeploy::qwen::PrefillSampleNode::is_first_
bool is_first_
Definition: qwen.h:244

nndeploy::qwen::PrefillSampleNode::run
virtual base::Status run()
Run node (pure virtual function)

nndeploy::qwen::PrefillSampleNode::sample
int32_t sample(device::Tensor *logits, const std::vector< int > &pre_ids)

nndeploy::qwen::PrefillSampleNode::~PrefillSampleNode
virtual ~PrefillSampleNode()
Definition: qwen.h:237

nndeploy::qwen::PrintNode
Definition: qwen.h:314

nndeploy::qwen::PrintNode::run
virtual base::Status run()
Run node (pure virtual function)

nndeploy::qwen::PrintNode::serialize
virtual base::Status serialize(rapidjson::Value &json, rapidjson::Document::AllocatorType &allocator)
Serialize to JSON.

nndeploy::qwen::PrintNode::~PrintNode
virtual ~PrintNode()
Definition: qwen.h:325

nndeploy::qwen::PrintNode::deserialize
virtual base::Status deserialize(rapidjson::Value &json)
Deserialize from JSON.

nndeploy::qwen::PrintNode::set_path
void set_path(std::string path)
Definition: qwen.h:332

nndeploy::qwen::PrintNode::PrintNode
PrintNode(const std::string &name, std::vector< dag::Edge * > inputs, std::vector< dag::Edge * > outputs)
Definition: qwen.h:316

nndeploy::qwen::PromptNode
Definition: qwen.h:269

nndeploy::qwen::PromptNode::updateInput
virtual base::EdgeUpdateFlag updateInput()
Update input.
Definition: qwen.h:285

nndeploy::qwen::PromptNode::applyTemplate
std::string applyTemplate(std::string prompt_template, const std::string &content, const std::string &role="")

nndeploy::qwen::PromptNode::setSize
void setSize(int size)
Definition: qwen.h:297

nndeploy::qwen::PromptNode::getSize
int getSize()
Definition: qwen.h:302

nndeploy::qwen::PromptNode::~PromptNode
virtual ~PromptNode()
Definition: qwen.h:282

nndeploy::qwen::PromptNode::run
virtual base::Status run()
Run node (pure virtual function)

nndeploy::qwen::PromptNode::PromptNode
PromptNode(const std::string &name, std::vector< dag::Edge * > inputs, std::vector< dag::Edge * > outputs)
Definition: qwen.h:271

nndeploy::qwen::PromptParam
Definition: qwen.h:52

nndeploy::qwen::PromptParam::serialize
base::Status serialize(rapidjson::Value &json, rapidjson::Document::AllocatorType &allocator)

nndeploy::qwen::PromptParam::deserialize
base::Status deserialize(rapidjson::Value &json)

nndeploy::qwen::PromptParam::user_content_
std::string user_content_
Definition: qwen.h:56

nndeploy::qwen::QwenDecode
Definition: qwen.h:387

nndeploy::qwen::QwenDecode::setInferenceType
base::Status setInferenceType(base::InferenceType inference_type)

nndeploy::qwen::QwenDecode::deinit
virtual base::Status deinit()
Deinitialize node.

nndeploy::qwen::QwenDecode::init
virtual base::Status init()
Initialize node.

nndeploy::qwen::QwenDecode::setInferParams
base::Status setInferParams(bool is_path, base::ModelType model_type, base::DeviceType device_type)

nndeploy::qwen::QwenDecode::QwenDecode
QwenDecode(const std::string &name, std::vector< dag::Edge * > inputs, std::vector< dag::Edge * > outputs)
Definition: qwen.h:389

nndeploy::qwen::QwenDecode::run
virtual base::Status run()
Run node (pure virtual function)

nndeploy::qwen::QwenDecode::max_seq_len_
int max_seq_len_
Definition: qwen.h:454

nndeploy::qwen::QwenDecode::stop_tokens_
std::vector< int > stop_tokens_
Definition: qwen.h:457

nndeploy::qwen::QwenDecode::config_path_
std::string config_path_
Definition: qwen.h:463

nndeploy::qwen::QwenDecode::setConfigPath
void setConfigPath(std::string config_path)
Definition: qwen.h:421

nndeploy::qwen::QwenDecode::decode_sample_node_
dag::Node * decode_sample_node_
Definition: qwen.h:450

nndeploy::qwen::QwenDecode::decode_node_
dag::Node * decode_node_
Definition: qwen.h:451

nndeploy::qwen::QwenDecode::all_seq_len_
int all_seq_len_
Definition: qwen.h:453

nndeploy::qwen::QwenDecode::history_ids_
tokenizer::TokenizerIds history_ids_
Definition: qwen.h:460

nndeploy::qwen::QwenDecode::getStopTokens
void getStopTokens(std::string &token_file)

nndeploy::qwen::QwenDecode::result_
std::string result_
Definition: qwen.h:462

nndeploy::qwen::QwenDecode::isStop
bool isStop()
Definition: qwen.h:430

nndeploy::qwen::QwenDecode::decode_embedding_node_
dag::Node * decode_embedding_node_
Definition: qwen.h:448

nndeploy::qwen::QwenDecode::defaultParam
virtual base::Status defaultParam()
Configure default parameters.

nndeploy::qwen::QwenDecode::decode_infer_node_
infer::Infer * decode_infer_node_
Definition: qwen.h:449

nndeploy::qwen::QwenDecode::deserialize
virtual base::Status deserialize(rapidjson::Value &json)
Deserialize from JSON.

nndeploy::qwen::QwenDecode::serialize
virtual base::Status serialize(rapidjson::Value &json, rapidjson::Document::AllocatorType &allocator)
Serialize to JSON.

nndeploy::qwen::QwenDecode::special_tokens_
std::vector< int > special_tokens_
Definition: qwen.h:458

nndeploy::qwen::QwenDecode::loops
int loops()
Definition: qwen.h:429

nndeploy::qwen::QwenDecode::setConfigParam
base::Status setConfigParam()

nndeploy::qwen::QwenPrefill
Definition: qwen.h:338

nndeploy::qwen::QwenPrefill::setInferenceType
base::Status setInferenceType(base::InferenceType inference_type)

nndeploy::qwen::QwenPrefill::serialize
virtual base::Status serialize(rapidjson::Value &json, rapidjson::Document::AllocatorType &allocator)
Serialize to JSON.

nndeploy::qwen::QwenPrefill::setConfigParam
base::Status setConfigParam()

nndeploy::qwen::QwenPrefill::defaultParam
virtual base::Status defaultParam()
Configure default parameters.

nndeploy::qwen::QwenPrefill::setConfigPath
void setConfigPath(std::string config_path)
Definition: qwen.h:367

nndeploy::qwen::QwenPrefill::QwenPrefill
QwenPrefill(const std::string &name, std::vector< dag::Edge * > inputs, std::vector< dag::Edge * > outputs)
Definition: qwen.h:340

nndeploy::qwen::QwenPrefill::deserialize
virtual base::Status deserialize(rapidjson::Value &json)
Deserialize from JSON.

nndeploy::qwen::QwenPrefill::deinit
virtual base::Status deinit()
Deinitialize node.

nndeploy::qwen::QwenPrefill::init
virtual base::Status init()
Initialize node.

nndeploy::qwen::QwenPrefill::setInferParams
base::Status setInferParams(bool is_path, base::ModelType model_type, base::DeviceType device_type)

nndeploy::qwen::QwenPrefill::run
virtual base::Status run()
Run node (pure virtual function)

nndeploy::tokenizer::TokenizerIds
Definition: tokenizer.h:239

nndeploy::tokenizer::TokenizerIds::ids_
std::vector< std::vector< int32_t > > ids_
Definition: tokenizer.h:241

common.h

composite_node.h

device.h

edge.h

glic_stl_include.h

graph.h

infer.h

log.h

loop.h

macro.h

NNDEPLOY_CC_API
#define NNDEPLOY_CC_API
api
Definition: macro.h:29

memory_pool.h

nndeploy::base::InferenceType
InferenceType
Definition: common.h:284

nndeploy::base::ModelType
ModelType
Definition: common.h:239

nndeploy::base::dataTypeOf< float >
DataType dataTypeOf< float >()

nndeploy::base::EdgeUpdateFlag
EdgeUpdateFlag
Definition: common.h:365

nndeploy::base::kEdgeUpdateFlagComplete
@ kEdgeUpdateFlagComplete
Definition: common.h:366

nndeploy::base::kEdgeUpdateFlagTerminate
@ kEdgeUpdateFlagTerminate
Definition: common.h:367

nndeploy::base::DataFormat
DataFormat
Definition: common.h:130

nndeploy::base::kDataFormatS1D
@ kDataFormatS1D
Definition: common.h:143

nndeploy::dag::IOType::kIOTypeString
@ kIOTypeString

nndeploy::dag::IOType::kIOTypeText
@ kIOTypeText

nndeploy::dag::NodeType::kNodeTypeOutput
@ kNodeTypeOutput

nndeploy::dag::NodeType::kNodeTypeInput
@ kNodeTypeInput

nndeploy::qwen::createQwenGraph
dag::Graph * createQwenGraph(const std::string &name, base::InferenceType inference_type, base::DeviceType device_type, dag::Edge *input, dag::Edge *output, base::ModelType model_type, bool is_path, std::vector< std::string > model_value)

nndeploy::qwen::parseConfig
QwenConfig parseConfig(const std::string &file_path)

nndeploy
Definition: common.h:10

node.h

object.h

opencv_include.h

param.h

status.h

string.h

nndeploy::base::DataType
Definition: common.h:24

nndeploy::base::DeviceType
Definition: common.h:109

nndeploy::qwen::QwenConfig
Definition: qwen.h:31

nndeploy::qwen::QwenConfig::layer_nums_
int layer_nums_
Definition: qwen.h:32

nndeploy::qwen::QwenConfig::embedding_file_
std::string embedding_file_
Definition: qwen.h:36

nndeploy::qwen::QwenConfig::prompt_
std::string prompt_
Definition: qwen.h:39

nndeploy::qwen::QwenConfig::max_seq_len_
int max_seq_len_
Definition: qwen.h:34

nndeploy::qwen::QwenConfig::model_value_
std::string model_value_
Definition: qwen.h:35

nndeploy::qwen::QwenConfig::prompt_template_
std::string prompt_template_
Definition: qwen.h:38

nndeploy::qwen::QwenConfig::tokenizer_json_
std::string tokenizer_json_
Definition: qwen.h:37

nndeploy::qwen::QwenConfig::kv_init_shape_
std::vector< int32_t > kv_init_shape_
Definition: qwen.h:40

nndeploy::qwen::QwenConfig::hidden_size_
int hidden_size_
Definition: qwen.h:33

tensor.h

tokenizer.h