zh-cn/latest/net_8h_source.html

 #ifndef _NNDEPLOY_NET_NET_H_

 #define _NNDEPLOY_NET_NET_H_


 #include "nndeploy/ir/interpret.h"

 #include "nndeploy/ir/ir.h"

 #include "nndeploy/net/optimizer.h"

 #include "nndeploy/net/runtime.h"

 #include "nndeploy/net/util.h"

 #include "nndeploy/op/op.h"


 namespace nndeploy {

 namespace net {


 class NNDEPLOY_CC_API Net : public op::Op {

  public:

   Net();

   virtual ~Net();


   // 在这个函数之前调用setDeviceType

   base::Status setInterpret(ir::Interpret *interpret);

   base::Status setModelDesc(ir::ModelDesc *model_desc);

   base::Status setDynamicShape(bool is_dynamic_shape, base::ShapeMap &min_shape,

                                base::ShapeMap &opt_shape,

                                base::ShapeMap &max_shape);

   base::Status setTensorPoolType(TensorPoolType tensor_pool_type);

   base::Status setTensorPoolMemory(bool is_external);


   TensorWrapper *createTensor(const std::string &name, bool is_weight = false);

   TensorWrapper *addTensor(device::Tensor *tensor, bool is_external = true,

                            bool is_weight = false);

   device::Tensor *getTensor(const std::string &name);


   bool isWeight(const std::string &name);

   // 有转移所有权属性

   device::Tensor *getWeight(const std::string &weight);


   op::Op *createOp(base::DeviceType device_type, const std::string &name,

                    ir::OpType op_type,

                    std::initializer_list<std::string> inputs,

                    std::initializer_list<std::string> outputs);

   op::Op *createOp(base::DeviceType device_type, const std::string &name,

                    ir::OpType op_type, std::vector<std::string> &inputs,

                    std::vector<std::string> &outputs);

   base::Status addNet(Net *net, bool is_external);


   base::Status setOpParam(const std::string &op_name,

                           std::shared_ptr<base::Param> param);

   std::shared_ptr<base::Param> getOpParam(const std::string &op_name);


   virtual base::Status init();

   virtual base::Status deinit();


   virtual int64_t getMemorySize();

   virtual base::Status setMemory(device::Buffer *buffer);


   virtual base::Status inferDataType();

   virtual base::Status inferShape();

   virtual base::Status inferDataFormat();


   bool isDynamicShape();

   virtual base::Status reshape(base::ShapeMap &shape_map);


   virtual base::Status preRun();

   virtual uint64_t getFlops();


   virtual base::Status run();

   virtual base::Status postRun();


   base::Status dump(std::ostream &oss);


   base::Status enableOpt(bool flag);


   base::Status setEnablePass(std::set<OptPassType>);


   base::Status setDisablePass(std::set<OptPassType>);


   base::Status setWorkers(int worker_num,

                           std::vector<base::DeviceType> device_types =

                               std::vector<base::DeviceType>());


   base::Status copyToInputTensor(device::Tensor *tensor);


   device::Tensor *getOutputTensorAfterRun(const std::string &name,

                                           base::DeviceType device_type,

                                           bool is_copy,

                                           base::DataFormat data_format);


  protected:

   virtual base::Status construct();

   // NNDEPLOY_LOGI("1. Optimizer Graph V1!\n");

   base::Status optimizer();

   // NNDEPLOY_LOGI("##############\n");

   // NNDEPLOY_LOGI("runtime init\n");

   // NNDEPLOY_LOGI("#. Optimizer Graph V2!\n");

   // NNDEPLOY_LOGI("#. Memory Allocation Phase!\n");

   // NNDEPLOY_LOGI("#. Cost Calculations!\n");

   // NNDEPLOY_LOGI("##############\n");

   virtual base::Status runtime();


  protected:

   ir::ModelDesc *model_desc_;


   std::vector<TensorWrapper *> tensor_repository_;

   std::vector<OpWrapper *> op_repository_;


   bool is_dynamic_shape_ = false;                // 是否是动态shape

   base::ShapeMap min_shape_ = base::ShapeMap();  // 当为动态输入时最小shape

   base::ShapeMap opt_shape_ = base::ShapeMap();  // 当为动态输入时最优shape

   base::ShapeMap max_shape_ = base::ShapeMap();  // 当为动态输入时最大shape

   TensorPoolType tensor_pool_type_ =

       kTensorPool1DSharedObjectTypeGreedyBySizeImprove;

   bool tensor_pool_memory_is_external_ = false;

   Runtime *runtime_ = nullptr;


   bool net_opt_flag_ = true;           // 默认开启图优化

   std::set<OptPassType> enable_pass_;  // 仅使用这些pass，如果为空则启用全部pass

   // 禁用这些pass，如果为空则启用全部pass;

   // 如果同时设置了enable_pass_，则只有enable_pass_生效

   std::set<OptPassType> disable_pass_;


   // 推理并行数量

   int worker_num_ = 1;

   // 推理设备类型

   std::vector<base::DeviceType> device_types_;

 };


 Net *createNet(ir::ModelDesc *model_desc, base::DeviceType device_type,

                base::PrecisionType precision_type);


 }  // namespace net

 }  // namespace nndeploy


 #endif

nndeploy::base::Status
Definition: status.h:87

nndeploy::device::Buffer
Definition: buffer.h:21

nndeploy::device::Tensor
Tensor类
Definition: tensor.h:26

nndeploy::ir::Interpret
Definition: interpret.h:10

nndeploy::ir::ModelDesc
参照onnx的格式，描述模型的结构
Definition: ir.h:109

nndeploy::net::Net
Definition: net.h:15

nndeploy::net::Net::inferShape
virtual base::Status inferShape()
形状推理

nndeploy::net::Net::createTensor
TensorWrapper * createTensor(const std::string &name, bool is_weight=false)

nndeploy::net::Net::copyToInputTensor
base::Status copyToInputTensor(device::Tensor *tensor)
将输入tensor复制到输入tensor

nndeploy::net::Net::disable_pass_
std::set< OptPassType > disable_pass_
Definition: net.h:162

nndeploy::net::Net::getMemorySize
virtual int64_t getMemorySize()
获取推理所需的内存大小

nndeploy::net::Net::Net
Net()

nndeploy::net::Net::device_types_
std::vector< base::DeviceType > device_types_
Definition: net.h:167

nndeploy::net::Net::getWeight
device::Tensor * getWeight(const std::string &weight)

nndeploy::net::Net::isWeight
bool isWeight(const std::string &name)

nndeploy::net::Net::createOp
op::Op * createOp(base::DeviceType device_type, const std::string &name, ir::OpType op_type, std::initializer_list< std::string > inputs, std::initializer_list< std::string > outputs)

nndeploy::net::Net::setWorkers
base::Status setWorkers(int worker_num, std::vector< base::DeviceType > device_types=std::vector< base::DeviceType >())
设置推理并行数量

nndeploy::net::Net::reshape
virtual base::Status reshape(base::ShapeMap &shape_map)
重新推理形状，通常在初始化之后、preRun前调用

nndeploy::net::Net::getFlops
virtual uint64_t getFlops()
得到op的flops

nndeploy::net::Net::getTensor
device::Tensor * getTensor(const std::string &name)

nndeploy::net::Net::inferDataFormat
virtual base::Status inferDataFormat()
数据格式推理

nndeploy::net::Net::setTensorPoolType
base::Status setTensorPoolType(TensorPoolType tensor_pool_type)

nndeploy::net::Net::createOp
op::Op * createOp(base::DeviceType device_type, const std::string &name, ir::OpType op_type, std::vector< std::string > &inputs, std::vector< std::string > &outputs)

nndeploy::net::Net::isDynamicShape
bool isDynamicShape()

nndeploy::net::Net::setDynamicShape
base::Status setDynamicShape(bool is_dynamic_shape, base::ShapeMap &min_shape, base::ShapeMap &opt_shape, base::ShapeMap &max_shape)

nndeploy::net::Net::model_desc_
ir::ModelDesc * model_desc_
Definition: net.h:144

nndeploy::net::Net::preRun
virtual base::Status preRun()

nndeploy::net::Net::setInterpret
base::Status setInterpret(ir::Interpret *interpret)

nndeploy::net::Net::setModelDesc
base::Status setModelDesc(ir::ModelDesc *model_desc)

nndeploy::net::Net::getOpParam
std::shared_ptr< base::Param > getOpParam(const std::string &op_name)

nndeploy::net::Net::addTensor
TensorWrapper * addTensor(device::Tensor *tensor, bool is_external=true, bool is_weight=false)

nndeploy::net::Net::runtime
virtual base::Status runtime()

nndeploy::net::Net::addNet
base::Status addNet(Net *net, bool is_external)

nndeploy::net::Net::setOpParam
base::Status setOpParam(const std::string &op_name, std::shared_ptr< base::Param > param)

nndeploy::net::Net::deinit
virtual base::Status deinit()

nndeploy::net::Net::init
virtual base::Status init()
初始化

nndeploy::net::Net::postRun
virtual base::Status postRun()

nndeploy::net::Net::setEnablePass
base::Status setEnablePass(std::set< OptPassType >)
在图优化时仅启用这些pass，如果为空则启用全部pass

nndeploy::net::Net::op_repository_
std::vector< OpWrapper * > op_repository_
Definition: net.h:147

nndeploy::net::Net::~Net
virtual ~Net()

nndeploy::net::Net::optimizer
base::Status optimizer()

nndeploy::net::Net::setTensorPoolMemory
base::Status setTensorPoolMemory(bool is_external)

nndeploy::net::Net::tensor_repository_
std::vector< TensorWrapper * > tensor_repository_
Definition: net.h:146

nndeploy::net::Net::setMemory
virtual base::Status setMemory(device::Buffer *buffer)
设置推理所需的内存（推理内存由外部分配）

nndeploy::net::Net::construct
virtual base::Status construct()

nndeploy::net::Net::setDisablePass
base::Status setDisablePass(std::set< OptPassType >)
在图优化时禁用这些pass，如果为空则启用全部pass

nndeploy::net::Net::run
virtual base::Status run()

nndeploy::net::Net::enable_pass_
std::set< OptPassType > enable_pass_
Definition: net.h:159

nndeploy::net::Net::inferDataType
virtual base::Status inferDataType()
类型推理

nndeploy::net::Net::enableOpt
base::Status enableOpt(bool flag)
设置开启图优化的开关 flag: true 启用图优化 false：关闭图优化

nndeploy::net::Net::getOutputTensorAfterRun
device::Tensor * getOutputTensorAfterRun(const std::string &name, base::DeviceType device_type, bool is_copy, base::DataFormat data_format)
获取推理后的输出tensor

nndeploy::net::Net::dump
base::Status dump(std::ostream &oss)

nndeploy::net::Runtime
Definition: runtime.h:63

nndeploy::net::TensorWrapper
Definition: util.h:35

nndeploy::op::Op
Op的基类
Definition: op.h:42

util.h

interpret.h

ir.h

NNDEPLOY_CC_API
#define NNDEPLOY_CC_API
api
Definition: macro.h:29

nndeploy::base::PrecisionType
PrecisionType
Definition: common.h:167

nndeploy::base::ShapeMap
std::map< std::string, std::vector< int > > ShapeMap
Definition: common.h:381

nndeploy::base::DataFormat
DataFormat
Definition: common.h:130

nndeploy::ir::OpType
OpType
算子类型 算子分类
Definition: op_param.h:65

nndeploy::net::TensorPoolType
TensorPoolType
Definition: tensor_pool.h:28

nndeploy::net::kTensorPool1DSharedObjectTypeGreedyBySizeImprove
@ kTensorPool1DSharedObjectTypeGreedyBySizeImprove
Definition: tensor_pool.h:31

nndeploy::net::createNet
Net * createNet(ir::ModelDesc *model_desc, base::DeviceType device_type, base::PrecisionType precision_type)

nndeploy
Definition: common.h:10

op.h

optimizer.h

runtime.h

nndeploy::base::DeviceType
Definition: common.h:109