d8/d6a/tinymaix_8h_source.html

/* Copyright 2022 Sipeed Technology Co., Ltd. All Rights Reserved.

Licensed under the Apache License, Version 2.0 (the "License");

you may not use this file except in compliance with the License.

You may obtain a copy of the License at

    http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software

distributed under the License is distributed on an "AS IS" BASIS,

WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

See the License for the specific language governing permissions and

limitations under the License.

==============================================================================*/


#ifndef __TINYMAIX_H

#define __TINYMAIX_H


#include <stdint.h>


#include <stdlib.h>

#include <string.h>


#define TM_MDL_INT8 0

#define TM_MDL_INT16 1

#define TM_MDL_FP32 2

#define TM_MDL_FP16 3

#define TM_MDL_FP8_143 4//experimental

#define TM_MDL_FP8_152 5//experimental

#include "tm_port.h"


#define TM_MDL_MAGIC 0x5849414d//mdl magic sign

#define TM_ALIGN_SIZE (8)      //8 byte align

#define TM_ALIGN(addr) ((((size_t) (addr)) + (TM_ALIGN_SIZE - 1)) / TM_ALIGN_SIZE * TM_ALIGN_SIZE)

#define TM_MATP(mat, y, x, ch) ((mat)->data + ((y) * (mat)->w + (x)) * (mat)->c + (ch))

//HWC

#if TM_MDL_TYPE == TM_MDL_INT8

typedef int8_t mtype_t;   //mat data type

typedef int8_t wtype_t;   //weight data type

typedef int32_t btype_t;  //bias data type

typedef int32_t sumtype_t;//sum data type

typedef int32_t zptype_t; //zeropoint data type

#define UINT2INT_SHIFT (0)

#elif TM_MDL_TYPE == TM_MDL_INT16

typedef int16_t mtype_t;  //mat data type

typedef int16_t wtype_t;  //weight data type

typedef int32_t btype_t;  //bias data type

typedef int32_t sumtype_t;//sum data type

typedef int32_t zptype_t; //zeropoint data type

#define UINT2INT_SHIFT (8)

#elif TM_MDL_TYPE == TM_MDL_FP32

typedef float mtype_t;  //mat data type

typedef float wtype_t;  //weight data type

typedef float btype_t;  //bias data type

typedef float sumtype_t;//sum data type

typedef float zptype_t; //zeropoint data type

#elif TM_MDL_TYPE == TM_MDL_FP16

#if TM_ARCH != TM_ARCH_RV64V

#error "only support RV64V's float16!"

#endif

#include <riscv_vector.h>

typedef float16_t mtype_t;  //mat data type

typedef float16_t wtype_t;  //weight data type

typedef float16_t btype_t;  //bias data type

typedef float16_t sumtype_t;//sum data type

typedef float16_t zptype_t; //zeropoint data type

#elif (TM_MDL_TYPE == TM_MDL_FP8_143) || (TM_MDL_TYPE == TM_MDL_FP8_152)

#if TM_ARCH != TM_ARCH_CPU

#error "only support CPU simulation now!"

#endif

typedef uint8_t mtype_t;//mat data type

typedef uint8_t wtype_t;//weight data type

typedef uint8_t btype_t;//bias data type

typedef float sumtype_t;//sum data type

typedef float zptype_t; //zeropoint data type

#else

#error "Not support this MDL_TYPE!"

#endif


#if TM_MDL_TYPE == TM_MDL_FP8_143

#define TM_FP8_SCNT (1)

#define TM_FP8_ECNT (4)

#define TM_FP8_MCNT (3)

#define TM_FP8_BIAS (9)

#elif TM_MDL_TYPE == TM_MDL_FP8_152

#define TM_FP8_SCNT (1)

#define TM_FP8_ECNT (5)

#define TM_FP8_MCNT (2)

#define TM_FP8_BIAS (15)

#endif


typedef float sctype_t;

#define TM_FASTSCALE_SHIFT (8)


typedef enum {

    TM_OK = 0,

    TM_ERR = 1,

    TM_ERR_MAGIC = 2,

    TM_ERR_UNSUPPORT = 3,

    TM_ERR_OOM = 4,

    TM_ERR_LAYERTYPE = 5,

    TM_ERR_DIMS = 6,

    TM_ERR_TODO = 7,

    TM_ERR_MDLTYPE = 8,

    TM_ERR_KSIZE = 9,

} tm_err_t;


typedef enum {

    TML_CONV2D = 0,

    TML_GAP = 1,

    TML_FC = 2,

    TML_SOFTMAX = 3,

    TML_RESHAPE = 4,

    TML_DWCONV2D = 5,

    TML_ADD = 6,

    TML_MAXCNT,

} tm_layer_type_t;


typedef enum {

    TM_PAD_VALID = 0,

    TM_PAD_SAME = 1,

} tm_pad_type_t;


typedef enum {

    TM_ACT_NONE = 0,

    TM_ACT_RELU = 1,

    TM_ACT_RELU1 = 2,

    TM_ACT_RELU6 = 3,

    TM_ACT_TANH = 4,

    TM_ACT_SIGNBIT = 5,

    TM_ACT_MAXCNT,

} tm_act_type_t;


typedef enum {

    TMPP_NONE = 0,

    TMPP_FP2INT = 1,    //user own fp buf -> int input buf

    TMPP_UINT2INT = 2,  //int8: cvt in place; int16: can't cvt in place

    TMPP_UINT2FP01 = 3, // u8/255.0

    TMPP_UINT2FPN11 = 4,// (u8-128)/128

    TMPP_UINT2DTYPE = 5,//uint8 to fp16,fp8

    TMPP_MAXCNT,

} tm_pp_t;


//mdlbin in flash


typedef struct {

    uint32_t magic;     //"MAIX"

    uint8_t mdl_type;   //0 int8, 1 int16, 2 fp32,

    uint8_t out_deq;    //0 don't dequant out; 1 dequant out

    uint16_t input_cnt; //only support 1 yet

    uint16_t output_cnt;//only support 1 yet

    uint16_t layer_cnt;

    uint32_t buf_size;  //main buf size for middle result = pingpong+keep

    uint32_t sub_size;  //pingpong buf size;

    uint16_t in_dims[4];//0:dims; 1:dim0; 2:dim1; 3:dim2

    uint16_t out_dims[4];

    uint8_t reserve[28];   //reserve for future

    uint8_t layers_body[0];//oft 64 here

} tm_mdlbin_t;


//mdl meta data in ram


typedef struct {

    tm_mdlbin_t *b;     //bin

    void *cb;           //Layer callback

    uint8_t *buf;       //main buf addr

    uint8_t *subbuf;    //sub buf addr

    uint16_t main_alloc;//is main buf alloc or static

    uint16_t layer_i;   //current layer index

    uint8_t *layer_body;//current layer body addr

} tm_mdl_t;


//dims==3, hwc

//dims==2, 1wc

//dims==1, 11c


typedef struct {

    uint16_t dims;

    uint16_t h;

    uint16_t w;

    uint16_t c;

    union {

        mtype_t *data;

        float *dataf;

    };

} tm_mat_t;


typedef struct {        //48byte

    uint16_t type;      //layer type

    uint16_t is_out;    //is output

    uint32_t size;      //8 byte align size for this layer

    uint32_t in_oft;    //input  oft in main buf

    uint32_t out_oft;   //output oft in main buf

    uint16_t in_dims[4];//0:dims; 1:dim0; 2:dim1; 3:dim2

    uint16_t out_dims[4];

    //following unit not used in fp32 mode

    sctype_t in_s;  //input scale,

    zptype_t in_zp; //input zeropoint

    sctype_t out_s; //output scale

    zptype_t out_zp;//output zeropoint

                    //note: real = scale*(q-zeropoint)

} tml_head_t;


typedef struct {

    tml_head_t h;


    uint8_t kernel_w;

    uint8_t kernel_h;

    uint8_t stride_w;

    uint8_t stride_h;


    uint8_t dilation_w;

    uint8_t dilation_h;

    uint16_t act;//0 none, 1 relu, 2 relu1, 3 relu6, 4 tanh, 5 sign_bit


    uint8_t pad[4];//top,bottom,left,right


    uint32_t depth_mul;//depth_multiplier: if conv2d,=0; else: >=1

    uint32_t reserve;  //for 8byte align


    uint32_t ws_oft;//weight scale oft from this layer start

                    //skip bias scale: bias_scale = weight_scale*in_scale

    uint32_t w_oft; //weight oft from this layer start

    uint32_t b_oft; //bias oft from this layer start

                    //note: bias[c] = bias[c] + (-out_zp)*sum(w[c*chi*maxk:(c+1)*chi*maxk])

                    //      fused in advance (when convert model)

} tml_conv2d_dw_t;  //compatible with conv2d and dwconv2d


typedef struct {

    tml_head_t h;

} tml_gap_t;


typedef struct {

    tml_head_t h;


    uint32_t ws_oft; //weight scale oft from this layer start

    uint32_t w_oft;  //weight oft from this layer start

    uint32_t b_oft;  //bias oft from this layer start

    uint32_t reserve;//for 8byte align

} tml_fc_t;


typedef struct {

    tml_head_t h;

} tml_softmax_t;


typedef struct {

    tml_head_t h;

} tml_reshape_t;


typedef struct {

    tml_head_t h;


    uint8_t kernel_w;

    uint8_t kernel_h;

    uint8_t stride_w;

    uint8_t stride_h;


    uint8_t dilation_w;

    uint8_t dilation_h;

    uint16_t act;//0 none, 1 relu, 2 relu1, 3 relu6, 4 tanh, 5 sign_bit


    uint8_t pad[4];//top,bottom,left,right


    uint32_t ws_oft;//weight scale oft from this layer start

                    //skip bias scale: bias_scale = weight_scale*in_scale

    uint32_t w_oft; //weight oft from this layer start

    uint32_t b_oft; //bias oft from this layer start

                    //note: bias[c] = bias[c] + (-out_zp)*sum(w[c*chi*maxk:(c+1)*chi*maxk])

                    //      fused in advance (when convert model)

} tml_dwconv2d_t;


typedef struct {

    tml_head_t h;

    uint32_t in_oft1;

    sctype_t in_s1;  //input scale,

    zptype_t in_zp1; //input zeropoint

    uint32_t reserve;//align8

} tml_add_t;


typedef tm_err_t (*tml_stat_t)(tml_head_t *layer, tm_mat_t *in, tm_mat_t *out);

typedef tm_err_t (*tm_cb_t)(tm_mdl_t *mdl, tml_head_t *lh);


tm_err_t tm_load(tm_mdl_t *mdl, const uint8_t *bin, uint8_t *buf, tm_cb_t cb, tm_mat_t *in);//load model

void tm_unload(tm_mdl_t *mdl);                                                              //remove model

tm_err_t tm_preprocess(tm_mdl_t *mdl, tm_pp_t pp_type, tm_mat_t *in, tm_mat_t *out);        //preprocess input data

tm_err_t tm_run(tm_mdl_t *mdl, tm_mat_t *in, tm_mat_t *out);                                //run model


tm_err_t tml_conv2d_dwconv2d(tm_mat_t *in, tm_mat_t *out, wtype_t *w, btype_t *b, int kw, int kh, int sx, int sy, int dx, int dy, int act, int pad_top, int pad_bottom,

                             int pad_left, int pad_right, int dmul, sctype_t *ws, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp);

tm_err_t tml_gap(tm_mat_t *in, tm_mat_t *out, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp);

tm_err_t tml_fc(tm_mat_t *in, tm_mat_t *out, wtype_t *w, btype_t *b, sctype_t *ws, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp);

tm_err_t tml_softmax(tm_mat_t *in, tm_mat_t *out, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp);

tm_err_t tml_reshape(tm_mat_t *in, tm_mat_t *out, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp);

tm_err_t tml_add(tm_mat_t *in0, tm_mat_t *in1, tm_mat_t *out, sctype_t in_s0, zptype_t in_zp0, sctype_t in_s1, zptype_t in_zp1, sctype_t out_s, zptype_t out_zp);


#if TM_ENABLE_STAT

tm_err_t tm_stat(tm_mdlbin_t *mdl);//stat model

#endif


uint8_t TM_WEAK tm_fp32to8(float fp32);

float TM_WEAK tm_fp8to32(uint8_t fp8);


#define TML_GET_INPUT(mdl, lh) ((mtype_t *) ((mdl)->buf + (lh)->in_oft))

#define TML_GET_OUTPUT(mdl, lh) ((mtype_t *) ((mdl)->buf + (lh)->out_oft))

#if (TM_MDL_TYPE == TM_MDL_INT8) || (TM_MDL_TYPE == TM_MDL_INT16)

#define TML_DEQUANT(lh, x) (((sumtype_t) (x) - ((lh)->out_zp)) * ((lh)->out_s))

#define TM_DEQUANT(i8, s, zp) (((sumtype_t) (i8) - (zp)) * (s))

#define TM_QUANT(fp32, s, zp) ((mtype_t) ((fp32) / (s) + zp))

#elif (TM_MDL_TYPE == TM_MDL_FP8_143) || (TM_MDL_TYPE == TM_MDL_FP8_152)

#define TML_DEQUANT(lh, x) (tm_fp8to32(x))

#else//FP32,FP16

#define TML_DEQUANT(lh, x) ((float) (x))

#define TM_DEQUANT(x, s, zp) (x)

#define TM_QUANT(x, s, zp) (x)

#endif


#if TM_LOCAL_MATH

//http://www.machinedlearnings.com/2011/06/fast-approximate-logarithm-exponential.html


static inline float _exp(float x) {

    float p = 1.442695040f * x;

    uint32_t i = 0;

    uint32_t sign = (i >> 31);

    int w = (int) p;

    float z = p - (float) w + (float) sign;

    union {

        uint32_t i;

        float f;

    } v = {.i = (uint32_t) ((1 << 23) * (p + 121.2740838f + 27.7280233f / (4.84252568f - z) - 1.49012907f * z))};

    return v.f;

}


#define tm_exp _exp//maybe some arch have exp acceleration, use macro in arch_xxx.h to reload it

#else

#define tm_exp exp

#endif


#endif

uint32_t
u32_t uint32_t
Definition stdint.h:13

int16_t
s16_t int16_t
Definition stdint.h:9

int8_t
s8_t int8_t
Definition stdint.h:6

int32_t
s32_t int32_t
Definition stdint.h:12

uint8_t
u8_t uint8_t
Definition stdint.h:7

uint16_t
u16_t uint16_t
Definition stdint.h:10

tm_mat_t
Definition tinymaix.h:175

tm_mat_t::dims
uint16_t dims
Definition tinymaix.h:176

tm_mat_t::h
uint16_t h
Definition tinymaix.h:177

tm_mat_t::data
mtype_t * data
Definition tinymaix.h:181

tm_mat_t::dataf
float * dataf
Definition tinymaix.h:182

tm_mat_t::c
uint16_t c
Definition tinymaix.h:179

tm_mat_t::w
uint16_t w
Definition tinymaix.h:178

tm_mdl_t
Definition tinymaix.h:162

tm_mdl_t::cb
void * cb
Definition tinymaix.h:164

tm_mdl_t::layer_body
uint8_t * layer_body
Definition tinymaix.h:169

tm_mdl_t::main_alloc
uint16_t main_alloc
Definition tinymaix.h:167

tm_mdl_t::layer_i
uint16_t layer_i
Definition tinymaix.h:168

tm_mdl_t::buf
uint8_t * buf
Definition tinymaix.h:165

tm_mdl_t::subbuf
uint8_t * subbuf
Definition tinymaix.h:166

tm_mdl_t::b
tm_mdlbin_t * b
Definition tinymaix.h:163

tm_mdlbin_t
Definition tinymaix.h:146

tm_mdlbin_t::input_cnt
uint16_t input_cnt
Definition tinymaix.h:150

tm_mdlbin_t::magic
uint32_t magic
Definition tinymaix.h:147

tm_mdlbin_t::layer_cnt
uint16_t layer_cnt
Definition tinymaix.h:152

tm_mdlbin_t::buf_size
uint32_t buf_size
Definition tinymaix.h:153

tm_mdlbin_t::output_cnt
uint16_t output_cnt
Definition tinymaix.h:151

tm_mdlbin_t::sub_size
uint32_t sub_size
Definition tinymaix.h:154

tm_mdlbin_t::out_deq
uint8_t out_deq
Definition tinymaix.h:149

tm_mdlbin_t::mdl_type
uint8_t mdl_type
Definition tinymaix.h:148

tml_add_t
Definition tinymaix.h:272

tml_add_t::h
tml_head_t h
Definition tinymaix.h:273

tml_add_t::in_s1
sctype_t in_s1
Definition tinymaix.h:275

tml_add_t::in_zp1
zptype_t in_zp1
Definition tinymaix.h:276

tml_add_t::reserve
uint32_t reserve
Definition tinymaix.h:277

tml_add_t::in_oft1
uint32_t in_oft1
Definition tinymaix.h:274

tml_conv2d_dw_t
Definition tinymaix.h:203

tml_conv2d_dw_t::h
tml_head_t h
Definition tinymaix.h:204

tml_conv2d_dw_t::kernel_w
uint8_t kernel_w
Definition tinymaix.h:206

tml_conv2d_dw_t::act
uint16_t act
Definition tinymaix.h:213

tml_conv2d_dw_t::kernel_h
uint8_t kernel_h
Definition tinymaix.h:207

tml_conv2d_dw_t::b_oft
uint32_t b_oft
Definition tinymaix.h:223

tml_conv2d_dw_t::ws_oft
uint32_t ws_oft
Definition tinymaix.h:220

tml_conv2d_dw_t::stride_w
uint8_t stride_w
Definition tinymaix.h:208

tml_conv2d_dw_t::w_oft
uint32_t w_oft
Definition tinymaix.h:222

tml_conv2d_dw_t::depth_mul
uint32_t depth_mul
Definition tinymaix.h:217

tml_conv2d_dw_t::dilation_h
uint8_t dilation_h
Definition tinymaix.h:212

tml_conv2d_dw_t::stride_h
uint8_t stride_h
Definition tinymaix.h:209

tml_conv2d_dw_t::reserve
uint32_t reserve
Definition tinymaix.h:218

tml_conv2d_dw_t::dilation_w
uint8_t dilation_w
Definition tinymaix.h:211

tml_dwconv2d_t
Definition tinymaix.h:249

tml_dwconv2d_t::stride_h
uint8_t stride_h
Definition tinymaix.h:255

tml_dwconv2d_t::act
uint16_t act
Definition tinymaix.h:259

tml_dwconv2d_t::dilation_w
uint8_t dilation_w
Definition tinymaix.h:257

tml_dwconv2d_t::b_oft
uint32_t b_oft
Definition tinymaix.h:267

tml_dwconv2d_t::kernel_h
uint8_t kernel_h
Definition tinymaix.h:253

tml_dwconv2d_t::stride_w
uint8_t stride_w
Definition tinymaix.h:254

tml_dwconv2d_t::dilation_h
uint8_t dilation_h
Definition tinymaix.h:258

tml_dwconv2d_t::ws_oft
uint32_t ws_oft
Definition tinymaix.h:264

tml_dwconv2d_t::h
tml_head_t h
Definition tinymaix.h:250

tml_dwconv2d_t::w_oft
uint32_t w_oft
Definition tinymaix.h:266

tml_dwconv2d_t::kernel_w
uint8_t kernel_w
Definition tinymaix.h:252

tml_fc_t
Definition tinymaix.h:232

tml_fc_t::w_oft
uint32_t w_oft
Definition tinymaix.h:236

tml_fc_t::b_oft
uint32_t b_oft
Definition tinymaix.h:237

tml_fc_t::h
tml_head_t h
Definition tinymaix.h:233

tml_fc_t::ws_oft
uint32_t ws_oft
Definition tinymaix.h:235

tml_fc_t::reserve
uint32_t reserve
Definition tinymaix.h:238

tml_gap_t
Definition tinymaix.h:228

tml_gap_t::h
tml_head_t h
Definition tinymaix.h:229

tml_head_t
Definition tinymaix.h:187

tml_head_t::in_oft
uint32_t in_oft
Definition tinymaix.h:191

tml_head_t::out_zp
zptype_t out_zp
Definition tinymaix.h:199

tml_head_t::out_s
sctype_t out_s
Definition tinymaix.h:198

tml_head_t::type
uint16_t type
Definition tinymaix.h:188

tml_head_t::is_out
uint16_t is_out
Definition tinymaix.h:189

tml_head_t::in_s
sctype_t in_s
Definition tinymaix.h:196

tml_head_t::in_zp
zptype_t in_zp
Definition tinymaix.h:197

tml_head_t::out_oft
uint32_t out_oft
Definition tinymaix.h:192

tml_head_t::size
uint32_t size
Definition tinymaix.h:190

tml_reshape_t
Definition tinymaix.h:245

tml_reshape_t::h
tml_head_t h
Definition tinymaix.h:246

tml_softmax_t
Definition tinymaix.h:241

tml_softmax_t::h
tml_head_t h
Definition tinymaix.h:242

tm_load
tm_err_t tm_load(tm_mdl_t *mdl, const uint8_t *bin, uint8_t *buf, tm_cb_t cb, tm_mat_t *in)
Definition tm_model.c:17

tm_stat
tm_err_t tm_stat(tm_mdlbin_t *mdl)
Definition tm_stat.c:45

tml_stat_t
tm_err_t(* tml_stat_t)(tml_head_t *layer, tm_mat_t *in, tm_mat_t *out)
Definition tinymaix.h:282

tm_act_type_t
tm_act_type_t
Definition tinymaix.h:123

TM_ACT_NONE
@ TM_ACT_NONE
Definition tinymaix.h:124

TM_ACT_MAXCNT
@ TM_ACT_MAXCNT
Definition tinymaix.h:130

TM_ACT_RELU
@ TM_ACT_RELU
Definition tinymaix.h:125

TM_ACT_RELU1
@ TM_ACT_RELU1
Definition tinymaix.h:126

TM_ACT_TANH
@ TM_ACT_TANH
Definition tinymaix.h:128

TM_ACT_SIGNBIT
@ TM_ACT_SIGNBIT
Definition tinymaix.h:129

TM_ACT_RELU6
@ TM_ACT_RELU6
Definition tinymaix.h:127

tml_gap
tm_err_t tml_gap(tm_mat_t *in, tm_mat_t *out, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp)
Definition tm_layers.c:233

tml_reshape
tm_err_t tml_reshape(tm_mat_t *in, tm_mat_t *out, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp)
Definition tm_layers.c:305

tm_fp32to8
uint8_t TM_WEAK tm_fp32to8(float fp32)

btype_t
int32_t btype_t
Definition tinymaix.h:38

tm_unload
void tm_unload(tm_mdl_t *mdl)
Definition tm_model.c:48

sctype_t
float sctype_t
Definition tinymaix.h:90

tm_err_t
tm_err_t
Definition tinymaix.h:94

TM_ERR_KSIZE
@ TM_ERR_KSIZE
Definition tinymaix.h:104

TM_ERR_TODO
@ TM_ERR_TODO
Definition tinymaix.h:102

TM_OK
@ TM_OK
Definition tinymaix.h:95

TM_ERR
@ TM_ERR
Definition tinymaix.h:96

TM_ERR_MDLTYPE
@ TM_ERR_MDLTYPE
Definition tinymaix.h:103

TM_ERR_LAYERTYPE
@ TM_ERR_LAYERTYPE
Definition tinymaix.h:100

TM_ERR_DIMS
@ TM_ERR_DIMS
Definition tinymaix.h:101

TM_ERR_UNSUPPORT
@ TM_ERR_UNSUPPORT
Definition tinymaix.h:98

TM_ERR_OOM
@ TM_ERR_OOM
Definition tinymaix.h:99

TM_ERR_MAGIC
@ TM_ERR_MAGIC
Definition tinymaix.h:97

tm_run
tm_err_t tm_run(tm_mdl_t *mdl, tm_mat_t *in, tm_mat_t *out)
Definition tm_model.c:86

tml_fc
tm_err_t tml_fc(tm_mat_t *in, tm_mat_t *out, wtype_t *w, btype_t *b, sctype_t *ws, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp)
Definition tm_layers.c:256

wtype_t
int8_t wtype_t
Definition tinymaix.h:37

tm_preprocess
tm_err_t tm_preprocess(tm_mdl_t *mdl, tm_pp_t pp_type, tm_mat_t *in, tm_mat_t *out)
Definition tm_model.c:55

zptype_t
int32_t zptype_t
Definition tinymaix.h:40

tml_add
tm_err_t tml_add(tm_mat_t *in0, tm_mat_t *in1, tm_mat_t *out, sctype_t in_s0, zptype_t in_zp0, sctype_t in_s1, zptype_t in_zp1, sctype_t out_s, zptype_t out_zp)
Definition tm_layers.c:311

mtype_t
int8_t mtype_t
Definition tinymaix.h:36

sumtype_t
int32_t sumtype_t
Definition tinymaix.h:39

tm_layer_type_t
tm_layer_type_t
Definition tinymaix.h:107

TML_CONV2D
@ TML_CONV2D
Definition tinymaix.h:108

TML_DWCONV2D
@ TML_DWCONV2D
Definition tinymaix.h:113

TML_FC
@ TML_FC
Definition tinymaix.h:110

TML_SOFTMAX
@ TML_SOFTMAX
Definition tinymaix.h:111

TML_ADD
@ TML_ADD
Definition tinymaix.h:114

TML_GAP
@ TML_GAP
Definition tinymaix.h:109

TML_MAXCNT
@ TML_MAXCNT
Definition tinymaix.h:115

TML_RESHAPE
@ TML_RESHAPE
Definition tinymaix.h:112

tm_fp8to32
float TM_WEAK tm_fp8to32(uint8_t fp8)

tml_conv2d_dwconv2d
tm_err_t tml_conv2d_dwconv2d(tm_mat_t *in, tm_mat_t *out, wtype_t *w, btype_t *b, int kw, int kh, int sx, int sy, int dx, int dy, int act, int pad_top, int pad_bottom, int pad_left, int pad_right, int dmul, sctype_t *ws, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp)
Definition tm_layers.c:68

tml_softmax
tm_err_t tml_softmax(tm_mat_t *in, tm_mat_t *out, sctype_t in_s, zptype_t in_zp, sctype_t out_s, zptype_t out_zp)
Definition tm_layers.c:273

tm_cb_t
tm_err_t(* tm_cb_t)(tm_mdl_t *mdl, tml_head_t *lh)
Definition tinymaix.h:283

tm_pad_type_t
tm_pad_type_t
Definition tinymaix.h:118

TM_PAD_VALID
@ TM_PAD_VALID
Definition tinymaix.h:119

TM_PAD_SAME
@ TM_PAD_SAME
Definition tinymaix.h:120

tm_pp_t
tm_pp_t
Definition tinymaix.h:134

TMPP_UINT2FP01
@ TMPP_UINT2FP01
Definition tinymaix.h:138

TMPP_UINT2INT
@ TMPP_UINT2INT
Definition tinymaix.h:137

TMPP_FP2INT
@ TMPP_FP2INT
Definition tinymaix.h:136

TMPP_NONE
@ TMPP_NONE
Definition tinymaix.h:135

TMPP_UINT2DTYPE
@ TMPP_UINT2DTYPE
Definition tinymaix.h:140

TMPP_MAXCNT
@ TMPP_MAXCNT
Definition tinymaix.h:141

TMPP_UINT2FPN11
@ TMPP_UINT2FPN11
Definition tinymaix.h:139

_exp
static float _exp(float x)
Definition tinymaix.h:334

tm_port.h

TM_WEAK
#define TM_WEAK
Definition tm_port.h:44