用定点的数值运算代替浮点的数值运算。
一般指的是模型训练后进行反训练之前,或反训练之后部署之前进行剪枝,或保留模型的部分权重和结构。 online:边剪枝边训练 offline:不训练直接剪枝
一般指的是模型训练后进行反训练之前,或反训练之后部署之前进行剪枝,或保留模型的部分权重和结构。
模型训练好后,前面一层和后面一层可能存在合并关系,例如前面的卷积和后面的归一化,它们的算子层面可能进行合并——类似合并同类项。 注意:算子融合是无损的,但是能节省计算资源。
模型训练好后,前面一层和后面一层可能存在合并关系,例如前面的卷积和后面的归一化,它们的算子层面可能进行合并——类似合并同类项。
注意:算子融合是无损的,但是能节省计算资源。