TensorFlow 是否支持层之间不同的位宽量化,或者是否强制在整个模型上执行相同的技术?
例如,假设我16-bit在层执行量化n。我可以进行层8-bit量化吗n+1?
16-bit
n
8-bit
n+1
动漫人物
相关分类