猿问

在 Tensorflow-lite 中输入具有动态尺寸的图像

我有一个 tensorflow 模型,它接受不同大小的输入图像:


inputs = layers.Input(shape=(128,None,1), name='x_input')


<tf.Tensor 'x_input:0' shape=(?, 128, ?, 1) dtype=float32>

当我将此模型转换为 tensorflow-lite 时,它会抱怨:


converter = tf.lite.TFLiteConverter.from_frozen_graph(

  graph_def_file, input_arrays, output_arrays)

tflite_model = converter.convert() 


ValueError: None is only supported in the 1st dimension.

Tensor 'x_input_1' has invalid shape '[None, 128, None, 1]'.

我无法将图像缩放到固定大小。我看到的唯一解决方案是将图像填充到某个最大尺寸并在图中使用该尺寸,但这似乎很浪费。有没有其他方法可以使 tensorflow-lite 与动态图像尺寸一起工作?这种限制有什么理由吗?谢谢。


桃花长相依
浏览 571回答 2
2回答

慕森王

是的,您可以在 TF-Lite 中使用动态张量。之所以不能直接将形状设置为,[None, 128, None, 1]是因为这样以后可以轻松支持更多的语言。此外,它充分利用了静态内存分配方案。对于旨在用于具有低计算能力的小型设备的框架,这是一个明智的设计选择。以下是如何动态设置张量大小的步骤:0. 冻结看起来你正在从一个冻结的 GraphDef 转换,即一个*.pb文件。假设您的冻结模型具有输入 shape [None, 128, None, 1]。1.转换步骤。在此步骤中,将输入大小设置为您的模型可以接受的任何有效大小。例如:tflite_convert \&nbsp; --graph_def_file='model.pb' \&nbsp; --output_file='model.tflite' \&nbsp; --input_shapes=1,128,80,1 \&nbsp; &nbsp; &nbsp;# <-- here, you set an&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; #&nbsp; &nbsp; &nbsp;arbitrary valid shape&nbsp; --input_arrays='input' \&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp; --output_arrays='Softmax'2.推理步骤诀窍是interpreter::resize_tensor_input(...)在推理过程中实时使用TF-Lite API的功能。我将提供它的python实现。Java 和 C++ 实现应该相同(因为它们具有相似的 API):from tensorflow.contrib.lite.python import interpreter# Load the *.tflite model and get input detailsmodel = Interpreter(model_path='model.tflite')input_details = model.get_input_details()# Your network currently has an input shape (1, 128, 80 , 1),# but suppose you need the input size to be (2, 128, 200, 1).model.resize_tensor_input(&nbsp; &nbsp; input_details[0]['index'], (2, 128, 200, 1))model.allocate_tensors()而已。您现在可以将该模型用于具有 shape 的图像(2, 128, 200, 1),只要您的网络架构允许这样的输入形状。请注意,model.allocate_tensors()每次进行此类重塑时都必须这样做,因此效率非常低。这是强烈建议,以避免在程序中使用此功能太多。

SMILET

上述答案不再适用于较新版本的 Tensorflow。应该在转换步骤中使用形状 None 而不是虚拟形状,然后使用interpreter.resizeInput() 来工作。见这里:https&nbsp;:&nbsp;//github.com/tensorflow/tensorflow/issues/41807
随时随地看视频慕课网APP

相关分类

Python
我要回答