用于文本分类的Tensorflow模型

我正在使用OCR和Tensorflow构建一个Android应用程序。它扫描超市中的价格标签,并且必须将扫描的数据放入不同的字段。我已经完成了OCR部分,因此图像->文本识别工作正常,仅需Tensorflow即可处理文本输入。


总体而言,我是Tensorflow和机器学习的新手。是否可以使用Tensorflow进行以下工作,如果可以,您是否可以分享一些有关这样做的想法?


平均输入如下所示:


CARLSBERG

EESTI

HELE OLU 5%

1.59 +0.10

500 ml pudel

3.18 /I

4740019113419

目标是按以下方式对这些数据进行排序:


Brand: CARLSBERG

Product name: HELE OLU 5%

Size: 500

Units: ml

确定如何对特定字符串进行分类的参数为:


案件

电话号码

超市(默认情况下为已知)

总行数

字母/数字比率


慕斯王
浏览 129回答 3
3回答

天涯尽头无女友

我认为第一步将是动手实践或生成一些带有标签的培训数据。您应该研究特征提取。例如,如果您注意到某个项目的第二行通常是价格,则可以将其表示为参数。或者说,如果数字后面跟有毫升/升/盎司之类的单位,则很可能是体积。您想知道的是您对特定行/字符串说的价格有多大的信心。但是,我认为TensorFlow将更适合该问题的OCR部分,您已经解决了。您要问的更多是文本解析,可以使用NLP方法更好地解决。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python