我有一张名片的图片。使用 OCR 我可以将此图像转换为文本。现在我想分离信息并添加到联系人中。
通过正则表达式,我可以解析电话、电子邮件、网站等信息,但未能从中分离出地址,因为格式因卡片而异。
我在 Android 平台的设备上使用 firebase ml 套件。我正在附上 OCR 的输出。
来自谷歌图片的名片输入图片
OCR 的输出是
第 1 行 = [larriS,保险]
第 2 行 = [A, Legacy, of, Quality, Service]
第 3 行 = [韦恩,斯坦斯菲尔德,我,CLCS]
第 4 行 = [1380, Rio, Rancho, Blvd, SE363]
第 5 行 = [Rio, Rancho,, NM, 87124]
第 6 行 = [CELL, 505.554.0510]
第 7 行 = [电话,505-818-9377]
第 8 行 = [传真,888-753.4449]
第 9 行 = [WayneJames@me.com]
检查了link1、link2和link3但未能从正则表达式中找到地址,所以我试图通过间接方式找到它。
如果它有邮政编码,则尝试通过该地址查找地址,但邮政编码也各不相同。找到一些希望为不同的国家/地区使用多个正则表达式,但这不是解决方案,请您帮我找到一种提取它的方法。而且我知道它可以 100% 适用于市场上可用的所有类型的格式,但我想涵盖最多。
相关分类