以最大概率从名片中提取地址

我有一张名片的图片。使用 OCR 我可以将此图像转换为文本。现在我想分离信息并添加到联系人中。

通过正则表达式,我可以解析电话、电子邮件、网站等信息,但未能从中分离出地址,因为格式因卡片而异。

我在 Android 平台的设备上使用 firebase ml 套件。我正在附上 OCR 的输出。

来自谷歌图片的名片输入图片

http://img3.mukewang.com/60ee9eb30001471208000469.jpg

OCR 的输出是

  1. 第 1 行 = [larriS,保险]

  2. 第 2 行 = [A, Legacy, of, Quality, Service]

  3. 第 3 行 = [韦恩,斯坦斯菲尔德,我,CLCS]

  4. 第 4 行 = [1380, Rio, Rancho, Blvd, SE363]

  5. 第 5 行 = [Rio, Rancho,, NM, 87124]

  6. 第 6 行 = [CELL, 505.554.0510]

  7. 第 7 行 = [电话,505-818-9377]

  8. 第 8 行 = [传真,888-753.4449]

  9. 第 9 行 = [WayneJames@me.com]

检查了link1、link2和link3但未能从正则表达式中找到地址,所以我试图通过间接方式找到它。

如果它有邮政编码,则尝试通过该地址查找地址,但邮政编码也各不相同。找到一些希望为不同的国家/地区使用多个正则表达式,但这不是解决方案,请您帮我找到一种提取它的方法。而且我知道它可以 100% 适用于市场上可用的所有类型的格式,但我想涵盖最多。


烙印99
浏览 119回答 1
1回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java