手记

深度学习真的working吗

近年来,深度学习的发展可谓是如日中天,各种论文、各种Beat Baseline。可是,深度学习真的能大规模的应用到生产中吗?深度学习的泛化能力真的足够好吗?从事深度学习的工作有一段日子了,我举两个我实际工作遇到的例子,大家讨论讨论。
1、图像分割
最近的一个项目中要应用到图像分割技术,我们采用了SSD。我们直接看一张图:


SSD示意图


算法标出了四个人(可信度大于0.5的),并且人物的边界让人费解,这样的算法显然是不可靠的。分辨这样的图片为什么对计算机来说非常困难?首先,图中的人物是穿少数民族服装的(我是云南人,云南是一个多民族的身份,自然会有这样的图片要处理);其次,图中的一个大人是坐着的还抱着一个小孩。这对计算机来说很难界定人物的边界,所以出现了这样奇怪的结果。
但是,为什么人很容易分辨,一眼就能看出图中有三个人。所以现在的深度学习算法的泛化能力真的足够了吗?算法到底有没有学会了如何分辨一个人,这些都是不得而知的。

2、短文本摘要
去年的一个项目,给一篇小的短文生成一个标题,我们采用的Seq2Seq+Attention模型。我们还是直接看一个例子:


文本摘要示例


我还是云南人,对云南来说是从来没有过台风的,显然这段短新闻被算法生成了一个非常非常奇怪的标题,我们人工修改了。类似的例子,还有腾讯对“一带一路”的翻译。我们当然可以给算法找借口,这是因为训练语料中没有类似的语料啊。但是,这是人工智能吗。如果是,那么是不是应该从这段文本中总结出《超强台风“山竹”进入云南 将带来降雨》类似这样的标题,即使之前从来没有见过。

我觉得,现在媒体过分夸大了深度学习,让大家觉得深度学习就像神一样,什么都能搞定。可能大家都想着怎么提高真确率(即使有再高的正确率也不一定能应用),怎么修改模型,而不去思考深度学习到底是什么东西,具不具备学习的能力,是不是真正的人工智能。当然,这些都只是我个人的一些想法。



作者:Funzion
链接:https://www.jianshu.com/p/6712fb8ff8ce


0人推荐
随时随地看视频
慕课网APP