自从AI火了之后,它的各种神奇应用就层出不穷。
现在,有人已经把AI用在男科♂诊断上,研究“小蝌蚪”。
没错,这是个正经研究,出自挪威奥斯陆城市大学,甚至还发了一篇Nature Science Reports。
解决的核心问题是,如何让AI来观察“小蝌蚪”,进而判断男性的生育能力。
研究者们对着一群“小蝌蚪”的视频研究了很久之后发现:
你们熟悉的卷积神经网络(CNN)简直是自动观察小蝌蚪的神器。
相比传统机器学习,CNN可以更有效的对男性小蝌蚪的运动能力进行分析,错误率低至9%左右,也就是准确率已经超过九成了。
因此,将来如果有准备当爸爸的盆友,去医院做检查的时候,盯着你的“儿子”看的,可能就不是医生,而是AI了。
小蝌蚪动不动,影响当爸爸的能力
在这项研究中,AI主要看的指标是小蝌蚪的运动状态。
先来科普一下,一个正常育龄男性能不能当爸爸,和他生殖系统的很多因素有关,单就基因的传递者小蝌蚪来说,它们的总数、形态、浓度等等因素都会影响男性的生育能力。
小蝌蚪的运动状态,也是其中一个重要指标。
比如,有高速运动(progressive)的小蝌蚪,跑起来飞快,可以直线跑,也可以绕大圆圈跑,非常健壮;
还有低速运动(non-progressive)的小蝌蚪,跑的不快,或者在原地兜圈子,不太健壮;
也有一动不动(immotile)的小蝌蚪,太不活跃,很难找到另一半来合成受精卵。
而一个小蝌蚪想把自己的基因传承下去,需要至少25微米/秒的运动能力,如果一位男士的小蝌蚪里能跑到这个速度的不到32%,那他可能就没那么容易当爸爸了。
因此,如果要诊断一位男士的生育能力,那就要去医院里检测他的精液样本。
而这项研究,就是用传统机器学习和深度学习的方法区分高速运动、低速运动和一动不动的小蝌蚪。
来自85个人的数据
那么,研究的第一步,要找个小蝌蚪数据集,于是……
他们找到了一个名叫VISEM的数据集。
这个数据集的作者找了85个人,这些人去实验室附近的小黑屋或者自己家里收集了一些精液样本,然后研究人员把这些样本放到显微镜下,录2~7分钟的视频,视频的帧率是每秒50帧。
除了视频,数据集里还有这85个人的年龄、体重指数(BMI)和禁欲天数三个指标。
先用机器学习算法
既然要比较传统机器学习算法和CNN哪个辨别小蝌蚪运动状态的能力强,那就先上传统机器学习。
第一步,要提取特征。
这里,研究者们用到了一个名叫LIRE(Lucene Image Retrieval)开源库,然后用超过40个不同的算法测试了超过30个不同的特征。
最终选定了Tamura特征,这组特征里包括小蝌蚪的粗细程度、对照、方向性、线条形状、规则度和粗糙度,并且分别用Tamura特征、数据集里85个人的数据和两者兼顾做了三组辨别三种不同活力小蝌蚪的实验。
综合三组实验的结果,有六个算法表现是最好的,他们是:简单线性回归,随机森林,高斯过程,序列最小优化(SMOreg),弹性网和随机树,识别的错误率大概在11%左右。
不过,用这些机器学习算法有一点麻烦:每次只能辨别出一个值,所以要针对三种活力不同的精子各运行一次,比较费时间。
再用深度学习方法
试完了传统机器学习方法,再来试试深度学习,用CNN来辨别。
这里不能直接用原始数据,需要提前做一些处理,从视频中提取原始帧,用光流生成帧序列的时间表示。
然后在用CNN来在这些处理后的数据上,再做一下那三组实验,分辨三种不同活力小蝌蚪的数量,这下要方便地多,可以一下子辨别出三个值,不用跑三遍算法了。
△ 处理过程
最后运行出来的结果,错误率大约在9%左右。
相比前面的11%,错误率明显降低,效果要好得多了。
所以,用深度学习辨别精子活力,不仅比传统机器学习的方法要好,而且可以只跑一遍算法,更快速便捷。
或许未来,深度学习可以应用到医疗实践中,成为诊断男性不育的利器。