vchalup以下为朗读小姐姐全文音频
作者 |Kevin Hartnett翻译 |茹小茹
审校|酷炫脑主创朗读|胡恩美工|雪今晶编辑 |湘蓉在某些方面,计算机的视觉优于人类,但从另一角度而言,它们可能永远无法与人类媲美。
当工程师们第一次尝试教计算机感知周围环境时,他们理所当然地认为计算机和人类一样具有视觉。约克大学的计算机科学家约翰 · 索特索斯说,20世纪60年代关于计算机第一个假说就是“它们同样受到人类视觉特性的驱使”。
但自那以后,人工智能领域发生了翻天覆地的变化。
到目前为止,计算机视觉已经从石破天惊的设想发展为了一个广阔的领域。在给相似动物进行分类,或者检测医学影象中的病理情况时,计算机的表现甚至超越了人类。可以说,人工“神经网络” 与人类处理视觉信息的方式差异越来越大了。它们已经可以做到另辟蹊径,并在人类设计的游戏中击败了我们自身。
计算机的视觉神经网络其实相当简单。它们接收一个输入图像,然后通过一系列步骤对其进行处理(首先检测像素,进而是边缘和轮廓,最后对整个物体的类型做出猜测)。这一系列流水线般的既定设置又被称为前馈系统。
人类对视觉形成还有很多未知,但我们能够确定某些假说一定是不成立的。在广达杂志最近的一篇文章《数学模型解开的视觉奥秘》中,作者描述了一个全新的数学模型,以解释人类视觉的核心理论,即大脑的视觉皮层是如何根据视网膜接收到的有限信息,重建出生动而准确的三维世界的。
该模型表明,视觉皮层可以通过一系列神经反馈回路,将外部世界数据具体化,进而呈现为眼前的图像。这种反馈过程与计算机视觉的前馈方法大相径庭。
康奈尔大学的神经系统科学家乔纳森·维克多说: “这项研究启发我们,人类和计算机视觉是多么的复杂而不同。”。
但是计算机的确在某些视觉任务处理时击败了人类。那么问题来了: 计算机与人类的视觉通路究竟有没有共同之处呢?
在某些方面,答案显然是否定的。到达视觉皮层的信息受到解剖结构的限制: 连接视觉皮层和外部环境的神经相对较少,这大大削减了大脑皮层可获得的视觉数据。
计算机并不面临这种“带宽问题”,因而也不必挣扎于过低的信息量。
“如果计算能力和内存趋于无限,机器还需要对信息进行压缩处理吗?答案大概是否定的。”。
但是索特所斯认为,人类视觉的优越之处也不可忽视。
图源网络
他说,当今计算机擅长的分类工作是一种低级智能,仅需要从海量数据中搜索相关度就可完成。而对于其他高阶任务,比如物体的多方位扫描识别(类似于绕着雕像环走并观察熟悉它的外形)而言 ,单纯的相关度搜索就显得不太够了。此时的计算机需要人类手动确认才能正常运行。
在去年接受《广达》杂志采访时,人工智能先驱朱迪亚?珀尔笼统地阐述了这一观点,他认为从长远来看,相关度训练并不会给人工智能系统带来光明的未来。
例如,人类视觉的一个重要特征就是能够重复观察。视觉信息处理之后,我们会对所见物体做出判断。当这个结论不太对劲时,人类可以再看一遍,而这一次我们通常得以窥得事情的真相。以前馈方式工作的计算机视觉系统往往缺乏这种能力,因而即使面对这很简单的视觉任务,计算机也会出现明显的失误。
人类视觉还有一个更微妙的、计算机永远无法拥有的特性。
人类的视觉系统需要多年时间才能成熟。2019年,索特所斯和他的合作者在一篇论文中阐述道,直到17岁左右,人们才能完全掌握在嘈杂环境中排除干扰和专注于既定目标的能力。其他研究则发现,直到20岁之前,人类对面孔的感知能力都在不断提高。
计算机视觉系统通过内化大量的数据来进行工作,这种基本程序是固定的,不会像大脑那样随着发育时间的推移而成熟。既然潜在的学习机制如此不同,二者的运行结果可能一样吗?索特索斯认为计算机视觉系统的前景不容乐观。
“这些深度学习方法与人类毫无关系,”他说。这暗示我们瓶颈期即将来临,或许日后人工智能系统的发展将寸步难行。”
参考文献[1] Wong-Kee-YouAMB, Tsotsos JK, Adler SA. Development of spatial suppression surrounding thefocus of visual attention.J Vis. 2019;19(7):9. doi:10.1167/19.7.9
酷炫脑长期征集脑科学、心理学类文章,欢迎投稿
投稿请发邮箱:2829023503@qq.com
点这里,让朋友知道你热爱脑科学