我觉得这种讨论的背后焦点要比理论和应用的关系更为深刻,它表明的是不同的学者对于智能(包括视觉在内)完全不一样的学术方法论。这种争论有一个并不明显但是非常重要的假设上的不同,那就是实现智能“是否需要”和“是否有可能”像物理学那样去将复杂的体系简化成易于理解的严谨描述。这一描述在物理学里面几乎是一致地数学的,因为它是目前人类可以用于严谨描述规律的唯一方法。然而若是要研究智能现象本身,它是否能够被归约成(Reduce)严谨的规律还是一个未知的事情。但是,绝大多数经过长期科研训练的科学家在无意识的情况下将“所有现象都可以简化成严谨描述”变成了类似公理的假设,然而他们却从来没有思考过这一假设是否适用于智能本身。这一思路较为极端的例子应该算是英国的罗杰·彭罗斯(Roger Penrose)爵士,他连续撰写了三部书《皇帝的新脑》(The Emperor's New Mind)、《意识的阴影》(The Shadow of the Mind)和《庞大,渺小,及人类意识》(The Large, the Small and the Human Mind),来阐明意识(我认为这里的“意识”与“智能”没有什么定义上的差别)的解释需要完整的量子引力(Quantum Gravity)理论,并且用图灵机停机问题和哥德尔不完备性定理来说明目前基于经典物理的技术不可能创造出意识来。然而,完整的量子引力理论时至今日都是不存在的,不然就不会有《星际穿越》(Interstellar)这么好看的电影存在了。以彭罗斯为代表的科学家在这方面仅仅是作了一些猜测,远远不能证明他们是对的。此外,彭罗斯对于图灵机停机问题和哥德尔不完备性定理的使用是对于机器的,将人变成了第三方的视角。然而第三方的视角对于主体而言必然不会存在这些悖论,如果想要出现这些悖论,每个人类个体应该考虑的问题是他自己而不是别的逻辑系统。也许哪天外星人看到了我们人类,然后在人脑的某种模型中应用了一下康托尔的对角线原理,然后说“看,人类是没有智能的,因为他有悖论”——这明显是错误的思考方式。这一派的人其实还不少,比如施一公、饶毅(相关参考:巅峰对话:生命科学的欣赏、普及、升华)还有题主的朱教授,以及绝大多数理论学派的学者(注:这里面其实只有一小部分人认为这个智能理论需要量子重力理论为前提,但他们都认为智能现象是可以归约为严谨描述的)。不过他们也许并没有意识他们使用了这一假设来看待智能。这一派的特点是对一切都尽量追求完美的解释,如果能够将所有的智能现象都归约成一个公式那是最好的了。不过,目前来讲这样的尝试还没有完全成功。一个例子是传统的统计机器学习理论,应用到实际模型上因太过偏离实际应用而变得没有办法参考,不过这是因为这些理论都是对最坏情况的“上界的上界”,自然无法描述实际使用的一般状况。深度学习的发展在一定程度上是跳出这种“上界的上界”的限制的过程,当然在这个过程中也受益于数据、计算量和模型等各方面的进步。不过我个人觉得这一派的研究其实是非常有用的,即使最终无法将智能归约为几个公式的理论,在这个过程中能够搞清楚那些可以搞清楚的也是非常有价值的成果。反过来,有另外的一些研究者则认为智能作为一种现象,实际上只是人类对自己生物系统(特别是神经系统)复杂性的一种直观描述。因为复杂性是它的根本要求,因此它是不可能被归约成(Reduce)严谨的规律的。这种不可归约性甚至包括了“如何定义智能”这一问题。图灵在1950年发表的著名哲学论文《计算机器与智能》(Computing Machinery and Intelligence)中所提出的“图灵测试”(Turing Test)就是一种基于这种观念的对智能的定义,即只要被测试者大体上(即统计上)无法与由判定人(Judge)一致认可的智能参考物(即人自己)有所区别,那么就可以认为是有智能的(在我看来,这一描述实际上是一种早期且非严谨的PAC学习理论雏形)。我个人觉得这种承认智能复杂而不可归约的看法才是朴素而有用的。深度学习的祖师爷辛顿(Geoffrey Hinton)在2016 IEEE/RSE James Clerk Maxwell奖章颁奖典礼上就曾说过,图灵和冯·诺伊曼本来就不承认基于逻辑可以创造智能。如果联系历史,我个人猜想他们拒绝的是整个认为智能可以归约成严谨规律的思路,而类似神经网络这样的工程化方法也许才是进步的源泉。更何况,我们互相承认每个人类个体都是是智能体,然而我们从来没有要求我们每一个体都必须将另外的个体归约成一个理论或者搞清楚他神经元的每个状态才能去理解他——这在物理上是不现实的。随着人造机器计算能力的提升,我们也许会不得不只能去关注系统的行为,而对其内部运作的机理则只能处于无法归约的层次上。这当然也取决于人类智能的物质基础,如果日后我们人类的生物大脑变得无比强大,那个时候看待现在的神经网络也许就跟我们看待过去的机械算盘一样明白了。此外,就算个体智能可以归约成严谨理论,还有比人类个体智能更为庞大的现象,那就是人类社会和人类的进化(如何创造机器实现社会和进化?)。目前大多深度学习的研究都是基于这一思想的,主要在模型设计、优化算法、应用领域等实际的方面来拓展。我个人觉得,既然这样的尝试目前来讲还没有看到尽头(比如不断的有新的任务通过深度学习方法变得可能),那么就没有必要以“发明一种理论来描述所有深度学习”作为目标,因为我们还不清楚深度学习这一系列方法在实用中的边界在哪里,更不清楚“将智能现象归约成严谨的规律”在根本上是否可行。在结束之前我想说明的是上面的两种派别的区分并不是绝对和独立的,有许多研究员在完成许多优秀实际工作的同时,也为理解这些模型提出了非常好的理论。尽管这些理论不像物理学科那样有强大的归约性,但是依然是非常重要的。