在印度河流域文明是其兴盛于c的印度次大陆北部地区的文化和政治实体。7000 - c。公元前 600 年。它的现代名称源于它位于印度河流域的位置,但它通常也被称为印度河-萨拉斯瓦蒂 文明和哈拉帕文明。 这些后一种名称来自吠陀文献中提到的萨拉斯瓦蒂河,该河与印度河相邻,该地区的古城哈拉帕是现代发现的第一个城市。这些名字都没有源自任何古代文本,因为尽管学者们普遍认为这个文明的人开发了一种书写系统(称为印度河文字或哈拉帕文字),但尚未被破译。 这三个名称都是现代建筑,对于文明的起源、发展、衰落和衰落,没有任何明确的信息。即便如此,现代考古学已经建立了一个可能的年表和分期: Pre-Harappan – c. 7000 - c。公元前 5500 年 早期的哈拉潘 – c。公元前 5500 - 2800 年成熟的哈拉潘 – c. 2800 - c。公元前 1900 年 晚哈拉潘 – c。1900 - c。公元前 1500 年 哈拉潘后 – c. 1500 - c。公元前600年 在印度河流域文明是现在经常用的更为有名的文化相比,埃及与美索不达米亚,但是这是一个相当新的发展。公元 1829 年哈拉帕的发现是印度存在任何此类文明的第一个迹象,到那时,埃及 象形文字已经被破译,埃及和美索不达米亚遗址被挖掘出来,楔形文字很快就会被学者乔治·史密斯 (1840-1876 CE) 翻译。因此,印度河流域文明的考古发掘起步相对较晚,现在认为埃及和美索不达米亚的许多成就和“第一”实际上可能属于印度河流域文明。 该文明的总人口被认为已超过 500 万,其领土沿印度河延伸超过 900 英里(1,500 公里)。 这种文化中最著名的两个挖掘城市是哈拉帕和摩亨佐-达罗(位于现代巴基斯坦),这两个城市都被认为曾经有 40,000-50,000 人之间的人口,当人们意识到大多数古代城市平均有10,000人居住。该文明的总人口被认为已超过 500 万,其领土沿着印度河沿岸延伸超过 900 英里(1,500 公里),然后向外四面八方。在尼泊尔边界附近、阿富汗、印度海岸和德里周围发现了印度河流域文明遗址,仅举几例。 之间 C. 1900 - c。公元前1500年,文明因不明原因开始衰落。在公元 20 世纪早期,这被认为是由于来自北方的浅肤色民族雅利安人的入侵,他们征服了西方学者将其定义为达罗毗荼人的深色皮肤民族。这种被称为雅利安人入侵理论的说法已经不可信。雅利安人 - 其种族与伊朗波斯人有关 - 现在被认为已经和平地迁移到该地区并将他们的文化与土著人民的文化融为一体,而现在人们理解达罗毗荼人是指任何种族的人达罗毗荼语言之一。 印度河流域文明为何衰落和衰落尚不得而知,但学者们认为这可能与气候变化、萨拉斯瓦蒂河干涸、灌溉农作物的季风路径改变、城市人口过剩、与埃及和美索不达米亚的贸易下降,或以上任何一种的组合。在今天,迄今为止发现的许多遗址仍在继续挖掘,未来的一些发现可能会提供有关该文化历史和衰落的更多信息。 发现与早期发掘 印度河流域文明人的文物上的符号和铭文,被一些学者解释为一种书写系统,仍未破译,因此考古学家通常避免定义文化的起源,因为任何尝试都是推测性的。迄今为止,关于文明的所有信息都来自在不同地点挖掘的物证。因此,印度河流域文明的故事最好以公元 19 世纪遗址的发现来说明。 詹姆斯·刘易斯(更广为人知的名字是查尔斯·马森,公元 1800-1853 年)是一名在东印度公司陆军炮兵部队服役的英国士兵,公元 1827 年,他与另一名士兵一起逃跑。为了避免被当局发现,他将自己的名字改为查尔斯·马森,并开始了一系列遍及印度的旅行。马森是一位狂热的钱币收藏家(钱币收藏家),他对古钱币特别感兴趣,并在遵循各种线索的过程中,独自挖掘了古遗址。这些遗址之一是他在公元 1829 年发现的 Harappa。在他的笔记中做了记录之后,他似乎很快就离开了该地点,但不知道谁可以建造这座城市,错误地将其归因于亚历山大大帝在印度的竞选活动中。公元前 326 年。 当马森在历险之后返回英国时(他的遗弃不知何故被原谅了),他于公元 1842 年出版了他的著作《在俾路支斯坦、阿富汗和旁遮普邦的各种旅程的叙述》,这引起了英国在印度当局的注意,尤其是,亚历山大坎宁安。亚历山大·坎宁安爵士(公元 1814-1893 年在位)是一位对古代历史充满热情的英国工程师,他于公元 1861 年创立了印度考古调查局 (ASI),该组织致力于保持挖掘和保护的专业标准的历史遗迹。坎宁安开始对该遗址进行挖掘,并于公元 1875 年发表了他的解释(他在其中确定并命名了印度河流域文字),但这并不完整且缺乏定义,因为哈拉帕仍然与世隔绝,与任何已知的过去可能建造它的文明都没有联系。 公元 1904 年,任命了 ASI 的新主管约翰·马歇尔(John Marshall,1876-1958 年在位),他后来访问了哈拉帕并得出结论,该遗址代表了一个以前未知的古代文明。他下令彻底挖掘该遗址,大约在同一时间,他听说了几英里外的另一个遗址,当地人将其称为 Mohenjo-daro(“死人丘”),因为那里有动物和人类的骨头,在那里发现了各种文物。摩亨佐达罗的发掘始于 1924-1925 年的季节,两个遗址的相似之处得到了认可;发现了印度河流域文明。 哈拉帕与摩亨佐达罗 被称为吠陀经的印度教文本,以及其他伟大的印度传统著作,如摩诃婆罗多和罗摩衍那,已经为西方学者所熟知,但他们不知道是什么文化创造了它们。当时的系统性种族主义使他们无法将这些作品归于印度人民,同样,起初,考古学家也因此得出结论,哈拉帕是美索不达米亚苏美尔人的殖民地,或者可能是埃及的前哨。 Harappa 不符合埃及或美索不达米亚建筑,然而,因为没有寺庙、宫殿或纪念性建筑的证据,没有国王或王后、石碑或皇家雕像的名字。这座城市占地 370 英亩(150 公顷),是由粘土制成的平屋顶的小型砖房。有一座城堡、城墙、街道呈网格状,清楚地展示了高度的城市规划技巧,比较这两个地点,挖掘者可以明显看出他们正在处理一种高度发达的文化。 两个城市的房屋都有抽水马桶、下水道系统,街道两边的固定装置是精心设计的排水系统的一部分,甚至比早期的罗马人还要先进。在波斯称为“捕风器”的设备安装在一些建筑物的屋顶上,为家庭或行政办公室提供空调,在摩亨佐达罗,有一个很大的公共浴室,周围环绕着一个庭院,台阶通向下方进去。 随着其他遗址的出土,同样的复杂程度和技巧也逐渐浮出水面,人们了解到所有这些城市都是预先规划好的。与通常从较小的农村社区发展起来的其他文化不同,印度河流域文明的城市是经过深思熟虑的,选择了一个地点,并在完全居住之前有目的地建造。此外,它们都表现出对单一愿景的一致性,该愿景进一步表明强大的中央 *** 和高效的官僚机构可以规划、资助和建设这样的城市。学者约翰·基伊评论: 令所有这些先驱感到惊讶的是,现在已知的数百个哈拉帕遗址的独特特征仍然是它们明显的相似性:“我们压倒性的印象是文化的统一性,无论是在哈拉帕文明繁荣的几个世纪中,还是在它占据了广阔的区域。” 例如,无处不在的砖块都是标准化的尺寸,就像哈拉帕人用来测量重量的石块也是标准的,并且基于模块化系统。道路宽度符合类似的模块;因此,街道的宽度通常是侧车道的两倍,而主干道的宽度是街道宽度的两倍或一倍半。迄今为止挖掘出的大部分街道都是笔直的,呈南北走向或东西走向。因此,城市规划符合规则的网格模式,并且似乎通过几个建设阶段保留了这种布局。(9) 公元 1944 年至 1948 年间,在英国考古学家莫蒂默·惠勒爵士 (Sir Mortimer Wheeler,1890 年至 1976 年在位) 的指导下,这两个遗址的挖掘工作仍在继续,他的种族主义意识形态使他难以接受黑皮肤人建造了这些城市。尽管如此,他还是成功地为哈拉帕建立了地层,并为印度河流域文明的后期分期奠定了基础。 年表 惠勒的工作为考古学家提供了从文明的基础到其衰落和衰落的大致日期的方法。如上所述,年表主要基于来自哈拉帕遗址的物证,但也来自他们与埃及和美索不达米亚的贸易往来的知识。仅举一种产品,青金石在两种文化中都非常受欢迎,虽然学者们知道它来自印度,但直到印度河流域文明被发现之前,他们才知道它的确切来源。尽管这种半宝石会在印度河流域文明没落后继续进口,但很明显,最初,部分出口产品来自该地区。 Pre-Harappan – c. 7000 - c。公元前 5500 年:新石器时代的最佳例证是 Mehrgarh 等遗址,这些遗址展示了农业发展、动植物驯化以及工具和陶瓷生产的证据。 早期的哈拉潘 – c。公元前 5500-2800 年:与埃及、美索不达米亚以及可能的中国建立牢固的贸易关系。居住在小村庄的社区在水道附近建造的港口、码头和仓库。 成熟的哈拉潘 – c. 2800 - c。公元前 1900 年:伟大城市的建设和广泛的城市化。哈拉帕和摩亨佐-达罗都在蓬勃发展 c. 公元前 2600 年。其他城市,如 Ganeriwala、Lothal 和 Dholavira,都是按照相同的模式建造的,土地的这种开发随着数百个其他城市的建设而继续,直到在整个土地上的各个方向都有 1,000 多个城市。 晚哈拉潘 – c。1900 - c。公元前 1500 年:文明的衰落与雅利安人从北方(很可能是伊朗高原)的迁移浪潮同时发生。物理证据表明气候变化导致了洪水、干旱和饥荒。与埃及和美索不达米亚失去贸易关系也被认为是一个促成原因。 哈拉潘后 – c. 1500 - c。公元前 600 年:城市被遗弃,人们向南迁移。到公元前 530 年居鲁士二世(大帝,公元前 550-530 年)入侵印度时,文明已经垮台。 文化方面 人们似乎主要是工匠、农民和商人。没有常备军的证据,没有宫殿,也没有寺庙。摩亨佐-达罗的大浴场被认为用于与宗教信仰有关的净化仪式,但这是推测;它可以很容易地成为一个公共娱乐池。每个城市似乎都有自己的州长,但据推测,一定存在某种形式的中央集权 *** ,以实现城市的统一。约翰·基伊评论: Harappan 工具、器具和材料证实了这种统一的印象。不熟悉铁——这在公元前第三个千年是无人知晓的——哈拉帕人使用由燧石、一种石英或铜和青铜制成的标准化工具套件,以“毫不费力的能力”进行切片、刮削、斜切和钻孔。这些最后,随着黄金和白银,是唯一可用的金属。它们还用于铸造器皿和小雕像,以及制作各种刀具、鱼钩、箭头、锯、凿子、镰刀、别针和手镯。(10) 在各个地点发现的数以千计的文物中,有直径略超过一英寸(3 厘米)的小型皂石印章,考古学家将其解释为在贸易中用于个人身份识别。与美索不达米亚的圆柱印章一样,这些印章被认为已被用于签署合同、授权土地销售以及在长途贸易中验证原产地、装运和收货。 人们发明了轮子、牛拉的车、宽到足以运输贸易货物的平底船,并且可能还发明了帆。在农业上,他们了解并利用灌溉技术和运河、各种农具,建立了不同的放牧区和庄稼区。生育仪式可能已经被观察到女性的丰收和怀孕,正如许多女性形式的小雕像、护身符和小雕像所证明的那样。人们认为人们可能崇拜一位母神,也可能崇拜一位男性配偶,被描绘成与野生动物在一起的有角的人物。然而,该文化的宗教信仰是未知的,任何建议都必须是推测性的。 通过大量发现的雕像、皂石印章、陶瓷和珠宝,可以看出他们的艺术技巧水平。最著名的艺术品是青铜小雕像,高 4 英寸(10 厘米),被称为“ *** ”,于公元 1926 年在摩亨佐-达罗发现。这幅作品展示了一个十几岁的女孩,右手放在臀部,左手放在膝盖上,下巴抬起,好像在评估求婚者的要求。同样令人印象深刻的作品是一个皂石雕像,高 6 英寸(17 厘米),被称为祭司王,描绘了一个戴着头饰和装饰臂章的大胡子男子。 艺术品的一个特别有趣的方面是在超过 60% 的个人印章上出现了似乎是独角兽。这些海豹上有许多不同的图像,但正如 Keay 指出的那样,独角兽出现在“在成熟的哈拉帕遗址发现的 1755 个海豹中的 1156 个和海豹”(17)。他还指出,无论印章上出现什么图像,也有被解释为印度河文字的标记,表明“文字”所传达的含义与图像不同。“独角兽”可能代表个人的家庭、氏族、城市或政治派别,并“书写”个人信息。 衰落和雅利安入侵理论 正如对于印章是什么、“独角兽”代表什么或人们如何崇拜他们的神的问题没有明确的答案一样,也没有关于文化衰落和衰落的原因。之间 C. 1900 - c。公元前 1500 年,城市逐渐被废弃,人们向南迁移。如前所述,有许多关于此的理论,但没有一个是完全令人满意的。根据其中之一,Gaggar-Hakra 河,在吠陀文本中被认为是萨拉斯瓦蒂河,它与印度河相邻,在 c. 公元前 1900 年,需要对依赖它的人们进行重大迁移。Mohenjo-daro 等地点的严重淤积表明大洪水是另一个原因。 另一种可能性是必要贸易商品的减少。美索不达米亚和埃及在同一时期都遇到了麻烦,这可能导致贸易严重中断。哈拉潘晚期与美索不达米亚的青铜时代中期(公元前 2119-1700 年)大致对应,在此期间,与印度河流域人民的主要贸易伙伴苏美尔人正在赶走古田入侵者,并在约 公元前 1792-1750 年,巴比伦国王汉谟拉比在巩固他的帝国时征服了他们的城邦。在埃及,这一时期对应于中王国后期(公元前 2040-1782 年),当时弱小的第 13 王朝在希克索斯人到来之前统治 以及中央 *** 权力和权威的丧失。 然而,20 世纪早期的 CE 学者抓住的原因不是这些,而是声称印度河流域的人已被一种浅肤色的雅利安人的优越种族的入侵征服并驱赶到南方。 雅利安人入侵理论 到惠勒挖掘这些遗址时,西方学者已经翻译和解释了印度的吠陀文献200 多年,并在那个时候发展出一种理论,即次大陆在某个时候被一种已知的浅肤色种族征服了。作为在整个土地上建立高雅文化的雅利安人。这一理论发展缓慢,起初是通过英威尔士语言学家威廉·琼斯爵士(公元 1746-1794 年)在公元 1786 年出版的著作而发展起来的。琼斯是梵文的狂热读者,他指出梵文与欧洲语言之间有显着的相似之处,并声称所有这些语言都必须有一个共同的来源;他称这个来源为原始印欧语系。 后来的西方学者试图确定琼斯的“共同来源”,得出的结论是,一个来自北方的浅肤色种族——欧洲附近的某个地方——征服了南方的土地,特别是印度,建立了文化并传播了他们的语言和习俗,尽管什么都没有,客观上支持了这个观点。一位名叫约瑟夫·亚瑟·德·戈比诺 (Joseph Arthur de Gobineau)(公元 1816-1882 年在位)的法国精英作家在他于公元 1855 年的著作《关于人类种族不平等的论文》中推广了这一观点,并声称优越的、浅肤色的种族具有“雅利安血统”并且自然倾向于统治较小的种族。 早期的伊朗人自称为雅利安人,意为“高贵”或“自由”或“文明”,直到它被欧洲种族主义者腐蚀以服务于他们自己的议程。 Gobineau 的书受到了德国作曲家理查德·瓦格纳(Richard Wagner,1813-1883 年在位)的赞赏,他的英国女婿休斯顿·斯图尔特·张伯伦(Houston Stewart Chamberlain,1855-1927 年在位)在他的作品中进一步普及了这些观点,最终影响了他的作品阿道夫·希特勒和纳粹意识形态的缔造者阿尔弗雷德·罗森博格 (L. 1893-1946 CE)。这些种族主义观点得到了德国语言学家和学者的进一步验证,他不同意这些观点,马克斯·穆勒 (1823-1900 CE),所谓的雅利安入侵理论的“作者”,他坚持认为,在他的所有工作中,雅利安人与语言差异有关,与种族无关。 然而,穆勒所说的并不重要,因为当惠勒在公元 1940 年代挖掘这些遗址时,人们已经在这些理论中呼吸了 50 多年的时代气息。大多数学者、作家和学者还需要几十年的时间才能开始认识到“雅利安人”最初指的是一类人——与种族无关——用考古学家 JP 马洛里的话来说,“作为种族名称,[雅利安] 一词最恰当地限于印度-伊朗人”(Farrokh,17)。早期的伊朗人自称为雅利安人,意思是“高贵”或“自由”或“文明”,这个词持续使用了 2000 多年,直到它被欧洲种族主义者腐蚀以服务于他们自己的议程。 Wheeler 对这些遗址的解释得到了雅利安人入侵理论的启发并得到了验证。雅利安人已经被公认为吠陀经和其他著作的作者,但他们在该地区的日期为时已晚,无法证明他们建造了令人印象深刻的城市的说法。不过,也许他们已经摧毁了他们。当然,惠勒和当时的任何其他考古学家一样了解雅利安人入侵理论,并通过这个镜头将他的发现解释为支持它;在这样做的过程中,他验证了该理论,然后该理论获得了更大的普及和接受。 结论 雅利安人入侵理论虽然仍然被那些有种族主义议程的人引用和推进,但在 1960 年代通过主要是美国考古学家乔治·F·戴尔斯的工作失去了信任,他审查了惠勒的解释,访问了这些遗址,但没有发现任何证据支持它。惠勒解释为在战斗中暴死的骷髅没有显示出这样的迹象,城市也没有表现出任何与战争相关的破坏。 此外,没有证据表明北方有任何大规模军队的动员,也没有任何征服的迹象c。公元前1900年在印度。波斯人——唯一自称为雅利安人的种族——他们自己是公元前 100 年之间伊朗高原上的少数民族。1900 - c。公元前 1500 年,并且无法发动任何形式的入侵。因此,有人提出“雅利安人入侵”实际上很可能是印度-伊朗人的迁徙,他们与印度土著人民和平融合、通婚并被文化同化。 随着对印度河流域文明遗址的不断发掘,更多的信息无疑将有助于更好地了解其历史和发展。对文化的巨大成就和高水平技术和复杂性的认可越来越多地曝光并受到更多关注。学者 Jeffrey D. Long 表达了普遍的看法,他写道:“由于其高水平的技术进步,人们对这个文明非常着迷”(198)。印度河流域文明已经被称为与埃及和美索不达米亚并列的三大古代文明之一,未来的发掘几乎肯定会提升其地位。
人脸识别是一个被广泛研究着的热门问题,大量的研究论文层出不穷,在一定程度上有泛滥成“灾”之嫌。
为了更好地对人脸识别研究的历史和现状进行介绍,本文将AFR的研究历史按照研究内容、技术方法等方面的特点大体划分为三个时间阶段,如表1所示。
该表格概括了人脸识别研究的发展简史及其每个历史阶段代表性的研究工作及其技术特点。
下面对三个阶段的研究进展情况作简单介绍:
第一阶段(1964年~1990年)
这一阶段人脸识别通常只是作为一个一般性的模式识别问题来研究,所采用的主要技术方案是基于人脸几何结构特征(Geometricfeature based)的方法。
这集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。
人工神经网络也一度曾经被研究人员用于人脸识别问题中。
较早从事AFR研究的研究人员除了布莱索(Bledsoe)外还有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。
金出武雄于1973年在京都大学完成了第一篇AFR方面的博士论文,直到现在,作为卡内基-梅隆大学(CMU)机器人研究院的一名教授,仍然是人脸识别领域的活跃人物之一。
他所在的研究组也是人脸识别领域的一支重要力量。
总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。
第二阶段(1991年~1997年)
这一阶段尽管时间相对短暂,但却是人脸识别研究的 *** 期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的FERET人脸识别算法测试,并出现了若干商业化运作的人脸识别系统,比如最为著名的Visionics(现为Identix)的FaceIt系统。
美国麻省理工学院(MIT)媒体实验室的特克(Turk)和潘特兰德(Pentland)提出的“特征脸”方法无疑是这一时期内最负盛名的人脸识别方法。
其后的很多人脸识别技术都或多或少与特征脸有关系,现在特征脸已经与归一化的协相关量(NormalizedCorrelation)方法一道成为人脸识别的性能测试基准算法。
这一时期的另一个重要工作是麻省理工学院人工智能实验室的布鲁内里(Brunelli)和波基奥(Poggio)于1992年左右做的一个对比实验,他们对比了基于结构特征的方法与基于模板匹配的方法的识别性能,并给出了一个比较确定的结论:模板匹配的方法优于基于特征的方法。
这一导向性的结论与特征脸共同作用,基本中止了纯粹的基于结构特征的人脸识别方法研究,并在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展,使其逐渐成为主流的人脸识别技术。
贝尔胡米尔(Belhumeur)等提出的Fisherface人脸识别方法是这一时期的另一重要成果。
该方法首先采用主成分分析(Principalponent Analysis,PCA,亦即特征脸)对图像表观特征进行降维。
在此基础上,采用线性判别分析(LinearDiscriminant Analysis, LDA)的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。
该方法目前仍然是主流的人脸识别方法之一,产生了很多不同的变种,比如零空间法、子空间判别模型、增强判别模型、直接的LDA判别方法以及近期的一些基于核学习的改进策略。
麻省理工学院的马哈丹(Moghaddam)则在特征脸的基础上,提出了基于双子空间进行贝叶斯概率估计的人脸识别方法。
该方法通过“作差法”,将两幅人脸图像对的相似度计算问题转换为一个两类(类内差和类间差)分类问题,类内差和类间差数据都要首先通过主成分分析(PCA)技术进行降维,计算两个类别的类条件概率密度,最后通过贝叶斯决策(最大似然或者最大后验概率)的方法来进行人脸识别。
人脸识别中的另一种重要方法——弹性图匹配技术(Elastic GraphMatching,EGM) 也是在这一阶段提出的。
其基本思想是用一个属性图来描述人脸:属性图的顶点代表面部关键特征点,其属性为相应特征点处的多分辨率、多方向局部特征——Gabor变换[12]特征,称为Jet;边的属性则为不同特征点之间的几何关系。
对任意输入人脸图像,弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点,同时提取它们的Jet特征,得到输入图像的属性图。
最后通过计算其与已知人脸属性图的相似度来完成识别过程。
该方法的优点是既保留了面部的全局结构特征,也对人脸的关键局部特征进行了建模。
近来还出现了一些对该方法的扩展。
局部特征分析技术是由洛克菲勒大学(RockefellerUniversity)的艾提克(Atick)等人提出的。
LFA在本质上是一种基于统计的低维对象描述方法,与只能提取全局特征而且不能保留局部拓扑结构的PCA相比,LFA在全局PCA描述的基础上提取的特征是局部的,并能够同时保留全局拓扑信息,从而具有更佳的描述和判别能力。
LFA技术已商业化为著名的FaceIt系统,因此后期没有发表新的学术进展。
由美国国防部反毒品技术发展计划办公室资助的FERET项目无疑是该阶段内的一个至关重要的事件。
FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。
该项目包括三部分内容:资助若干项人脸识别研究、创建FERET人脸图像数据库、组织FERET人脸识别性能评测。
该项目分别于1994年,1995年和1996年组织了3次人脸识别评测,几种最知名的人脸识别算法都参加了测试,极大地促进了这些算法的改进和实用化。
该测试的另一个重要贡献是给出了人脸识别的进一步发展方向:光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。
柔性模型(Flexible Models)——包括主动形状模型(ASM)和主动表观模型(AAM)是这一时期内在人脸建模方面的一个重要贡献。
ASM/AAM将人脸描述为2D形状和纹理两个分离的部分,分别用统计的方法进行建模(PCA),然后再进一步通过PCA将二者融合起来对人脸进行统计建模。
柔性模型具有良好的人脸合成能力,可以采用基于合成的图像分析技术来对人脸图像进行特征提取与建模。
柔性模型目前已被广泛用于人脸特征对准(FaceAlignment)和识别中,并出现了很多的改进模型。
总体而言,这一阶段的人脸识别技术发展非常迅速,所提出的算法在较理想图像采集条件、对象配合、中小规模正面人脸数据库上达到了非常好的性能,也因此出现了若干知名的人脸识别商业公司。
从技术方案上看, 2D人脸图像线性子空间判别分析、统计表观模型、统计模式识别方法是这一阶段内的主流技术。
第三阶段(1998年~现在)
FERET’96人脸识别算法评估表明:主流的人脸识别技术对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。
因此,光照、姿态问题逐渐成为研究热点。
与此同时,人脸识别的商业系统进一步发展。
为此,美国军方在FERET测试的基础上分别于2000年和2002年组织了两次商业系统评测。
基奥盖蒂斯(Gehiades)等人提出的基于光照锥 (Illumination Cones) 模型的多姿态、多光照条件人脸识别方法是这一时期的重要成果之一,他们证明了一个重要结论:同一人脸在同一视角、不同光照条件下的所有图像在图像空间中形成一个凸锥——即光照锥。
为了能够从少量未知光照条件的人脸图像中计算光照锥,他们还对传统的光度立体视觉方法进行了扩展,能够在朗博模型、凸表面和远点光源假设条件下,根据未知光照条件的7幅同一视点图像恢复物体的3D形状和表面点的表面反射系数(传统光度立体视觉能够根据给定的3幅已知光照条件的图像恢复物体表面的法向量方向),从而可以容易地合成该视角下任意光照条件的图像,完成光照锥的计算。
识别则通过计算输入图像到每个光照锥的距离来完成。
以支持向量机为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。
支持向量机是一个两类分类器,而人脸识别则是一个多类问题。
通常有三种策略解决这个问题,即:类内差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。
布兰兹(Blanz)和维特(Vetter)等提出的基于3D变形(3D Morphable Model)模型的多姿态、多光照条件人脸图像分析与识别方法是这一阶段内一项开创性的工作。
该方法在本质上属于基于合成的分析技术,其主要贡献在于它在3D形状和纹理统计变形模型(类似于2D时候的AAM)的基础上,同时还采用图形学模拟的方法对图像采集过程的透视投影和光照模型参数进行建模,从而可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开,更加有利于人脸图像的分析与识别。
Blanz的实验表明,该方法在CMU-PIE(多姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率,证明了该方法的有效性。
2001年的国际计算机视觉大会(ICCV)上,康柏研究院的研究员维奥拉(Viola)和琼斯(Jones)展示了他们的一个基于简单矩形特征和AdaBoost的实时人脸检测系统,在CIF格式上检测准正面人脸的速度达到了每秒15帧以上。
该方法的主要贡献包括:1)用可以快速计算的简单矩形特征作为人脸图像特征;2)基于AdaBoost将大量弱分类器进行组合形成强分类器的学习方法;3)采用了级联(Cascade)技术提高检测速度。
目前,基于这种人脸/非人脸学习的策略已经能够实现准实时的多姿态人脸检测与跟踪。
这为后端的人脸识别提供了良好的基础。
沙苏哈(Shashua)等于2001年提出了一种基于商图像[13]的人脸图像识别与绘制技术。
该技术是一种基于特定对象类图像集合学习的绘制技术,能够根据训练集合中的少量不同光照的图像,合成任意输入人脸图像在各种光照条件下的合成图像。
基于此,沙苏哈等还给出了对各种光照条件不变的人脸签名(Signature)图像的定义,可以用于光照不变的人脸识别,实验表明了其有效性。
巴斯里(Basri)和雅各布(Jacobs)则利用球面谐波(Spherical Harmonics)表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要的结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。
这意味着一个凸的朗博表面物体在各种光照条件下的图像集合可以用一个低维的线性子空间来近似。
这不仅与先前的光照统计建模方法的经验实验结果相吻合,更进一步从理论上促进了线性子空间对象识别方法的发展。
而且,这使得用凸优化方法来强制光照函数非负成为可能,为光照问题的解决提供了重要思路。
FERET项目之后,涌现了若干人脸识别商业系统。
美国国防部有关部门进一步组织了针对人脸识别商业系统的评测FRVT,至今已经举办了两次:FRVT2000和FRVT2002。
这两次测试一方面对知名的人脸识别系统进行了性能比较,例如FRVT2002测试就表明Cognitec, Identix和Eyematic三个商业产品遥遥领先于其他系统,而它们之间的差别不大。
另一方面则全面总结了人脸识别技术发展的现状:较理想条件下(正面签证照),针对37437人121,589 幅图像的人脸识别(Identification)最高首选识别率为73%,人脸验证(Verification)的等错误率(EER[14])大约为6%。
FRVT测试的另一个重要贡献是还进一步指出了目前的人脸识别算法亟待解决的若干问题。
例如,FRVT2002测试就表明:目前的人脸识别商业系统的性能仍然对于室内外光照变化、姿态、时间跨度等变化条件非常敏感,大规模人脸库上的有效识别问题也很严重,这些问题都仍然需要进一步的努力。
总体而言,目前非理想成像条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。
而非线性建模方法、统计学习理论、基于Boosting[15]的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。
总而言之, 人脸识别是一项既有科学研究价值,又有广泛应用前景的研究课题。
国际上大量研究人员几十年的研究取得了丰硕的研究成果,自动人脸识别技术已经在某些限定条件下得到了成功应用。
这些成果更加深了我们对于自动人脸识别这个问题的理解,尤其是对其挑战性的认识。
尽管在海量人脸数据比对速度甚至精度方面,现有的自动人脸识别系统可能已经超过了人类,但对于复杂变化条件下的一般人脸识别问题,自动人脸识别系统的鲁棒性和准确度还远不及人类。
这种差距产生的本质原因现在还不得而知,毕竟我们对于人类自身的视觉系统的认识还十分肤浅。
但从模式识别和计算机视觉等学科的角度判断,这既可能意味着我们尚未找到对面部信息进行合理采样的有效传感器(考虑单目摄像机与人类双眼系统的差别),更可能意味着我们采用了不合适的人脸建模方法(人脸的内部表示问题),还有可能意味着我们并没有认识到自动人脸识别技术所能够达到的极限精度。
但无论如何,赋予计算设备与人类似的人脸识别能力是众多该领域研究人员的梦想。
相信随着研究的继续深入,我们的认识应该能够更加准确地逼近这些问题的正确答案。
346 浏览 7 回答
169 浏览 2 回答
114 浏览 3 回答
169 浏览 6 回答
155 浏览 3 回答
333 浏览 5 回答
286 浏览 3 回答
208 浏览 3 回答
178 浏览 4 回答
225 浏览 2 回答
241 浏览 2 回答
305 浏览 2 回答
267 浏览 1 回答
247 浏览 2 回答
234 浏览 1 回答