自动的概念比较宽泛。是指自动查全IEEE站的论文并自动下载,还是提供一个URL然后自动下载页面内的论文PDF并且提取元数据,还是给关键字自动下载搜索结果列表的论文?你需要自己先明确自己的需求,这些“自动”实现的难度是不一样的。听你的意思是,你所在的网络环境应该是能够下载IEEE的PDF格式论文吧,要注意的是如果批量下载大量论文的话,可能会被屏蔽C段地址造成别人也无法访问哦。
Python是可以的,可以自己从urllib的基础开始,也可以用模拟浏览器,也有scrapy这样的框架。总之,技术上是可行的。
如果只是写论文整理文献,可以学习使用Zotero,可以很方便的自动下载页面内的论文并生成元数据,引用和批注都很方便,除了IEEE的网站也支持其他非常多的网站类型。
比较官方的说法,python是一种解释型语言,解释型语言是指代码一行一行的解释执行,就好像有个 同声传译 ,你每说一句话,他都能不间断地给你翻译,把你说的话(意指写好的代码)翻译成机器能够理解的语言。对于机器来说,这些翻译后的语言就是机器语言,就是指令,机器收到指令后,就会根据指令执行对应的操作。
与解释型语言相对的,有编译型语言,编译型语言则通过编译器先将代码翻译成机器语言,再交给机器去执行。举个例子,我方主持了一个会议,参会的分别有英国人、俄国人和西班牙人,他们三方都带了自己的同声传译。假如是解释型语言呢,我在开会的时候用一种每个同声传译都听得懂的的语言,也就是一种官方用语。这样我可以不间断地用这种语言来做交流,因为这些翻译人员都会为这三国参会人员同步翻译成目标语言,你应该也注意到了,解释型语言类似于一种通用的语言。而如果是编译型语言呢,我会让我这边的3个翻译人员将我的一份中文演讲稿,分别翻译成英文版的、俄文版的和西班牙语版的,在开会的时候,我只要交给参会的国际友人去翻阅就好了。解释型语言侧重的是一种通用的、能够实时解释翻译的特性,而编译型语言侧重的是有针对性、提前准备的特性。然而,在开会的时候,解释型效率是没有那么高的,因为需要同声传译消耗时间去做翻译,而编译型的效率会高些,因为翻译工作已经在开会前做好了,只需要参会人员理解并且执行就好。
1989年的圣诞节,荷兰程序员Guido van Rossum( 吉多·范罗苏姆 ,以下简称吉多)在家休假无聊,为了打发时间,他开发了一种新的解释型语言。可见,该程序员无聊的时候,就是写代码。因为作者非常喜欢 Monty Python's Flying Circus (巨蟒剧团之飞翔的马戏团,这是英国的一个电视喜剧),就拿python作为这个新语言的名字。我想大家不一定都知道这部喜剧,但是可能都听说过python,可能微信在几天前给你推过python相关的培训广告,可能一些学校已经将掌握python基础概念作为一门选修课,可能你的智能家居里的操作系统有一部分核心代码是用python实现的,可能你的手机里有一个插件也是用python实现的,python现在的应用范围非常广泛,功能也非常强大。
吉多之前在 荷兰数学和计算机科学研究学会 上班,在那里,他为ABC编程语言工作了好多年。 ABC语言长这样的
这是一个函数,你也许看不懂,根据英文单词,或许可以大概猜出点什么。这里只想让你知道,python也差不多长这样,相比较会更容易理解些。
ABC虽然是一门编程语言,它的定位是作为教学或原型设计的工具,是专门为学校老师或者科研人员设计的。ABC的定位决定了它受众不是很广泛,并且它也有使用门槛,对计算机不了解的人,没有经过一段时间的学习,可能根本就上不了手。所以,ABC并不能作为一门通用的编程语言,在业内也无法获得成功。虽然说ABC没有python那么成功,但是ABC可以说是"the mother of python",作者在很多地方都借鉴了ABC,取其精华、取其糟粕。现如今,python是长这样的
可能对于没接触过编程的人来说,它们两不都是一样的,不都是一堆英文字母么,我都看不懂。但是对于初学计算机课程,那些需要学习C语言的人来说,python相比较算是更容易理解了。python非常简短,一些复杂的流程,在C语言中,可能需要几十行代码,但是在python中,可能就只需要几行代码。当然不同的业务场景,可能不是这样的,但是普遍情况下,用python的开发效率是非常高的。python适合快速开发,适合产品快速迭代出新。
1999年1月,也就是语言面世的10年后, 吉多 向DARPA(Defense Advanced Research Projects Agency,美国国防部一个负责科研的下属机构)申请资金。我去翻了下该申请的修订版,修订版在1999年8月份提交,修订版比第一版内容更具有概括性,并且内容翔实,条理清晰,值得翻阅。
该修订版叫 Computer Programming for Everybody ,直译过来,就是针对每个人的计算机编程,翻译为通俗易懂的词——人人编程,人人编程是一种 社会 现象,每个人都有一定的编程能力,并且对计算机有一定的认识,了解软硬件是怎么运转起来的,了解一些软硬件的设计规范,能够通过编程来表达自己的想法,能够通过编程来配置自己的软件,通过编程来控制自己的机器,以改善自己的生活。举个例子,你在某宝买了一个扫地机器人,该机器人支持定义打扫路线,支持设置扫地机器人在需要更换扫把的时候,指示灯显示指定的颜色。你知道扫地机器人可以做什么,有什么操作习惯,这是基于你对一些机器的理解,如果你用过很多软件,或者参与过软件的设计,你大概都知道一些软件可能都有“设置”、“编辑”或“帮助”等菜单键。这种设计思维,或者操作习惯,都是很多软件都有的,有了这种认识之后,你面对很多同类型的软件、或者同类型的产品,就大概能够知道从那里入手,以及对它有什么功能,都有一个初步的期待或者认识。既然大家都了解计算机了,那么计算机的一些概念或者说是理念,可以说是属于常识的一部分,面对一些计算机或者说智能设备,也大概知道从哪里上手使用。我觉得这就是作者要达到的愿景。
该修订版主要有几个目的:
在这里,他想从推广python开始,因为python作为一门适合快速开发的工具,既适合专家,也适合初学者,同时python有一个活跃的且不断增长的用户群体,这个用户群体对他这个申请也非常感兴趣,愿意为之努力。python的用户数多,说明已经在市场得到了一定的认可,并且这个用户群体也愿意为python的发展做贡献,这对于一门编程语言来说,最好不过了。
该提案的 基本论点 部分写得很好,他说他想普及计算机应用,但并非通过介绍新的硬件,或者新软件这种形式,而是通过赋予每个人编程能力来实现。信息技术的发展给了人们各种强大的计算机,它们以桌面电脑、笔记本电脑或者嵌入式系统的形式存在,如果用户在软件设计和实现上有一个通用的认知,那将会极大地促进生产和创造,并且对未来有深远的影响。试想一下,如果你有一种修改和配置软件的能力,并且你可以把你的修改通过社区网站分享其他人,其他人碰到同样的问题的话,就可以参照你的方法。这种能力在紧急的情况下是很重要的,你不必等专家来给你解决问题,你自己就可以尝试解决这些问题。说到这里,你有没有想起贴吧,或者论坛,论坛有很多个板块,不同的领域分不同的板块,假如你想root手机(手机越狱,指解除手机厂商的限制,获取手机的用户最高权限,以实现对手机的某种控制),你可以到论坛上root板块找答案,这种形式可谓跟吉多提到的是一样的。如果你对你的手机或者电脑有更深入的了解,你可以通过编程改善你的输入法,或者改变你的显示器冷暖色等等,这些都是对你生活有帮助的。吉多在这里就是想达到这种状态,简单点说,人人都对计算机有一定的了解,且都有处理计算机问题的能力。
为了实现这个目标,作者制定了5年计划,这个5年计划如下:
5年计划循序渐进,由浅入深。1999年3月,美国国防部对此进行了回应,同意拨款给他。作者的5年计划在1999年底开始实施,虽然想推进5年,但是只收到1年的资金支持。不过,作者还是没有放弃这个项目,一直推进,直到他不再参与python的工作。当时美国国防部对他们提供了多少资金呢,我没看到官方公开的数据。2013年有报道称,DARPA向Continuum Analytics提供3百万美元的支持,让该公司给python开发数据处理以及数据可视化工具。具体数字是否可靠,这个尚不清楚,但管中窥豹,可见美国国防部对该项目表示认可,并提供了资金支持。Continuum Analytics有一个比较有名的工具,叫Anaconda,Anaconda可以理解为是python + 各种科学计算库的工具箱,Anaconda官网有这么一句话
翻译为“Continuum Analytics的Anaconda是使用python的、领先的开源科学计算平台,我们赋予那些正在改变世界的人超能力。”
在查资料的时候,我发现了一个wiki论坛, 该论坛对该项目进行了评价,论坛列出了该项目成功的地方和失败的地方,以及一些 社会 人士的看法。论坛这样总结道,这个项目成功的地方在于:
这个项目失败的地方在于:
回想自己初学python的时候,我觉得这个总结是很公正的。python确实容易入门,有编程基础的人可能只需要一个星期就能掌握python的一些基本语法。相比C语言,python对于初学者是很友好的,很容易让人上手。但是,要深入理解python,并没有这么简单,需要花很多时间去磨练。接手一个使用python的项目,你需要花一些时间精力去熟悉,去摸透里面的逻辑,这对于初学者来说,是无法避免的。 对于一个程序员来说,作者能想象到以后计算机的普及应用,以及用户的认知水平,还有他能够做什么,通过什么来实现,能有这些远大的抱负,这是非常不容易的。西方世界经常说到“change the world,make the world a better place”,作者也确实做到了,他设计的python在计算机世界里扮演者一个非常重要的角色。如果通过 科技 能够改变世界,那么python就是改变世界的其中一步。1980-2000年,美国对 科技 公司是政策扶持、技术扩散,这期间涌现了如IBM、HP、思科等 科技 公司,大家熟知的微软和苹果都是在这期间上市的。python可以说是这个 科技 运动的一个缩影,在 科技 浪潮的推动下,python得到了长足的发展。
很多 科技 或工业相关的网站会根据当年编程语言的流行度做下排名,它们会列出当年在业界最受欢迎的编程语言。其中,IEEE Spectrum 和 TIOBE 的2021年度编程语言是python,如果我还没记错的话,TIOBE的2020年度编程语言也是python。可见python是非常受欢迎的,用现在的话讲,就是“网红”编程语言。现在,很多计算设备上都有python的身影,小到智能家居、手机、智能手表,大到锂电车、工控车床、甚至航天飞机都有python的身影。你可能在浏览网页的时候,右下角弹出一个“7天python入门”的广告,可见python现在还是有很多需求,因为有需求,所以才有人去投广告,才会有人去找培训机构。
作者在给美国国防部的提案中写到,他想跟高中或大学展开合作,设计一些python的课程,针对不同年级,设计不同水平的课程。现在来看,他确实是做到了,现在哈佛、密歇根大学等排名靠前的大学,都有python课程,python在这些大学的CS(计算机科学)课程中应用非常广泛,可以说是作为CS导论的一个教学工具。在一些比较高级的课程,比如数据科学、人工智能等都可以看到python的身影,这是因为学术界以及工业界为python提供了一些处理科学计算和大数据的工具,这也归功于美国国防部的支持。美国有许多编程夏令营,针对不同年龄段有不同的课程,并且也有许多支持python代码的编程竞赛。Google在coursera上有一个面向初学者的课程,该课程叫 Google IT Automation with Python,完成课程大约需要 8 个月,课程建议每周花5小时学习,课程结束后就可以获得Google颁发的证书。可见,不管是工业界,还是教育界,都对python有不同程度的支持。这里打个岔,第一版的Google搜索引擎还是用python写的,作者也在Google工作了一段时间。
现如今,每隔一段时间,就有一个PyCon活动,这个活动汇聚世界各地的开发者,每年都有开发者来展示他们使用python的成功案例,或者表达自己对python的新功能或者缺陷的看法。可见,python用户社区一直都是很活跃的。这让我想到了某新能源 汽车 ,该 汽车 用户有很高的粘性,有一位车主跟我说过,他们有一个微信群,里面有该新能源 汽车 的高管,很多车主乐意在里面指出问题,或者提建议,因为这些高管会对问题或者建议做出相应的反馈。用户愿意提意见,产品经理愿意广开言路,采纳多方建议,实属不易。python社区也差不多如此。
几年前,你是否看过一个新闻,《人工智能“网红”编程语言Python进入山东小学课本》,这是2017年澎湃网的一则新闻,里面讲了python进入了山东省小学六年级教材,作为一门“网红”编程语言,它是否适合低龄学生,这个倒是没细说,但是可见国内有些地方是把编程作为一种比较基础的能力来考量。python往低龄阶段渗透是否合适呢,我在翻资料的时候瞥到韩国高丽大学的一篇论文,论文讲述小学生在学习python的过程中会碰到一些困难,比如经常少打了一些括号,经常拼错单词,经常碰到语法错误,以及对这些现象的看法。还有,南京师范大学有一篇报道,讲述了中学生学习在学习python时,采用面向问题的学习模式,我理解是case by case的教学模式,这种模式有利于学生培养学生的计算机思维,以及帮助他们理解一些计算机相关的概念,解决计算机相关的问题。
python是否适合低龄学生呢,我觉得这个是值得讨论的话题。最后还要问你一句,你会让你的小孩学习python么,从什么时候开始学呢?你的娃因为不知道打多少个括号嚎啕大哭时,你能帮得上忙么?你到时候需要专门请一个程序员来给你的娃做家教么?