首先来简单了解一下需要的模块,然后打开需要的模块urllib.request,打开Google的URL进行交互HTTPResponse对象,然后调用函数geturl返回根据URL得到的资源。
然后假如想要查看网页的HTML代码,可以调用里面的变量url的方法read来实现,接下来调用info函数返回源数据,然后进行下载文件的实现,并且进行数据的读写和存储。
接下来是进行把网络对象进行复制到本地文件里面,使用参数urlretrieve将要保存的文件指定路径,不使用就会默认被当作临时文件随机命名然后保存,可以为将来起到查找的方便之处。
然后就能设置当你进行浏览器访问网页时,浏览器就能进行用户代理,用户代理字段也可以进行自己设置,很简单的设置,有一些网站不一定会识别,需要进行简单的设置就能识别了,只需要改变字段的值就可以了。
相关说明
超级链接在本质上属于一个网页的一部分,它是一种允许我们同其他网页或站点之间进行连接的元素。各个网页链接在一起后,才能真正构成一个网站。
所谓的超链接是指从一个网页指向一个目标的连接关系,这个目标可以是另一个网页,也可以是相同网页上的不同位置,还可以是一个图片,一个电子邮件地址,一个文件,甚至是一个应用程序。而在一个网页中用来超链接的对象,可以是一段文本或者是一个图片。当浏览者单击已经链接的文字或图片后,链接目标将显示在浏览器上,并且根据目标的类型来打开或运行。