LinuxEye - Linux系统教程

LinuxEye - Linux系统教程

当前位置: 主页 > 脚本编程 >

使用Python抓取网站图片

时间:2013-06-27 23:10来源:www.linuxeye.com 编辑:LinuxEye 点击:
使用Python抓取网站图片 #!/usr/bin/env python#coding:utf8import re,urlliburl=https://linuxeye.com/def getHtml(): page = urllib.urlopen(url) html = page.read() return htmldef getImg(html): reg = rimg src=(.*?\.\w{3,4}) imgre = re.co
使用Python抓取网站图片
#!/usr/bin/env python
#coding:utf8
import re,urllib
url='https://linuxeye.com/'
def getHtml():
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'<img src="(.*?\.\w{3,4})"'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    n = 0
    print imglist
    for imgurl in imglist:
        n=n+1
        pic_suffix = imgurl.split('.')[-1]
        if imgurl[0:4] == 'http':
            print imgurl
            urllib.urlretrieve(imgurl,'%d.%s' % (n,pic_suffix))
        else:
            print url + imgurl
            urllib.urlretrieve(url + imgurl,'%d.%s' % (n,pic_suffix))

U=getHtml()
getImg(U)

转载请保留固定链接: https://linuxeye.com/program/1791.html

------分隔线----------------------------
标签:Python
栏目列表
推荐内容