在抓取维基百科网页的时候有报错-SSL-CERTIFICATE_VERIFY_FAILED

coding2live 2021-01-29 15:17:47 182

我在爬取网页的时候,遇到了一个证书的问题:

from urllib.request import urlopen 
from bs4 import BeautifulSoup 
import re

pages = set()
def getLinks(pageUrl):
    global pages
    html = urlopen("http://en.wikipedia.org"+pageUrl)
    bsObj = BeautifulSoup(html)
    for link in bsObj.findAll("a", href=re.compile("^(/wiki/)")):
        if 'href' in link.attrs:
            if link.attrs['href'] not in pages:
                #We have encountered a new page
                newPage = link.attrs['href'] 
                print(newPage) 
                pages.add(newPage) 
                getLinks(newPage)
getLinks("")

报错是:

  File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/urllib/request.py", line 1319, in do_open
    raise URLError(err)
urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1049)>

以下答案仅供参考

我也遇到过这个问题。

如果你的操作系统是macOS,那按照如下步骤去解决:
转到Macintosh HD >应用程序> Python3.X文件夹>双击“Install Certificates.command”文件

问题就解决了。