一、Python(爬虫)
爬虫可以形象地理解为在网络上爬行的一只蜘蛛,将互联网比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛,如果它遇到资源,那么它就会抓取下来。比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张网上来获取数据。爬虫可以抓取的某个网站或者某个应用的内容,提取有用的价值,也可以模拟用户在浏览器或者 App 应用上进行操作,实现自动化的程序。通过下面的实例学习,能够掌握网页的一般结构,使用 requests 库抓取网站数据,使用 Beautiful Soup 解析网页,清洗整理数据。