我们进行网络爬虫的过程中,可以使用JavaScript获取链接处跳转后的真实地址。而这个过程的实现离不开phantomjs,phantomjs适用于无头浏览器,可以用于无UI界面的网站测试、屏幕快照、页面操作自动化、网页监控和网络爬虫等。本文将向大家介绍phantomjs。
一、phantomjs介绍
一个基于webkit内核的无头浏览器。没有UI界面,它就是一个浏览器,是一个可编程的无头浏览器。
一个纯后台的,完整功能的浏览器,这东西就有很多可以想像的空间了 —— 抓取,测试等。
二、phantomjs官方
官方地址:http://phantomjs.org/。
官方API:http://phantomjs.org/api/。
官方示例:http://phantomjs.org/examples/。
PhantomJS GitHub:https://github.com/ariya/phantomjs/。
三、使用
1、无UI界面的网站测试
2、屏幕快照
3、页面操作自动化
4、网络监控
5、网络爬虫
phantomjs不仅是个隐形的浏览器,它还提供了诸如CSS选择器、支持Web标准、DOM操作、JSON、HTML5、Canvas、SVG等,同时也提供了处理文件I/O的操作,从而使我们可以向操作系统读写文件哦~