Google Chrome最新版本发布了一个新的实用功能Headless Chrome 。 无头Chrome对浏览器自动化非常有用。 您可以使用命令行和编程语言捕获任何网页的屏幕截图,而无需启动Chrome GUI。 它还支持打印网页DOM并创建网页的pdf。 本教程将帮助您在Linux命令行上使用Google Chrome Headless功能。
1.启动无头Chrome
打开系统控制台,并使用--headless
命令行选项更多地启动Google Chrome无头。
$ google-chrome --headless http://www.example.com
这种无头模式还支持远程调试选项,以检查发生的情况。 您可以在任何其他浏览器的指定端口上访问系统,并检查在那里渲染的内容。 在指定端口上使用以下命令启动调试:
$ google-chrome --headless --remote-debugging-port=9222 https://google.com
现在在另一个Web浏览器中访问http:// localhost:9222 。
无头Chrome还具有许多其他有用的功能,如打印DOM,捕获截图或通过命令行创建任何网页的pdf。
2.捕获网页屏幕截图
您可以使用--screenshot
选项来捕获任何网页的截图。 输出屏幕截图将保存在当前目录中。 欲了解更多详情, 请访问这里 。
$ goolge-chrome --headless --disable-gpu --screenshot http://www.example.com/
3.创建网页PDF
您可以使用--print-to-pdf
选项创建任何网页的PDF。 输出pdf文件将保存在当前目录下。 欲了解更多详情, 请访问这里 。
$ google-chrome --headless --disable-gpu --print-to-pdf http://www.example.com/
4.打印网页DOM
您可以使用--dump-dom
标志将document.body.innerHTML打印到标准输出。
-dump-dom标志将document.body.innerHTML打印到stdout:
$ google-chrome --headless --disable-gpu --dump-dom http://www.example.com/
参考:访问以下链接以了解有关无头Chrome的更多详细信息。
https://developers.google.com/web/updates/2017/04/headless-chrome