GNU Wget尝试爬虫
本文共3600余字,预计阅读时间12分钟,本文同步发布于知乎(账号silaoA)和微信公众号平台(账号伪码人)。
关注学习了解更多的Cygwin、Linux技术。
知乎上见到太多的爬虫入门案例,多是用Python、Java实现,若只是抓取特定的网页链接,何不用GNU Wget
试试呢?
本文在Cygwin环境,参照wget
的man
和info
手册,尝试编写调用wget
爬取静态图片。如对wget已很了解,跳过第一节,直接看爬虫尝试一节。以下内容,建议照着敲代码实践,如只是看一遍说明书,感觉都记得了,so what?