Scrapy框架学习——命令行工具
全局命令<不需要要项目,在命令行中直接运行>:
scrapy startproject myproject
- 创建一个名为myproject的scrapy项目
scrapy genspider [-t template] <name> <domain>
- 创建一个新的spider(-l 列出spider的模板,-d 查看模板的内容 -t 使用这个模板)
scrapy -h
- 查看所有可用的命令
scrapy crawl <spider>
- 使用spider进行爬虫
scrapy check [l] <spider>
- 运行contract检查
scrapy list
- 列出所欲可能的spider
scrapy edit <spider>
- 使用设定的编辑器编辑spider
scrapy fetch <url>
- 使用scrapy下载器Downloader下载给定的URL,并将获取到的内容标准输出
scrapy view <url>
- 用来查看spider获取到的页面,因为可能spider获取到的页面跟想要的不同。
scrapy shell [url]
-scrapy 终端,能够使用scrapy内部命令对url返回的内容进行操作。
scrapy parse <url> [options]
- 获取给定的URL并使用相应的spider分析处理。
scrapy settings [options]
- 获取scrapy的设定。
scrapy runspider <spider_file.py>
- 在未创建项目的情况下,运行在一个编写在python文件中的spider
scrapy -version [-v]
- 输出scrapy版本
scrapy deploy []
- 将仙姑部署到scrapyd服务。
scrapy bench
- 运行benchmark测试。










