脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Pycharm安装scrapy及初始化爬虫项目的完整步骤

Pycharm安装scrapy及初始化爬虫项目的完整步骤

2022-08-07 10:09_码农耕地人 Python

因为入门python以来一直使用pycharm,所以对着黑白的DOS不习惯,所以此次来实现使用pycharm进行实现使用scrapy框架,下面这篇文章主要给大家介绍了关于Pycharm安装scrapy及初始化爬虫项目的完整步骤,需要的朋友可以参考下

一)安装scrapy

1、打开cmd命令窗口,输入:pip install Scrapy。

2、安装成功之后会显示下面字符,表示未将scrapy设置到环境变量。

Pycharm安装scrapy及初始化爬虫项目的完整步骤

3、配置环境变量:右键我的电脑-->属性-->高级设置--->环境变量---->系统变量中的Path--->编辑--->添加--->将上文中黄色的路径添加到环境变量即可。

4、scrapy安装完毕。

 

二)创建一个scrapy爬虫项目:

1、创建一个普通的Pycharm项目,然后找到下面的terminal

Pycharm安装scrapy及初始化爬虫项目的完整步骤

 2、输入命令scrapy startproject 模块名称(可以自己随便起,我以名为mine为例),成功之后你会发现自己的项目中多了一个mine的包文件。

Pycharm安装scrapy及初始化爬虫项目的完整步骤

 3、上述操作成功后终端会显示下图文字:此时我们输入cd那条命令。进入目标文件。

Pycharm安装scrapy及初始化爬虫项目的完整步骤

 4、这时就可以创建爬虫目标文件啦,

        输入scrapy genspider 爬取名 网站域名

1、爬取名是自己随便起的,比如我要爬百度那么我就可以起名为baidu

2、网站域名就是去掉  https:www.  剩下的部分,以博客园的为例:

网址为:https://www.cnblogs.com/

域名为 cnblogs.com

 2和3操作截图: 

Pycharm安装scrapy及初始化爬虫项目的完整步骤

5、此时我们会在目录里看见一个新的py文件:里自动生成如下代码:

Pycharm安装scrapy及初始化爬虫项目的完整步骤

Pycharm安装scrapy及初始化爬虫项目的完整步骤

 

三)开启pycharm对scrapy框架的调试功能:

由于pycharm没有创建scrapy框架的模块,所以我们想调试scrapy程序时要自己写一个小脚本来开启pycharm对scrapy的调试功能。

 1、在与mine包同级条件下创建一个main.py文件:

Pycharm安装scrapy及初始化爬虫项目的完整步骤

 2、mine文件将一下代码赋值进去:

import os
import sys
 
from scrapy.cmdline import execute
 
sys.path.append(os.path.dirname(os.path.abspath(__file__)))
execute(["scrapy", "crawl", "cnblog"])  # 第三个参数为自己创建的那个爬取的名称

 这样就大功告成啦!

 

总结

到此这篇关于Pycharm安装scrapy及初始化爬虫项目的文章就介绍到这了,更多相关Pycharm安装scrapy初始化爬虫项目内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文地址:https://blog.csdn.net/weixin_60414376/article/details/124023917

延伸 · 阅读

精彩推荐
  • PythonPython编程pytorch深度卷积神经网络AlexNet详解

    Python编程pytorch深度卷积神经网络AlexNet详解

    AlexNet和LeNet的架构非常相似。这里我们提供了一个稍微精简版本的AlexNet,去除了当年需要两个小型GPU同时运算的设计特点...

    Supre_yuan5702022-01-22
  • Python利用Python yagmail三行代码实现发送邮件

    利用Python yagmail三行代码实现发送邮件

    这篇文章主要给大家介绍了关于利用Python yagmail三行代码实现发送邮件的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的...

    M_ha5212021-02-20
  • Python使用pandas忽略行列索引,纵向拼接多个dataframe

    使用pandas忽略行列索引,纵向拼接多个dataframe

    这篇文章主要介绍了使用pandas忽略行列索引,纵向拼接多个dataframe的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    呆萌的代Ma11972021-09-28
  • PythonDRF之请求与响应的实现

    DRF之请求与响应的实现

    本文主要介绍了DRF请求与响应的实现,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧...

    暗黑妹妹11282021-12-13
  • PythonPython实现繁體转为简体的方法示例

    Python实现繁體转为简体的方法示例

    这篇文章主要介绍了Python实现繁體转为简体的方法,涉及Python编码转换相关操作技巧,需要的朋友可以参考下...

    Tangzongyu1236992021-05-03
  • Pythonpython win32 简单操作方法

    python win32 简单操作方法

    下面小编就为大家带来一篇python win32 简单操作方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧...

    脚本之家5072020-11-12
  • PythonPython里disconnect UDP套接字的方法

    Python里disconnect UDP套接字的方法

    这篇文章主要介绍了Python里disconnect UDP套接字的方法,本文使用的是ctypes绕过的方法,需要的朋友可以参考下 ...

    anquye2004162020-06-10
  • Pythonpython连接mongodb密码认证实例

    python连接mongodb密码认证实例

    今天小编就为大家分享一篇python连接mongodb密码认证实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    weisongming5832021-04-08