import re content = "Hello 1234567 World_ This is a Regex Demo" result = re.match("^Hello\s(\d+)\sWorld.*Demo$", content…
scrapy创建爬虫项目
创建项目 scrapy startproject tutorial 该命令将会创建包含下列内容的 tutorial 目录: tutorial/ scrapy.cfg tutorial/ __init__.py items.py pipeli…
Python中re(正则表达式)模块详解
今天学习测试了一下Python中的正则表达式的模块用法。初学 Python ,对 Python 的文字处理能力有很深的印象,除了 str 对象自带的一些方法外,就是正则表达式这个强大的模块了。但是对于初学者来说,要用好这个功能还是有点难度,…
PIL安装
PIL:Python Imaging Library,已经是Python平台事实上的图像处理标准库了。PIL功能非常强大,但API却非常简单易用。 安装PIL 在Debian/Ubuntu Linux下直接通过apt安装: $ sudo a…
[mac]安装python3后使用pip和pip3的区别
安装了python3之后,会有pip3 1. 使用pip install XXX 新安装的库会放在这个目录下面 python2.7/site-packages 2. 使用pip3 install XXX 新安装的库会放在这个目录下面 pyt…
利用scrapy和MongoDB来开发一个爬虫
今天我们利用scrapy框架来抓取Stack Overflow里面最新的问题(问题标题和网址),并且将这些问题保存到MongoDb当中,直接提供给客户进行查询。 安装 在进行今天的任务之前我们需要安装二个框架,分别是Scrapy (1.1.…
Python zip() 函数
Python 内置函数 描述 zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。 如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压…
python去除空格和换行符的方法
一、去除空格 strip() " xyz ".strip() # returns "xyz" " xyz ".lstrip() # returns "xyz " " xyz ".rstrip() # returns " xyz" " x y…
windows7下 pycharm pip install scrapy 报错误 error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools
在http://landinghub.visualstudio.com/visual-cpp-build-tools上下载Microsoft Visual C++ 14.0以上版本 Visual C++ 2015 Build Tools 安…