Release notes¶
AyugeSpiderTools 3.3.0 (2023-06-21)¶
Deprecation removals¶
优化了
Item
体验,升级为AyuItem
,使用更方便,但注意与旧版本写法并不兼容:删除了
MysqlDataItem
实现。删除了
MongoDataItem
实现。增加了
AyuItem
参数以方便开发和简化pipelines
结构,新示例请查看DemoSpider
项目或readthedocs
文档对应内容。
Deprecations¶
无。
New features¶
添加文件下载的示例,具体内容及示例请查看 readthedocs 上对应内容,具体案例请查看 DemoSpider 中的
demo_file
项目。
Bug fixes¶
无。
Code optimizations¶
升级依赖库中
numpy
和loguru
版本,避免其漏洞警告提示。更新对应的模板生成示例,简化一些不常用的配置即注释等。
AyugeSpiderTools 3.2.0 (2023-06-07)¶
Deprecation removals¶
去除数据表前缀和集合前缀的鸡肋功能:
删除了
MYSQL_TABLE_PREFIX
参数。删除了
MONGODB_COLLECTION_PREFIX
参数。
删除其它的鸡肋功能:
移除
runjs
方便运行js
方法的鸡肋封装。移除
rpa
管理自动化程序的方法。
删除了使用
requests
作为scrapy
请求库的功能,推荐使用本库中aiohttp
的方式。
Deprecations¶
无。
New features¶
添加
kafka
推送的示例,具体内容及示例请查看 readthedocs 上对应内容,具体案例请查看 DemoSpider 项目。
Bug fixes¶
无。
Code optimizations¶
增加
RabbitMQ
中heartbeat
和socket_timeout
参数可自定义的功能。整理依赖文件。
AyugeSpiderTools 3.1.0 (2023-05-30)¶
Deprecation removals¶
无。
Deprecations¶
无。
New features¶
添加
mq
推送的示例,具体内容及示例请查看 readthedocs 上对应内容,具体案例请查看 DemoSpider 项目。
Bug fixes¶
无。
Code optimizations¶
修复部分
typo
问题。
AyugeSpiderTools 3.0.1 (2023-05-17)¶
这是一个 major
版本更新,含有 bug
修复、代码优化等。
Deprecation removals¶
删除
ayugespidertools
的cli
名称 -> 改为ayuge
来管理。
Deprecations¶
无。
New features¶
修改
item
实现方式,不再通过将字段都存入alldata
中即可实现动态设置字段的功能,使用更清晰,且能更方便地使用ItemLoaders
的功能,具体内容及示例请查看 readthedocs 上对应内容,具体案例请查看 DemoSpider 项目。
Bug fixes¶
修复不会创建表注释的问题。
Code optimizations¶
修改
dict_keys_to_lower
和dict_keys_to_upper
的将字典 key 转为大写或小写的功能优化为嵌套字典中所有 key 都转为大写或小写。将模板中
settings.py
中的配置读取放入库中update_settings
实现,简化settings.py
文件内容。优化
Makefile
功能,简化清理__pycache__
文件夹的功能。修改部分
typo
问题。更新
readthedocs
内容,更新测试文件。
AyugeSpiderTools 2.1.0 (2023-05-09)¶
这是一个主要更改了 scrapy
依赖库为 2.9.0
版本,含有 bug
修复。
Deprecation removals¶
tox
去除windows
平台的测试场景。
Deprecations¶
下一大版本将删除
ayugespidertools
的cli
名称 -> 改为ayuge
来管理。
New features¶
本库依赖库
scrapy
版本升级为2.9.0
。
Bug fixes¶
修复使用
ayuge
及ayuge -h
命令时,未显示当前库版本的问题。
Code optimizations¶
无。
AyugeSpiderTools 2.0.3 (2023-05-06)¶
此版本为微小变动。
Deprecation removals¶
无
Deprecations¶
下一大版本将删除
ayugespidertools
的cli
名称 -> 改为ayuge
来管理。
New features¶
添加
mongodb
的asyncio
的示例。
Bug fixes¶
无
Code optimizations¶
readthedocs
的markdown
解析由recommonmark
改为myst-parser
,以支持更多的markdown
语法。
AyugeSpiderTools 2.0.1 (2023-04-27)¶
此版本为大版本更新,修改了项目结构以统一本库及与 scrapy
结合的代码风格,也有一些功能完善等。最新功能示例请在 DemoSpider 或 readthedocs 中查看。
Deprecation removals¶
一些
api
变动:
更改前 | 更改后 | 备注 |
---|---|---|
from ayugespidertools.AyugeSpider import AyuSpider | from ayugespidertools.spiders import AyuSpider | |
from ayugespidertools.AyuRequest import AioFormRequest | from ayugespidertools.request import AiohttpFormRequest | |
from ayugespidertools.AyuRequest import AiohttpRequest | from ayugespidertools.request import AiohttpRequest | |
from ayugespidertools.common.Utils import * | from ayugespidertools.common.utils import * | |
from ayugespidertools.Items import * | from ayugespidertools.items import * | |
from |
from |
|
from ayugespidertools.AyugeCrawlSpider import AyuCrawlSpider | from ayugespidertools.spiders import AyuCrawlSpider | |
ayugespidertools.Pipelines | ayugespidertools.pipelines | pipelines |
ayugespidertools.Middlewares | ayugespidertools.middlewares | middlweares |
一些参数配置变动:
更改前 | 更改后 | 备注 |
---|---|---|
PROXY_URL | proxy | 代理 proxy 参数 |
PROXY_INDEX | index | 代理配置等 |
注:所有配置的 key
都统一改为小写
一些使用方法更改:
使用
AiohttpRequest
构造请求时,由之前的meta
中的aiohttp_args
配置参数,改为由args
的新增参数取代,其参数类型同样为dict
,也可以为AiohttpRequestArgs
类型,更容易输入。
Deprecations¶
下一大版本将删除
ayugespidertools
的cli
名称 -> 改为ayuge
来管理。
New features¶
丰富
aiohttp
请求场景,增加重试,代理,ssl
等功能。
Bug fixes¶
无
Code optimizations¶
更新测试用例。
AyugeSpiderTools 1.1.9 (2023-04-20)¶
这是一个维护版本,具有次要功能、错误修复和清理。
Deprecation removals¶
无
Deprecations¶
无
New features¶
增加
ayuge startproject
命令支持project_dir
参数。# 这将在 project dir 目录下创建一个 Scrapy 项目。如果未指定 project dir,则 project dir 将与 myproject 相同。 ayuge startproject myproject [project_dir]
Bug fixes¶
修复模板中
settings
的CONSUL
配置信息没有更新为v1.1.6
版本推荐的使用方法的问题。(releases ayugespidertools-1.1.6)修复在
startproject
创建项目时生成的run.sh
中的路径信息错误问题。
Code optimizations¶
添加测试用例。
以后的版本发布说明都会在 ayugespidertools readthedocs 上展示。