YYL469
|
fcc847e096
|
修复爬虫bug
|
2024-07-03 18:19:54 +08:00 |
|
YYL469
|
b3f0ea0c5f
|
修改spider文件夹结构,优化数据爬取结构,实现模块化
|
2024-07-03 17:38:16 +08:00 |
|
戒酒的李白
|
f98d111c32
|
【大修bug】添加csv表格原始数据,修改词频统计函数bug
|
2024-07-03 15:45:08 +08:00 |
|
YYL469
|
f3b64ee2d9
|
修改【main.py】,增加【saveData.py】,将数据存储模块与调度模块分离
|
2024-07-03 13:30:50 +08:00 |
|
YYL469
|
24a81848f4
|
【main.py】实现完整的爬取数据过程,并将爬取的数据存储到数据库中
|
2024-07-02 21:55:04 +08:00 |
|
YYL469
|
43519f8d52
|
【spiderComments.py】实现文章评论爬取
|
2024-07-02 20:04:36 +08:00 |
|
YYL469
|
f4f9c098d4
|
【spiderContent.py】实现文章内容爬取
|
2024-07-02 19:37:10 +08:00 |
|
YYL469
|
1e93ed693e
|
【spiderNav.py】实现导航栏爬取
|
2024-07-02 19:02:18 +08:00 |
|
戒酒的李白
|
7235f7a22b
|
【整体架构设计】设定了整个项目的框架,包括了项目的目录结构、模块划分、模块之间的调用关系等。
|
2024-07-02 16:09:32 +08:00 |
|