Commit Graph

26 Commits

Author SHA1 Message Date
戒酒的李白 c62f2b2a8e Added a logging utility class and supplemented, standardized the logging output for all modules. 2025-01-27 18:09:30 +08:00
Asy0y0 06e6060b7a Delete some unnecessary introductions 2025-01-12 03:18:25 -06:00
戒酒的李白 e58f105761 More convenient project initialization, with database initialization added to app.py. 2025-01-09 23:30:15 +08:00
戒酒的李白 a30773715e Modify the database hardcoding to switch to command-line interactive database connection. 2025-01-09 23:08:55 +08:00
lintsinghua 8c4f3e9b52 Update spiderContent.py 2024-12-14 20:07:14 +08:00
lintsinghua a7472b4287 Update spiderComments.py 2024-12-14 20:06:39 +08:00
lintsinghua babb9d54a9 Update spiderNav.py 2024-12-14 20:05:58 +08:00
戒酒的李白 ab8d9f0b39 【数据爬取规则修改】这次以后就不要再用爬虫了,我们的数据库到明天就不要动了 2024-07-04 19:19:27 +08:00
戒酒的李白 4ab789af4b 【bug修复】去除掉了两个模块,让项目能够启动不报错 2024-07-04 18:16:48 +08:00
juanboy b3b3cff505 爬虫结束自动打标注 2024-07-04 15:33:20 +08:00
YYL469 a491308f89 优化爬虫代码 2024-07-04 13:25:09 +08:00
YYL469 b9558ad943 修改爬虫bug 2024-07-04 13:19:34 +08:00
redhongx c5f5d59013 【saveData.py】【query.py】修改数据库连接IP 2024-07-04 11:02:07 +08:00
YYL469 9bebd200b7 优化爬虫代码 2024-07-04 09:41:18 +08:00
YYL469 c0686430de 增加spider脚本,每5小时爬取一次数据 2024-07-03 21:55:16 +08:00
YYL469 846c921983 修复爬虫bug 2024-07-03 19:52:52 +08:00
YYL469 1edb52a52b 修复爬虫bug 2024-07-03 19:49:32 +08:00
YYL469 fcc847e096 修复爬虫bug 2024-07-03 18:19:54 +08:00
YYL469 b3f0ea0c5f 修改spider文件夹结构,优化数据爬取结构,实现模块化 2024-07-03 17:38:16 +08:00
戒酒的李白 f98d111c32 【大修bug】添加csv表格原始数据,修改词频统计函数bug 2024-07-03 15:45:08 +08:00
YYL469 f3b64ee2d9 修改【main.py】,增加【saveData.py】,将数据存储模块与调度模块分离 2024-07-03 13:30:50 +08:00
YYL469 24a81848f4 【main.py】实现完整的爬取数据过程,并将爬取的数据存储到数据库中 2024-07-02 21:55:04 +08:00
YYL469 43519f8d52 【spiderComments.py】实现文章评论爬取 2024-07-02 20:04:36 +08:00
YYL469 f4f9c098d4 【spiderContent.py】实现文章内容爬取 2024-07-02 19:37:10 +08:00
YYL469 1e93ed693e 【spiderNav.py】实现导航栏爬取 2024-07-02 19:02:18 +08:00
戒酒的李白 7235f7a22b 【整体架构设计】设定了整个项目的框架,包括了项目的目录结构、模块划分、模块之间的调用关系等。 2024-07-02 16:09:32 +08:00