随机等待时长已经加到非常长了，但还是会在相似的页数被封禁 #578

EthanNCai · 2024-04-28T12:41:20Z

为了更好的解决问题，请认真回答下面的问题。等到问题解决，请及时关闭本issue。

答：
github版

答：
是的

答：
否，只尝试了一个用户

答：
weiboid -> 1640337222

问：若您已提供出错微博的weibo_id或url，可忽略此内容，否则能否提供出错账号的user_id及您配置的since_date，方便我们定位出错微博（非必填）？

答：

答：
"random_wait_pages": [1, 2],
"random_wait_seconds": [70, 110], 在这个设置下仍然会在第200条微博（第二十页附近）被封

dataabc · 2024-04-28T14:58:19Z

可能和目标账号有关，某些类型的微博限制比较严。您可以修改spider.py，把range(1, page_num + 1)改成range(20, page_num + 1)，这样程序就会从20页开始获取。

EthanNCai · 2024-04-29T02:57:47Z

感谢解答，但从20页开始获取仍然会在40页左右被封，也许确实是因为这个账号比较严，现在的解决方法是将参数设置为"random_wait_pages": [1, 2],
"random_wait_seconds": [120, 180] 就可以无限获取了，为了效率只能考虑用多个代理ip同时爬

EthanNCai added the failed 程序运行出错 label Apr 28, 2024

Provide feedback