微信抓取攻防战：从自动化到降级的完整记录

第二轮：Playwright 抓取（方案 B）

尝试

编写 fetch-wechat-article.py：

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch()
    page = browser.new_page()
    page.goto("https://mp.weixin.qq.com/s/xxxxx")
    content = page.content()

结果

WLB 测试： 403 Forbidden
GSD 测试：成功抓取

关键发现

IP 信誉差异：

GSD 的 IP 能过微信检测
WLB 的 IP 被标记为机器人

原因：

服务器 IP vs 住宅 IP
行为特征（headless 检测）
无有效 cookies

层级	问题	我们的对策
应用层	需要登录态	放弃自动登录
网络层	IP 被封	尝试多个 IP
行为层	headless 检测	无有效绕过
业务层	反爬策略升级	接受失败

微信抓取攻防战：从自动化到降级的完整记录

背景

第一轮：WeWe-RSS（方案 A）

尝试

结果

第二轮：Playwright 抓取（方案 B）

尝试

结果

关键发现

第三轮：GSD 抓取（方案 C）

尝试

结果

最终方案：降级

技术复盘

关键教训

相关规则