打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
使用Python自动填写问卷星(pyppeteer反爬虫版)

本方法可能已被问卷星破解

引言

原准备用python+selenium完成对问卷星的自动填写,但在填写完成后出现智能验证提示(可能是问卷星升级了,加强了对爬虫的监视叭!)


emm,这个问题还不难解决,最大的问题在于在点击智能验证按钮后却显示验证失败…

在网上查找一翻资料后找到了用pyppeteer解决反爬的方法,过程如下


准备

  • 安装python第三方库asynciopyppeteerpyppeteer_stealth

完整代码

说明:本代码可实现利用pyppeteer自动问卷星填写填空题,填空题,日期选择题,地址(手动输入)

import asyncio
from pyppeteer import launch
from pyppeteer_stealth import stealth    # 反爬虫第三方库

async def main():
    # launch方法会新建一个browser对象,然后赋值给browser
    browser = await launch({
        # 路径就是你的谷歌浏览器的安装路径
        'executablePath': 'C:\\Program Files\\Google\\Chrome\\Application\\chrome.exe',
        # Pyppeteer 默认使用的是无头浏览器,所以要显示需要给False
        'headless': False,
        # 设置Windows-size和Viewport大小来实现网页完整显示
        'args': ['--no-sandbox', '--window-size=1366,850']
    })

    # 调用 newPage 方法相当于浏览器中新建了一个选项卡,同时新建了一个Page对象
    page = await browser.newPage()
    await page.setViewport({'width':1366,'height':768})
    # 防止页面识别出脚本(反爬虫关键语句)
    await stealth(page)

    # 调用了Page对象的goto方法就相当于在浏览器中输入问卷的网址,浏览器跳转到了对应的页面进行加载
    await page.goto('网址')
    # 填空题:page.type(selector,text),在指定selector的元素上填写text
    await page.type('#q1', '姓名')
    await page.type('#q2', '学号')
    await page.type('#divquestion5 > table > tbody > tr:nth-child(1) > td > div > textarea', '体温')
    
    # 单选题:先用page.querySelector(selector)找到指定的元素,再调用元素的click()方法
    button = await page.querySelector("#divquestion3 > ul > li:nth-child(8)")
    await button.click()
   
   	# 地址题:先点击手动填写地址,再在地址框内填写相应地址
    address = await page.querySelector("#divquestion7 > ul > li:nth-child(1) > label")
    await address.click()
    await page.type('#q9', '地址')
    
    # 日期选择题:先点击日期选择框,在出现的iframe寻找元素并调用click()方法
    date1 = await page.querySelector("#q4")
    await date1.click()
    
    frame = page.frames
    date2 = await frame[1].querySelector('#selectTodayButton')
    await date2.click()

    # 找到提交按钮提交
    submit = await page.querySelector('#submit_button')
    # await submit.click()
    await asyncio.sleep(2)                 # 页面延迟2s看是否提交成功
    await browser.close()
    

asyncio.get_event_loop().run_until_complete(main())

注:如何寻找网页元素的selector请自行百度

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
超越selenium的爬虫神器Pyppeteer
Google推出的爬虫新神器:Pyppeteer,神挡杀神,佛挡杀佛!
Python——网络爬虫
想入门Python爬虫?三步到位,轻松入门
爬虫神器 Pyppeteer 介绍及爬取某商城实战
爬虫界又出神器|一款比selenium更高效的利器
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服