'验证码正确......')
break
else:
print ('验证码错误,请重新输入......')
date['verifyCode']=datacode
r=requests.post(log_url,data=date,headers=log_header,cookies=cookie)
#print(r.text)获得网址的源代码
html=BeautifulSoup(r.text,'lxml')
tagList=html.find('b')
print('#############################################################')
print('进入选课系统成功:')
print(tagList.get_text())
print('#############################################################')
在这里用了另外一个库 用于解析所获取的登陆后网页源代码
总的来说就是 先用浏览器和抓包工具,浏览器多次登陆,用抓包工具和浏览器的f12查看登陆前经历了哪些步骤,哪些网页,每个网页分别发送了哪些数据,用的是get方法还是post方法
在知道后,用代码将所需要的数据写出来并保存后用requests库的get方法post方法模拟发送数据给学校服务器。最后获得登陆后的网页源代码
不过。。。我在获得源代码后发现html中的iframe标签显示的是选课的内容,但是我用于分析网页代码的库是BeautifulSoup
它不支持分析iframe内容。。。白忙活了那么久。
通过在网上查找信息发现selenium这个库支持分析iframe标签的内容
所以接下来就去学习用这个库去获取学习的选课信息并且自动选课
下次就放用selenium做爬虫的过程