我们以学信网为例爬取个人信息
**如果看不清楚
按照以下步骤:**
1.火狐为例 打开需要登录的网页–> F12 开发者模式 (鼠标右击,点击检查元素)–点击网络 –>需要登录的页面登录下–> 点击网络找到 一个POST提交的链接点击–>找到post(注意该post中信息就是我们提交时需要构造的表单信息)
import requests from bs4 import BeautifulSoup from http import cookies import urllib import http.cookiejar headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0', 'Referer':'https://account.chsi.com.cn/passport/login"utf-8") lt=soup.find('input',type="hidden")['value'] return lt lt = get_lt(url)#获取登录form表单信息 以学信网为例 login(username,password,lt) login_url = 'https://my.chsi.com.cn/archive/gdjy/xj/show.action' per_html = session.get(login_url) soup = BeautifulSoup(per_html.text,'lxml',from_encoding="utf-8") print(soup) for tag in soup.find_all('table',class_='mb-table'): print(tag) for tag1 in tag.find_all('td'): title= tag1.get_text(); print(title)
以上这篇python 爬取学信网登录页面的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
标签:
python,爬取,登录页面
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
金钱帮资源网 Copyright www.kbjia.com
暂无“python 爬取学信网登录页面的例子”评论...
更新日志
2024年10月11日
2024年10月11日
- 《暗黑4》资料片IGN 8分:新增内容令人相当满意!
- 《一人一首成名曲·怀旧篇 3CD》[WAV+CUE][1.5GB]
- 《张信哲 粤语精选集 从开始到现在 2CD》[WAV+CUE][780MB]
- 《中国歌典 1950-1999年代经典歌曲 10CD》[FLAC/分轨][3.5GB]
- 群星.2024-流水迢迢影视原声带【诗和远方】【FLAC分轨】
- 蓝心湄.1999-心湄看新湄【SONY】【WAV+CUE】
- FINE乐团.2022-宇宙神经【FLAC分轨】
- 万代南梦宫逼迫中国选手弃权《铁拳》比赛 国籍不符合资格
- 《黑神话》官方手办引热议:真的很好看真的买不起
- 《黑神话:悟空》取景地灵岩寺现巨型悟空!挥舞大棒超帅气
- 秦咏.1997-歌咏诗情·历年名曲典故【音乐谷】【WAV+CUE】
- 群星.1997-纯电影·电影歌曲剧照纪念篇【新艺宝】【WAV+CUE】
- 邰肇玫.1981-雪歌(滚石25周年经典复刻系列)【滚石】【WAV+CUE】
- 《Duck Side of the Moon》特色玩法介绍
- 《刀郎 辉煌10年绝版珍藏 3CD》[WAV/分轨][1.6GB]