本文目录一览:
- 1、python怎么处理点击“加载更多”(load more)的网页?比如:https://securingtomorrow.mcafee.com/
- 2、Python如何检测恶意刷单行为
- 3、如何用python刷简书文章的浏览量
- 4、python怎么自己设置浏览量和点击量
- 5、如何利用Python自动完成对网页平台上可点击的元素操作,用什么模块,具体函数有哪些,请大神指教
python怎么处理点击“加载更多”(load more)的网页?比如:https://securingtomorrow.mcafee.com/
一般这种网站是动态加载的,通过XHR请求的参数变化更新数据。
如果不熟悉解析过程可以使用selenium的webdriver模拟抓取。
Python如何检测恶意刷单行为
1、打开python。2、输入检测类的代码。将账号的订单数和ip地主数量两个变量进行异常值检测,分析出黄牛恶意下单的行为特征,多次重复下单,下单地址区间极短,甚至相同地址。
如何用python刷简书文章的浏览量
# coding=utf-8
import pycurl
import urllib
from StringIO import StringIO
import json
import re
# class definition
class shua_view_class:
def __init__(self,link):
self.website = unicode(link)
self.configure()
def shouye(self):
buffer = StringIO()
self.c.setopt(pycurl.URL, self.website)
self.c.setopt(pycurl.POST, 0)
self.c.setopt(self.c.WRITEDATA, buffer)
self.c.perform()
body = buffer.getvalue().decode('utf-8')
self.uuid = re.search(r"uuid\":\"(.+)\"}", body).group(1)
view_count = re.search(r"views_count\":(\d+)", body).group(1)
#print self.uuid
print "view:" + str(view_count)
def configure(self):
self.c = pycurl.Curl()
USER_AGENT = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
self.c.setopt(pycurl.HTTPHEADER, ['Origin: jianshu.com', 'Referer: '+self.website]) # this line is very important to if we can succeed!
self.c.setopt(self.c.FOLLOWLOCATION, 1)
self.c.setopt(pycurl.VERBOSE, 0)
self.c.setopt(pycurl.FAILONERROR, True)
self.c.setopt(pycurl.USERAGENT, USER_AGENT)
def shuaview(self):
data_form = {
'uuid': self.uuid,
}
# print data_form
buffer = StringIO()
data_post = urllib.urlencode(data_form)
url = self.website.replace("/p/","/notes/") + '/mark_viewed.json'
#print url
self.c.setopt(pycurl.URL, url)
self.c.setopt(pycurl.POST, 1)
self.c.setopt(pycurl.POSTFIELDS, data_post)
self.c.setopt(self.c.WRITEFUNCTION, buffer.write)
self.c.perform()
response = buffer.getvalue()
response_json = json.loads(response)
def exit(self):
self.c.close()
# main function
Post_link="jianshu.com/p/****"
n = 0
app=shua_view_class(Post_link)
app.shouye() # check the view number before we shua view
while True:
app.shuaview()
n += 1
if n 100: # add 101 more views
break
app.shouye() # check the view number after we shua view
app.exit()
python怎么自己设置浏览量和点击量
根据你的描述是用钩子实现 好像是叫pyhook什么的 安装包带有实例。 但是如果你了解什么是表单和http和javascript的话用webkit实现更靠谱。
如何利用Python自动完成对网页平台上可点击的元素操作,用什么模块,具体函数有哪些,请大神指教
用selenium就可以了,它模拟打开浏览器,打开网页。
通过页面元素的特征,定位到要点击的元素,click()方法就可以完成点击
比如
self.driver.find_element_by_xpath('//ul[@class="uhomeTagList-ul"]/li[2]').click()