python访问url,python访问字典的值

本文目录一览：

1、如何用python访问网页并在表单处输入内容
2、怎样处理python爬虫中有中文的url
3、url编码问题在python中怎么解决
4、python点击访问下一篇并爬取直到最后一页
5、如何python获取sql数据库访问的url
6、linux下使用python访问服务器中文件

如何用python访问网页并在表单处输入内容

我用过selenium模拟浏览器

使用selenium的chrome或firefox的webdriver打开浏览器

driver.get(url) #访问你的网页from=driver.find_elements_by_xpath("xxx")通过xpath或id等方法锁定到网页上表单的那个元素后，用

from.send_keys("xxx")来输入内容

怎样处理python爬虫中有中文的url

一，先举个例子：比如你要处理的url链接

二，说你为什么要处理中文，是因为url有中文requests请求不到数据还是其他原因，

你应该打开该网站，f12开发工具看请求的链接是什么形式

三，url里的中文要转化换成什么，是MD5Z值（8a91ee17510f2b7401510f60a67f039c

），还是中文转码为%E5%A5这种

四,事情说清楚，想干什么，得到什么结果，怎么解决

python访问url,python访问字典的值

url编码问题在python中怎么解决

最近在抓取一些js代码产生的动态数据，需要模拟js请求获得所需用的数据，遇到对url进行编码和解码的问题，就把遇到的问题总结一下，有总结才有进步，才能使学到的知识更加清晰。对url进行编码和解码，python提供了很方便的接口进行调用。

url中的query带有特殊字符（不是url的保留字）时需要进行编码。当url中带有汉字时，需要特殊的处理才能正确编码，以下都只针对这种情形，当然也适用于纯英文字符的url。

(1) url编码：

import urllib

url = 'wd=哈哈' #如果此网站编码是gbk的话，需要进行解码，从gbk解码成unicode，再从Unicode编码编码为utf-8格式。

url = url.decode('gbk', 'replace')

print urllib.quote(url.encode('utf-8', 'replace'))

结果: 3a%2f%2ftest.com%2fs%3fwd%3d%e5%93%88%e5%93%88

(2) url解码:

import urllib

encoded_url = est.com%2fs%3fwd%3d%e5%93%88%e5%93%88'

print urllib.unquote(encoded_url).decode('utf-8', 'replace').encode('gbk', 'replace') #反过来

函数调用的参数以及结果都是utf-8编码的，所以在对url编码时，需要将参数串的编码从原始编码转换成utf-8，

对url解码时，需要将解码结果从utf-8转换成原始编码格式。

依据网站采用的编码不同，或是gbk或是utf-8，赋赋予不同的编码，进行不同的url转码。GBK格式，一个中文字符转为%xx%xx，共两组；utf-8格式，一个中文字符转为%xx%xx%xx，共三组。

import sys,urllib

s = '杭州'

urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))

%BA%BC%D6%DD

urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))

'%E6%9D%AD%E5%B7%9E'

[python] view plain copy

a = "墨西哥女孩被拐4年接客4万次生的孩子成为人质-搜狐新闻"

print urllib.quote(urllib.quote(a))

进行两次编码转换后，会变为：%25E5%25A2%25A8%25E8%25A5%25BF%25E5%2593%25A5%25E5%25A5%25B3%25E5%25AD%25A9%25E8%25A2%25AB%25E6%258B%25904%25E5%25B9.................................................................................这样的形式。

同样需要两次解码后才能得到中文。

最近用python写了个小爬虫自动下点东西，但是url 是含中文的，而且中文似乎是 gbk 编码然后转成 url的。举个例子吧，我如果有个unicode字符串“历史上那些牛人们.pdf”，那么我转换成url之后是，

t="%20%E5%8E%86%E5%8F%B2%E4%B8%8A%E9%82%A3%E4%BA%9B%E7%89%9B%E4%BA%BA%E4%BB%AC.pdf"，

但是对方网站给的是 s="%C0%FA%CA%B7%C9%CF%C4%C7%D0%A9%C5%A3%C8%CB%C3%C7.PDF"

print urllib.unquote("%C0%FA%CA%B7%C9%CF%C4%C7%D0%A9%C5%A3%C8%CB%C3%C7.PDF").decode('gbk').encode('utf-8')

历史上那些牛人们.PDF

python点击访问下一篇并爬取直到最后一页

对于只是读取某几个网站更新内容的爬虫完全没必要在python代码中实现增量的功能，直接在item中增加Url字段。

item['Url'] = response.url

然后在数据端把储存url的column设置成unique。

之后在python代码中捕获数据库commit时返回的异常，忽略掉或者转入log中都可以。

网上有说支持增量的，我看了代码+实际测试，还是觉得不是增量的...

我的做法是pipeline的open_spider时读取所有item里面的url，做成一个parsed_urls的list，在rule的process_link中过滤掉这些已经下载的url，如果需要的话可以再item里面加入last_notify属性进一步扩展...

如何python获取sql数据库访问的url

python

操作数据库，要安装一个Python和数据库交互的包MySQL-python-1.2.2.win32-py2.5.exe，然后我们就可以使用MySQLdb这个包进行数据库操作了。

操作步骤如下：

1、建立数据库连接

import

MySQLdb

conn=MySQLdb.connect(host="localhost",user="root",passwd="sa",db="mytable")

　 cursor=conn.cursor()

2、执行数据库操作

n=cursor.execute(sql,param)

我们要使用连接对象获得一个cursor对象,接下来,我们会使用cursor提供的方法来进行工作.

这些方法包括两大类:1.执行命令,2.接收返回值

3、cursor用来执行命令的方法:

　 callproc(self, procname,

args):用来执行存储过程,接收的参数为存储过程名和参数列表,返回值为受影响的行数

　 execute(self, query,

args):执行单条sql语句,接收的参数为sql语句本身和使用的参数列表,返回值为受影响的行数

　 executemany(self, query,

args):执行单挑sql语句,但是重复执行参数列表里的参数,返回值为受影响的行数

nextset(self):移动到下一个结果集

　 4、cursor用来接收返回值的方法:

fetchall(self):接收全部的返回结果行.

　 fetchmany(self,

size=None):接收size条返回结果行.如果size的值大于返回的结果行的数量,则会返回cursor.arraysize条数据.

fetchone(self):返回一条结果行.

　 scroll(self, value,

mode='relative'):移动指针到某一行.如果mode='relative',则表示从当前所在行移动value条,如果mode='absolute',则表示从结果集的第一

行移动value条.

5、下面的代码是一个完整的例子.

#使用sql语句,这里要接收的参数都用%s占位符.要注意的是,无论你要插入的数据是什么类型,占位符永远都要用%s

sql="insert

into cdinfo values(%s,%s,%s,%s,%s)"

#param应该为tuple或者list

param=(title,singer,imgurl,url,alpha)

#执行,如果成功,n的值为1

n=cursor.execute(sql,param)

#再来执行一个查询的操作

cursor.execute("select

* from cdinfo")

#我们使用了fetchall这个方法.这样,cds里保存的将会是查询返回的全部结果.每条结果都是一个tuple类型的数据,这些tuple组成了一个tuple

cds=cursor.fetchall()

#因为是tuple,所以可以这样使用结果集

cds[0][3]

#或者直接显示出来,看看结果集的真实样子

cds

#如果需要批量的插入数据,就这样做

sql="insert

into cdinfo values(0,%s,%s,%s,%s,%s)"

#每个值的集合为一个tuple,整个参数集组成一个tuple,或者list

param=((title,singer,imgurl,url,alpha),(title2,singer2,imgurl2,url2,alpha2))

#使用executemany方法来批量的插入数据.这真是一个很酷的方法!

n=cursor.executemany(sql,param)

需要注意的是(或者说是我感到奇怪的是),在执行完插入或删除或修改操作后,需要调用一下conn.commit()方法进行提交.这样,数据才会真正保

存在数据库中.我不清楚是否是我的mysql设置问题,总之,今天我在一开始使用的时候,如果不用commit,那数据就不会保留在数据库中,但是,数据

确实在数据库呆过.因为自动编号进行了累积,而且返回的受影响的行数并不为0.

6、关闭数据库连接

需要分别的关闭指针对象和连接对象.他们有名字相同的方法

cursor.close()

conn.close()

Django操作数据库

django是一个出色的用于python的web框架。django连接有操作数据库的api，使用起来十分简洁。我们在settings.py中配置好所要连接的数据库，然后在modules、view、urls中分别写好业务逻辑

linux下使用python访问服务器中文件

如果你的脚本就在linux服务器上，直接使用file读取文件就可以操作了

m = file("你的文件路径")

如果是远程访问，可能就需要架设http服务器，然后通过url访问，这个你可以看下urllib,urllib2这两个python库。

如果解决了您的问题请采纳！

如果未解决请继续追问

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

python访问url,python访问字典的值

本文目录一览：

如何用python访问网页并在表单处输入内容

怎样处理python爬虫中有中文的url

url编码问题在python中怎么解决

python点击访问下一篇并爬取直到最后一页

如何python获取sql数据库访问的url

linux下使用python访问服务器中文件

python访问url,python访问字典的值

python字典访问字典里的值,Python字典访问

python字典访问的三种方法（python中访问字典中的值

Python字典：快速查找和访问数据的利器

python字典的创建及访问（python 创建字典）

Python字典：高效地存储和访问键值对

Python 字典：快速访问和管理数据

python访问zk（Python访问字符串中的值）

Python字典：快速存储和访问数据

Python字典：使用键值对来存储和访问数据

Python字典：数据存储与快速访问

Python字典条目示例：如何使用字典创建和访问键和值

Python的字典：优秀的键值存储和数据访问方式

Python字典——高效存储和访问数据

Python字典：实现快速数据查询和访问

Python字典：高效地组织和访问数据结构

Python字典：快速存储和访问数据的利器

Python字典：高效存储和访问数据的利器

Python字典：高效存储、访问和管理数据

Python字典：更高效的数据存储和访问方法

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

python访问url,python访问字典的值

本文目录一览：

如何用python访问网页并在表单处输入内容

怎样处理python爬虫中有中文的url

url编码问题在python中怎么解决

python点击访问下一篇并爬取直到最后一页

如何python获取sql数据库访问的url

linux下使用python访问服务器中文件

python访问url,python访问字典的值

python字典访问字典里的值,Python字典访问

python字典访问的三种方法（python中访问字典中的值

Python字典：快速查找和访问数据的利器

python字典的创建及访问（python 创建字典）

Python字典：高效地存储和访问键值对

Python 字典：快速访问和管理数据

python访问zk（Python访问字符串中的值）

Python字典：快速存储和访问数据

Python字典：使用键值对来存储和访问数据

Python字典：数据存储与快速访问

Python字典条目示例：如何使用字典创建和访问键和值

Python的字典：优秀的键值存储和数据访问方式

Python字典——高效存储和访问数据

Python字典：实现快速数据查询和访问

Python字典：高效地组织和访问数据结构

Python字典：快速存储和访问数据的利器

Python字典：高效存储和访问数据的利器

Python字典：高效存储、访问和管理数据

Python字典：更高效的数据存储和访问方法

人机检测，请谅解