本文目录一览:
- 1、PHP获取远程页面html
- 2、php怎么抓取 淘宝搜索页面的Html内容
- 3、php新手在线等答案:用php如何让提取html表单中输入的数据???
- 4、php读取html
- 5、php正则表达来获取html中的部分内容
- 6、php定时抓html内容和保存读取
PHP获取远程页面html
file_get_contents()比file()慢?
如果抓取别人的页面还是用file_get_contents()比较好~
file()取回的是数组
而file_get_contents()取回的是字符串
你是想取回个数组再把它们连起来方便?还是直接把他们取回来方便?
另外
file_get_contents(String,int)
有个可选参数设定读取的长度
在PHP手册中说:
file_get_contents() 函数是用来将文件的内容读入到一个字符串中的首选方法。如果操作系统支持还会使用内存映射技术来增强性能。
php怎么抓取 淘宝搜索页面的Html内容
发送http头信息试试,另外想要做蜘蛛程序的话,还是python比较好用,有丰富了web类库
php新手在线等答案:用php如何让提取html表单中输入的数据???
在form中,的属性method=get
或者post方法,
在php中获取表单数据如下:
$_get[表单名]
$_post[表单名]
这样就可以获取到html中表单里面的数据信息
php读取html
preg_match('/p align=\"center\"bigstrong(.*?)\/strong\/big\/p/',$str,$result);
$str就是上面的html里面的内容,$result就是匹配到的字符串,你可以print_r($result);看看里面就有你要的结果,或者直接echo $result[1];就是
“在LINUX下配置MYSQL、PHP和JSP”这几个字符了
请采纳。
php正则表达来获取html中的部分内容
1、几种函数的简单说明:
(1)preg_grep -- 返回与模式匹配的数组单元
preg_grep 返回一个input 数组中与给定的 pattern 模式相匹配的单元所组成的数组。
(2)preg_match -- 进行正则表达式匹配
说明:int preg_match ( string pattern, string subject [, array matches [, int flags]] )在 subject 字符串中搜索与 pattern 给出的正则表达式相匹配的内容。 返回值0或1。
(3)preg_replace -- 执行正则表达式的搜索和替换
(4)preg_split -- 用正则表达式分割字符串
2. 一般来说,如果用正则来获取匹配内容,一般使用 preg_match/ preg_match_all 函数。
补充回答:
正则表达式如下:
'%div class="wap2"span功能/span(.*?)/div%si'
以下是代码,经测试,运行正常:
?php
$str = 'div class="wap2"span功能/span这里面是要获取的内容,不能确定什么字符,可能是数字(123456…)字母(babaidn…),特殊浮等(o_O\(^o^)/…)/div';
$pa = '%div class="wap2"span功能/span(.*?)/div%si';
preg_match($pa,$str,$r);
echo $r[1];
?
php定时抓html内容和保存读取
?php
@header ( 'Content-type: text/html;charset=UTF-8' );
$name = "AA";
$seconds = 60;
$url = "./";
$html = $url . $name . ".html";
$file = $name . ".dat";
set_time_limit ( 0 );
while ( file_exists ( $file ) ) {
$info = file_get_contents ( $html );
$info = iconv ( "UTF-8", "GBK", $info );
echo $info;
if (preg_match ( "/!--开始--((?:(?!!--结束--)[\s\S])*)!--结束--/", $info, $m )) {
$fh = fopen ( $file, "w" );
fwrite ( $fh, $m [1] );
fclose ( $fh );
}
sleep ( $seconds );
}