本文目录一览:
php 获取谷歌页面数据!
google历史 bra href="" target="_blank"/a br br百度历史 bra href="" target="_blank"/a br br对于说抄袭我不赞成。搜索引擎的内容,比如知道啊,贴吧啊,相似,不是什么问题。再说百度是有自己的技术的。google那么厉害也不可以泄露自己的技术。你可以看看《相信中国,寻找百度》这本书。对于你了解百度的成长史很有帮助。你会觉得,百度真的很了不起了。。。
如何用php或者js在谷歌浏览器欧中获取所有打印机名称
启用JavaScript Google Chrome 第一步:你需要打开的设置Google Chrome点击右边的浏览器右上角的菜单图标。选择Settings从选择弹出。 启用JavaScript Google Chrome Settings“Show advanced settings…”。它坐落在最底层部分Settings。 一个更快的方法去那里是按Control+, PC Command+, Mac 启用JavaScript Google Chrome 根据“Privacy”,点击“Content settings...”。 启用JavaScript Google Chrome 当打开对话窗口,寻找并选择"JavaScript"第"Allow all sites to run JavaScript (recommended)"。 启用JavaScript Google Chrome 点击"OK"或"Done"按钮将其关闭,并关闭"Settings"设置。 点击"Reload this page"按钮刷新页面在Web浏览器上。
如何 用php抓取google关键词排名
- 说下思路,利用PHP的curl函数储存cookie,google搜索页面是无法用file_get_connents打开的,必须要完全模拟浏览器才行,百度就不同了,直接用file_get_conntens抓取页面,然后用正则处理下就行了。
-
header("Content-Type:text/html;charset=utf-8"); function ggsearch($url_s, $keyword, $page=1){ $enKeyword = urlencode($keyword); $rsState = false; $page_num = ($page-1)10; if($page <= 10){ $interface = "eth0:".rand(1,4); //避免GG封IP $cookie_file = dirname(FILE)."/temp/google.txt"; //存储cookie值 $url = ";hl=en prmd=imvnsei=JPnJTvLFI8HlggeXwbRl start=$page_num sa=N"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); //curl_setopt($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']); //获取浏览器类型 curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5"); curl_setopt($ch, CURLOPT_INTERFACE, "$interface"); //指定访问IP地址 curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); $contents = curl_exec($ch); curl_close($ch); $match = "!<div\sid="search"(.)</div\s+<!--z-->!"; preg_match_all("$match", "$contents", $line); while(list($k, $v) = each($line[0])){ preg_match_all("!<h3\s+class="r">a[^>]+(.?)</a>!", $v, $title); $num = count($title[1]); for($i=0; $i < $num; $i++){ if(strstr($title[0][$i], $url_s)){ $rsState = true; $j = $i + 1; $sum = $j + (($page)*10 -10); //echo $contents; echo "关键字" . $keyword . "<br>" . "排名:" . '<font color="red" size="20" style="">' . $sum . '</font>' . "####" . "第" . '<font color="#00FFFF" size="18" style="">' . $page . '</font>' . "页" . "第" . '<font color="#8000FF" size="15" style="">' . $j . '</font>' . "名" . $title[0][$i] . "<br>"; echo "<a href='".$url."'>" . "点击搜索结果" . "</a>" . "<br>"; echo "<hr>"; break; } } } unset($contents); if($rsState === false){ ggsearch($url_s, $keyword, ++$page); //找不到搜索页面的继续往下搜索 } } else { echo '关键字' . $keyword . '10页之内没有该网站排名' . '<br>'; echo "<hr>"; } } if(!empty($_POST['submit'])){ $time = explode(' ', microtime()); $start = $time[0] + $time[1]; $more_key = trim($_POST['textarea']); $url_s = trim($_POST['url']); if(!empty($more_key) && !empty($url_s)){ /判断输入字符的规律/ if(strstr($more_key, "\n")){ $exkey = explode("\n", $more_key); } if(strstr($more_key, "|")){ $exkey = explode("|", $more_key); } if(!strstr($more_key, "\n") && !strstr($more_key, "|")){ $exkey = array($more_key); } /判断是否有www或者http://之类的东西/ if(count(explode('.', $url_s)) <= 2){ $url = ltrim($url_s, ''); $url = 'www.' . $url_s; } foreach($exkey as $keyword){ //$keyword; ggsearch($url_s, $keyword); } $endtime = explode(' ', microtime()); $end = $endtime[0] + $endtime[1]; echo '<hr>'; echo '程序运行时间:'; echo $end - $start; //die(); } } ?>
```html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "">
<html xmlns="">
<head>
<title>抓取排名</title>
</head>
<body>
<form action="" method="post">
<span>关键字:</span>
<textarea name="textarea" rows="20" cols="40" wrap="off">
格式例如:keyword1|keyword2|keyword3
或者:
keyword1
keyword2
keyword3
</textarea>
<span>url地址:</span>
<input type="text" name="url" />
<input type="submit" name="submit" value="搜索" />
</form>
</body>
php怎么爬取google查询 结果
先访问网页,使用curl或者file_get_contents获取,然后再用正则判断即可获取