本文目录一览:
php如何能处理大量的信息?
楼上等于没回答
处理大量的信息,这要看信息由多少,操作有多频繁,具体要做什么处理,我理解的是你抓取过来分析完以后肯定要做入库处理。所以问题就出在这,如果大批量的入库操作同时进行,会使mysql库跑死,会出现类似于mysql server has gong away的错误。不过一般的抓取只要分好表,数据内容部是太大应该不会有问题。所以解决这个问题,能想到的办法就是把内容用strip_tags格式化处理,最好不要保留html内容,如果实在用也要把html语言格式化一下,同时,最好执行批量插入,就是不要每条去连一次表,可以设定一次插入100条数据,例子:
insert into table () values (一行记录),(另一行记录),(等等),(等等)...
或者实行分表,把内容放到不同的表中。
至于抓取,php是没有任何问题的,如果是你抓取下来直接入库然后在分析或者直接分析的话建议用file_get_contents();
如果抓成文件再处理的话当然是wget更好一些。
但是大批量抓取还是不建议用php
什么是PHP,在哪些地方可以应用
就简单的来讲,你现在所看到的页面,上面的数据,比如右上角的账号,右侧的广告,都是由后台取出数据,经过处理(筛选,排序等)再放到页面展示。展示给用户看的是前端,处理、管理数据的是后端,后端往往是给制作网站的相关人员用的。而php只是写后端的语言之一
PHP是什么,常用在什么地方
PHP是一个基于服务端来创建动态网站的脚本语言,您可以用PHP和HTML生成网站主页。当一个访问者打开主页时,服务端便执行PHP的命令并将执行结果发送至访问者的浏览器中,这类似于ASP和CoildFusion,然而PHP和他们不同之处在于PHP开放源码和跨越平台,PHP可以运行在WINDOWSNT和多种版本的UNIX上。它不需要任何预先处理而快速反馈结果,它也不需要mod_perl的调整来使您的服务器的内存映象减小。PHP消耗的资源较少,当PHP作为Apache Web服务器一部分时,运行代码不需要调用外部二进制程序,服务器不需要承担任何额外的负担。
PHP脚本程序主要是由哪几部分组成?
运行PHP脚本程序,必须借助PHP预处理器、WEB服务器和WEB浏览器,必要时还需借助数据库服务器。
1.WEB浏览器
也叫网页浏览器,简称浏览器。常见的浏览器有微软的Internet Explorer(IE)浏览器、Mozilla的Firefox浏览器等。
2.PHP预处理器
PHP Preprocessor的功能是将PHP程序中的代码解释为文本信息,这些文本信息中可以包含HTML代码。
3.WEB服务器
WEB Server也称为WWW(World Wide Web)服务器,功能是解析HTTP。当WEB服务器接收到浏览器的一个HTTP动态请求时,Web服务器会调用与请求对应的程序,程序经PHP预处理器解释执行后,WEB服务器向浏览器返回HTTP响应,该响应通常是一个HTML页面。浏览器收到该HTTP响应后,将执行结果显示在浏览器上。
常见的WEB服务器有微软的Internet Information Server(IIS)服务器、IBM的WebSphere服务器、开源的Apache服务器等。IIS中文全称是互联网信息服务器。
WEB浏览器请求的是静态页面,只需要WEB服务器响应该请求;如果浏览器请求的是动态页面(php代码),此时WEB服务器会委托PHP预处理器将动态页面解释为HTML静态页面,再有WEB服务器返回给浏览器显示。
4.数据库服务器
Database Server是一套为应用程序提供数据管理的服务软件,服务包含数据的添加、修改、删除、事务管理、索引服务、高速缓存、查询优化、安全及存储控制等。
常见的数据库服务器有甲骨文的Oracle、微软的SQL Server、IBM的DB2、SAP的Sybase以及SUN公司的MySQL等。