php批量获取远程文件(文字|图片)及保存

2012.12.09

主要谈谈最近对file_get_content和CURL的使用感受!

首先想到的是file_get_contents

这个方法获取的时候,如果是只使用一次的话还好,基本都会准确的获得,但是如果写个循环连续获得,绝对要出错,具体为什么,这个不清楚,百度谷歌好久无果,但是有个方法可以降低这个概率,就是写一个头信息(可以包含任何你想改变的,比如这里需要添加个agent,甚至说refer)

file_get_contents功能上还是不行,那就用专业的cURL来吧!more

首先看看自己的PHP配置了这个功能里没有,如果没有就配置一下扩展.然后就是抓取了什么的,我遇到了一个棘手的,就是输入的图片或者链接地址是个虚的,直接获取什么都没有,因为它自己会跳转,但是伟大的cURL可以配置成获取跳转后的内容,并且可以设置迭代次数.其实cURL就是个没有UI的浏览器,还可以设置代理什么的,表单登录,存储cookie等等

对了,PHP界有个挺NB的snoopy类,其实功能的实现也是依托了cURL.

谈一下保存图片的方法

获取后可以设置为 数据流的方式传变量,最后保存, 或者是通过ob_start....那个东西来搞定!

正则表达式

具体的正则不说了,说个图片标签的正则吧//i

一些细节就不说了,说到天亮也说不完.了,有问题可以留言

最近的这个感想主体就是这样了!希望的主体思想能够辐射你们!哈哈

Comments
Write a Comment