PHP实现数据采集的方法

阅读量:24
2021-04-17

采集就是使用PHP程序,把其他网站中的信息抓取到我们自己的数据库中、网站中。本文主要和大家分享PHP实现数据采集的方法,希望能帮助到大家。

PHP制作采集的技术:

从底层的socket到高层的文件操作函数,一共有3种方法可以实现采集。

1. 使用socket技术采集:

socket采集是最底层的,它只是建立了一个长连接,然后我们要自己构造协议字符串去发送请求。

例如要想获取这个页面的内容,~1~3!2~A,用socket写如下:

  1. <?php  
    //连接,$error错误编号,$errstr错误的字符串,30s是连接超时时间
    $fp=fsockopen("",80,$errno,$errstr,30);  
    if(!$fp) die("连接失败".$errstr);  
    //构造协议字符串,因为socket编程是最底层的,它还没有使用协议
    $"GET /?spm=a2hww.20023042.topNav.5~1~3!2~A rn";   //  rn表示前面的是一个命令
    $"Host:rn";  //请求的主机
    $"Connection:closernrn";   // 连接关闭,最后一行要两个rn
    //发送这个字符串到服务器
    fwrite($fp,$,strlen($));  
    //接收服务器返回的数据
    $data='';  
    while (!feof($fp)) {  
    $data.=fread($fp,4096);  //fread读取返回的数据,一次读取4096字节
    }  
    //关闭连接
    fclose($fp);  
    var_dump($data);  
    ?>

打印出的结果如下,包含了返回的头信息及页面的源码:

声明:本文原创发布星网无限,转载请注明出处,感谢您的尊重!如有疑问,请联系admin@处理

THE END

发表评论

相关推荐

  • 有关fgets()函数的文章推荐10篇

    以下正文:这篇文章主要介绍了PHP文件读写操作相关函数总结,本文总结了fwrite()、fread()、fgets()、fgetc()、file()、readf ...

    阅读量:65
    2021-04-19
  • php递归与无限分类实例详解

    这篇文章主要介绍了php实现递归与无限分类的方法,涉及php的递归操作技巧,需要的朋友可以参考下本文实例讲述了php实现递归与 ...

    阅读量:45
    2021-04-19
  • CI框架中zip类的使用

    CI框架自带的zip类简单实用,本文就来简单说一下ci框架的zip类的使用,需要的朋友可以参考下CI框架自带的zip类简单实用,本文 ...

    阅读量:43
    2021-04-18
  • SWFUpload插件上传文件的代码

    这篇文章主要介绍了文件上传之SWFUpload插件(代码),实现此代码主要分为两部分:1.前台文件和 2.后台文件upload.php,需要 ...

    阅读量:42
    2021-04-18
  • 关于destoon的URL Rewrite设置方法

    这篇文章主要介绍了destoon的URL Rewrite(伪静态)设置方法,需要的朋友可以参考下1、如果您的服务器支持.htaccess,则无需设 ...

    阅读量:47
    2021-04-18