设为首页 加入收藏

TOP

PHP学习笔记:通过curl实现采集网站内容
2017-10-10 12:01:49 】 浏览:1533
Tags:PHP 学习 笔记 通过 curl 实现 采集 网站 内容

  关于curl,请各位同学自行百度,我直接上案例。

  首先开启你的curl拓展,在php.ini文件把curl拓展开启,即取消extension=php_curl.dll的分号。

eg:利用curl采集网站内容,并输出到txt文档:

  目标:抓取本博客首页,并输出到文档

<?php $ch = curl_init("http://www.cnblogs.com/jianqingwang/"); $fp = fopen("example_jianqingwang.txt", "w"); curl_setopt($ch, CURLOPT_FILE, $fp); curl_setopt($ch, CURLOPT_HEADER, 0); curl_exec($ch); curl_close($ch); fclose($fp); ?>

效果:

eg:抓取网站内容,并直接输出

      目标:抓取http://www.cnblogs.com/jianqingwang/,并直接输出

 
  

<?
// 1. 初始化
$ch = curl_init();
// 2. 设置选项,包括URL
curl_setopt($ch, CURLOPT_URL, "http://www.cnblogs.com/jianqingwang/");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0);//改为0就不输出
curl_setopt($ch, CURLOPT_HEADER, 0);
// 3. 执行并获取HTML文档内容
$output = curl_exec($ch);
// 4. 释放curl句柄
curl_close($ch);
?>

 

效果:

    说明:这里界面有点不一样,是因为css和图片地址都是相对路径,所以图片、css都失效了。

 

eg:

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Mac版PhpStorm之XAMPP整合apache.. 下一篇windows7下的PHP开发环境搭建(iis..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目