php抓取某個(gè)網(wǎng)站的數(shù)據(jù),php爬取數(shù)據(jù)

PHP獲取網(wǎng)站中的信息并存入數(shù)據(jù)庫

用PHP自帶函數(shù)就可以實(shí)現(xiàn)，首先要過去對(duì)方的網(wǎng)頁信息，用

創(chuàng)新互聯(lián)網(wǎng)站建設(shè)公司，提供成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作，網(wǎng)頁設(shè)計(jì)，建網(wǎng)站，PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);可快速的進(jìn)行網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴(kuò)展；專業(yè)做搜索引擎喜愛的網(wǎng)站，是專業(yè)的做網(wǎng)站團(tuán)隊(duì)，希望更多企業(yè)前來合作!

file_get_contents();參數(shù)是對(duì)方的URL地址，這個(gè)函數(shù)返回是一個(gè)字符串你想要的東西就在這個(gè)字符串中了

接下來就可以針對(duì)這個(gè)字符串做處理了，說下思路，正如你這個(gè)問題想獲取到航班號(hào)起飛時(shí)間，在這個(gè)網(wǎng)頁中應(yīng)該有很多相同的標(biāo)簽元素，它們都有共同點(diǎn)，用

用正則表達(dá)式preg_match();或者是

preg_match_all();這兩個(gè)函數(shù)它們都返回一個(gè)數(shù)組，這個(gè)數(shù)組存的就是你要的航班號(hào)和起飛時(shí)間，那么相同信息的數(shù)組就會(huì)出現(xiàn)了，然后在對(duì)這個(gè)數(shù)組進(jìn)行分析找到你要的某個(gè)值或全部的值

獲取信息要用到的3個(gè)函數(shù)是：

file_get_contents();

preg_match();

preg_match_all();

如何利用php抓取網(wǎng)站動(dòng)態(tài)產(chǎn)生的數(shù)據(jù)

$url = "網(wǎng)站地址目錄";

$queryServer = curl_init();

curl_setopt($queryServer, CURLOPT_URL, $url);

curl_setopt($queryServer, CURLOPT_HEADER, 0);

curl_setopt($queryServer, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($queryServer, CURLOPT_RETURNTRANSFER, true);

curl_setopt($queryServer, CURLOPT_CONNECTTIMEOUT, 10);

curl_setopt($queryServer, CURLOPT_TIMEOUT, 30);

$html = curl_exec($queryServer);

$html = iconv('UTF-8','GBK//IGNORE',$html); //如果你需要是的數(shù)據(jù)是utf-8編碼的,這一行可以注銷，如果需要gbk編碼的,請(qǐng)保留.如果出現(xiàn)亂碼，就是一行的問題，你自己調(diào)著試吧

//echo $holder;exit; 此處可以輸出來測試.

$html = str_replace(array("\n","\r","\t"),"",$html);

$preg = '/table\s+width=\"800\"[^]+(.*?)\/table/';

preg_match_all($preg,$html,$out);

//匹配每行

preg_match_all('/tr[^]+(.*?)\/tr/',$out[1][0],$tr);

//匹配每個(gè)td

$result = array();

$match = '/td.+([^]+)\/td/U';

foreach( $tr[0] as $key = $value ){

preg_match_all($match,$value,$arr);

$result[] = $arr[1];

}

//輸出測試,$result就是你要的數(shù)據(jù)，至于你要怎么輸出顯示格式，那就隨心調(diào)就好了。

foreach( $result as $key = $value ){

echo implode("\t",$value);

echo "br";

}

exit;

PHP抓取網(wǎng)頁指定內(nèi)容

?php

* 如下：方法有點(diǎn)笨

* 抓取網(wǎng)頁內(nèi)容用 PHP 的正則

* 用JS每隔5分鐘刷新當(dāng)前頁面---即重新獲取網(wǎng)頁內(nèi)容

* 注： $mode中--title/title-更改為所需內(nèi)容（如 $mode = "#a(.*)/a#";獲取所有鏈接）

* window.location.href="";中的

* 更改為自己的URL----作用：即刷新當(dāng)前頁面

* setInterval("ref()",300000);是每隔300000毫秒（即 5 * 60 *1000 毫秒即5分鐘）執(zhí)行一次函數(shù) ref()

* print_r($arr);輸出獲得的所有內(nèi)容 $arr是一個(gè)數(shù)組可根據(jù)所需輸出一部分（如 echo $arr[1][0];）

* 若要獲得所有內(nèi)容可去掉

* $mode = "#title(.*)/title#";

if(preg_match_all($mode,$content,$arr)){

print_r($arr);

echo "br/";

echo $arr[1][0];

}

再加上 echo $content；

$url = ""; //目標(biāo)站

$fp = @fopen($url, "r") or die("超時(shí)");

$content=file_get_contents($url);

$mode = "#title(.*)/title#";

if(preg_match_all($mode,$content,$arr)){

//print_r($arr);

echo "br/";

echo $arr[1][0];

}

script language="JavaScript" type="text/javascript"

function ref(){

window.location.href="";

}

setInterval("ref()",300000);

//--

/script

PHP怎樣抓取網(wǎng)頁代碼中動(dòng)態(tài)顯示的數(shù)據(jù)

PHP Simple HTML DOM或者phpQuery可以直接取得某些div中的內(nèi)容，里面有幾個(gè)例子專門針對(duì)于網(wǎng)頁抓取，調(diào)整好抓取頻次，舍去已經(jīng)存在的數(shù)據(jù)，你可以參考下

;id=57class=2

請(qǐng)問php怎樣抓取其它網(wǎng)站的動(dòng)態(tài)數(shù)據(jù)，顯示在自己的網(wǎng)頁內(nèi)并同步更新。

剛吃完午飯吧，來幫你實(shí)現(xiàn)一下吧。記得加分哦。

$url = "";