很多站长朋友们都不太清楚php获取网页内容过滤,今天小编就来给大家整理php获取网页内容过滤,希望对各位有所帮助,具体内容如下:
本文目录一览: 1、 PHP 如何从mysql 一个字段中提取内容并过滤所有HTML代码,然後存入另一个字段内? 2、 php怎样用正则表达式提取span标签中内容并过滤掉p和br标签 3、 php获取指定网页内容 4、 用PHP如何获取网页审查元素中的内容? 5、 如何过滤php内容页面里面的$nbsp; PHP 如何从mysql 一个字段中提取内容并过滤所有HTML代码,然後存入另一个字段内?本人不擅长写正则,正则部分 你自己看着写吧
步骤 1 首先测试整理products_short_description
1.1 定义一个 变量内容为 products_description 的某一个完整内容
1.2 用正则过滤掉不想要的东西, 将想要的东西整理好
注:这个做完 你已经完成很大一部分内容了
2 备份数据库表 products,将products复制成 products_test表。为了测试 不破坏products表
3 查询出products_test表内容 。获取到每行数据的时候 执行下 步骤1 的内容
4 将步骤一相关正确的结果 放置到一个数组中 产品id为key ,形成的正确结果为value
5 最终 遍历正确的数组。 执行更新 products_test 表
6 当确认 以上无误 ,那你就可以更改products 表了
php怎样用正则表达式提取span标签中内容并过滤掉p和br标签你要过滤的字符串是不是就都是这种,就这么长的。
你的需求是不是就是把字符串里面的各种标签都去掉?
如果你的需求和上面的说的相符,不需要用正则表达式,PHP 提供了 strip_tags 函数,用来过滤字符串里面的 html 标签,接收两个参数:第一个参数是要处理的字符串,第二个参数是允许(要保留)的tag
$str = '<span id="aaa"><p>11111</p><br><p>22222</p><span>';
echo strip_tags( $str ); // output : 1111122222
echo strip_tags( $str, '<span>' ); //output : <span id="aaa">1111122222<span>
我觉得这可能是你的实际需求,如果不符合你的需求,继续追问。
php获取指定网页内容一、用file_get_contents函数,以post方式获取url
<?php
$url= '';
$data= array('foo'=> 'bar');
$data= http_build_query($data);
$opts= array(
'http'=> array(
'method'=> 'POST',
'header'=>"Content-type: application/x-www-form-urlencoded\r\n" .
"Content-Length: " . strlen($data) . "\r\n",
'content'=> $data
)
);
$ctx= stream_context_create($opts);
$html= @file_get_contents($url,'',$ctx);
二、用file_get_contents以get方式获取内容
<?php
$url='';
$html= file_get_contents($url);
echo$html;
?>
三、用fopen打开url, 以get方式获取内容
<?php
$fp= fopen($url,'r');
$header= stream_get_meta_data($fp);//获取报头信息
while(!feof($fp)) {
$result.= fgets($fp, 1024);
}
echo"url header: {$header} <br>":
echo"url body: $result";
fclose($fp);
?>
四、用fopen打开url, 以post方式获取内容
<?php
$data= array('foo2'=> 'bar2','foo3'=>'bar3');
$data= http_build_query($data);
$opts= array(
'http'=> array(
'method'=> 'POST',
'header'=>"Content-type: application/x-www-form-
urlencoded\r\nCookie:cook1=c3;cook2=c4\r\n" .
"Content-Length: " . strlen($data) . "\r\n",
'content'=> $data
)
);
$context= stream_context_create($opts);
$html= fopen(';id2=i4','rb',false, $context);
$w=fread($html,1024);
echo$w;
?>
五、使用curl库,使用curl库之前,可能需要查看一下php.ini是否已经打开了curl扩展
<?php
$ch= curl_init();
$timeout= 5;
curl_setopt ($ch, CURLOPT_URL, '');
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents= curl_exec($ch);
curl_close($ch);
echo$file_contents;
?>
用PHP如何获取网页审查元素中的内容?使用file_get_contents可以获取网页源码
<?php
$homepage = file_get_contents ( '' );
echo $homepage ;
?>
如何过滤php内容页面里面的$nbsp;你过滤html时直接用strip_tags()函数,空格就一块去掉了。
或者直接替换一下,$str = str_replace("靠,空格不显示,这里应该是空格符号 ","",$str);
关于php获取网页内容过滤的介绍到此就结束了,不知道本篇文章是否对您有帮助呢?如果你还想了解更多此类信息,记得收藏关注本站,我们会不定期更新哦。
查看更多关于php获取网页内容过滤 php获取网页内容过滤不了的详细内容...