好得很程序员自学网
  • 首页
  • 后端语言
    • C#
    • PHP
    • Python
    • java
    • Golang
    • ASP.NET
  • 前端开发
    • Angular
    • react框架
    • LayUi开发
    • javascript
    • HTML与HTML5
    • CSS与CSS3
    • jQuery
    • Bootstrap
    • NodeJS
    • Vue与小程序技术
    • Photoshop
  • 数据库技术
    • MSSQL
    • MYSQL
    • Redis
    • MongoDB
    • Oracle
    • PostgreSQL
    • Sqlite
    • 数据库基础
    • 数据库排错
  • CMS系统
    • HDHCMS
    • WordPress
    • Dedecms
    • PhpCms
    • 帝国CMS
    • ThinkPHP
    • Discuz
    • ZBlog
    • ECSHOP
  • 高手进阶
    • Android技术
    • 正则表达式
    • 数据结构与算法
  • 系统运维
    • Windows
    • apache
    • 服务器排错
    • 网站安全
    • nginx
    • linux系统
    • MacOS
  • 学习教程
    • 前端脚本教程
    • HTML与CSS 教程
    • 脚本语言教程
    • 数据库教程
    • 应用系统教程
  • 新技术
  • 编程导航
    • 区块链
    • IT资讯
    • 设计灵感
    • 建站资源
    • 开发团队
    • 程序社区
    • 图标图库
    • 图形动效
    • IDE环境
    • 在线工具
    • 调试测试
    • Node开发
    • 游戏框架
    • CSS库
    • Jquery插件
    • Js插件
    • Web框架
    • 移动端框架
    • 模块管理
    • 开发社区
    • 在线课堂
    • 框架类库
    • 项目托管
    • 云服务

当前位置:首页>后端语言>PHP
<tfoot draggable='sEl'></tfoot>

php正则网页内容 php正则表达式匹配字符串

很多站长朋友们都不太清楚php正则网页内容,今天小编就来给大家整理php正则网页内容,希望对各位有所帮助,具体内容如下:

本文目录一览: 1、 php 正则提取网页中指定的信息并且整理成想要的格式 2、 PHP如何正则表达式提取网页内容 3、 php 用正则表达式提取网页内容 4、 php 正则表达式 匹配网站内容 5、 PHP正则获取整个页面标签里面的内容 php 正则提取网页中指定的信息并且整理成想要的格式

<?php

$Table = '<table border="1" bordercolor="#666666" style="BORDER-COLLAPSE:collapse" cellspacing="0" class=tableborder>  <tr class="color-header">    <td width="100" align="center" nowrap>课程性质</td>    <td width="100" align="center" nowrap>课程号</td>    <td width="150" align="center" nowrap>课程名称</td>    <td width="80" align="center" nowrap>考试类型</td>    <td width="40" align="center" nowrap>学时</td>    <td width="40" align="center" nowrap>学分</td>    <td width="80" align="center" nowrap>成绩类型</td>    <td width="60" align="center" nowrap>期末成绩</td>    <td width="60" align="center" nowrap>总评成绩</td>  </tr>     <tr class="color-row">    <td nowrap> 专业核心课</td>    <td align="center" nowrap>1091123</td>    <td nowrap> 软件工程</td>    <td nowrap> 考试</td>    <td align="right" nowrap>51 </td>    <td align="right" nowrap>2.5 </td>    <td nowrap> 期末考试</td>    <td align="right" nowrap>89 </td>    <td align="right" nowrap>95 </td>  </tr>     <tr class="color-row">    <td nowrap> 学科基础课</td>    <td align="center" nowrap>1091134</td>    <td nowrap> C++程序设计</td>    <td nowrap> 考试</td>    <td align="right" nowrap>51 </td>    <td align="right" nowrap>2.5 </td>    <td nowrap> 期末考试</td>    <td align="right" nowrap>87 </td>    <td align="right" nowrap>86 </td>  </tr> </table>'; //你所谓的部分网页源内容, 我这里是赋值给一个变量, 实际中, 你怎么来, 你自己写

/*过滤下多余的换行和空格*/

$Table = preg_replace('/\s{2,}/', '', $Table);

/*正则提取出每一行先*/

preg_match_all('/<tr\s+class="color\-row">(([\s\S](?<!<\/tr>))*)<\/tr>/is', $Table, $Tr);

/*得到每一行(也就是每一个科目的成绩的一个数组), 数组值是td单元格html代码, 还不行, 还需要进一步匹配数据*/

$ChengJiArray = $Tr[1];

/*设置一个变量, 用于储存总共有多少学科, 初始赋值一个空数组*/

$XueKeArray = array();

/*遍历匹配出来的表格行数组*/

foreach(  $ChengJiArray as $Value ) {

 preg_match_all('/<td[^>]*>([^<]*)<\/td>/is', $Value, $Td); //匹配每个单元格中的数据

 $Data = $Td[1]; //等到数据集合

 /*构建一个记录各个项目的数组*/

 $XiangMuArray = array( 'name' => $Data[2], 'type' => $Data[6], 'fenshu' => $Data[7], 'zongfenshu' => $Data[8]);

 /*给最后的学科数组赋值*/

 $XueKeArray[] = $XiangMuArray;

}

/*清空不需要的变量和数组*/

unset( $Table, $Tr, $ChengJiArray, $Value, $Td, $Data, $XiangMuArray );

/*最后打印一下结果数组用于测试, 具体应用你自己写*/

print_r( $XueKeArray );

运行结果截图:

PHP如何正则表达式提取网页内容

如果你要<div class="nav" monkey="nav">和<div class="head-ad">之间的所有源码,用 preg_match 就可以,不用preg_match_all ,如果你要里面的所有的 <li></li>标签中的内容,可以用preg_match_all

//提取所有代码

$pattern = '/<div class="nav" monkey="nav">(.+?)<div class="head-ad">/is';

preg_match($pattern, $string, $match);

//$match[0] 即为<div class="nav" monkey="nav">和<div class="head-ad">之间的所有源码

echo $match[0];

//然后再提取<li></li>之间的内容

$pattern = '/<li.*?>(.+?)<\/li>/is';

preg_match_all($pattern, $match[0], $results);

$new_arr=array_unique($results[0]);

foreach($new_arr as $kkk){

echo $kkk;

}

php 用正则表达式提取网页内容

$str = '<li class="blackArea" data-sourcelatest-elem="item" data-tvid="694641300" data-vid="7b0b59d2ef0cb1152368ca9be9a4ae76" data-idx="4" data-sourcelatest-month="" data-delegate="videoPlayList">

<p class="video_position video_rb"><span class="v_name" rseat="xj_ty3">第2017-06-08期</span></p>

<h3> <a title="微体兔新版馋嘴小面" href="javascript:void(0);" rseat="xj_vn3">微体兔新版馋嘴小面</a> </h3>

</li>';

$pattern = "/[\s\S]*<li[^>]+data-tvid[=\"\']+([^\"\']*)[\"\'][^>]*data-vid[=\"\']+([^\"\']*)[\"\'][\s\S]*/i";

$tvid = preg_replace($pattern, "$1", $str);

$vid = preg_replace($pattern, "$2", $str);

$reg = "/[\s\S]*<p[^>]*>((?:(?!<\/p>)[\s\S])*)<\/p>[\s\S]*/i";

$p = preg_replace($reg, "$1", $str);

$reg = "/[\s\S]*<h3[^>]*>((?:(?!<\/h3>)[\s\S])*)<\/h3>[\s\S]*/i";

$h3 = preg_replace($reg, "$1", $str);

echo $tvid."\n".$vid."\n".$p."\n".$h3;

php 正则表达式 匹配网站内容

<div

class="nav"

monkey="nav">和<div

class="head-ad">之间的所有源码,用

preg_match

就可以,不用preg_match_all

,如果你要里面的所有的

<li></li>标签中的内容,可以用preg_match_all

//提取所有代码

$pattern

=

'/<div

class="nav"

monkey="nav">(.+?)<div

class="head-ad">/is';

preg_match($pattern,

$string,

$match);

//$match[0]

即为<div

class="nav"

monkey="nav">和<div

class="head-ad">之间的所有源码

echo

$match[0];

//然后再提取<li></li>之间的内容

$pattern

=

'/<li.*?>(.+?)<\/li>/is';

preg_match_all($pattern,

$match[0],

$results);

$new_arr=array_unique($results[0]);

foreach($new_arr

as

$kkk){

echo

$kkk;

}

PHP正则获取整个页面标签里面的内容

htmlspecialchars是将html转码,防止XSS攻击的。你这样没有意义。

CURL获取内容后直接 preg_match_all('/<p>(.*?)<\/p>/');就可以了

还有不懂的可以追问

关于php正则网页内容的介绍到此就结束了,不知道本篇文章是否对您有帮助呢?如果你还想了解更多此类信息,记得收藏关注本站,我们会不定期更新哦。

查看更多关于php正则网页内容 php正则表达式匹配字符串的详细内容...

声明:本文来自网络,不代表【好得很程序员自学网】立场,转载请注明出处:http://www.haodehen.cn/did208361
更新时间:2023-05-03   阅读:17次

上一篇: 每天学会php语法 php语言怎么学

下一篇:php显示for循环 php用for循环

最新资料更新

  • 1.php判断字符串的编码 php 判断字符串是否存在某个字符串
  • 2.php资源扫描教程 php识别二维码内容源码
  • 3.php开发宝典 php7开发宝典pdf下载
  • 4.nginx分离部署php nginx分发请求
  • 5.redis缓存类php php redis页面缓存
  • 6.杭州php前景如何 杭州php培训学校
  • 7.php瀑布流响应 html 瀑布流
  • 8.关于php用户同时登录的信息
  • 9.怎么写php需求 php市场需求
  • 10.php美国东部时间 美国东部时间 换算
  • 11.php微信爬虫 微信爬虫访问是什么
  • 12.长沙php就业怎样 2021年php就业班
  • 13.php数据库对象 php针对数据库的查询函数是
  • 14.php接口和抽象类的区别 php抽象函数
  • 15.订餐系统php 订餐系统升级维护,请前往
  • 16.PHP版本在哪调 phpversion
  • 17.php在线做点兼职 php在线做点兼职是真的吗
  • 18.php构造方法重写 php 构造方法
  • 19.php移动gps定位 functionsphp位置
  • 20.php后端需要css吗 php后端教程

CopyRight:2016-2025好得很程序员自学网 备案ICP:湘ICP备09009000号-16 http://www.haodehen.cn
本站资讯不构成任何建议,仅限于个人分享,参考须谨慎!
本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。

网站内容来源于网络分享,如有侵权发邮箱到:kenbest@126.com,收到邮件我们会即时下线处理。
网站框架支持:HDHCMS   51LA统计 百度统计
Copyright © 2018-2025 「好得很程序员自学网」
[ SiteMap ]