时间:2021-05-26
功能:
1.获取内容中的url,email,image。
2.替换内容中的url,email,image。
url:<a href="url">xxx</a>
email:admin@admin.com
image:<img src="image">
Grep.class.php
复制代码 代码如下:
<?php
/** grep class
* Date: 2013-06-15
* Author: fdipzone
* Ver: 1.0
*
* Func:
*
* set: 设置内容
* get: 返回指定的内容
* replace: 返回替换后的内容
* get_pattern 根据type返回pattern
*/
class Grep{ // class start
private $_pattern = array(
'url' => '/<a.*?href="((http(s)?:\/\/).*?)".*?/si',
'email' => '/([\w\-\.]+@[\w\-\.]+(\.\w+))/',
'image' => '/<img.*?src=\"(http:\/\/.+\.(jpg|jpeg|gif|bmp|png))\">/i'
);
private $_content = ''; // 源内容
/* 設置搜尋的內容
* @param String $content
*/
public function set($content=''){
$this->_content = $content;
}
/* 获取指定内容
* @param String $type
* @param int $unique 0:all 1:unique
* @return Array
*/
public function get($type='', $unique=0){
$type = strtolower($type);
if($this->_content=='' || !in_array($type, array_keys($this->_pattern))){
return array();
}
$pattern = $this->get_pattern($type); // 获取pattern
preg_match_all($pattern, $this->_content, $matches);
return isset($matches[1])? ( $unique==0? $matches[1] : array_unique($matches[1]) ) : array();
}
/* 获取替换后的内容
* @param String $type
* @param String $callback
* @return String
*/
public function replace($type='', $callback=''){
$type = strtolower($type);
if($this->_content=='' || !in_array($type, array_keys($this->_pattern)) || $callback==''){
return $this->_content;
}
$pattern = $this->get_pattern($type);
return preg_replace_callback($pattern, $callback, $this->_content);
}
/* 根据type获取pattern
* @param String $type
* @return String
*/
private function get_pattern($type){
return $this->_pattern[$type];
}
} // class end
?>
Demo
复制代码 代码如下:
<?php
header('content-type:text/htm;charset=utf8');
require('Grep.class.php');
$content = file_get_contents('http:///');
$obj = new Grep();
$obj->set($content);
$url = $obj->get('url', 0);
$email = $obj->get('email', 1);
$image = $obj->get('image', 1);
print_r($url);
print_r($email);
print_r($image);
$url_new = $obj->replace('url', 'replace_url');
echo $url_new;
function replace_url($matches){
return isset($matches[1])? '[url]'.$matches[1].'[/url]' : '';
}
?>
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
聚焦爬虫:爬取页面中指定的页面内容。编码流程:1.指定url2.发起请求3.获取响应数据4.数据解析5.持久化存储数据解析分类:1.bs42.正则3.xpath
本文实例讲述了php实现专业获取网站SEO信息类。分享给大家供大家参考。具体如下:这个seo类的功能包括:-检查指定的网站响应-获取从该网站主页的语言和其他me
本文实例讲述了JS实现选定指定HTML元素对象中指定文本内容功能。分享给大家供大家参考,具体如下:该功能用处多多,可以灵活运用之!主要函数如下://选中文本中指
本文实例讲述了php实现获取及设置用户访问页面语言类,分享给大家供大家参考。具体分析如下:该实例UserLanguageClass获取/设置用户访问的页面语言,
Mybatis与Ibatis的区别:1、Mybatis实现了接口绑定,使用更加方便在ibatis2.x中我们需要在DAO的实现类中指定具体对应哪个xml映射文件