翻过高山走不出你
给你两个思路1,读取出来后,删除所有的html代码function html2txt($document){$search = array('@<script[^>]*?>.*?</script>@si', // 去掉脚本'@<style[^>]*?>.*?</style>@siU', // 去掉css'@<[\/\!]*?[^<>]*?>@si', // 去掉html'@<![\s\S]*?--[ \t\n\r]*>@' // 去掉ddt头部);$text = preg_replace($search, '', $document);return $text;} 这条函数可以做到2,采用正则表达式匹配中文$str = "04aol汉字";$pattern = "/^(\d)([A-Za-z])([".chr(0xa1)."-".chr(0xff)."]+)$/";if(preg_match($pattern, $str, $tmp)){print_r($tmp);}