我正在使用file_get_contents获取网站的整个HTML代码,并将其保存到变量中。
本网站的内容基于时间,并经常更新。我需要运行一个脚本,该脚本将从其HTML中获取特定的列和行,然后我计划将其转换为人类可读的文本形式。
我现在的问题是,我对应该使用什么方法来扫描HTML,找到我想要提取的列和行,并且只有在自上次运行脚本以来对其进行了更新时才保存它。
12345678_0001
相关分类