编辑:没有说清楚。我正在使用 PHP
我正在尝试创建一个现代化的 Boxrec 网站,我正在从维基百科抓取数据。在拳击手的每个维基百科页面中,都有一张他们的比赛表格。我已经成功地从另一个表中提取了胜利、失败和平局数据。我如何使用 PHP 将战斗表数据提取到某种(2D?)纯文本数组中?
这是该表的链接(这是第二个表,较大的一个) https://en.wikipedia.org/wiki/Sugar_Ray_Robinson#Professional_boxing_record
这是我尝试过的代码(我可能完全不同意这个)
$dom = new domDocument;
$dom->loadHTML($table);
$dom->preserveWhiteSpace = false;
$tables = $dom->getElementsByTagName('table');
$rows = $tables->item(1)->getElementsByTagName('tr');
foreach ($rows as $row) {
$cols = $row->getElementsByTagName('td');
echo $cols[2];
}
这给了我
警告: DOMDocument::loadHTML():意外的结束标记:实体中的 div,第 38 行 C:\xampp\htdocs\boxing\search\index.php 中的第 4375 行
忽然笑