jsoup - Jsoup总是添加 <tbody> 标记

  显示原文与译文双语对照的内容
0 0

我正在尝试解析 http://www.moneycontrol.com/stocks/marketstats/gainerloser.php?optex=NSE&opttopic=topgainers&index=-2


Document document = Jsoup.parseBodyFragment(html);

Elements tableElements = document.select("table[class=tbldata14 bdrtpg]");

这样我就能得到所有的<tr><table class="tbldata14 bdrtpg" width="100%" border="0" cellspacing="0" cellpadding="0"> 但是它附加了一个额外的<tbody>,它在原始html中不存在。


<table class="tbldata14 bdrtpg" width="100%" border="0" cellspacing="0" cellpadding="0"> 
 **<tbody>**
 <tr class="bggry"> 
 <th width="19%" align="left" class="brdrgtgry"><a href="/stocks/marketstats/gainerloser.php?optex=NSE&amp;opttopic=topgainers&amp;sort=sc_comp&amp;order=" class="bl_12"><b>Company Name</b></a></th> 
 <th class="brdrgtgry" align="left">High</th> 
 <th class="brdrgtgry" align="left">Low</th>.. ...

非常感谢您的帮助.

时间: 原作者:

0 0

请执行以下操作:


document.select("table[class=tbldata14 bdrtpg] tr");

它将选择表的实际内容。

原作者:
...