Парс данных из html

Вопросы по программированию, не подходящие в другие разделы.

Модераторы: Naeel Maqsudov, C_O_D_E

Ответить
frankie
Сообщения: 1
Зарегистрирован: 04 окт 2013, 19:16

Джентельмены,
Нужно спарсить данные, в итоге хотелось бы получить в форме csv(может есть какие-то получше варианты)
Основная же проблема заключается в том, что из языков программирования владею только русским и английским
Прошу помочь, если данная просьба не является кощунством
Кроме этого ещё статьи из html надо вытащить, очень буду признателен, если поясните алгоритм
[HTML]<th valign=top width=122>Port Location:</th>
<td class=dash lign=left valign=top width=8> </td>
<td class=dash align=left valign=top width=370><b>Bandar Abbas</b></td>
</tr>
<tr>
<th valign=top>Port Name:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top><b>Port of Bandar Abbas</b></td>
</tr>
<tr>
<th valign=top>Port Authority:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top></td>
</tr>
<tr>
<th valign=top>Address:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top>Bandar Abbas
Iran</td>
</tr>
<tr>
<th valign=top>Phone:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top>98 761 564015</td>
</tr>
<tr>
<th valign=top>Fax:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top>98 761 564063</td>
</tr>
<tr>
<th valign=top>800 Number:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top></td>
</tr>
<tr>
<th valign=top>Email:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top><a href="mailto:"></a></td>
</tr>
<tr>
<th valign=top>Web Site:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top><a href="http://" target="_blank"></a></td>
</tr>
<tr>
<th valign=top>Latitude:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top>27° 8' 27" N</td>
</tr>
<tr>
<th valign=top>Longitude:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top>56° 12' 24" E</td>
</tr>
<tr>
<th valign=top>UN/LOCODE:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top>IRBND</td>
</tr>
<tr>
<th valign=top>Port Type:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top>Seaport</td>
</tr>
<tr>
<th valign=top>Port Size:</th>
<td class=dash align=left valign=top> </td>
<td class=dash align=left valign=top>Medium</td>[/HTML]
Ответить