Spidering

Все, что вы хотели знать о программизме, но боялись спросить.
Ответить
MikeD
Частый Гость
Сообщения: 11
Зарегистрирован: 20 фев 2003, 09:41

Spidering

Сообщение MikeD »

Нужно в инете с разных URL выдерать куски из HTML есть что-то вроде либы для облегчения гемора или прийдется самому по граблям ходить?
Boo
Пользователь
Сообщения: 92
Зарегистрирован: 20 фев 2003, 00:41

Сообщение Boo »

многоплатформенные альтернативы:
C/C++
- libcurl. поможет тебе брать файлы по HTTP/FTP. HTML будешь парсить сам. хотя для этого можно например приспособить PCRE.
- libwww. более монстроидальный подход. хотя все есть все в одном флаконе, даже пример реализации паука там вроде был.

Perl
- LWP::RobotUA

если бы вопрос содержал язык и платформу, то можно было бы дать более другие рекомендации.
Аватара пользователя
Marmot
Графоман
Сообщения: 38345
Зарегистрирован: 17 фев 2003, 17:58
Откуда: Canyon Heights
Контактная информация:

Сообщение Marmot »

Ответить