Страница 1 из 1

Http parser

Добавлено: 18 июн 2004, 07:52
dima
Ищу http parser. С++ или C#.

Кто-нибудь пользуется ?

Re: Http parser

Добавлено: 18 июн 2004, 08:26
ajkj3em
dima писал(а):Ищу http parser. С++ или C#.

Кто-нибудь пользуется ?
чего там парсить то ?

request/response line
headers (in "key: value\r\n" format)
blank line ("\r\n")
body

ну может быть chunked encoding и compressed payload - не совсем
очевидные вещи, но все равно там на день работы и при этом ты
получаешь ровно такой интерфейс как тебе надо

Добавлено: 18 июн 2004, 11:38
dima
хотелось-бы пользоваться им как xml-parserom - указать входной поток и ходить как по дереву.

Добавлено: 18 июн 2004, 11:53
папа Карло
в этом деле смайл крутой.... только его тут не часто бывает....

Добавлено: 18 июн 2004, 16:01
Vitaliy-2000
dima писал(а):хотелось-бы пользоваться им как xml-parserom - указать входной поток и ходить как по дереву.
а что в потоке??? а если там будет сплошной mime?
или ты html с http спутал все же? :wink:

Добавлено: 18 июн 2004, 16:02
Vitaliy-2000
папа Карло писал(а):в этом деле смайл крутой.... только его тут не часто бывает....
это точно
заматерел - дальше некуда :shock: :D

Добавлено: 18 июн 2004, 20:31
Marmot
А это не пойдёт: http://tidy.sourceforge.net/
или вот это :-) : http://mercury.ccil.org/~cowan/XML/tagsoup/

Добавлено: 21 июн 2004, 07:46
dima
В потоке конечно-же html страница.

За линки спасибо. Большое.

Добавлено: 21 июн 2004, 10:24
ura
Так можно использовать объектную модель от того же Microsoft.
Только скорее HTML структура это набор коллеций по тегам нежели древовидная, но все завист от задачи. Те же parent, siblings, children отношения там присутствуют.

Добавлено: 21 июн 2004, 11:15
dima
пробовал. Не подходит. Не все html подходят под xml-правила.

Добавлено: 21 июн 2004, 11:23
Vitaliy-2000
dima писал(а):В потоке конечно-же html страница.

За линки спасибо. Большое.
тогда тайди (Tidy) однозначно!!! я постоянно пользую енту вещь (на яве) в своих хакерских целях (парсинг веб-баз в удобоваримый формат)

Он берет даже сильно не валидный html с пропущенными закрывающими тегами таблиц и тому подобное

Добавлено: 22 июн 2004, 19:36
Lepsik
тебе для какой среды ?

для Борланда я пользую Cuesoft

для VC родной мелкософтовский, для PocketPC самописный многплатформенный