Страница 1 из 1

How to get text from MS Doc file ?

Добавлено: 04 май 2009, 06:33
dima
Привет

Программа должна получать как параметер имя MS doc файла и печатать на консоль все слова которые показывает MS Word (желательно по строкам)
Как лучше сделать ?
Весь документ английский. Могут быть Вордовские таблицы

Re: How to get text from MS Doc file ?

Добавлено: 04 май 2009, 09:07
badger
Я не знаю, для какой операционной системы Вам это надо и как Вы собираетесь это использовать, но есть, например, antiword. Им можно. И он портирован под разные ОС. Есть ещё catdoc, но его я только под Unix использовал. Не знаю, портирован ли под Win32.

http://www.linux.com/articles/113959

Re: How to get text from MS Doc file ?

Добавлено: 04 май 2009, 09:14
(Alex)
если java то http://poi.apache.org/hwpf/index.html - kak вариант

Re: How to get text from MS Doc file ?

Добавлено: 04 май 2009, 09:34
dima
Спасибо !