![]() |
|
||||
|
|
Цитата:
|
|
Цитата:
Прикол в том, что до меня эту задачу ставили тамошнему программеру - безрезультатно. |
|
Цитата:
Сапромат я учил сам - в курсе АСУ не было, учил на спор. Сейчас почти все забыл. Если мне дать соответствующие книжки и спецификации - за некое разумное время научусь. Но зачем? |
|
Цитата:
|
|
Цитата:
А вот вполне инженерная программистская задача -- по локальной сети, через парочку роутеров, обнаружить некое оборудование, считать с него параметры, перехватить управление. Можно идти топором, а можно и исользовать некоторые принципы из совершенно смежных областей -- педагогика, социология, биология и т.д. :) Это я не про банкомат! :) |
|
Цитата:
Цитата:
|
|
Цитата:
http://www.freepatentsonline.com/EP1732012.html Я в основном с PDFLib работаю - это маленькая фирма, которую Adobe очень не любит. Открытый то он открытый, но настолько сложный. что эта открытость мало помогает... |
|
Цитата:
А закодировать хороший алгоритм и обезьяна сумеет (комплимент :-) |
|
Цитата:
Кстати, РТИ -- сбежавший факультет БПИ! :))) |
|
Цитата:
|
|
Цитата:
|
|
Цитата:
;))) |
|
Цитата:
The method of identifying redundant text fragments in..... Нифига не понял :))))))))))) А нафига их искать-то? Последовательности эти ? Ж))))))))))))) |
|
Цитата:
А про программиста и машинистку см.ниже -- кодирование и алгоритмизация -- таки разные вещи. |
|
Автор:
gin_tonic
Дата: 19.12.2009 03:16 Re: Умер Егор Гайдар |
|
|
Цитата:
Или это шутка юмора такая была? |
|
Цитата:
Так какого хрена столько реализаций и все стучат себя в грудь, что они лучшие... Кроме того, есть еще и HDL коденье :))))) |
|
Цитата:
|
|
Цитата:
|
|
Цитата:
|
|
Цитата:
В общем случае тот текст, который Вы видите на странице ПДФ построен из мешанины не связаных между собой кусочков. Потому, что формат предназначался для печати. Разные программы создают мешанину разной степени запутанности. пробелов между словами тем более нет. К этому добавляются проблемы с кодировкой. Если Вы хотите этот текст вытащить наружу, вам надо: Задача 1. Разобрать эту мешанину, найти закономерности и выстроить слова. Задача 2. Определить последовательность слов. Задача 3. Определить логическую структуру - параграфы, таблицы итд и их последовательность. Подобные задачи решают OCRы, но там иные критерии иные алгоритмы. Акробат имеет свой алгоритм, есть еще пара продуктов со своим подходом. Разумеется, я считаю наш - лучшим... |
|
Цитата:
|
|
Цитата:
- Любители. Вот вы. товарищ Фурцева обратились бы к геникологу-любителю? Я это к тому что любым делом должен заниматься профессионал. Это вс еравно , если бы командиру инженерной роты поручили бы языка взять, а мне дорогу построитьть -) |
|
Цитата:
Вот я всегда говорил, что патенты эти самые и придумали.... Знания и информация должны быть свободными! Изобрел прищепку? Ну так выпускай её. Продавай. И не пищи потом, что кто-то придумал на основе пружины и двух херовин лучше.... А потом начинается - мы тут патент на слово "водка" получили, а мы на фигурные скобки.... |
|
Цитата:
|
|
Цитата:
|
|
Цитата:
И кстати - обычный юниксовый pdf2text (если там таки инкапсулирован текст) - меня никогда не подводил..... Ну естественно, это мнение дилетанта :))) |
|
Цитата:
Впрочем мне наплевать. Мне это хороший кусок хлеба с маслом, пока домой не вернемся. Дома я этим точно заниматься не буду. |
|
Цитата:
Подрыв экономики Палестины? Пардон - Израиля.... |
|
Цитата:
Рябчиков жуй.." (с) |
|
Цитата:
- время. Надо перегнать ПДФ в картинку и потом его ОСРить. - Ошибки ОСР. Даже при 600 dpi будут ошибки, особенно при тесном тексте и цветном бакграунде. Цитата:
|
|
2002 - 2011 © Bigler.ru Перепечатка материалов в СМИ разрешена с ссылкой на источник. Разработка, поддержка VGroup.ru Кадет Биглер: cadet@bigler.ru Вебмастер: webmaster@bigler.ru |