Новинки:

Сайт подключен к Orphus. Если вы заметили опечатку, выделите слово и нажмите Ctrl+Enter. Спасибо!

Re: результы...


Сайт о сжатии >> Форум #Компрессор# >> [Ответить] [Ответы]

Автор: FAL,
15 июля 2004 года в 12:08:10

В ответ на : Re: результы... от Savenger в 14 июля 2004 года в 20:30:08:


> О как... "Если хочешь что-то спрятать - положи на самое видное место" (с)
> Обязательно попробую сегодня похимичить с либой...

:) Там просто есть ехе-шник, можно просто упаковать выходные данные.

> Большинство понятно и так, а вот RemoveSafeQuote делает из [FONT face="Tahoma"] - [FONT face=Tahoma]. KillStrangeSpaces заменяет последовательности "] [" на "][".

Ага, я так и думал.

> Угу... так же как нет смысла писать декодер, пока нет смысла в использовании кодера... (8 Но 10%, должен заметить, это уже достаточно не плохо.

Ну да, только вот при определении смысла использования на основании коэффициента сжатия неизвестно как работающего кодера можно сильно промахнуться :)

> В смысле? Я тут в кодере столкнулся с тем, что... ...он может заменить что-нибудь в html-ссылке, в результате чего попортить её (например, изменить регистр). Опять же, если обрабатывать ещё и варианты "просто теги", "ссылки" - это ж голова распухнет.. (%

А если писать что-то серьезное, то придется попыхтеть :)

А препроцессинг текста - выделяем символ, например, 1 (это не "1", а именно единица) и перед каждым словом, начинающемся с большой буквы пишем 1, а потом это слово:
"Слово" -> "1слово",
а еще лучше поставить пробел:
"1 слово",
если слово все из больших букв, то получается:
"СЛОВО -> 2 слово",
таким образом мы заметно улучшим сжатие для текста при использовании PPM.
Также можно перед знаками препинания ставить пробел, что тоже улучшит сжатие.
В общем, например по этой ссылке
http://www.compression.ru/download/articles/text/smirnov_2002_pos_tagging/smirnov_2002_pos_tagging.html

Ответы:



Ответить на это сообщение

Тема:

Имя (желательно полное):

E-Mail:

URL:

Город:

Страна:

Вежливый и подробный комментарий:
(Форматируйте его, пожалуйста, как почту - короткими строками
Еnter в конце строки, пустая строка между параграфами).

Пожалуйста, заполните все поля.
И не нажимайте по два раза на кнопку! Дождитесь ответа сервера.