[an error occurred while processing this directive]
[an error occurred while processing this directive]
|
Автор: FAL, 11 июля 2004 года в 13:30:46 В ответ на : Re: Препроцессинг. Того стоит? от Savenger в 10 июля 2004 года в 00:12:46: > Нет, это понятно, просто выйгрыш в 3% меня не устроит.. Хочется чего-то (хотя бы немного) впечатляющего... (% Вообще-то 3% это очень неплохой выигрыш от препроцессинга, да еще при использовании продвинутых универсальных алгоритмов :) Так что примерно эта цифра и будет иметь место. Хотя 5% тоже можно получить :) Скажу более - бывают файлы, на которых можно получить сжатие раз в пять выше, чем обычным сжатием, но это очень редко. Такие файлы должны состоять в большинстве своем их тегов, на коих мы и отыгрываемся. Опять-таки, все исходя из опыта общания с XML. > Тогда как узнать какой именно тег закрывается? Такое возможно только на правильно сделанных HTML, а мне предстоит обрабатывать "что попало" прямо из Internet. В противном случаи, либо "исправлять" HTML перед сжатием, либо делать очень сложный парсинг... Ну либо то, ли другое. Во всяком случае, можно подумать про несложный парсинг, аналогично препроцессингу обычного текста. Многого не займет, а выгрыш даст. > Этим занимается оптимизатор. > Можно хотя бы пару цифр? Даже по памяти... Цифры... сжатие было с потерями, то есть удалялись все форматирующие символы и комментарии. Если сравнить, то на 20 файлах имеем: elts lzmaЃ 6359 490,575 байт (сжатие оригинальных файлов) elts lzmaЃ 6181 564,194 байт (сжатие распакованных файлов) elts fxpЃ 5525 386,200 байт (сжатие с препроцессингом) > Опять же, проблема только найти реализацию, т.к. я не знаком с C++, мне сложно сделать подходящую библиотеку даже из готовых исходников, чего уж говорить, если и таковых в наличаи не окажется... )8 Исходники есть на этом сайте. > LZMA либу (DLL) мне прислал один из здешних форумян (не знаю, хочет ли он обнародования своего имени, поэтому не буду оглашать на всякий...), её и используем. Да и по тестам LZMA показал себя с очень не плохой стороны... Да, но тексты жмутся лучше куда лучше PPM, нежели LZ. > Если кто-нибудь даст свободную (лицензионно) PPMd DLL'ку - с удовольствием потестирую результаты и, если они более впечатлят, чем LZMA, немедленно начну использовать. (8 Ну это к автору :) А вообще всех и вся в моих тестах побила durilca, как это ни печально :) |
[an error occurred while processing this directive]