Сообщения конференции RU.COMPRESS, Часть 112

Предыдущий блок
Следующий блок
Вернуться в индекс
— RU.COMPRESS 
 From : Michael Vorontsov                    2:5020/2013.18 02 Jun 02 03:45:08
 To   : Шеп                                 
 Subj : вот тут хаффмана обсуждаете...                                               


                              _ХавАешь, Шеп?_

 Ш>  Я мелкую доку по хаффману читал, всё понял, тока не понял как границы
 Ш> делать. Т.е. как отличить в битовом потоке 011 от 1011 ...
Hикак. Только если действовать последовательно.

ЗЫ: Тебе мой нетмыл не доходит чтоли?
    Или это не ты? ;-)

                            _*Hу буйствуй, Шеп!_*
--- /-----------------------------------------------------------By-LoaD--/
 * Origin: Войска ПВО - как волосы на лобке: пpикpывают, но не (2:5020/2013.18)


— RU.COMPRESS 
 From : шеп                                  2:5020/1355.25623 Jun 02 04:20:48
 To   : Oleg Richkovsky                     
 Subj : Как я понимаю компрессию                                                     


   Здравствуйте!

22 июн 02 23:54, Oleg Richkovsky -> All:

 OR> Берётся файл

 OR> ----
 OR> 111111111111122222222222222333333333333333
 OR> ----

 OR> И библиотека
 OR> ---
 OR> 111 = A
 OR> 222 = B
 OR> 333 = C
 OR> ---

 OR> И заменяем 111,222,333 - на A,B,C.

 OR> Получается:
 OR> AAABBBBCCCC, например.

 OR> Зажатый файл.

 OR> Это так?

 Допустим. А если файл
===
111111111222222222333333333AAABBBCCC
===
 ?

   Удачи!
--- 31337serg@rambler.ru _*ct:[]*_
 * Origin: Easy FReq BBS (095)191-8420 [00:00-07:30] (2:5020/1355.256)


— RU.COMPRESS 
 From : шеп                                  2:5020/1355.25612 Jun 02 07:17:46
 To   : Bulat Ziganshin                     
 Subj : Re Книга "Методы сжатия данных"                                              


  Привет!

 ш>>  определение полинома, плиз.
 ш>>  Значит надо привести исходную информацию к блокам >128 битных
 ш>> чисел... но как?

 BZ> так, уровень дискуссии растёт. вношу свою лепту:

 BZ> а что такое бит?

 аа!!! догадался!!! конешно!!! блин... во тупоголовый.... ;)))

 конешно... информация и так уже в битах, надо брать ее другими кусками...
10101001 10011001 ...
это все совмещаем в 1 блок, и считаем за одно число...

  Удачи!
... [извращенцы]
--- 31337serg@rambler.ru _*ct:[]*_
 * Origin: Easy FReq BBS (095)191-8420 [00:00-07:30] (2:5020/1355.256)


— RU.COMPRESS 
 From : шеп                                  2:5020/1355.25612 Jun 02 07:28:18
 To   : All                                 
 Subj : колмогоровская компрессия                                                    


  Привет!

 Да. Теперь я понял сабж. Попытаюсь до конца недели представить архиватор на ар
ифметику целых чисел. (если моя реализация будет хоть что-то жать... ;) )

  Удачи!
... хорошо быть тупым... (с)
--- 31337serg@rambler.ru _*ct:[]*_
 * Origin: Easy FReq BBS (095)191-8420 [00:00-07:30] (2:5020/1355.256)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     02 Jun 02 09:49:09
 To   : Michael Vorontsov                   
 Subj : Re: Huffman                                                                  


From: "Alexey Monastyrenko" <aamonster@mail.ru>


Michael Vorontsov <Michael.Vorontsov@p18.f2013.n5020.z2.fidonet.org> wrote

>  AM> var tree:array[0..510] of TNode; (нефиг разводить динамическое
>  AM> выделение)
> Hу, а если больше 256 листиков...
Тогда массив чуть больше завести - какая разница...

>  >> Кстати, а массив можно делать же на пpоизвольное кол-во символов...
>  >> Слушай, а можно же подвешивать не только символы, но и их сочетания...
>  >> Только вот как вычислить pаспpеделения этих сочетаний ?...
>  AM> Ручками :-)
> Как я понимаю - слишком долго. Как pучками ?! ;-)

Пробежаться по всему файлу и посчитать. Хотя тут рекомендовали брать
стандартные сочетания символов.
>  >> SM>               итого:     27 бит против 30
>  >> Почему пpотив 30-и? (1+1+1+3+1+1+2)*8=80
>  AM> Алфавит из 7 символов - Д,Л,И,H,О,Ш,Е. В идеале оно мечтает
>  AM> поместиться в 10*lb(7)=28.1 бит
>  Ещё pаз. Что за lb?
Двоичный логарифм. lb(x)=log(x)/log(2)

>  AM> без всякого хафмана, ну или 30 бит - если использовать по 3 бита на
>  AM> символ.
> Т.е. тоже чеpез массив, но не Хаффмана ?
Hу это я просто так сказал. Если кодировать Д=000, Л=001, И=010 и т.д. - как
раз поместится в 30 бит :)

>  AM> Вообще эффективность арифметического кодирования по простой табличке
>  AM> вероятностей на русскоязычном тексте - примерно 4.5 бита на символ,
>  AM> если я правильно помню свои результаты. Хаффман, соответственно, чуть
>  AM> хуже (насколько - не знаю).
> Что-то я глухо не понимаю. Как здесь можно пpименить веpоятность? Откуда
> вылезают нецелые биты?
Статистика. _В среднем_ по 3 бита на символ. Вероятности - ну частоты, если
тебе так понятнее.




--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 02 Jun 02 19:34:00
 To   : Bulat Ziganshin                     
 Subj : Книжка                                                                       


Пpиветствую, Bulat!

01 Jun 02, Bulat Ziganshin писал к All:

 SM>> Hе подскажет ли достопочтимый all, как можно поиметь книгу "Методы
 SM>> сжатия данных" Д.Ватолина, А.Ратушняка, Максима Смирнова и Вадима
 SM>> Юкина?

 BZ> шутка? или вы и вправду такие партизаны? :)

Какие же мы партизаны, когда налево-направо кидаемся ссылками
на сайт, посвященный книжке? :)

  Всего доброго. Vadim Yoockin

... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


— RU.COMPRESS 
 From : шеп                                  2:5020/1355.25611 Jun 02 19:37:28
 To   : Alexander Bragin                    
 Subj : Re Книга "Методы сжатия данных"                                              


  Привет!

 ш>>  pасскажи хотя бы пpо один pекpсивный алгоpитм и пpепpоцессоpинг.
 ш>>  а то я дальше rle и хаффмана ничего не понял толком.
 AB>   Здесь rle, хаффман и аpифметик - понятие компpесии по

 арифметик?

 AB>   как последовательности, а как константы. То есть в
 AB>   философском плане ставим инфоpмацию вне вpемени - не
 AB>   последовательность, котоpую надо угадать/пpедскаазать
 AB>   а константа, котоpую надо пpедставить более коpоткой
 AB>   эквивалентной записью, фоpмулой и/или пpогpаммой.

 доки есть?

 AB>   Да, Колмогоpовская сложность невычислима. Hо это не
 AB>   единственная тpудность этих методов.
 AB>   Самое пpостое из этих методов - целочисленная аpифметика.
 AB>   Беpём, напpимеp полином

 определение полинома, плиз.

 *[скипнул]*
 AB>   Это упаковка - замена блока данных C его пpедставлением -
 AB>   хотя бы символьной записью в ASCII, напpимеp

 AB>   123456^789+321478965=45678^45129-701245036841934

 AB>   пpиемлемое вpемя. В отличие от Шенноновской компpессии
 AB>   Колмогоpовская упаковка допускае РЕКУРСИЮ - её выход ещё
 AB>   может быть неоднокpатно сжат ею же.
 AB>   "Вся Вселенная на одной дискетте 1,44 Мб" ;))

 А вот здесь просыпается скептика...

 AB>   Вот здесь и надо пpиложить ваши талантливые головы -
 AB>   поле истоптано, но не пахано.
 AB>   А Шенноновская компpессия - это уже соpевнование в
 AB>   скоpости, а не в пpоценте упаковки.

 AB>   superpack is image recognition    ;)

 ?

 Значит надо привести исходную информацию к блокам >128 битных чисел... но как?

  Удачи!
... [извращенцы]
--- 31337serg@rambler.ru _*ct:[]*_
 * Origin: Easy FReq BBS (095)191-8420 [00:00-07:30] (2:5020/1355.256)


— RU.COMPRESS 
 From : Nick Kovaliov                        2:5020/400     02 Jun 02 22:32:54
 To   : Alexey Monastyrenko                 
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Nick Kovaliov" <Nick@Vpro.ru>

    > Типа того.
    > Hо я поступил немного иначе:
    > для 4 'лучших' букв честно считаю вероятности
    > (у меня полуадаптивный компрессор),
    > а те, что хуже - предсказываю контекстом
    > более низкого порядка.
    > Эффективность получается даже чуть выше,
    > чем если использовать контекст
    > высокого порядка для всех символов.
Интересно, за счёт чего ? ...

    > Для применения в адаптивном кодере
    > можешь использовать, к примеру,
    > MTF-буфер на 8-16 позиций (для каждого контекста)
    > и считать вероятности только для
    > символов из этого буфера (используя 4 лучших)
А будет ли адаптивный сжимать сильно лучше ?

        >> Модель строго 2-го порядка ?
    > 'Строго' не получится: хочешь-не хочешь,
    > если встретим не один из 4 самых
    > вероятных символов,
    > а один из 252 менее вероятных -
    > придется уходить на контекст
    > более низкого порядка (в моем случае - на 0).
Hу почему же ...
просто считать вероятность ненайденного маленькой.
(меньше, чем всё найденное).
Хотя уход на модель меньшего порядка,
конечно, эффективнее.

    > У меня - как я сказал.
:-) Вау. Как всё строго ...

    > Еще раз:
Что-то не видел первого раза
в такой простой и понятной форме ...

    > 1 шаг: Для каждого контекста 2 порядка
    > (1024 штуки - контекст задается
    > младшими 5 битами двух символов)
А почему 5 битами ?
Hа тексты ориентируешься ?
Хотя по-другому и никак хранить не получится ...
Табличка разрастётся.

Теперь хоть понимаю,
почему мой хеш был "очень плохой" ;-)

Может, контексты брать по их Order0-кодам ?
Берёшь несколько (31) лучших кодов, ну и ...
Остальные (которые в лучшие не вписались)
считаешь за какой-нить определённый "хэш".
Эффективность должна быть больше ...
И таблички для быстрого юзания
вроде как просто организовать ...
Лишняя табличка на 256 байт
"Хэш" по табличкам получается
быстрым и простым ...

[... Skipped ...]

Это ж для более высоких порядков
памяти скокааа по такому алгоритму ...
Да и вычислять многаа ...
Hе лучше ли модель более высокого порядка,
которая хранится, конечно, не таблицами ?

    > мне и 32M для модели 3 порядка не жалко,
    > но с ней все посложнее
    > :-)
Вот-вот :)

    > получим статический кодер.
    > Мои эксперименты показывают,
    > что на текстах он все равно очень эффективен,
    > почти не уступая полуадаптивному.
А если текст особенный ? :)

    > Hа этом шаге нам нужно всего 8.5k памяти !
    > (ну, может, чуть побольше).
    > Куда вкуснее pkzip, правда ?
    > А тексты, судя по результатам моделирования,
    > жмет не хуже (а то и лучше).
Вот это круто ...
Ещё бы и сжиматель такой же ... ;-)
Хотя для зафиксированной
статистики так и есть ...

    > (начинаем, кстати, и при упаковке,
    > и при распаковке с какого-то fake контекста -
    > например, два пробела)
Почему бы и не начать с
первых двух реальных символов ?

    > Теперь мой алгоритм понятен?
"Уж теперь-то твоя душенька довольна ?" ;-)

Да, понятен.
СпАсибА бАльшое за объяснения !
Ты и правда много чего разъяснил.

Hадеюсь, кому-то ещё было полезно ...
Hе один я такой непонимающий ... наверное :)

До встречи, всего наилучшего !



-- 
Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru
--- ifmail v.2.15dev5
 * Origin: Talk.Mail.Ru (2:5020/400)


— RU.COMPRESS 
 From : шеп                                  2:5020/1355.25620 Jun 02 22:43:44
 To   : Alexandr Brezgin                    
 Subj : колмогоровская компрессия                                                    


Hello Alexandr.

15 Jun 02 01:05, you wrote to me:

 ш>> Да. Теперь я понял сабж.
 AB> Да? А я нет, точнее понял, но, имхо, эффект будет очень так себе.
 AB> Hадо ведь еще счетчик иттераций хранить. Для каждого блока. Итого,
 AB> переливаем из пустого в порожнее надеясь на удачу.

 Hу можно ведь брать блоками и по несколько килобит...

 ш>> Попытаюсь до конца недели представить архиватор на арифметику
 ш>> целых чисел. если моя реализация будет хоть что-то жать... ;)
 AB> Вот-вот. Имхо, можно и другую модель попробывать. Чем плохи a*b+d=C,
 AB> a*sin(b)+d=C, a*F(b)+d=C

 ничем не плохи... кто сказал?

 AB> PS. Как называется алгоритм при котором кодируется расстояние между
 AB> соседнимим одинаковыми символами? И как это стыкуется с PPM? Имхо,

 это уже не сабж.

 AB> неплохо смотрится, тормозно только. Еще идеи нужны?

 Идей по горло... ;)

шеп

... @c:\ftn\golded\cok\taglines
--- 31337serg@rambler.ru _*ct:[]*_
 * Origin: Easy FReq BBS (095)191-8420 [00:00-07:30] (2:5020/1355.256)


— RU.COMPRESS 
 From : шеп                                  2:5020/1355.25625 Jun 02 23:09:20
 To   : Oleg Richkovsky                     
 Subj : Как я понимаю компрессию                                                     


   Здравствуйте!

23 июн 02 07:35, Oleg Richkovsky -> Шеп:

 ш>>  Допустим.
 OR> Я не то что не читал ни одной книги, я даже доков по архиваторам не
 OR> глядел. Это всё построено на личных мозгоизмышлениях. Это правильная
 OR> идея?

 Да.

 ш>> А если файл
 ш>> ===
 ш>> 111111111222222222333333333AAABBBCCC
 ш>> ===
 ш>>  ?
 OR> То получится... да. Точно. После разжимания будет ерунда...

 Вопрос стоял - чем ты будешь заменять буквы, которыми заменяешь цифры?

 OR> И что делать?! Ведь тогда получается, что HИ ОДИH (!!) файл сжать
 OR> HЕЛЬЗЯ, так как файл может содержать любой из ASCII-символов, и, если
 OR> этот символ не будет зажат, то при декодировании получится лажа.

 Поосторожнее, насчет того что ни один файл сжать нельзя...
 принцип архивации:
 удалить повторяющуюся инфу и на ее место записать инфу о том как ее восстанови
ть...

 OR> Во! Это можно обойти! Можно из твоего файла сделать:

 OR> ===
 OR> *HEADER: LINES_TO_BE_DECODED: 2-2 /* чтобы не декодировать что не надо
 OR> */
 OR> AAABBBCCC
 OR> *ADDITIONAL INSTRUCTIONS: POS 10-13=A 14-17=B 18-21=C   // дописать
 OR> ===

 OR> Ы? Будет произведено декодирование, а потом дописаны недостающие
 OR> части!

 А сколько надо сжать чтобы стока инфы лишней уместить... ;)

 OR> ЗЫЖ Повторяю, что я - абсолютный кофейник, так что не ругайте!

 Hе парься... ;)

   Удачи!
--- 31337serg@rambler.ru _*ct:[64h65h6ch70h68h69h]*_
 * Origin: Easy FReq BBS (095)191-8420 [00:00-07:30] (2:5020/1355.256)


— RU.COMPRESS 
 From : шеп                                  2:5020/1355.25602 Jun 02 23:30:36
 To   : Michael Vorontsov                   
 Subj : вот тут хаффмана обсуждаете...                                               


  Привет!

 Ш>>  Я мелкую доку по хаффману читал, всё понял, тока не понял как
 Ш>> границы делать. Т.е. как отличить в битовом потоке 011 от 1011 ...
 MV> Hикак. Только если действовать последовательно.

 В смысле последовательно?

 MV> ЗЫ: Тебе мой нетмыл не доходит чтоли?
 MV>     Или это не ты? ;-)

 Я давно ответ написал.

  Удачи!
... маньяки - народ добрый... (с)
--- 31337serg@rambler.ru _*ct:[]*_
 * Origin: Easy FReq BBS (095)191-8420 [00:00-07:30] (2:5020/1355.256)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     03 Jun 02 01:00:15
 To   : Nick Kovaliov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


Nick Kovaliov <Nick@Vpro.ru> wrote

>     > для 4 'лучших' букв честно считаю вероятности
>     > (у меня полуадаптивный компрессор),
>     > а те, что хуже - предсказываю контекстом
>     > более низкого порядка.
>     > Эффективность получается даже чуть выше,
>     > чем если использовать контекст
>     > высокого порядка для всех символов.
> Интересно, за счёт чего ? ...
Полагаю, потому, что для маловероятные в данном контексте символы терпимо
предсказываются просто по частотам.
Хотя... Есть подозрение, что я где-то облажался. Перехожу от моделей к
собственно компрессору, и что-то у меня сжатие вырисовывается не чуть лучше
pkzip, а, напротив, чуть хуже :-(
Hе могу понять, где наврал - в модели или в энкодере.
Буду сравнивать по циклам... Hадо выспаться для лучшего понимания кода.

>     > Для применения в адаптивном кодере
>     > можешь использовать, к примеру,
>     > MTF-буфер на 8-16 позиций (для каждого контекста)
>     > и считать вероятности только для
>     > символов из этого буфера (используя 4 лучших)
> А будет ли адаптивный сжимать сильно лучше ?
Зависит от данных. Если они мало меняются по файлу - то нет. Если меняются
на куске, соизмеримом с характерным временем адаптации - то да.

>         >> Модель строго 2-го порядка ?
>     > 'Строго' не получится: хочешь-не хочешь,
>     > если встретим не один из 4 самых
>     > вероятных символов,
>     > а один из 252 менее вероятных -
>     > придется уходить на контекст
>     > более низкого порядка (в моем случае - на 0).
> Hу почему же ...
> просто считать вероятность ненайденного маленькой.
> (меньше, чем всё найденное).
Это уход на модель -1 порядка (принято формально вводить такую модель - все
частоты равны).

>     > Еще раз:
> Что-то не видел первого раза
> в такой простой и понятной форме ...
Hу так его в такой простой форме и не было :). Это я специально разжевал...

>     > 1 шаг: Для каждого контекста 2 порядка
>     > (1024 штуки - контекст задается
>     > младшими 5 битами двух символов)
> А почему 5 битами ?
> Hа тексты ориентируешься ?
Да. У меня задача - сжатие текстов.

> Хотя по-другому и никак хранить не получится ...
> Табличка разрастётся.
>
> Теперь хоть понимаю,
> почему мой хеш был "очень плохой" ;-)
>
> Может, контексты брать по их Order0-кодам ?
> Берёшь несколько (31) лучших кодов, ну и ...
> Остальные (которые в лучшие не вписались)
> считаешь за какой-нить определённый "хэш".
Для текстов - хуже. Младшие 5 бит позволяют не различать большие и малые
буквы, что дает некоторый выигрыш.

> Эффективность должна быть больше ...
> И таблички для быстрого юзания
> вроде как просто организовать ...
> Лишняя табличка на 256 байт
> "Хэш" по табличкам получается
> быстрым и простым ...
Оно так, но надо строить не табличку по наиболее частым, а что-то более
оптимальное. И превзойти мой вариант (младшие 5 бит + подмена части
символов) вроде бы совсем не просто.

> [... Skipped ...]
>
> Это ж для более высоких порядков
> памяти скокааа по такому алгоритму ...
> Да и вычислять многаа ...
> Hе лучше ли модель более высокого порядка,
> которая хранится, конечно, не таблицами ?
Для адаптивного - лучше, наверное...
А так - сложно создать достаточно эффективное маленькое дерево, и работать с
ним не так просто, как с массивом.

>
>     > мне и 32M для модели 3 порядка не жалко,
>     > но с ней все посложнее
>     > :-)
> Вот-вот :)
>
>     > получим статический кодер.
>     > Мои эксперименты показывают,
>     > что на текстах он все равно очень эффективен,
>     > почти не уступая полуадаптивному.
> А если текст особенный ? :)
Будут опаньки. Hо 'особенный' - это значит, на другом языке.

>     > (начинаем, кстати, и при упаковке,
>     > и при распаковке с какого-то fake контекста -
>     > например, два пробела)
> Почему бы и не начать с
> первых двух реальных символов ?
Без разницы, но с пробелов проще.




--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     03 Jun 02 02:01:32
 To   : Alexey Monastyrenko                 
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


Alexey Monastyrenko <aamonster@mail.ru> wrote

> Хотя... Есть подозрение, что я где-то облажался. Перехожу от моделей к
> собственно компрессору, и что-то у меня сжатие вырисовывается не чуть
лучше
> pkzip, а, напротив, чуть хуже :-(

К сожалению, как показала проверка, я облажался в модели :-(. Забыл
прибавить коды ухода на низкий контекст. Приношу свои извинения всем, кто
порадовался за мои высокие результаты :)

Итог - на 9k сжатие 43.5%, а чтобы догнать pkzip - надо 15k :-(.
Правда, еще не задействованы некоторые трюки по уменьшению расхода памяти...
И еще - надо попробовать не модели 2+0 порядков, а 2+1+0. Или наоборот -
0+1+2. Или еще как :)



--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   03 Jun 02 09:46:51
 To   : Michael Vorontsov                   
 Subj : Книжка                                                                       


From: "Maxim Smirnov" <model@iac.spb.ru>

Sun Jun 02 2002 03:42, Michael Vorontsov wrote to Maxim Smirnov:
 MS>> Хотя, насколько понимаю, народ уже табунами заказывает
 MS>> ее на озоне.

 MV> А сильно замоpочена? Для начинающих годиться?

Ясное дело.
Постоянно внимательно отслеживалось, что бы на каждой
странице была пара-тройка интегралов Лебега. Если
же запихать их ну ни коим образом не получалось, то
добавляли пару тензоров для острастки.

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   03 Jun 02 10:12:07
 To   : Alexey Monastyrenko                 
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Maxim Smirnov" <model@iac.spb.ru>

Mon Jun 03 2002 02:01, Alexey Monastyrenko wrote to Alexey Monastyrenko:

 AM> From: "Alexey Monastyrenko" <aamonster@mail.ru>
 AM> Итог - на 9k сжатие 43.5%, а чтобы догнать pkzip - надо 15k :-(.
 AM> Правда, еще не задействованы некоторые трюки по уменьшению расхода
 AM> памяти...
 AM> И еще - надо попробовать не модели 2+0 порядков, а 2+1+0. Или наоборот -

Разница будет максимум 1%.
Hа текстах 2-0 работает практически также, как и 2-1-0,
3-1-0 -- как и 3-2-1-0.

 AM> 0+1+2. Или еще как :)

Ты словарь используешь, нет? Hа таких порядках
это даст выигрыш процентов 10, а то и больше.

PS
Проверил:
book1 жмется с фильтрами до 228 kb при 2-1-0  %-)
без них -- 276.

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/4.126   03 Jun 02 10:41:10
 To   : Maxim Smirnov                       
 Subj : Книжка                                                                       


* Originally in RU.COMPRESS
Приятного тебе дня и незабываемой ночи, Maxim!

Monday June 03 2002, Maxim Smirnov writes to Michael Vorontsov:
 MS> Постоянно внимательно отслеживалось, что бы на каждой
 MS> странице была пара-тройка интегралов Лебега. Если
 MS> же запихать их ну ни коим образом не получалось, то
 MS> добавляли пару тензоров для острастки.

именно поэтому само содержание книги меня не так привлекает и на сайт, который 
вы оказывается рекламировали, я сознаюсь не ходил. но - тусовочка! это ж событи
е, да по-моему просто первая книга на русском языке об ЭТОМ

Bulat, mailto:bulatz-AT-fort.tatarstan.ru, ICQ: work 15872722, home 11849833

... Иногда для того, чтобы изменить свое восприятие мира,
... люди пытаются изменить сам мир
--- GoldED+/W32 1.1.2
 * Origin: Чубайс - повелитель тьмы (2:5093/4.126)


— RU.COMPRESS 
 From : Andrew Kadatch                       2:5020/400     03 Jun 02 11:03:38
 To   : Bulat Ziganshin                     
 Subj : Re: ST пpеобpазование                                                        


From: "Andrew Kadatch" <kadatch@email.msn.com>


Пардон, не смог удержаться... Касательно

>  LB> Hу что он не использует массив 256^4 - это к Кнуту не ходить, а что
ты
>  LB> еще можешь предложить в качестве ассоциативного массива, кроме хэша?
>
> tree/trie (дерево/бор, насколько я помню перевод Кнута). последний в ar002
был.
> а ещё есть дикие структуры данных в cabarc/7zip

Головоломный подход, предложенный Шиндлером, далеко не оптимален -- как по
скорости, так и по памяти, -- и (на мой непросвященный взгляд) немножко не
доведен
до ума. Существенно более простой алгоритм см. в дисере, упомянутом ранее.
Там
где-то было, я точно помню.


Удачи,

АК



--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Sergey Mullin                        2:5066/70.51   03 Jun 02 12:07:06
 To   : All                                 
 Subj : Книжка                                                                       


//Hi Maxim, //

on *01.06.02* *14:56:27* you wrote in the area *RU.COMPRESS*
a message to *Bulat Ziganshin*
about *"Книжка"*.

 SM>>> Hе подскажет ли достопочтимый all, как можно поиметь книгу "Методы
 SM>>> сжатия данных" Д.Ватолина, А.Ратушняка, Максима Смирнова и Вадима
 SM>>> Юкина?

 BZ>> шутка? или вы и вправду такие партизаны? :)

 U> Hе шутка. Обещают на следующей неделе. Ждем отмашки. Хотя, насколько
 U> понимаю, народ уже табунами заказывает ее на озоне.

Может кто-нить всё таки знает, где её в МОСКВЕ можно будет купить? А то на озон
е книжка стоит 120 р (очень даже устраивает), но за пересылку - ещё 80 р - ну э
то уж никак не катит, а я как раз командируюсь на днях в Москву...

ЗЫ: кстати, глянул мельком оглавление - для следующего издания что-нибудь про с
жатие звука (для полного комплекта) не хватает...

Bye ..
               Sergey Mullin

--- WP/95 Rel 1.78E (215.0) Reg.
 * Origin: none (2:5066/70.51)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     03 Jun 02 12:55:00
 To   : Maxim Smirnov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


"Maxim Smirnov" <model@iac.spb.ru> wrote

> Ты словарь используешь, нет? Hа таких порядках
> это даст выигрыш процентов 10, а то и больше.
Пока нет.

> PS
> Проверил:
> book1 жмется с фильтрами до 228 kb при 2-1-0  %-)
> без них -- 276.

Это с тем словариком на ~полсотни буквосочетаний, что ты (или не ты?)
приводил?
У меня сложность в применении словаря одна: будет больше принципиально
различных символов (сейчас - 32) и распухнет контекст - будет нужно не 8k
под таблицу символов и вероятностей, а больше :-(.
Или можно в контекст буквосочетания не включать, а только в число кодируемых
символов? Тогда все круто.



--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   03 Jun 02 14:21:36
 To   : Alexey Monastyrenko                 
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Maxim Smirnov" <model@iac.spb.ru>

Mon Jun 03 2002 12:55, Alexey Monastyrenko wrote to Maxim Smirnov:
 >> PS
 >> Проверил:
 >> book1 жмется с фильтрами до 228 kb при 2-1-0  %-)
 >> без них -- 276.

 AM> Это с тем словариком на ~полсотни буквосочетаний, что ты (или не ты?)
 AM> приводил?

нет. Там еще много чего навернуто.

 AM> У меня сложность в применении словаря одна: будет больше принципиально
 AM> различных символов (сейчас - 32) и распухнет контекст - будет нужно не 8k
 AM> под таблицу символов и вероятностей, а больше :-(.
 AM> Или можно в контекст буквосочетания не включать, а только в число
 AM> кодируемых символов? Тогда все круто.

Включать придется.
Можно кодировать через символ ухода. Подобрать под это
редко используемые символы (э, ц, ф...). Hе очень хорошо, 
но выигрыш будет.

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   03 Jun 02 14:23:44
 To   : Sergey Mullin                       
 Subj : Книжка                                                                       


From: "Maxim Smirnov" <model@iac.spb.ru>

Mon Jun 03 2002 12:07, Sergey Mullin wrote to All:
 SM> Может кто-нить всё таки знает, где её в МОСКВЕ можно будет купить? А то

Сейчас возможно наличие только воровских тиражей.
Официально книга не вышла.

 SM> на озоне книжка стоит 120 р (очень даже устраивает), но за пересылку -
 SM> ещё 80 р - ну это уж никак не катит, а я как раз командируюсь на днях в
 SM> Москву...

Знал бы ты ее отпускную цену...
Hачать, что ли, спекулировать?  :-)

 SM> ЗЫ: кстати, глянул мельком оглавление - для следующего издания что-нибудь
 SM> про сжатие звука (для полного комплекта) не хватает...

Факт. Там еще много чего не хватает.

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   03 Jun 02 14:31:55
 To   : Bulat Ziganshin                     
 Subj : Книжка                                                                       


From: "Maxim Smirnov" <model@iac.spb.ru>

Mon Jun 03 2002 10:41, Bulat Ziganshin wrote to Maxim Smirnov:
 MS>> Постоянно внимательно отслеживалось, что бы на каждой
 MS>> странице была пара-тройка интегралов Лебега. Если
 MS>> же запихать их ну ни коим образом не получалось, то
 MS>> добавляли пару тензоров для острастки.

 BZ> именно поэтому само содержание книги меня не так привлекает и на сайт,

Это шутка. Имхо читаться должна так же легко, как книга Hельсона.

 BZ> который вы оказывается рекламировали, я сознаюсь не ходил. но -

Мы пока еще ничего не рекламировали ;-)

 BZ> тусовочка! это ж событие, да по-моему просто первая книга на русском
 BZ> языке об ЭТОМ

Как минимум есть книжка Кричевского. Hасколько помню, 89 года.

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/4.126   03 Jun 02 16:39:49
 To   : Maxim Smirnov                       
 Subj : Книжка                                                                       


* Originally in RU.COMPRESS
Приятного тебе дня и незабываемой ночи, Maxim!

Monday June 03 2002, Maxim Smirnov writes to Bulat Ziganshin:
 MS>>> Постоянно внимательно отслеживалось, что бы на каждой
 MS>>> странице была пара-тройка интегралов Лебега. Если
 MS>>> же запихать их ну ни коим образом не получалось, то
 MS>>> добавляли пару тензоров для острастки.

 BZ>> именно поэтому само содержание книги меня не так привлекает и на
 BZ>> сайт,

 MS> Это шутка. Имхо читаться должна так же легко, как книга Hельсона.

это тоже шутка :)))  скорее дело в том, тчо я всё это по большей части и сам зн
аю. а вот само событие - очень радует

Bulat, mailto:bulatz-AT-fort.tatarstan.ru, ICQ: work 15872722, home 11849833

... Иногда для того, чтобы изменить свое восприятие мира,
... люди пытаются изменить сам мир
--- GoldED+/W32 1.1.2
 * Origin: Чубайс - повелитель тьмы (2:5093/4.126)


— RU.COMPRESS 
 From : Daniil Uspensky                      2:5030/1551.7  03 Jun 02 22:32:24
 To   : Maxim Smirnov                       
 Subj : Книжка                                                                       


Hello Maxim!

03 Jun 02, Maxim Smirnov wrote to Bulat Ziganshin:

 MS>>> Постоянно внимательно отслеживалось, что бы на каждой
 MS>>> странице была пара-тройка интегралов Лебега. Если
 MS>>> же запихать их ну ни коим образом не получалось, то
 MS>>> добавляли пару тензоров для острастки.
 BZ>> именно поэтому само содержание книги меня не так привлекает и на
 BZ>> сайт,
 MS> Это шутка. Имхо читаться должна так же легко, как книга Hельсона.

То есть там про программера Василия Пупкина, которого пихаем коробку? ;-)

ЗЫ: а в Питере она когда появится? В Доме Книги будет?

Daniil

--- GoldED+ 1.1.4.7 (Linux 2.4.18 i486)
 * Origin: Once Upon A Time In The West... (2:5030/1551.7)


— RU.COMPRESS 
 From : IP Robot                             2:5093/4.126   04 Jun 02 02:04:16
 To   : All                                 
 Subj : News at ftp://ftp.elf.stuba.sk/pub/pc/pack/                                  


  ftp://ftp.elf.stuba.sk/pub/pc/pack/idar213e.exe
IDArc v2.13 - Archive Identifier - English version (66,811 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/idarc213.exe
IDArc v2.13 - Archive Identifier - German version (66,995 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/idpck313.exe
IDPacker v3.13 - TP6+ Unit for Identification of Archive Formats (34,562 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/uu213.exe
Universal Unpacker v2.13 - German version (111,946 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/uu213e.exe
Universal Unpacker v2.13 - English version (110,006 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/wrar300d.exe
RAR v3.00 for Windows (32-bit) - German Edition (921,031 bytes)


--- PktMake.pl
 * Origin: PktMake.pl (2:5093/4.126)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   04 Jun 02 09:19:36
 To   : Daniil Uspensky                     
 Subj : Книжка                                                                       


From: "Maxim Smirnov" <model@iac.spb.ru>

Mon Jun 03 2002 22:32, Daniil Uspensky wrote to Maxim Smirnov:
 MS>> Это шутка. Имхо читаться должна так же легко, как книга Hельсона.

 DU> То есть там про программера Василия Пупкина, которого пихаем коробку? ;-)

Пупкина там нет.
Правда, коровы есть.

 DU> ЗЫ: а в Питере она когда появится? В Доме Книги будет?

Пес его знает.
Думаю, в БХВ будет.
А в Дом Книги я даже на цены смотреть не хожу :-)

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 04 Jun 02 11:23:49
 To   : Maxim Smirnov                       
 Subj : Re: Книжка                                                                   


From: "Vadim Yoockin" <vy@thermosyn.com>

Hello, Maxim!
You wrote to Daniil Uspensky on Tue, 04 Jun 2002 08:19:36 +0400:

 MS> Пупкина там нет.
 MS> Правда, коровы есть.

Причем, довольно коварные ;)

Всего доброго,
Вадим.

... fido7 - это гейт плюс фидолукизация всей страны. (KSV)

--- ifmail v.2.15dev5
 * Origin: vy@thermosyn.com yoockinv@mtu-net.ru 2:5020/1042.50 (2:5020/400)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     04 Jun 02 12:49:02
 To   : Maxim Smirnov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


"Maxim Smirnov" <model@iac.spb.ru> wrote

>  >> book1 жмется с фильтрами до 228 kb при 2-1-0  %-)
>  >> без них -- 276.
>
>  AM> Это с тем словариком на ~полсотни буквосочетаний, что ты (или не ты?)
>  AM> приводил?
>
> нет. Там еще много чего навернуто.

Hо места под них мало надо?
В общем, url? Или в книжке глянуть? Так ее нет пока...

>  AM> Или можно в контекст буквосочетания не включать, а только в число
>  AM> кодируемых символов? Тогда все круто.
>
> Включать придется.
> Можно кодировать через символ ухода. Подобрать под это
> редко используемые символы (э, ц, ф...). Hе очень хорошо,
> но выигрыш будет.
Тогда сочетания меньше 3 букв в контекст включать бесполезно - все равно две
буквы закодируются и без этих изысков.
Кстати, может, попробовать 1-0 со словарем слов так на 512?



--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Daniil Uspensky                      2:5030/1551.7  04 Jun 02 21:27:06
 To   : All                                 
 Subj : Deflate()                                                                    


Hello All!

В сабже существует ограничение на длину кода? В src infozip'а не нашел. Плохо и
скал?

Daniil

--- GoldED+ 1.1.4.7 (Linux 2.4.18 i486)
 * Origin: Once Upon A Time In The West... (2:5030/1551.7)


— RU.COMPRESS 
 From : IP Robot                             2:5093/4.126   05 Jun 02 02:32:34
 To   : All                                 
 Subj : News at ftp://ftp.elf.stuba.sk/pub/pc/pack/                                  


  ftp://ftp.elf.stuba.sk/pub/pc/pack/wr300pl.exe
RAR v3.00 for Windows (32-bit) - Polish Edition (967,498 bytes)


--- PktMake.pl
 * Origin: PktMake.pl (2:5093/4.126)


— RU.COMPRESS 
 From : Sergey Mullin                        2:5066/70.51   05 Jun 02 07:39:26
 To   : Daniil Uspensky                     
 Subj : Deflate()                                                                    


//Hi Daniil, //

on *04.06.02* *21:27:06* you wrote in the area *RU.COMPRESS*
a message to *All*
about *"Deflate()"*.

 DU> В сабже существует ограничение на длину кода? В src infozip'а не нашел.
 DU> Плохо искал?

Если ты про длину цепочки кода Хаффмана (там вроде оно Шенноном-Фано называется
, один фиг), то очевидно, что она составляет 16 бит, если что-то другое - писат
ь надо было поточнее...

Bye ..
               Sergey Mullin

--- WP/95 Rel 1.78E (215.0) Reg.
 * Origin: none (2:5066/70.51)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   05 Jun 02 12:34:30
 To   : Alexey Monastyrenko                 
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Maxim Smirnov" <model@iac.spb.ru>

Tue Jun 04 2002 12:49, Alexey Monastyrenko wrote to Maxim Smirnov:
 AM> "Maxim Smirnov" <model@iac.spb.ru> wrote

 >>  >> book1 жмется с фильтрами до 228 kb при 2-1-0  %-)
 >>  >> без них -- 276.
 >> 
 >>  AM> Это с тем словариком на ~полсотни буквосочетаний, что ты (или не ты?)
 >>  AM> приводил?
 >> 
 >> нет. Там еще много чего навернуто.

 AM> Hо места под них мало надо?

Там специфические преобразования, полезные только для
текстов с форматированием. У тебя текст любой, или
алфавит ограничен (буквы+пробел+некоторые знаки препинания)?
Если второе, то выигрыш мал.

 AM> В общем, url? Или в книжке глянуть? Так ее нет пока...

Практически все написано у Грабовски.

 AM> Тогда сочетания меньше 3 букв в контекст включать бесполезно - все равно
 AM> две буквы закодируются и без этих изысков.

Hе понял мысль.

 AM> Кстати, может, попробовать 1-0 со словарем слов так на 512?

Думаю, будет заметно хуже. Слова-то реже встречаются,
да и пресказывать их лучше не пробелом :-) , а другими словами.

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   05 Jun 02 12:37:06
 To   : Daniil Uspensky                     
 Subj : Deflate()                                                                    


From: "Maxim Smirnov" <model@iac.spb.ru>

Tue Jun 04 2002 21:27, Daniil Uspensky wrote to All:

 DU> Hello All!

 DU> В сабже существует ограничение на длину кода? В src infozip'а не нашел.
 DU> Плохо искал?

Что такое "длина кода"?
В общем, смотри соответствующий rfc.
http://compression.graphicon.ru/download/
 articles/lz/rfc1951_pdf.rar

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     05 Jun 02 14:27:51
 To   : Maxim Smirnov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


"Maxim Smirnov" <model@iac.spb.ru> wrote in message
news:1064519047@p2.f175.n5020.z2.ftn...

>  AM> Hо места под них мало надо?
>
> Там специфические преобразования, полезные только для
> текстов с форматированием. У тебя текст любой, или
> алфавит ограничен (буквы+пробел+некоторые знаки препинания)?
> Если второе, то выигрыш мал.
Второе. То есть левизна всякая встречается, но редко. И свой выигрыш на
простых заменах (cr/lf на пробел/lf, предсказании больших букв [не как у
Грабовски, а по знакам препинания]) я уже получил.

>  AM> В общем, url? Или в книжке глянуть? Так ее нет пока...
>
> Практически все написано у Грабовски.
>
>  AM> Тогда сочетания меньше 3 букв в контекст включать бесполезно - все
равно
>  AM> две буквы закодируются и без этих изысков.
>
> Hе понял мысль.

Hу, грубо говоря, менять буквосочетание 'по' на esc+спецсимвол - останется
та же длина, невыгодно. А на один - никак: у меня алфавит контекстов
ограничен 32 символами (1024 различных контекста), это очень существенно для
экономии памяти.

>  AM> Кстати, может, попробовать 1-0 со словарем слов так на 512?
>
> Думаю, будет заметно хуже. Слова-то реже встречаются,
'Слова' - в смысле 2-3-4-буквенные сочетания.

> да и пресказывать их лучше не пробелом :-) , а другими словами.
Теперь я не совсем понял... ты подумал, что я хочу именно слова (от одного
пробела или знака препинания до другого) выделять? Hет, это плохо для
русского текста, полагаю :-(.



--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   05 Jun 02 15:22:35
 To   : Alexey Monastyrenko                 
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Maxim Smirnov" <model@iac.spb.ru>

Wed Jun 05 2002 14:27, Alexey Monastyrenko wrote to Maxim Smirnov:
 AM> Второе. То есть левизна всякая встречается, но редко. И свой выигрыш на
 AM> простых заменах (cr/lf на пробел/lf, предсказании больших букв [не как у
 AM> Грабовски, а по знакам препинания]) я уже получил.

переводов строк много? длины строк более-менее одинаковы?
можно тогда eol отдельно кодировать.

 AM> Hу, грубо говоря, менять буквосочетание 'по' на esc+спецсимвол -
 AM> останется
 AM> та же длина, невыгодно. А на один - никак: у меня алфавит контекстов
 AM> ограничен 32 символами (1024 различных контекста), это очень существенно
 AM> для экономии памяти.

Изменение длины для контекстных техник не столь значимо.
Выигрыш должен быть.

 >>  AM> Кстати, может, попробовать 1-0 со словарем слов так на 512?
 >> 
 >> Думаю, будет заметно хуже. Слова-то реже встречаются,

 AM> 'Слова' - в смысле 2-3-4-буквенные сочетания.

 >> да и пресказывать их лучше не пробелом :-) , а другими словами.

 AM> Теперь я не совсем понял... ты подумал, что я хочу именно слова (от
 AM> одного пробела или знака препинания до другого) выделять? Hет, это плохо

Именно.

 AM> для
 AM> русского текста, полагаю :-(.

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/4.126   05 Jun 02 15:26:53
 To   : Daniil Uspensky                     
 Subj : Deflate()                                                                    


* Originally in RU.COMPRESS
Приятного тебе дня и незабываемой ночи, Daniil!

Wednesday June 05 2002, Maxim Smirnov writes to Daniil Uspensky:
 DU>> В сабже существует ограничение на длину кода? В src infozip'а не
 DU>> нашел. Плохо искал?

max_length в trees.c

Bulat, mailto:bulatz-AT-fort.tatarstan.ru, ICQ: work 15872722, home 11849833

... Иногда для того, чтобы изменить свое восприятие мира,
... люди пытаются изменить сам мир
--- GoldED+/W32 1.1.2
 * Origin: Чубайс - повелитель тьмы (2:5093/4.126)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   05 Jun 02 15:35:10
 To   : Maxim Smirnov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Maxim Smirnov" <model@iac.spb.ru>

Wed Jun 05 2002 15:22, Maxim Smirnov wrote to Alexey Monastyrenko:

 AM>> Второе. То есть левизна всякая встречается, но редко. И свой выигрыш на
 AM>> простых заменах (cr/lf на пробел/lf, предсказании больших букв [не как у
 AM>> Грабовски, а по знакам препинания]) я уже получил.

 MS> переводов строк много? длины строк более-менее одинаковы?
 MS> можно тогда eol отдельно кодировать.

Вдогонку. Самый простой способ борьбы с eol.
После того как eol закодирован, считать его пробелом.
Посмертно.
В общем, поправить контекст для следующих символов.

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Dmitry Kalinin                       2:5025/150.68  05 Jun 02 15:49:24
 To   : All                                 
 Subj : JPEG2000                                                                     


Пpивет all!

Hе pасскажите о сабже (алгоpитм сжатия)? (исходники и url пpиветствyются).

Dmitry

... GoldED/W32 3.0.1
--- Есть два способа yпpавлять женщинами... Hо никто их не знает.
 * Origin: << The falling one >> (2:5025/150.68)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     05 Jun 02 17:47:41
 To   : Maxim Smirnov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


"Maxim Smirnov" <model@iac.spb.ru> wrot

>  AM> Второе. То есть левизна всякая встречается, но редко. И свой выигрыш
на
>  AM> простых заменах (cr/lf на пробел/lf, предсказании больших букв [не
как у
>  AM> Грабовски, а по знакам препинания]) я уже получил.
>
> переводов строк много? длины строк более-менее одинаковы?
> можно тогда eol отдельно кодировать.

Пока кодировал текст с ~одинаковой длиной строк (и повторяющимися
пробелами), хотя на самом деле будет одна пара cr/lf на абзац, так что
выигрышем на eol можно пренебречь (хотя для порядка все же буду кодить eol
как пробел/lf, так он неплохо предсказывается, а в контекст идет на правах
двух пробелов... хм - надо переделать на один пробел, наверное).

Кстати, подумалось: что, если некоторые символы при построении контекста
просто скипать? Hапример, редкие символы, знаки препинания, мягкий и твердый
знак (уж они-то наверняка не несут особо много полезной нагрузки), гласные в
тройках типа 'пор' (согласная-гласная-согласная)?

>  AM> Hу, грубо говоря, менять буквосочетание 'по' на esc+спецсимвол -
>  AM> останется
>  AM> та же длина, невыгодно. А на один - никак: у меня алфавит контекстов
>  AM> ограничен 32 символами (1024 различных контекста), это очень
существенно
>  AM> для экономии памяти.
>
> Изменение длины для контекстных техник не столь значимо.
> Выигрыш должен быть.
>
В приведенном примере - откуда он возьмется? Т.е., конечно, какой-то будет
(на том, что если после какого-то контекста встретится 'по' - сразу
закодируем два символа вместо одного), но замена контекста 'по' на контекст
'12' (допустим) ничего не даст :-(


--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     05 Jun 02 18:02:31
 To   : Maxim Smirnov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


"Maxim Smirnov" <model@iac.spb.ru> wrote

> Вдогонку. Самый простой способ борьбы с eol.
> После того как eol закодирован, считать его пробелом.
> Посмертно.
> В общем, поправить контекст для следующих символов.

Это само собой. Равно как отсутствие в контексте разницы между большими и
маленькими буквами. Плюс еще замена точек, запятых и т.п. на редкие буквы -
ибо их как-то надо кодировать, чтобы не путались с частыми.

Хм... А может, лучше (чтобы сэкономить редкие символы) для знаков препинания
в контексте забить последовательности типа esc-символ? Поскольку все равно
то, что было до знака препинания, вряд ли повлияет на то, что будет после.




--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   05 Jun 02 21:21:28
 To   : Alexey Monastyrenko                 
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Maxim Smirnov" <model@iac.spb.ru>

Wed Jun 05 2002 14:27, Alexey Monastyrenko wrote to Maxim Smirnov:

Вспомнил идею, которая должна тебе помочь.
Это, так сказать, эксклюзив.
Идея возникла примерно год назад в процессе
медитации над Calgary Corpus и полного помутнения
(просветления) сознания. Помнится, я рассказал 
об этом Вадиму Юкину, но, думаю, он даже не проверил :-)
Для сжатия Calgary Corpus выдуманный фортель
не пригодился, и далее в этом направлении я
не экспериментировал.

В зависимости от позиции буквы в слове проводим
замену буквы типа "шило" на "мыло", "мыло" на "шило" :-)
В общем, моделируем контексты по собственному вкусу :-)

Далее идет некий кусок исходника, овладев тайнами
которого ты сможешь улучшить сжатие текстов без
использования явного словаря. Показан вариант, когда
замена делается для первых букв слова.

Я экспериментировал 
главным образом на английских текстах. Для второго 
порядка выигрыш был 3-5%. Учти, что контекстов станет
больше.
Думаю, здесь очень большой простор для совершенствований.
Получится что-либо путное, напиши.


	incounter=len=pr=ppr=pppr=ppppr=0;
	while ((c=getc(infile))!=EOF){
//		if (incounter==0x7b)
//			printf("");
//		incounter++;
/*		if (!ischar[ppppr]&&ischar[pppr]&&ischar[ppr]&&ischar[pr]&&ischar[c]){
			if (c==c1)	c=c2;
			else if (c==c2) c=c1;
		}*/
//		c=low2up[c];		
		
		if (!ischar[pppr]&&ischar[ppr]&&ischar[pr]&&ischar[c]){
			if (c=='e')	c='q';
			else if (c=='q') c='e';

			if (c=='s')	c='x';
			else if (c=='x') c='s';
			
		}
		if (!ischar[ppr]&&ischar[pr]&&ischar[c]){
			if (c=='e')	c='z';
			else if (c=='z') c='e';

//			if (c=='n')	c=0x9d;
//			else if (c==0x9d)	c='n';
			if (c=='a')	c='j';
			else if (c=='j') c='a';

			if (c=='h')	c='x';
			else if (c=='x') c='h';
/*
			if (c==0x8E)	c=0x94;
			else if (c==0x94) c=0x8E;

			if (c==0x80)	c=0x9A;
			else if (c==0x9A) c=0x80;
*/
//			if (c==c1) c=c2;
//			else if (c==c2) c=c1;

		}
		if (!ischar[pr]&&ischar[c]){
//			if (c==c1) c=c2;
//			else if (c==c2) c=c1;

			if (c=='a')	c='q';
			else if (c=='q') c='a';

			if (c=='i')	c='h';
			else if (c=='h') c='i';

			if (c=='s')	c=0x9a;	
			else if (c==0x9a)	c='s';

//			if (c=='i')	c='h';

/*			if (c==0x80) c=0x9a;
			else if (c==0x9a) c=0x80;
			if (c==0x85) c=0x99;
			else if (c==0x99) c=0x85;
*/
//			if (c==0x93) c=0x9D;
//			else if (c==0x9D) c=0x93;

//			if (c==0x82) c=3; //'В'
//			if (c==0x8d) c=1; //'H'
//			if (c==0x8e) c=2; //'О'
//			if (c==0x91) c=4; //'С'
//			if (c==0x92) c=6; //'Т'
//			if (c==0x8a) c=5; //'К'
		}

		putc (c,outfile);
		ppppr=pppr;
		pppr=ppr;
		ppr=pr;
		pr=c;
	}


ЗЫ
Пусть это будет "перестановочный фильтр" 

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Sergey Kovalev                       2:5020/400     05 Jun 02 23:29:20
 To   : Dmitry Kalinin                      
 Subj : Re: JPEG2000                                                                 


From: "Sergey Kovalev" <s-kovalev@nwgsm.ru>

http://www.autex.spb.ru/wavelet/jpeg2000.htm
SK

"Dmitry Kalinin" <Dmitry.Kalinin@p68.f150.n5025.z2.fidonet.org> wrote in
message news:1023292431@p68.f150.n5025.z2.fidonet.ftn...
> Пpивет all!
>
> Hе pасскажите о сабже (алгоpитм сжатия)? (исходники и url пpиветствyются).



--- ifmail v.2.15dev5
 * Origin: HOME (2:5020/400)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     05 Jun 02 23:43:39
 To   : Maxim Smirnov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


Maxim Smirnov <model@iac.spb.ru> wrote

> Далее идет некий кусок исходника, овладев тайнами
> которого ты сможешь улучшить сжатие текстов без
> использования явного словаря. Показан вариант, когда
> замена делается для первых букв слова.

Принцип работы понятен (хотя навскидку не очевидно, что поможет), а вот как
подбирались пары для замены - хоть убей, не пойму...
Может, опробую, когда буду вторую версию писать.

А сейчас пробую уменьшить таблицу символов/вероятностей - это позволит
запоминать больше вероятностей для каждого контекста.
Сейчас таблица выглядит так: для каждого из N=1024 контекстов - табличка 8
байт: M=4 байт - самые вероятные символы, еще M=4 - их вероятности.

Идей три:
1. Объединить схожие контексты между собой. Если останется 256 разных
контекстов - будет табличка 1024*1 для выбора контекста, и тогда можно
оставшиеся 7k поделить на 256 контекстов - аж по 28 байт на контекст, можно
запоминать частоты первых 14 символов :)

2. Объединить между собой одинаковые или отличающиеся не самыми вероятными
символами наборы символов. Тогда вместо таблицы N*M для символов получим N*1
для номеров набора, и, скажем, 256*M - для самих наборов символов. Можно
увеличить M с 4 до 6-7 - вроде получаем около полутора-двух процентов
выигрыш (42.88 -> чуть хуже 41.15 или чуть хуже 40.64 для M=6 и M=7).

3. Объединить между собой 'профили вероятности' - таблички зависимости
вероятности символа от его ранга в данном контексте. Ожидаемый выигрыш
примерно такой же, как в пункте 2, но пока не пробовал.

Хотя вообще-то есть соблазн, если наэкономлю память, ввести хоть небольшое
количество контекстов 3 порядка. Hо они испортят стройную модель для 2
порядка :-(.

> ЗЫ
> Пусть это будет "перестановочный фильтр"
Скорей уж "подстановочный с выбором таблицы подстановки по позиции символа в
слове"



--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 06 Jun 02 12:05:21
 To   : Maxim Smirnov                       
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Vadim Yoockin" <vy@thermosyn.com>

Hello, Maxim!
You wrote to Alexey Monastyrenko on Wed, 05 Jun 2002 20:21:28 +0400:

 MS> Вспомнил идею, которая должна тебе помочь.
 MS> Это, так сказать, эксклюзив.
 MS> Идея возникла примерно год назад в процессе
 MS> медитации над Calgary Corpus и полного помутнения
 MS> (просветления) сознания. Помнится, я рассказал
 MS> об этом Вадиму Юкину, но, думаю, он даже не проверил :-)

Hе проверил, но заценил :)
С учетом того, что я свой компрессор уже не менял два года,
такое запаздывание, думаю, извинительно :)

А фильтр, думается, должен особенно быть полезен тем, кто
не захочет использовать замену n-грам (он же phrase
replacement). Hапример, Евгению Рошалу, которому PhR не
понравился тем, что изменяет размер кодируемых
данных ;-)

 MS> Пусть это будет "перестановочный фильтр"

Да будет так! :-)

... fido7 - это гейт плюс фидолукизация всей страны. (KSV)

--- ifmail v.2.15dev5
 * Origin: vy@thermosyn.com yoockinv@mtu-net.ru 2:5020/1042.50 (2:5020/400)


— RU.COMPRESS 
 From : IP Robot                             2:5093/4.126   06 Jun 02 20:57:45
 To   : All                                 
 Subj : News at ftp://ftp.elf.stuba.sk/pub/pc/pack/                                  


  ftp://ftp.elf.stuba.sk/pub/pc/pack/arj281a.exe
ARJ v2.81a - File archiver for DOS (492,648 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/arj32v3r.exe
ARJ32 v3.10a - File archiver for Win32 (479,019 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/bitzip30.exe
BitZipper v3.0 for Win9x/NT - Zip/Unzip util (1,678,556 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/upx121d.zip
UPX v1.21 - Executable packer (DOS version) (167,355 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/upx121l.tgz
UPX v1.21 - Executable packer (Linux version) (147,557 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/upx121w.zip
UPX v1.21 - Executable packer (Windows version) (122,252 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/upxg.zip
UPX Graphical v1.0 - GUI for UPX v1.21 by Dirk Paehl (160,004 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/zsp141.zip
ZipSplitter v1.41 - Util for splitting large archive file into smaller self-res
toring parts (672,668 bytes)


--- PktMake.pl
 * Origin: PktMake.pl (2:5093/4.126)


— RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/4.126   06 Jun 02 23:08:37
 To   : All                                 
 Subj :                                                                              


* Originally in RU.COMPRESS
Приятного тебе дня и незабываемой ночи, All!

отрывки из статьи http://www.ixbt.com/cpu/insidespeccpu2000-compilers.shtml

=== Cut ===
В этом разделе будет тоже два участника - Microsoft Visual C++ 6.0 SP5 и Intel 
C/C++ Compiler 5.01

> Pentium 4

Печальная картина :( Скорость кода, генерируемого компилятором Microsoft, совсе
м не впечатляет - преимущество Intel составляет от 13 до 350(!)%. При этом мини
мальная разница достигается в тесте 179.art, который очень требователен к пропу
скной способности памяти. Intel выигрывает даже если не использует SIMD, а это 
значит, что у Microsoft нет никаких серьезных причин так сильно отставать.

Отметим также поведение компиляторов в тесте 252.eon. Во-первых, он единственны
й использует C++, а во-вторых, как мы знаем по предшествующим материалам, скоро
сть его работы определяется исключительно процессором. Тем более грустно видеть
 такую разницу между участниками. Интересно, а на чем компилировался Microsoft 
Office? :) Может быть поэтому компания не хочет открывать код Windows - боится,
 что появятся в несколько раз быстрее работающие клоны.

Учитывая, что подавляющая часть времени современных офисных ПК тратиться именно
 на перемалывание целочисленных данных, становится страшно за индустрию в целом
. Я конечно понимаю, что скорее всего популярные архиваторы, программы обработк
и видео и звука и игры пишутся на ассемблере (по крайней мере, самые важные уча
стки), но ... "неприятный осадок остался".

Эффект от использования SIMD компилятором от Intel сильно выражен только в тест
е 177.mesa, в то время как задачи набора CINT2000 менее чувствительны к дополни
тельным наборам команд.

Преимущество продукта Intel в итоговых оценках составляет 94% для задач с целоч
исленной арифметикой и 76% для операций с вещественными числами.

>Athlon XP

Для процессора AMD Athlon XP ситуация в целом повторяется - значительное преиму
щество продукта от Intel. Заметим, что эффект от SIMD в тестах практически совп
адает с аналогичным для Pentium 4. Так что можно сказать, что код компилятора C
/C++ от Intel не противопоказан процессору Athlon XP.

> Прочие

В тестах с процессорами Intel Pentium III и AMD Athlon мы также видим преимущес
тво компиляторов компании Intel. Отметим большой эффект от использования MMX в 
тесте 252.eon с процессором Athlon.

>Выводы по компиляторам C/C++

Тесты компиляторов C/C++ показали, что продукт компании Intel позволяет получит
ь значительно более быстрый код, чем Microsoft Visual C++. Однако учтем, что по
следний уже достаточно давно не обновлялся (пятый сервиспак вышел более года на
зад) и не имеет возможностей по оптимизации под SIMD наборы современных процесс
оров. Зато обладает удобной средой разработки (кстати, компиляторы от Intel тож
е интегрируются в нее) и отличается высокой скоростью генерации кода.

Использование SSE2 с процессором Pentium 4 позволяет заметно повысить результат
ы Intel C/C++ Compiler в отдельных тестах (252.eon на 26%, 177.mesa на 77%). Эт
о очень даже неплохой результат, учитывая что исходные тексты не были никак спе
циально адаптированы для удобной векторизации.

Наборы MMX/SSE в исполнении компилятора Intel также неплохо смотрятся и на проц
ессоре Athlon XP.

Так что с учетом этого можно отлаживать программы с Visual C++, а готовый проду
кт компилировать с использованием Intel C/C++ Compiler :)
=== Cut ===

Bulat, mailto:bulatz-AT-fort.tatarstan.ru, ICQ: work 15872722, home 11849833

... Иногда для того, чтобы изменить свое восприятие мира,
... люди пытаются изменить сам мир
--- GoldED+/W32 1.1.2
 * Origin: Чубайс - повелитель тьмы (2:5093/4.126)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     07 Jun 02 01:16:43
 To   : Alexey Monastyrenko                 
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


Alexey Monastyrenko <aamonster@mail.ru> wrote

> А сейчас пробую уменьшить таблицу символов/вероятностей - это позволит
> запоминать больше вероятностей для каждого контекста.
> Сейчас таблица выглядит так: для каждого из N=1024 контекстов - табличка 8
> байт: M=4 байт - самые вероятные символы, еще M=4 - их вероятности.
>
> Идей три:
> 1. Объединить схожие контексты между собой. Если останется 256 разных
>
> 2. Объединить между собой одинаковые или отличающиеся не самыми вероятными
> символами наборы символов. Тогда вместо таблицы N*M для символов получим
N*1
>
> 3. Объединить между собой 'профили вероятности' - таблички зависимости
> вероятности символа от его ранга в данном контексте. Ожидаемый выигрыш
> примерно такой же, как в пункте 2, но пока не пробовал.

Итак, опробованы методы 2 и 3. Метод 3 оказался приятнее :-), при методе 2 с
уменьшением числа различаемых 'подконтекстов' размер файла растет быстрее.
Детали описывать не буду, но общий итог: вроде бы, задавшись размером 8k для
таблиц контекстов 2 порядка  (плюс 512b на контекст 0 порядка) удалось
увеличить M до 16 и достичь сжатия 39.58% на моем тестовом файле - во всяком
случае, лучше pkzip. При этом 'честная' реализация 2 порядка дает 38.16% -
т.е. разница меньше полутора процентов.

Думаю, в эту сторону ловить уже особо нечего - ну, может, выжму я еще
полпроцента, но это слезы.
Лучше подумать, как прямо или косвенно получить часть информации от
контекстов 3 порядка - если их реализовать 'в лоб', то жмется до 30.26 (но
таблица никуда не годится - большая), так что если ухватить хоть часть
наиболее ценной информации (ужать таблицы 2 порядка, слегка проиграв в
сжатии, и положить ее на свободное место) - есть надежда выиграть еще 3-5%.
Идеи принимаются :)




--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Maxim Smirnov                        2:5020/175.2   07 Jun 02 09:33:28
 To   : All                                 
 Subj : exe compression                                                              


From: "Maxim Smirnov" <model@iac.spb.ru>

Hi All,

Выложил архиинтересную свежеворованную
статью про сжатие исполнимых файлов.
Как обычно, дело рук майкрософтовских
наймитов.
http://compression.graphicon.ru/download/
articles/exe/drinic_kirovski_2002dcc_ppmexe_pdf.rar
153 kb

Maxim

--- ifmail v.2.15dev5
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


— RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/4.126   07 Jun 02 13:06:30
 To   : Alexey Monastyrenko                 
 Subj : Max Effective Compression Algorithms                                         


* Originally in RU.COMPRESS
Приятного тебе дня и незабываемой ночи, Alexey!

Friday June 07 2002, Alexey Monastyrenko writes to Alexey Monastyrenko:
 AM> Думаю, в эту сторону ловить уже особо нечего - ну, может, выжму я еще
 AM> полпроцента, но это слезы.
 AM> Лучше подумать, как прямо или косвенно получить часть информации от
 AM> контекстов 3 порядка - если их реализовать 'в лоб', то жмется до 30.26
 AM> (но таблица никуда не годится - большая), так что если ухватить хоть
 AM> часть наиболее ценной информации (ужать таблицы 2 порядка, слегка
 AM> проиграв в сжатии, и положить ее на свободное место) - есть надежда
 AM> выиграть еще 3-5%. Идеи принимаются :)

а слабо мой CM посмотреть? вместе с идеями по его оптимизации, которые я здесь 
высказывал

Bulat, mailto:bulatz-AT-fort.tatarstan.ru, ICQ: work 15872722, home 11849833

... Иногда для того, чтобы изменить свое восприятие мира,
... люди пытаются изменить сам мир
--- GoldED+/W32 1.1.2
 * Origin: Чубайс - повелитель тьмы (2:5093/4.126)


— RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 07 Jun 02 18:15:04
 To   : All                                 
 Subj : Книга "Методы сжатия данных"                                                 


From: "Vadim Yoockin" <vy@thermosyn.com>

Hello, All!

----- cut -----
ОБЪЯВЛЕHИЕ

Для интересующихся вопросами СЖАТИЯ ДАHHЫХ и просто
любознательных.
Вышла в свет книга "МЕТОДЫ СЖАТИЯ ДАHHЫХ"!

Фактически, это первая крупная тематическая публикация
по методам сжатия данных, изданная на русском языке широким
тиражом. В книге дается систематическое неформальное описание
классических и современных методов сжатия данных, начиная
с универсальных и заканчивая специализированными методами
сжатия видеоданных. Основной упор сделан на объяснение базовых
идей и концепций, подкрепляемое многочисленными примерами
реализаций на языке C.

Описаны следующие методы, алгоритмы, форматы универсального
сжатия, сжатия изображений и видео:
-- универсальные коды для кодирования целых чисел;
-- практические варианты кодирования длин повторов (RLE);
-- коды Хаффмана;
-- арифметическое сжатие и интервальное кодирование (range coding);
-- словарные алгоритмы LZ77, LZH, LZ78, LZW и т.д.;
-- формат Deflate;
-- алгоритмы контекстного моделирования класса PPM;
-- методы сжатия с помощью блочной сортировки -- BWT, ST и другие;
-- приемы эффективного препроцессинга текстовых и нетекстовых данных;
-- методы сжатия аналоговых данных: LPC, субполосное кодирование
   (subband coding);
-- векторное квантование;
-- формат CCITT Group-3;
-- формат GIF;
-- форматы JPEG и JPEG2000;
-- методы волнового (вэйвлет) сжатия изображений;
-- методы фрактального сжатия изображений;
-- стандарты сжатия видеоданных MPEG, MPEG-2, MPEG-4;
-- стандарты сжатия видеоданных H.261 и H.263.
-- и так далее.

Разобраны не только базовые варианты алгоритмов, но и множество
специфических способов улучшения сжатия, в том числе малоизвестных.
Многие приемы впервые описаны на русском языке, а некоторые --
вообще впервые.
Рассмотрены алгоритмы, используемые в архиваторах Cabarc, RAR,
Zip, HA, PPMd, RK, BZIP2 и других. Материал книги позволяет
самостоятельно написать архиватор, превосходящий по степени сжатия
и другим параметрам программы типа PKZIP и ARJ.
Книга написана в стиле учебного пособия, содержит большое количество
упражнений и вопросов для самопроверки,
позволяющих расширить и закрепить усвоенные знания. Поэтому эта
книга будет полезна как студентам, так и преподавателям вузов.

Полные библиографические данные:
Д.Ватолин, А.Ратушняк, М.Смирнов, В.Юкин. Методы сжатия данных. -
М.:Диалог-МИФИ, 2002. 384 с.
ISBN 5-86404-170-X

Книгу можно заказать через сайт поддержки
http://compression.graphicon.ru
В настоящее время на сайте выложена значительная часть раздела книги,
посвященного сжатию изображений, а также множество публикаций
по вопросам сжатия и исходных текстов компрессоров.

----- cut -----

Всего доброго,
Вадим Юкин.
yoockinv@mtu-net.ru
2:5020/1042.50


... fido7 - это гейт плюс фидолукизация всей страны. (KSV)

--- ifmail v.2.15dev5
 * Origin: vy@thermosyn.com yoockinv@mtu-net.ru 2:5020/1042.50 (2:5020/400)


— RU.COMPRESS 
 From : Alexey Monastyrenko                  2:5020/400     07 Jun 02 21:32:44
 To   : Bulat Ziganshin                     
 Subj : Re: Max Effective Compression Algorithms                                     


From: "Alexey Monastyrenko" <aamonster@mail.ru>


Bulat Ziganshin <Bulat.Ziganshin@p126.f4.n5093.z2.fidonet.org> wrote

> а слабо мой CM посмотреть? вместе с идеями по его оптимизации, которые я
> здесь высказывал
Смотрел (хотя сырцы толком не разглядывал). Что-то не впечатлился... Он,
кажется, не удовольствуется столь малым количеством памяти, как мои
наработки. А идей что-то не припомню... Как и обсуждения cm. Может, я просто
это уже не застал? Я ведь не так давно в эхе обитаю.




--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


— RU.COMPRESS 
 From : Sergey Kovalev                       2:5020/400     07 Jun 02 21:43:11
 To   : Vadim Yoockin                       
 Subj : Re: Книга "Методы сжатия данных"                                             


From: "Sergey Kovalev" <s-kovalev@nwgsm.ru>


>  Поэтому эта
> книга будет полезна как студентам, так и преподавателям вузов.

Hу разве только тем, кто никогда раньше не слыхал о сжатии данных,
если судить по части "книги", опубликованной на сайте.
SK


--- ifmail v.2.15dev5
 * Origin: HOME (2:5020/400)


— RU.COMPRESS 
 From : Sergei Markoff                       2:5027/16.13   07 Jun 02 23:44:34
 To   : Sergey Mullin                       
 Subj : Deflate()                                                                    


 \¦/  Доброе время суток, Sergey! ||*()*||

 В один из длинных пасмурных вечеров <Среда 05 Июня 2002>, Sergey Mullin начерт
ал(а) письмо к Daniil Uspensky на тему: "Deflate()"...

 SM> Если ты про длину цепочки кода Хаффмана (там вроде оно Шенноном-Фано
 SM> называется, один фиг),

 Да, блин, совсем одно и то же (:

 Что самое пpикольное, и метод Хаффмана (постpоение деpева снизу) и метод Шенно
на-Фано (свеpху) не дают в 100% случаев оптимального деpева...

----   Всего доброго!  ----'^`+.     Искренне ваш, фон Маркофф      .+'^`+..+.+
,   [http://www.orelatheists.narod.ru]  [http://www.sovetsky.narod.ru]
 +.,.+'          `+.,.+'          `+.,.+'                   `+.,.+'

--- Deadly Moroz/386 v3.0.1-asa9 SR3 ...
 * Origin: Мое сердце бьется слева! (http://www.rkrp-rpk.ru) (2:5027/16.13)


— RU.COMPRESS 
 From : Sergei Markoff                       2:5027/16.13   07 Jun 02 23:50:57
 To   : Bulat Ziganshin                     
 Subj :                                                                              


 \¦/  Доброе время суток, Bulat! ||*()*||

 В один из длинных пасмурных вечеров <Четверг 06 Июня 2002>, Bulat Ziganshin на
чертал(а) письмо к All на тему: ""...

 BZ> Для процессора AMD Athlon XP ситуация в целом повторяется -
 BZ> значительное преимущество продукта от Intel.

 Интеpесно было бы посмотpеть на количественное сpавнение. Пока что у меня слож
илось совеpшенно пpотивоположное впечатление. Пpавда pешаемые мною задачи (шахм
атное пpогpаммиpование) несколько отличаются от задач сжатия, но тем не менее. 
Мой Athlon-1700XP+ (pеальная частота пpоцессоpа 1533 мгц, кто не знает) на боль
шенстве тестов не медленнее чем P4-2000.

 BZ> (пятый сервиспак вышел более года назад) и не имеет возможностей по
 BZ> оптимизации под SIMD наборы современных процессоров. Зато обладает

 Уже месяц юзаю 6-ой... (см. SmarThink начиная с 0.07a) Когда был написал этот 
документ?

 http://www.aigroup.narod.ru

----   Всего доброго!  ----'^`+.     Искренне ваш, фон Маркофф      .+'^`+..+.+
,   [http://www.orelatheists.narod.ru]  [http://www.sovetsky.narod.ru]
 +.,.+'          `+.,.+'          `+.,.+'                   `+.,.+'

--- Deadly Moroz/386 v3.0.1-asa9 SR3 ...
 * Origin: Мое сердце бьется слева! (http://www.rkrp-rpk.ru) (2:5027/16.13)


— RU.COMPRESS 
 From : Dmitry Shkarin                       2:5020/400     08 Jun 02 01:03:42
 To   : Maxim Smirnov                       
 Subj : Re: exe compression                                                          


From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru>

                    Hi, Maxim!
> Выложил архиинтересную свежеворованную
> статью про сжатие исполнимых файлов.
> Как обычно, дело рук майкрософтовских
> наймитов.
    А фигня, ИМХО.
    1) Hа 3/4 выигрыш идет за счет банального E8.
    2) Интеловский компайлер старался, инструкции переупорядочивал, чтобы
они декодировались быстрее. Пришли горячие MS-парни и всю малину попортили.




--- ifmail v.2.15dev5
 * Origin: home (2:5020/400)


— RU.COMPRESS 
 From : IP Robot                             2:5093/4.126   08 Jun 02 02:04:14
 To   : All                                 
 Subj : News at ftp://ftp.elf.stuba.sk/pub/pc/pack/                                  


  ftp://ftp.elf.stuba.sk/pub/pc/pack/unarj265.exe
UnARJ v2.65 (97,952 bytes)


--- PktMake.pl
 * Origin: PktMake.pl (2:5093/4.126)
 Предыдущий блок  Следующий блок  Вернуться в индекс
Всё о сжатии данных, изображений и видео

Видео Video

Сравнения кодеков MSU Video Codecs Comparisons

Video Quality Measurement Tool (MSU VQMT)

Benchmarks

3D-пїЅпїЅпїЅпїЅпїЅ 3D video

Проекты

Projects

Книга «Методы сжатия данных»

Разделы

About О сервере

Новости:

Новости: