de compresie a datelor
De ce am nevoie pentru a comprima informațiile și care sunt modalitățile de a face acest lucru.
Și într-adevăr, de ce? Calculăm, de exemplu, cât de mult durează de memorie o imagine de calitate aproape de televizor. Să permisiunea lui - .. 800h6009 pixeli, iar numărul de nuanțe de aproximativ 16 mii (High Color), adică, fiecare culoare pixel este reprezentat de un cod de doi octeți. 800x600 = 480000 elemente. 480000x2 bytes = 960,000 bytes - un pic mai puțin de 1 megabyte. Nu pare atât de mult - pe disc cu laser pentru a pune mai mult de 650 de imagini. Ei bine, dacă vorbim despre film? Viteza standard de proiecție de film - 24 cadre pe secundă. Deci, pe CD-ul poate fi scris lungimea fragmentului de 650: 24 = 27 de secunde. În cazul în care se potrivește. Dar acest lucru nu este singurul caz în care informația este „prea mult“. Astfel, unul dintre motivele pentru utilizarea de compresie a datelor - dorința de a pune mai multe informații în memoria aceeași capacitate. Există un al doilea motiv. de compresie a datelor accelerează transmiterea acesteia. Dar acest lucru - în capitolul următor.
Există mai multe metode de date (kompressii10) de compresie. Toate acestea pot fi împărțite în două grupuri - fără pierderi și lossy. În primul caz, mesajul decomprimat urmează îndeaproape cu originalul. Desigur, astfel încât să puteți procesa orice informație. Compresia a pierderilor este posibilă numai în acele cazuri în care admisibilitatea anumitor distorsiuni - care depinde de tipul particular de date.
Aproape toate metodele de compresie fără pierderi se bazează pe una dintre cele două este idei destul de simplu.
Unul dintre ei a apărut pentru prima dată în metoda de compresie a datelor de text, propuse în 1952 de Huffman. Știi că standardul, fiecare caracter al textului este codificat într-un singur octet. Dar faptul că unele litere sunt mai frecvente, iar altele mai puțin. De exemplu, într-un text scris în limba rusă, în fiecare o mie de caractere la o medie de 90 litere „o“, 72 - „e“ și doar 2 - „f“. Cele mai multe dintre toate, va golurile: 174. În cazul în care cele mai frecvente simboluri utilizate coduri mai scurte (mai mici de 8 biți), și pentru mai puțin frecvente - lungi (mai mult de 8 biți), textul în ansamblu va dura mai puțin memorie decât standard de codificare.
Mai multe metode de compresie se bazează pe contul de octeți repetate sau secvențe octet. Cel mai simplu dintre ele - RLE11 - utilizate pe scară largă în compresie a imaginii. Fișierele comprimate în acest mod se înregistrează câte ori a repetat aceleași octeți. De exemplu, în loc de „RRRRRGGGBBBBBBRRRBBRRRRRRR“ să fie stocate „5R3G6B3R2B7R“ 12. Evident, această metodă funcționează cel mai bine atunci când imaginea conține zone mari cu o singură culoare umbrită.
Alte metode se bazează pe faptul că, în cazul în care o secvență de octeți găsit într-un fișier de multe ori, acesta poate fi scris o dată într-un tabel special, și apoi pur și simplu indică „să ia atât de multe bytes de un astfel de spațiu tabelă.“ 13
tehnici de compresie fără pierderi reduce dimensiunile fișierelor nu sunt foarte puternice. În mod tipic, raportul de compresie nu depășește 1 / 3-1 / 4. Mult rezultate mai bune pot fi realizate folosind compresia lossy. În acest caz, pe baza unor studii speciale determinate ce informații pot fi sacrificată.
Rețineți că nu ar trebui să încercați pentru a comprima fișierele care au fost comprimate: dimensiunea oricărei doar o mică scădere sau chiar să crească.
De fapt, în imaginea de televiziune de 625 de linii.
Compressus (. Lat) - strângere.
Run-Length Encoding (Eng.) - secvență de codificare de lungime.
De fapt, desigur, utilizează coduri de culoare și coduri care indică fie cât de multe ori repetat următorul octet, sau cât de mulți octeți de mai jos - non-recurente.
Această idee se bazează sunt utilizate pe scară largă pentru diverse metode LZW de compresie a datelor, numit astfel pentru prima literă a numelor dezvoltării sale: Lempel, Ziv și Welch.
Joint Photographic Experts Group (Ing.) - Joint Photographic Experts Group, care a dezvoltat metoda de comprimare a imaginii cu același nume.
Moving Picture Experts Group (Ing.) - Grupul de Experți imagini în mișcare