Információtömörítés – Information compression

Információtömörítés – Information compression

Információtömörítés ~ az adatállományok fizikai méretének csökkentése az egyszerűbb tárolás és közvetítés érdekében.

Ugyanilyen vagy alig eltérő jelentésben használt kifejezések: adattömörítés

Ellentéte: az információ dekompressziója (kicsomagolása, kibontása)

Tágabb fogalomcsaládjához tartozó kifejezések: adatmenedzsment, adattárolás, adattovábbítás  

Milyen kategória? Informatikai-adattudományi szakszó.

A szó a nyelvi rendszerben az összevonással képzett terminus-szerű formánál gyakrabban fordul elő más (birtokos) szerkezetű nyelvi megoldással, és az általános fogalom helyett jellemzően az alacsonyabb szintű fogalmakat (képtömörítés, hangtömörítés, stb.) használják előszeretettel.

Az üzenetek, közlemények tömörsége és rövidsége, az egységnyi idő alatt átadott minél több információ, illetve ugyanannak az információnak a minél rövidebb idő alatti pontos átadása (brevitas, rövidség) már az antik retorikákban követelmény és eszmény volt.

Mostanra azonban szinte kizárólag az informatikában és a számítástechnikában használják, egy speciális, oda-vissza adatművelet elnevezésére – de a szakmailag helyes adattömörítés helyett sokan használják az általánosabbnak, izgalmasabbnak, saját diszciplináris sáncaikon túlmutatónak tűnő információtömörítést.

Az információ bármely tárgyiasított és digitalizált hordozójának (folyószöveg, adatbázis-szöveg, strukturálatlan szöveg, hangok, videók, képek) mérete van, és ez különböző eljárással csökkenthető. Technikailag azoknak a biteknek a száma lesz kevesebb, amelyekkel az adott fájl területet foglal el adott tárhelyen. A tömörítés célja a tárolás vagy az állományok gyors és hibamentes továbbításának, közvetítésének egyszerűsítése. Amikor újra használatba kell venni az állományt, a tömörítési folyamat inverze hajtható végre rajta. A műveletet jól ismeri szinte minden felhasználó, mert az információs írástudás elemi iskolájában kijárják az állománytömörítés (becsomagolás) és kibontás/kicsomagolás műveleteit az erre a célra rendszeresített szoftvertermékekkel. Természetesen „ipari célú”, óriás állományokon (például képkönyvtárakon) egészen más technikákkal és egészen más tömörítési arányokkal dolgoznak a szakértők.

A tömörítési eljárás lehet veszteséges (a fájlból elvesznek a szükségtelennek vélt adatok) vagy veszteségmentes. Ilyenkor az algoritmusok kihasználják a statisztikai redundanciát, hogy bárminemű információvesztés nélkül visszafordítható legyen a folyamat. A statisztikai redundancia azt jelenti, hogy a vélt és a valós adatok gyakran különböznek egymástól. Egy kép esetében például előfordulhat, hogy adott terület színét képpontonként tárolja a fájl ahelyett, hogy az egész terület színét egyetlen színhez párosítaná. A tömörítés kihasználja ezt a tényt, és ahelyett, hogy egy pixelhez egy színt párosítana, nagyszámú képponthoz összefoglalóan is képes egy színt társítani.

A veszteséges tömörítésnél a szükségtelennek vélt vagy kevésbé szükséges információk elvesznek a fájlból. Egy kép esetén például olyan színek tűnhetnek el, amelyeket az emberi szem nem képes érzékelni. Ezeket ezután egyszerűbb színek helyettesítik.

Értékelés és ajánlás Az üzenet tömörségét az információ tömörségével azonosító beszédfordulatokban gyakran találkozunk a két fogalom összekapcsolásával, de nem az összevont, szakkifejezés-szerű formában. Információ-vagy adattömörítésként csak a szakkönyvek használják, ez evvel foglalkozók és a hétköznapi felhasználók nem tesznek a tömörítés elé előtagot (információ, adat), vagy ha igen, az a tömörítendő állomány fajtája (kép, hang, szövegdokumentum, fájl).

Irodalom:

Blelloch, G. E. (2013): Introduction to Data Compression. Carnegie Mellon University.
https://www.cs.cmu.edu/~guyb/realworld/compression.pdf [2016-05-20]
Mittal, S – Vetter, J. (2015): A Survey Of Architectural Approaches for Data Compression in Cache and Main Memory Systems. IEEE, Transactions on Parallel and Distributed Systems.

Leave a Comment