Információs távolság – Information distance

Információs távolság – Information distance

Információs távolság ~ általában információs objektumok egymásra vonatkoztatásával előálló mennyiség. Speciálisan két véges hosszúságú számítógépes fájl egymásba alakíthatóságát kifejező számadat, bitben megadva. A távolság ebben az esetben azt a legrövidebben leírható programot jelenti, amelynek segítségével egyik fájl átalakítható egy másikká, vagy fordítva.

Ugyanilyen vagy alig eltérő jelentésben használt kifejezések: –

Tágabb fogalomcsaládjához tartozó kifejezések: minimális leíráshosszúság

Milyen kategória? Számítástechnikai szakterminológia, tankönyvben rögzített jelentéssel, de sűrű a használata más, formalizált rendszerekkel foglalkozó szakirodalomban is.

A szó a nyelvi rendszerben szinte kizárólag számítógépes program-környezetben használatos, ott is ritkán (magyar előfordulása is alig néhány akad).

Formális rendszerek esetében az értelmezett tárgy és az értelmező értelmezése közti tartomány közti különbségre régóta használják az információs távolság kifejezést, Ez képfelismerésnél például a környezetből származó információk és a keresett alakzat egymáshoz tartozó információi közti távolságot jelenti, amit jel/zaj viszonyként is értelmezhetünk (esetünkben minél kisebb ez az információs távolság, annál nehezebb az alakzat azonosítása). Hasonlóképpen került a tudománymetria fegyvertárába a két információs halmaz rokonságának mértékét jellemző mutatószámok közé az információs távolság (képletbe rendezve például a hivatkozható folyóiratok és a tényleges hivatkozások számát).

Az ezredforduló előtt néhány évvel elindult aztán egy minden korábbinál kötöttebb értelmű használat.

Az egyszerűség matematikai alapon történő meghatározására a hatvanas évek közepén megalkotott ún. Kolmogorov-komplexitásban megoldás szerepel a két objektum közti legrövidebb távolság meghatározására. Mivel a számítógépes térben a fizikai tárgyak megfelelői a fájlok, a szoftverkutatók azokkal kezdtek objektumként számolni. A fájlok közötti távolságot ennek megfelelően nem térbeli adatokkal tudták leírni, hanem 1-esekkel és 0-kkal, vagyis a számítástechnikában használatos nyelv, a kettes számrendszer elemeivel. Az információs távolság ennek értelmében nem fizikai, hanem „logikai”, vagy még inkább műveleti természetű: két fájl távolsága úgy fejezhető ki, hogy megállapítjuk a legrövidebben leírható programot, amely az egyik egyszerű fájlt képes a másikká alakítani.

Ahhoz, hogy ne pusztán egyszerű fájlok, hanem a számítógépen tárolt e-mailek, képek, videók stb. távolságát is képesek legyenek meghatározni, a tudósok megalkottak egy bonyolultabb képletet, az úgynevezett normalizált információs távolságot (Normalized Information Distance). Tömörítési algoritmusok segítségével teszik a vizsgálni kívánt tárgyat ábrázolhatóvá, s azután már lehetőség nyílik azok távolságának mérésére is. A módszertan kifejlesztésében a magyar származású, Hollandiában élő és kutató Vitányi Mihály Béla szerepe elévülhetetlen. Jellemző, hogy az általuk kialakított információs távolságfogalom használható minden, algoritmizálható alakzatra. (Például mitokondriális DNS-ek alapján különböző fajok filogenetikai törzsfáját tudták generálni, ahol az információs távolság genetikai távolságot reprezentált.)

Újabban a földrajz-és gazdaságtudomány határvidékén is használják, az információs aszimmetriák alakulásának megértéséhez. Azt fejezik ki vele, hogy a fizikai távolság növekedésével arányosan nő a piaci szereplők közötti információs távolság is (de a távolsággal arányos költségnövekedés kalkulálása egyelőre nehéz diónak bizonyul).

Értékelés és ajánlás: A fogalom megértése matematikai jártasságot és absztrakciós készséget igényel. Különböző tudományterületek használják részben hasonló, kis részben azonban különböző információs objektumaik közti kölcsönös aránymérésre. Az egyes fogalmi alkalmazások közti távolság azonban egyre nő: ahogy mind több új terület lép be, egyre nagyobb lesz az esélye annak, hogy ez a már így is csak az analógiás erő révén együtt tartott jelentés „szétrobban”, és három-négy új, szakosított jelentésre bomlik, önálló definíciókkal és elnevezésekkel.

Irodalom:

Vitányi, P. M. B. (2011): Information Distance in Multiples, IEEE Transactions on information theory, 57 (4).
Vitányi, P. M. B. et al. (2009): Normalized Information Distance. Springer, 45-82.

Leave a Comment