Információnyereség – Information gain

Információnyereség – Information gain

  1. Információnyereség ~ az információ matematikai elméletében valószínűség-eloszlások változását megfigyelve megszerzett mennyiség, a jelsorozatokban szereplő egyes jelek előfordulásának meghatározására szolgáló szám.

Ugyanilyen vagy alig eltérő jelentésben használt kifejezések: Kullback-Leibler divergencia

Ellentéte: információveszteség

Tágabb fogalomcsaládjához tartozó kifejezések: entrópiacsökkenés

Milyen kategória? Szakterminológia több tudományban és az azokhoz kötődő alkalmazási területeken.

A szó a nyelvi rendszerben kizárólag a fenti közösségek szakmai elitjében használatos.

  1. Információnyereség ~ az általunk birtokolt információvagyon növekedése valamilyen professzionális műveletnek köszönhetően.

Ugyanilyen vagy alig eltérő jelentésben használt kifejezések: információs többlet

Ellentéte: információveszteség

Tágabb fogalomcsaládjához tartozó kifejezések: információszerzés,

Milyen kategória? Hétköznapi értelemben, de szaktudományos környezetben forog.

A szó a nyelvi rendszerben alkalmi használattal létezik, nem indult el a feszesebb szakkifejezéssé fejlődés irányába.

  1. A döntési fák megalkotásával foglalkozó mesterséges intelligencia-kutatások osztályozó algoritmusai már a hatvanas évek eleje óta mérik a bizonyos teszt-típusok előtti információszükséglet és a teszt utáni új információszükséglet különbségét, hogy kiválaszthassák a legnagyobb információs nyereséget jelentő attributumot. A fogalmi apparátust és képleteiket azonban ők és az információnyereséghez szintén előszeretettel nyúló adatbányászok is az információ-és kódelmélettől importálták. Matematikailag egy kétváltozós függvény, az úgynevezett Kullback-Leibler divergencia szinonimájaként használják, amelyet az alábbi példával szemléltethetünk.

Tételezzük föl, hogy egy hírforrás folyamatosan híreket közöl a digitális közegben, amelyek fizikai mivoltukban jelek sorozatait jelentik. Ezekben a jelsorozatokban az egyes jelek valamilyen meghatározott elosztás szerint követik, ismétlik egymást. Ennek az ismeretében képessé válhatunk arra, hogy a jeleket tömöríteni tudjuk, hiányában azonban csupán egy becsült elosztást vagyunk képesek megállapítani. A Kullback-Leibler divergencia a jelek eredeti és a becsült elosztásának különbségéből kiszámolja, hogy egy jelsorozat (pl.: egy hír) kódolásához hány bittel kell többet felhasználni az eredeti, optimális változathoz képest, amelyet csakis akkor vagyunk képesek előállítani, ha – ahogy az előbb említettük – tökéletesen tudatában vagyunk az információeloszlásnak (Bartók, 2006).

Az információnyereséget a Kullback-Leibler divergenciából kiindulva gyakran alkalmazott módon is lehet használni: például két (üzleti, politikai stb.) fél közötti kölcsönös tájékoztatás mértékének kiszámításához. A kapott érték az adott helyzet bonyolultságától függően lehet az optimálist megközelítő (ha egyszerű) és attól messze álló (ha bonyolult).

  1. Az információnyereséget hétköznapi értelemben, nem szakszóként, de szakmai kontextusban számos kérdéskör kapcsán használják szerzők. A meteorológiában például az előrejelzések információtartalmának elemzésekor értékelik információnyereségnek az eredményt (Máhr-Varga-Haszonits, 1978). A folyamatos tájékozódásra kondicionált civil szervezetek számára az Internet ideális felület, mert sok-sok információs csatornát integrál, amelyek megfelelő használatával nagy információnyereséget érhetnek el (Leggewie, 1997). A felnőttoktatásban a célokra, motívumokra, jövő-állapotokra, összefüggésekre vonatkozó, megfelelő formában és ritmusban feltett kérdésekre épülő pedagógiai programtól várható (gyakran meglepő) információnyereség. De még az asztrofizikusok is a „többlet” értelmében használják magyarázataikban. Noha a fekete lyuk összeomlásának (elpárolgásának) pillanatában sok információ elveszik, a szingularitás visszamaradó darabkájából mégis meg tud szökni valamennyi – a veszteséget ez az aprócska információnyereség nem ellensúlyozza, de jó tudni róla.

Értékelés és ajánlás: A két eltérő jelentés az információ matematikai-statisztikai (mennyiségi) és hétköznapi (minőségi) megközelítéséből fakadó különbséget tükrözi. Az élénkülő matematikai-számítástudományi használattól az várható, hogy időben egyre több altípus fog majd elkülönülni (ahogy azt már meg is történt a relatív információnyereség fogalmának megalkotásával). S ha az információnyereség eltűnne az alkalmi használat világából, nem lennénk szegényebbek: a megjeleníteni kívánt tartalmak és értelmek más nyelvi eszközökkel is könnyen kifejezhetőek maradnának.  

Irodalom:

Michell, T. M. (1997): Machine Learning. McGraw-Hill Science, 55-65.
Bartók G. (2006): Természetes nyelvek gépi tanulása: az ABL algoritmus (diplomamunka), Eötvös Loránd Tudományegyetem, Természettudományi Kar, Matematikai Intézet, 8-9. http://www.doksi.hu/get.php?lid=7351 [2015-08-25]
Máhr, J. – Varga-Haszonits, Z. (1978): Az időjárás előrejelzése és a mindennapi élet. Gondolat.
Leggewie, C. (1997): Netizens oder: Der gut informierte Bürger heute. Transit, 13, 3-25.

Leave a Comment