HTML

A mágnesszalagok

Friss topikok

  • : Figyeljetek, ez nagyon érdekes, amiről vitatkoztok, de mi a nyavalya értelme volt 1990-ben mágness... (2010.04.26. 11:49) A mágnesszalag-bizottság krónikája
  • sztahanov: Meg a sakálam titkára. (2010.02.02. 13:02) Meghívó
  • Honfi-fi: SZIASZTOK ! Már az őskorban volt, én még dolgoztam szalagos gépen. Az egy un. BS2000-es Siemens gé... (2010.02.01. 22:47) Olvasási eredmények

Archívum

2010.01.26. 03:05 Barczi Imre

A mágnesszalag-bizottság krónikája

Az alábbiakban megkísérlem összefoglalni az egykori állambiztonsági szolgálat gépi nyilvántartását tartalmazó 18 mágnesszalag lementésének technikai történetét, tehát azt a 8 hónapos projektet, aminek a feladata egész pontosan az volt, hogy a szalagokon található még olvasható adatokat korszerű adathordozóra mentsük át, lehetővé téve a későbbi feldolgozást. Leírásomban igyekszem a minden bizonnyal izgalmasabb politikai kontextustól távol maradva a konkrét informatikai projektre koncentrálni. A szalagok ügye elég nagy reflektorfényt kapott, a médiában számos találgatás illetve hamis információ jelent meg, így különösen indokolt most, a munka befejezése után az érdeklődő közönség elé tárni, mi is történt valójában.

Aki már látott akár csak egy epizódot is a kortárs amerikai helyszínelő sorozatok bármelyikéből, joggal hiheti, hogy néhány ősrégi, romokban megmaradt szalag összes információjának leolvasása és értelmezése jó esetben 5 perces, de maximum egynapos munka. A rideg valóságban viszont egy extra nehezítésekkel tűzdelt informatikai projekt kevésbé látványos, inkább a vér, veríték és könnyek szentháromsága jellemzi: talán most kiderül, hogy mi tartott 8 hónapig.

A bizottság

2009 március elején kaptam a felkérést Kenedi Jánostól, hogy vegyek részt a szalagok archiválására felállított munkacsoportban civil informatikai szakértőként. A feladat egyszerre volt ijesztő, izgalmas és homályos, de természetesen azonnal igent mondtam.

A bizottság 4 civil és egy a Nemzetbiztonsági Szakszolgálat által delegált informatikusból illetve az NBH által delegált elnökből és jogászból állt. Első ülésünket március 20-án tartottuk, ezt november végéig még kb. további 50 maratoni összejövetel követte. Számomra ezen az első találkozón derült ki, hogy pontosan mi is a feladat: leolvasni a szalagokat és átmásolni róluk minden adatot azzal az apró nehezítéssel, hogy vakon kell dolgoznunk, mivel a szalagok 2060-ig titkosítva vannak, így munka közben egyáltalán nem láthatjuk, mi van rajtuk. A másik feltétel az volt, hogy nem tehetjük ki őket a rongálódás illetve az adatmódosulás legkisebb veszélyének sem, tehát bolondbiztos rendszert kell összeraknunk, mielőtt elkezdjük olvasni őket.

Régi, elavult technológiáról van szó, nem is sikerült olyan szakembert delegálni a bizottságba, akinek kimondottan a szalagokról történő adatmentés lett volna a szakterülete. A munkacsoportba így különböző szemlélettel és tapasztalattal bíró informatikusok kerültek, volt köztünk olyan, aki sokat dolgozott, illetve a mai napig foglalkozik régi szalagokkal és rendszerekkel (szegedi informatikatanár, gyűjteményi tárlatvezető, a bizottság alelnöke), volt adatmentésben tapasztalt szakember (Zsilinszky Sándor, a Kürt üzletágvezetője). A további két civil tag Harajda András és jómagam voltunk. Visszatekintve a vegyes összetétel kimondottan szerencsés volt, nagyon jó, széles látókörű csapat jött össze, beleértve a Hivatal munkatársait is, akikkel végig korrekt viszonyunk volt, még ha különböző prioritásaink voltak is a projekt részleteiben.

A szalagok

Március 28-án vehettük először kézbe a szalagokat. Leragasztott, lepecsételt borítékokban érkezett a 18 tekercs, a kibontás után az NBH fotósa lefényképezte őket, rögzítettük azokat az adatokat, amelyek szemmel megállapíthatóak voltak, majd újracsomagoltuk az összeset, ezúttal már a bizottság tagjainak aláírásával. Ettől a pillanattól elvileg más nem férhetett hozzájuk. Az aláírás és újrapecsételés ceremóniája minden további felbontáskor megismétlődött, bár ezután sokáig, az első mentésig nem láttuk a szalagokat.

A szalagok szemre megfelelő állapotúak és sértetlenek voltak, a csomagolásból úgy tűnt, hogy megfelelő körülmények között tárolták őket, penész vagy komolyabb szennyeződés nem volt rajtuk. Azt természetesen nem lehetett megállapítani, hogy milyen hőmérsékleten tárolták-e őket, érte-e őket valamilyen erős besugárzás, stb. Néhány métert letekertünk belőlük, nem voltak túlságosan összeragadva és oldalról vizsgálva őket az is látszott, hogy le voltak már tekerve korábban, tehát nem új, hanem használt szalagok. Korábbi életüket illetően persze nem lettünk okosabbak, a borítékokat olvashatatlan aláírással, NBH-s pecséttel (1. sz. körbélyegző) zárták le. Dátum nem szerepelt rajtuk, de irattári tételszám igen, pl. az egyiken 007/97/7, de ez nem volt egyértelmű zárási dátum.

A korábbi elméleteket – ti. hogy 6 szalagról van szó, mindegyik 3 példányban felírva - megerősítette a címkézés, hármasával nevezték el őket, pl. GYUJ H1, GYUJ H2 illetve GYUJ H3. A szalagok között volt 7 és 10 inch átmérőjű is (utóbbin hosszabb a szalag, így több adat fér rá), de az azonosított hármasokon belül mindig egyforma volt a méret. Nemcsak a borítékokon, hanem a szalagokon is voltak címkék, ezeken az első használatbavétel ideje 1990.01.25. volt. (Arra persze nincs garancia, hogy ezek valós adatok voltak.)

Bár a szalagok jó állapotúnak tűntek, az sejthető volt, hogy régen nem nyúltak hozzájuk. Tehát hiába voltak a tárolási körülmények szemre megfelelőek, az előírt 2-3 évenkénti átforgatást biztosan nem hajtották végre rajtuk már jó ideje. (A szalagok időnkénti áttekercselésére azért van szükség, mert az egymáson fekvő szalagrétegek hosszú idő alatt átmágnesezik egymást.) Ennél a pontnál tehát még meglehetősen bizonytalan volt, hogy tudunk-e róluk adatot menteni.

Felkészülés

A szalagok felírásáról semmilyen konkrét információ nem állt rendelkezésünkre, csak annyit tudtunk, hogy valószínűleg a BM adatfeldolgozó hivatalában rögzítették őket 1990 körül. Az ott dolgozó személyzetből azonban senkit nem lehetett előkeríteni és azt sem tudtuk pontosan, hogy milyen számítógépeket illetve szalagos egységeket használtak. A rendelkezésre álló információk alapján a Siemens 4004 család valamelyik változatáról volt szó, de mivel ezeket a gépeket az összes, máshol található hasonlóval együtt már rég leselejtezték, az olvasáshoz egy új, korszerűbb rendszer összerakása látszott célszerűnek. Ehhez megpróbáltunk összegyűjteni minden fellelhető információt a szalagokról, a lehetséges felhasznált formátumokról, az olvasóegységekről. A kutatás nagyrészt az interneten folyt, ahol a szóban forgó ½ inch-es 9 trackes szalagtípusról rengeteg információ található.

Ez a szalag ugyanis elavultsága ellenére az egyik legnépszerűbb adathordozó a világon. Bár már évek óta nem gyártanak se ilyen szalagot, se hozzávaló olvasóegységet, majdnem 40 éves pályafutása során rengeteget használták, nagyon sok adattár létezik még ma is, ami ebben a formátumban van csak meg. Először 1964-ben az IBM System/360 számítógéphez használtak ilyen szalagot, 2003-ban gyártották utoljára. Négyféle adatsűrűségű változat létezik, a legnagyobb sűrűségű és átmérőjű szalag maximális tárolókapacitása kb. 170 megabyte. Az első szalagos egységek szekrényméretű dobozok voltak, de mivel a szalagtípus jelentősen túlélte az őt létrehozó nagyszámítógépes hőskorszakot, nem meglepő módon a 80-as és 90-es években PC-hez illeszthető olvasók is készültek (ezek akkorák kb., mint 2 mikrohullámú sütő). Természetesen már ilyen olvasókat sem gyártanak, csak felújított, használt darabokat lehet beszerezni, ha nem is a sarki közértben, de az interneten lehet találni néhányat.

Említettük, hogy ezek a szalagok még sok helyen megtalálhatók, és sokszor előfordul az is, hogy adatot kell olvasni róluk. Ugyanakkor a megfelelő olvasók beszerzése költséges és nehéz. Ebből következik, hogy a világon ma is sok olyan vállalkozás van, ami ilyen szalagok átírására specializálódott – ráadásul ők a felgyülemlett sokéves tapasztalat folytán a régi, problémás szalagokat is jó hatásfokkal tudják menteni. Mi sem lett volna egyszerűbb, mint megkeresni a legközelebbi ilyet, hónunk alá csapni a 18 szalagot, elvinni őket és hazahozni a lementett adatokat. De ezt természetesen nem tehettük meg, mivel külső mentésnél se a titokvédelem, se a szalagok sérthetetlensége nem lett volna garantálható.

Maradt a nehezebb út, a saját rendszer építése, ráadásul a későbbi technikai galibák kivédésére úgy döntöttünk, hogy három független rendszert építünk, ezekben a PC lehet egyforma, de három különböző gyártmányú szalagos egység kell. Csak olyan olvasók jöhettek szóba, amelyek mind a négy adatsűrűséget tudták olvasni, hiszen fogalmunk se volt arról, hogy a 18 szalagot milyen módon rögzítették. (Ráadásul nem elég a legnagyobb sűrűségre képes egységet választani, mert az olvasók nem kompatibilisek automatikusan a kisebb sűrűségű szalagokkal, hiszen a rögzített jelek kódolása is más). További szempont volt, hogy az egység tudjon read only (csak olvasás) módban dolgozni, hogy még véletlenül se tudjuk felülírni a szalagokat.

Aránylag gyorsan, már április 9-én dűlőre jutottunk abban, hogy melyik az a 3 javasolt és 3 tartalék típus, amit érdemes lehet használni. A beszerzés – szintén adatbiztonsági okokból – az NBH saját csatornáin keresztül történt, miközben az eszközökre vártunk, rendszertervet írtunk. (Ebben többek között pontosan specifikáltuk a tesztelésre és éles mentésre használt rendszert, a folyamatokat, a lementett adatok biztonságos tárolásának és archiválásának módját, felkészültünk a hibalehetőségekre, stb. (Kétségkívül nem ez volt a projekt legizgalmasabb része.) Erre a munkára három hónapunk volt, mivel a beszerzés sajnos nem ment túl gyorsan – ahhoz képest, hogy az egész projektet a tervek szerint június végéig be kellett volna fejeznünk, az első olvasó július elején érkezett meg, a harmadik július 21-én, szűk két héttel a nyári szabadságok miatti kényszerszünet előtt. De ekkor még volt egy pici remény arra, hogy ha minden jól megy, befejezhetjük a mentést ebben a két hétben.

Az első tesztek

Az első olvasóegység megérkezésekor megkezdődött a rendszerépítés és a tesztelés. A rendszer működtetésére a Hivatalban kaptunk egy minden biztonsági szempontnak megfelelő helyiséget szünetmentes áramforrással, klímával, állandó kamerás megfigyeléssel, őrizhetőséggel, elektromágneses kisugárzás elleni védelemmel (ti. hogy ne lehessen lehallgatni az olvasás közben a hardverelemek által kisugárzott jeleket). A tesztelésre régi, használt szalagokat szereztünk be, több típust is kipróbáltunk.

A munka nem volt zökkenőmentes, a rendszerben sok ismeretlen elem volt. Igyekeztünk a PC-ket összehangolni az olvasókkal, harcoltunk sunyi hardverütközések ellen, tuningoltuk az olvasók állítható részeit, kerestük a legkíméletesebb mechanikát, próbáltuk kiválasztani az olvasószoftverek közül a legmegbízhatóbbat. Július végére állt össze a rendszer annyira, hogy kitűzhettük végre az első éles szalaggal végzett tesztolvasást, július 31-re. Tudtuk előre, hogy ez vízválasztó lesz: ha minden jól megy, hamar végzünk, ha nem, nagyon elhúzódik a projekt.

A tesztolvasáshoz egy olyan borítékot választottunk ki, amiben három kisebb típusú, 7 inch-es szalag volt egybecsomagolva, de csak az egyiket akartuk kipróbálni. Maga az olvasás meglehetősen szürreális körülmények között zajlott. Mivel a bizottság tagjai nem tekinthettek be a szalagon levő titkos adatokba, úgy helyeztük el a számítógépet, hogy csak a kezelő – tehát a titokgazda, Laborc Sándor, az NBH akkori igazgatója – láthatta a monitort. A szalag befűzése után a bizottság tagjai a szoba másik feléből izgulták végig a beolvasási kísérleteket, amit a titokgazdának előre rögzített leírás alapján – a bizottság szóbeli instrukcióival kiegészítve - kellett egyedül végrehajtania. Ez természetesen többször megismétlődött, közben olvasót, diszket illetve szalagot cseréltünk.

Meglepetésre rögtön az első szalag beolvasása sikeres volt. Két olvasóval is ugyanakkora állományt sikerült beolvasni. A bökkenő csak az volt, hogy állomány nyúlfarknyi, 4105 byte hosszú volt. Ha minden szalagon csak ennyi adat van, akkor a projekt csak technikailag lesz sikeres, a kutatás szempontjából nem. Látva a bizottság csalódottságát, a titokgazda ekkor felajánlotta, hogy próbáljunk ki a borítékból egy másik szalagot is. Itt kezdődtek a bajok.

A második szalagot két olvasóval is hibásan sikerült csak beolvasni. A szalag ráadásul borzasztó nyikorgó hangokat adott ki (már az első is, de ott nem törődtünk vele, hiszen ott még sikerült a beolvasás). A titokgazda ekkor úgy döntött, hogy próbáljuk ki a harmadik szalagot is.

A harmadik szalag beolvasása majdnem katasztrófába torkollott. Az első kísérletnél az olvasóegység egyszerűen begyűrte a szalag egy részét és beragadt. Itt abbahagytuk a próbálkozást, visszacsomagoltuk a szalagokat és megpróbáltuk kitalálni, hogyan tovább.

Az biztos volt, hogy ezzel a rendszerrel, ezzel a módszerrel nem folytathatjuk a többi szalag beolvasását, ha nem akarjuk kockáztatni épségüket. Több irányban kezdtünk el kutakodni: lehet-e az olvasóeszközök mechanikáját tovább tuningolni? Tudunk-e szervizleírásokat szerezni az olvasókhoz? Milyen fejállítási lehetőségek vannak? Jól tisztítjuk-e két olvasás között a fejet? Esetleg a szalagok állapota miatt nem megy jól a beolvasás? A nyikorgás és a begyűrődés arra mutatott, hogy talán szorulnak valami miatt a szalagok, így először arra gondoltunk, hogy kézzel minden szalagot áttekerünk, hogy kicsit meglazuljanak.

A megoldást aztán természetesen az interneten találtuk meg, teljesen véletlenül, amikor alaposabban rákerestünk a hosszú tárolás alatt kialakuló lehetséges szalagromlásokra. Egy nagyon fura dologra bukkantunk: a régi szalagok körében meglehetősen gyakori egy SSS vagy Sticky-Shed Syndrome nevű betegség. Ezt nehéz lefordítani, de azt jelenti, hogy a mágnesezhető bevonatot a szalag műanyag alapjára rögzítő ragasztóréteg nedvességet szív magába, ha évekig nem elég száraz helyen tárolják. Ettől aztán felpuhul, és az egész szalag ragadóssá, nyúlóssá, olvashatatlanná válik. A jelenség annyira közismert, hogy még Wikipedia bejegyzés is létezik hozzá. És persze gyógymód is, ami elsőre rossz viccnek tűnik: a szalagot sütni kell (igen, a szalagsütéshez is tartozik a Wikipediában külön bejegyzés). A sütés nagy hőfokon (50-60 Celsius fok) történik és akár több napig is tarthat, a lényeg az, hogy a felpuhult réteget kiszárítja, és a szalag a sütés után egy ideig újra olvasható lesz.

Itt volt az a pont, ahol felcsillant a remény, a legjobb pillanatban lett tehát vége az első felvonásnak, bő egy hónapos nyári szünet kezdődött.

Célegyenes

Szeptember 15-én megújult lelkesedéssel ültünk össze újra. Nem tettünk fel mindent egy lapra, a szalagsütés előkészítése mellett elkezdtünk egy bonyolultabb műszeres méréssorozatot, hogy biztosak legyünk abban, az olvasófejről megfelelő jel jön le, a relatív bonyolult Windows alapú szalagolvasó szoftverek mellé pedig alternatívának összeraktunk egy egyszerű linuxos olvasót is. A három olvasóból itt már csak egyet választottunk ki az utolsó szakaszra, azt, aminek a legkíméletesebb volt a mechanikája.

A legtöbb macera természetesen a sütéssel volt. Kaptunk egy brutális klímakamrát, amiben először tesztszalagokat sütöttünk, azt vizsgálva, hogy a hőkezelés után könnyebben olvashatók-e. Túl sok javulást nem tudtunk kimutatni, de legalább arról meggyőződtünk, hogy a sütés nem ront a szalagok állapotán. Ez a második tesztfázis október végén zárult, ekkor már kész volt a beolvasási menetrend is novemberre, sütési és olvasási időpontokkal (természetesen biztonsági okokból nem egyszerre sütöttük a szalagokat, lassan kezdtük és a végére terveztük felgyorsítani a folyamatot).

A mentés

A végre eredményes mentés – november 5. és 23. között - nagyjából eseménytelenül zajlott az előre megírt menetrend szerint. Nem sikerült ugyan az összes szalagot tökéletesen lementeni, de a mentés során bebizonyosodott az a sejtés, hogy minden szalagból három egyforma van, és sikerült minden hármasból legalább kettőt beolvasnunk úgy, hogy azonos volt a lementett adattartalom (ezt tudtuk betekintés nélkül is ellenőrizni). A biztonság kedvéért ráadásul minden szalagot mindkét szoftveres környezetben (Windows illetve Linux alatt) beolvastunk.

Válaszok

Mi van a szalagokon? Ezt nem tudni, mivel nem nézhettünk bele a lementett adatokba. Azt tudjuk, hogy ami a szalagokon van, azt sikerült átmenteni modern, megbízható adathordozókra. (Egész pontosan külső merevlemezre és nagy élettartamú DVD-re is készült mentés, több példányban.)

Mit lehet tudni a lementett adatokról? Azt tudjuk, hogy a szalagokon van adat és az állományok nincsenek titkosítva, mert a titokgazda a mentés során belenézett néhány állományba és látott olvasható adattöredékeket. Tudjuk, hogy hat állományt mentettünk le, G, H és K jelűeket, mindegyikből létezik egy rövidebb GYUJ és egy hosszabb TORZS jelű változat, ez összesen hat. Valószínűsíthető, hogy nem szöveges adat, hanem adatbázisok vannak a szalagokon, tehát nem lehet közvetlenül értelmezni őket, előbb vissza kell fejteni a rekordformátumot, de ez nem tűnik túl bonyolultnak. A szalagokról közel 40 megabyte adatot sikerült lementeni. Mivel az adatok nincsenek tömörítve, ez szöveges adat esetében megfelelhet 10,000 gépelt oldalnak, adatbázis esetében (ez a valószínűbb) néhány tízezer rekordnak.

Mi a biztosíték arra, hogy az adatokat nem fogják manipulálni? Mind a hat állományról készítettünk hash lenyomatot. Ez olyan ellenőrző karaktersorozat, ami megváltozik, ha az eredeti állományban akár csak egy karaktert is megváltoztatnak. A hash lenyomat segítségével a jövőben ellenőrizhető, hogy valóban az általunk lementett állományokról van-e szó.

Mi a biztosíték arra, hogy az adatokat nem manipulálták az elmúlt 19 évben? Erre nincs garancia. Mi azokat a szalagokat mentettük le, amiket 2009. március 28-án megmutattak nekünk. Azt, hogy előtte mi történt a szalagokkal, nem tudni (legalábbis ebből a projektből nem derül ki). Az állományok a szalagon tárolt dátum alapján 1990. január végén keletkeztek (de ezt módosíthatták). Azt pedig végképp lehetetlen megmondani, hogy a szalagokat olvasták-e azóta.

(Ez a bejegyzés az ÉS január 22.-i számában megjelent hasonló című cikk bővített változata.)

131 komment · 1 trackback

A bejegyzés trackback címe:

https://magnesszalagok.blog.hu/api/trackback/id/tr101702688

Trackbackek, pingbackek:

Trackback: Megakadt a Kenedi-bizottság 2010.04.15. 08:40:01

Senki nem kereste hivatalosan a múlt héten megalakult Kenedi-bizottság tagjait, akik ötvenezer hálózati személy adatait felügyelnék. A bizottság megalakulásakor kormányzati forrásaik még azt tudatták: gyakorlatilag már meg is kezdték a munkát.

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Barczi Imre 2010.01.26. 13:09:18

@bunkó: nincs olyan sokféle hash. 512 bites készült egyébként, nemnagyon manipulálható. A hashek nem titkosak, de nekünk csak kinyomtatva vannak meg (elég szigorú volt az adatok kifele áramoltatása). Az első hat karaktereket lehet hogy beleírom valamelyik posztba. Vagy lefényépezzük a papírt.

Szanaszét Szolizott Szilikonos Szőke 2010.01.26. 13:09:34

Gondolom meg is fizettek érte benneteket, mindenesetre big riszpekt a kitartásért. Szakmai kihívásnak sem egy utolsó dolog. Gratulálni tudok csak!

Barczi Imre 2010.01.26. 13:13:02

@Szanaszét Szolizott Szilikonos Szőke: amikor elvállaltam, fogalmam sem volt, hogy fizetnek-e érte. Végül kaptunk valami költségtérítést, jóval a normális, civil munkával töltött órabérünk alatt. Nincs jelentősége, ez egy érdekes projekt volt, ingyen is örültem volna hogy benne vagyok.

Netuddki. 2010.01.26. 13:13:31

@Barczi Imre: Na és mitől lesz politikailag szalonképtelen?
Attól, hogy valaki trágárkodik vagy elég csak ha csalódott a "rendszerben".
Egy ilyen blogon a kritikát is el kell viselni, különben hiteltelenné válik az egész. Akkor meg kár volt ezt a blogot nyitni. :(

Barczi Imre 2010.01.26. 13:16:39

@kovi1970: azt, hogy mi szalonképtelen, én döntöm el, mivel itt én vagyok a házigazda. Minden kritikát beengedek, szerintem te is tudod, hogy a szalonképtelenség mit jelent egy blog kommentjeiben. Ez egy informatikai projekt volt az én szemszögemből, más aspektusból nem szeretnék vitatkozni itt, nem adok terepet politikai arcoskodásnak (de még senki nem is próbálkozott).

Axum 2010.01.26. 13:18:01

Hol lehet ezt olvasni fekete háttér nélkül?

Barczi Imre 2010.01.26. 13:21:08

@Axum: szorri, nekem sem tetszik, csak a többi sablon túl vicces volt ehhez. Ott van a link az ÉS-re, ott el tudod olvasni fehér alapon, néhol át van írva kicsit, ennyi.

karandas 2010.01.26. 13:22:00

@Barczi Imre: Azt azért nem mondod komolyan, hogy a Kürt, az NBH delegál egy-egy expertet, erre begyűrődik a szalag, ill. utólag kiderül, hogy a wikipedián senki sem olvasott utána a szalagok fizikai avulásának?

Barczi Imre 2010.01.26. 13:24:47

@karandas: írtam, hogy nem volt közöttünk szalagromlás-szakértő. Egyébként sokféle hiba/romlás lehet, nem tudod, merre tapogatózz, amit nincs a kezedben a konkrét média. Nekünk az egész tesztelést más szalagokkal kellett megcsinálnunk, a 18 szalag biztonsági okokból nem volt tesztelésre használható. A tesztszalagainknak meg nem volt ilyen bajuk.

Szanaszét Szolizott Szilikonos Szőke 2010.01.26. 13:25:23

@Barczi Imre: Ó, a lényeg akkor is a riszpekten van ám, bár azért jobban is megfizethettek volna titeket. Mindenestre én, mint mezei szőke azt gondolom, hogy ez egy hatalmas meló volt, mégha a bókom nem is jött át rendesen eszerint. :)

bunkó · http://bunko.blog.hu 2010.01.26. 13:25:23

@Barczi Imre: "512 bites készült egyébként, nemnagyon manipulálható"

Ez valóban így van. Azonban ilyen magas biztonsági szint esetén erősebbet választottam volna a "nemnagyon" helyett. Két hash már ilyen.
Tudom, hogy elenyészően kicsi a valószínűsége annak, hogy valaki iszonyú energiaráfordítással készít egy hamis listát, aminek ugyanez a hash-je, de talán nem nulla.
És biztosan vannak a listán néhányan, akiknek nagyon sok pénzt megérne a dolog.

Barczi Imre 2010.01.26. 13:30:32

@bunkó: azt gondolom, hogy ha - feltéve, de meg nem engedve - a Hivatal manipulálni akarta volna a szalagok tartalmat,azt nem a haselés után, hanem még az olvasás előtt teszi. Sokkal egyszerűbben, kevesebb erőforrással megvalósítható lenne úgy.

Az SHA-2/512 jelenleg a legerősebb nem kísérleti hashelés. Igazából még sokkal elterjedtebb az SHA-1 (ld.: en.wikipedia.org/wiki/SHA_hash_functions#SHA-2_family). Az SHA-3 még fejlesztés alatt van, nem jöhet szóba.

tiboru · http://blogrepublik.eu 2010.01.26. 13:31:07

@Márai Coelhó:

Ez nem államtitok (mármint az, hogy a régi Egységes Gépi Prioráló Rendszerben milyen adattárak voltak). És azt is mindenki tudja évek óta, hogy a szalagokon a hálózati (és más operatív) nyilvántartások vannak.

Ezek *konkrét* tartalma az államtitok.

Például az nem államtitok, hogy a titkosszolgálatok meg a bűnügyi rendőrség lehallgathatnak telefonbeszélgetéseket. Hogy pontosan mikor és kiét - na az már igen.

bunkó · http://bunko.blog.hu 2010.01.26. 13:31:07

@Axum: Húzd végig az egered átlósan a szövegen. Nem lesz szép, de olvashatóbb.

Márai Coelhó · anygyalszarny.blog.hu 2010.01.26. 13:32:59

Egy markáns ellenvélemény. Ha a szalagokról levennék a minősítést, az nem jelentené azt, hogy azonnal nyilvánossá válnának. Tudomásom szerint egyetlen párt sem akarja nyilvánosságra hozni az egészet. Nem is biztos, hogy nemzetbiztonsági és külpolitikai érdekből elfogadható lenne, ha pl. az egykori kémelhárításai adattár tartalma nyilvánosságra kerülne, bár kétségtelen, hogy két évtized alatt szépen kihűlt az info-k nagy része. A minősítés törlése elsősorban azt eredményezné, hogy átkerülne az anyag (egy része) az ÁSZTL gyűjtőkörébe, ahol olyan levéltári kutatók donganák körül, akik némelyikének igencsak homályos a háttere és a kutatási motivációja.
Ha ezt az ügyet rendbe akarnák tenni, akkor először azt kellene megnézni, hogy honnan, hogyan kerültek ezek az adathordozók a mostani titokbirtokos szervekhez és miért lettek eddig olvashatatlanként elkönyvelve.

Harpi 2010.01.26. 13:33:00

Minden elismerésem a tiétek ezért a munkáért, őszintén gratula!
Én biztos belekékültem volna, hogy nem tudhatom meg, mi van a szalagokon...

Barczi Imre 2010.01.26. 13:40:40

@Harpi: én is nagyon szerettem volna belenézni, de nem a nevek miatt, azok kevésbé érdekelnek, hanem hogy mennyire lehet visszafejteni őket. Bár valószínűleg könnyen,ami elveszi a munka örömét :-)

@Márai Coelhó: nem értek hozzá túlságosan, de a nyilvánosságra hozatal ellen az az érv szokott elhangozni, hogy nem lehet leválogatni a listákból CSAK a belső ügynököket úgy, hogy ne sérüljenek a kémelhárítási titkok.

karandas 2010.01.26. 13:41:07

@Barczi Imre: Ha pedig legközelebb a hash nem egyezik, valaki széttárja a karját és közli, hogy innentől nem tekinthető hitelesnek az adatbázis.

Magyarország, én így szeretlek!

Barczi Imre 2010.01.26. 13:44:15

@karandas: ha a hash nem egyezik, az egyértelmű jele annak, hogy manipulálták az archivált adatokat. A hash azért elég megbízható. A különböző szalagról lementett azonos állományok hashe is csont nélkül megegyezett, ez alapján lehetett tudni, hogy vannak ismétlődések.

Márai Coelhó · anygyalszarny.blog.hu 2010.01.26. 13:44:19

@tiboru: Most mondjam azt, hogy volt olyan adattár, amelynek még a létezése is államtitok volt? Vagy pl. tudhatod, hogy most az NBH milyen adattárakat kezel? Nem. csak annyit tudhatsz a nyilvántartásaikról, amennyi az Nbtv.-ből tudható (szinte semmi).

Csak azért tettem szóvá egyébként, mert az államtitoksértésnek van gondatlan alakzata is és nem szerettem volna, ha a tiszteletre méltó szerző ilyen banánhéjon elhasalt volna.

bunkó · http://bunko.blog.hu 2010.01.26. 14:10:19

@Barczi Imre: "feltéve, de meg nem engedve - a Hivatal manipulálni akarta volna a szalagok tartalmat,azt nem a haselés után, hanem még az olvasás előtt teszi."

Ez igaz. Valószínűleg Ti a már rég "átfésült" adatokat archiváltátok (sőt, már azok kerültek a szalagokra annakidején :)
Persze lehet, hogy azóta olyanok is fontos emberek lettek (meggazdagodtak), akik annak idején még nem tartoztak a törlendő személyek csoportjába, de elegendő paranoiával és fantáziával korlátlan számú összeesküvéselmélet gyártható :)

Barczi Imre 2010.01.26. 14:10:19

Lesz jövő kedden egy félnapos konferencia a témában, meghívó itt:

magnesszalagok.blog.hu/2010/01/26/meghivo_2090

tiboru · http://blogrepublik.eu 2010.01.26. 14:10:42

@Márai Coelhó:

Kérdéseid közül egyre ("hogy honnan, hogyan kerültek ezek az adathordozók a mostani titokbirtokos szervekhez?") elég egyszerű a válasz: a Nemzetbiztonsági Hivatal a kémelhárításért felelős III/II. csoportfőnökség jogutódja.

A III/III-nak elviekben nincs ilyenje (mármint jogutódja), de a mostani (ugyancsak az NBH-hoz tartozó), és alkotmányvédelemnek becézett munka azért nagyban feltakar a régi belső elhárításra.

karandas 2010.01.26. 14:13:11

@Barczi Imre: Most képzeld el az alábbi szitut: Két-három év múlva feloldják a titkosítást. Elővesznek egy táska DVD-t/HDD-t, majd közlik, ez a ti munkátok eredménye, bárki leellenőrizheti a hash kódját. Mit tesz isten, nem az lesz, amit ti kaptatok. Konklúzió? Használhatatlan az egész nyilvántartás.

Igazán nem akarom politika irányba terelni a beszélgetést, de mintha egy olyan hölgy rémlene a BM felől, aki ezügyben vastagon érintett, továbbá a 90-es években írásba adta, hogy az ÁVÓ egy újjal sem bántotta a rábízottakat.

Barczi Imre 2010.01.26. 14:14:53

@karandas: a hasheket közösen generáltuk és azok is le vannak archiválva. Nem fordulhat elő, hogy nem egyeznek meg. Vagy ha igen, akkor egyértelmű, hogy módosították az adatokat.

tiboru · http://blogrepublik.eu 2010.01.26. 14:16:15

@Márai Coelhó:

Á, ilyesféle adattárra még gondolni sem szabad egy virágzó demokráciában :-)

Azt a XXI. századi minősítési javaslatot azért megnézném magamnak, amelyiken felelős vezető aláírása rendeli el, hogy önmagában egy adattár léte (tehát nem tartalma!) államtitoknak minősüljön :-)

És hogy az NBH milyen adattárakat kezel, azt jobb, ha nem is tudjuk :-P

Maestro 2010.01.26. 14:16:38

érdekelne az egésznek a mélyebb informatikai háttere, nagyjából olyan sorrendben, mint ahogy a postban van, leírva, hogy mikor mit csináltatok... megoldható? ami titkos, az úgysem a módszer hanem az adat.

Barczi Imre 2010.01.26. 14:18:05

@Maestro: gyere el a keddi konfra és keress meg.

Pivoblog · http://pivo.blog.hu/ 2010.01.26. 14:18:09

nehéz lehetett ennyit nyomozni, és sok minden még ki sem derült..

toodark 2010.01.26. 14:18:14

@bunkó: véleményem szerint készíteni egy olyan adatállományt, aminek a hash-e is megegyezik és még értelmes adatokat is tartalmaz, és még a hossza is megegyezik - fizikai képtelenség.

A kiraly 2010.01.26. 14:18:21

Nagyon tanulságos történet arra, hogy hogyan lehet minél több pénzt költeni, minél több energiát elhasználni borzasztóan fontos dolgokra.
Tudtommal egyébként még van fellelhető ember a mágnesszalagos technika világából, talán még onnan is ahol ezeket a szalagokat előállították.
Az egyébként egy olyan borzasztóan titkos hely volt, hogy még a számítógép konzol-írógépének hangjából is féltek, hogy külső lehalgatók visszaállíthatják a ki- és beírt szövegeket.
Sok ilyen hülye van még manapság is.

belekotty 2010.01.26. 14:21:00

Hehehe.. ha Blahut György nem volt ott - ha még él - akkor a titkosítést úgysem tudhattátok.
Talán el kellett volna vinni egy rendes mainframe-re ahol még van ilyen olvasó. 9600-al írták fel ezeket Siemensen, úgy hogy az IBM gépek amelyeknek van ilyen olvasója, viszik.
No meg ugye egy ditto sem ártott volna hozzá.
Abben sem lehettek biztos hogy két szalagjel tuán még nem írtak valamit, sőt van amikor a tükör mögé is írnak még. Standard programokkal azt le nem olvasod. Szivesen ide másolok neked egy IBM gépi kódu programot amivel bele lehet ezekbe nézni egy IBM nagygépen, csak pajkos 1500 sor. :-))

Barczi Imre 2010.01.26. 14:24:30

@belekotty: 9600-as sűrűség nem létezik. Ha titkosítva lett volna, nem tudunk értelmes adatotolvasni, de tudtunk. Az a két szalagjel az három, és természetesen a lezárás után is megpróbáltuk továbbolvasni a szalagokat.

AutosVilli 2010.01.26. 14:24:33

@Barczi Imre: Üdvüzlöm. Milyen tipusu nagy élettartamú DVD-re mentették,gondolom ez nem titkos infó.

Barczi Imre 2010.01.26. 14:28:12

@AutosVilli: többféle hosszú élettartamú DVD-re és diszkekre is archiváltunk. Az egyik típusú DVD a Kodak 100 évre garantált lemeze.

belekotty 2010.01.26. 14:28:33

@A kiraly: Van, többek között én. Na meg a Blahut György, aki annak idején titkosította.

tiboru · http://blogrepublik.eu 2010.01.26. 14:28:58

@Barczi Imre:

Óhatatlanul felötlik bennem egy lehetséges forgatókönyv:

Adott XY, aki nagyon nem szeretné, ha a róla (vagy bárki másról) nyilvántartott adatok nyilvánosságra kerülnének. Teszem azt olyan helyzetben van, hogy egy karaktert (tényleg nem többet) módosít az adathalmazon; például egy "Kovács" családnevet "Kováts"-ra.

Ezek után a hash már nem egyezik az archiválttal, ergo bárki mondhatja, hogy "Hjakérem, ez nem az eredeti nyilvántartás! Nem is vehető figyelembe!"

Ugyanis (ha jól értem) egyetlen karakter megváltoztatása a hashmódosulás szempontjából (tehát hitelességileg) ugyanolyan következményekkel jár, mintha minden "Kovács" családnevűt törölnének és helyettük beírnák, hogy "Szabó".

Az ötletet máris lekópirájtozom!

belekotty 2010.01.26. 14:29:18

Ami lementetteket igen kérdéses hogy jó-e. A szabvány szalagok elején van a 80 karakteres VOL1 cimke, majd kér HDR1 ami az első fájl adatait tartalmazza. Utána egy szalagjel, majd maga a fájl.
Aztán szalagjel utána az EOF cimkét, szalagjel, majd a következő fájl headerjeit. A szalag végén pedig két egymásutáni szalagjel jelzi a végét, esetlag van EOV cimke is. Csakhogy ravaszok szoktak még ezután is adatot írni. Ha standard programmal másoltad, ez azokat az adatokat nem vitte át. Úgyhogy lehet egy kalap az egész.

Barczi Imre 2010.01.26. 14:31:24

@belekotty: igen, erről beszélek. A szalaglezárás után is megpróbáltunk olvasni minden szalagon. Természetesen erre a legbutább linuxos olvasást használtuk, az nem néz semmit, csak olvas. Tesztszalagról sikerült is lezárás utáni részt olvasni.

RustySpoon (törölt) 2010.01.26. 14:31:52

@Barczi Imre: "További szempont volt, hogy az egység tudjon read only (csak olvasás) módban dolgozni, hogy még véletlenül se tudjuk felülírni a szalagokat."

Ez egy kicsit fájt :)

Egyébként érdekes volt, köszi..
Azt azért nehéz elhinni, hogy semmilyen szerződést nem írtatok alá.. Nyilván volt szerződésetek a munkára, biztos h abban voltak kitételek a titoktartással kapcsolatban..

Barczi Imre 2010.01.26. 14:35:41

@RustySpoon: mesélj, mi fájt, mert nem értem. A legtöbb olvasóban hardveresen ki lehet iktatni az írást. Természetesen ha a szalagon nincs gyűrű, eleve nem lehet írni, de accidents happen, jobb a túlbiztosítás.

Semmilyen olyan szerződést nem írtunk alá, amiben titoktartás szerepelt. Civil megfigyelők voltunk, amit mi láttunk, azt a a közvélemény is láthatja.

belekotty 2010.01.26. 14:35:47

800, 1600 és 9600-as szalagok voltak. Valszeg ti az 1600-ast használtátok. Ha a Siemens irt egy harmadik TM-et, az előfordulhat.
Ebben az ügyben rá kell keresni a Tape Labels című IBM doksira a guglin.
Mellesleg én sok hibás szalagot olvastam assemblerrel, ami csatorna programmal olvasott és nem vette figyelembe ha a CSW-ben (csatorna állapot szó) a UNIT CHECK bit X'02' volt. Így azt is beszedte amiben a CRC16 hibás volt. Persze az tele is volt krixkraxxal. Az hogy értelmes dolgokat láttok benne az nem jelent semmit - tehát belenéztetek - mert egy csomó szöveg fonetikusan titkosítva volt.

Barczi Imre 2010.01.26. 14:43:38

@belekotty: 800 (NRZ), 1600 (PE), 3200 (DPE) és 6250 (GCR) a négy standard sűrűség/kódolás. Az olvasók felismerik ezt, nem kell kézzel állítani. Az lehetséges, hogy az adatok egy része titkosítva volt, de akkor már egyszerűbb lett volna az egészet, nem?

Mi nem néztünk bele, csak olyanba, amit előbb a titokgazda megnézett, és azt mondta, hogy az szerinte nem titok, tehát headerek, ilyesmi.

karandas 2010.01.26. 14:43:42

@Barczi Imre: Világos, éppen ezért nem fog egyezni a tiétekkel. ;-)

Márai Coelhó · anygyalszarny.blog.hu 2010.01.26. 14:43:49

@tiboru: Az alkotmányvédelem értelmezésével egyetértek. :)
Az is kétségtelen, hogy az NBH a kémelhárítás tekintetében jogutód. (Nem mindig ilyen egyértelmű a dolog, de ebbe most nem megyek bele.) Ámde itt a történet arról szól, hogy vannak ezek a szalagok, amelykre 1990-ben írták fel a tartalmat, és amelyek feltehetőleg a cikkben megadott irattári tételszám szerinti évben kerültek az NBH TÜK-be. Érzékelhető, hogy itt van egy kis homály a történetben, arról nem is szólva, hogy az NBH a III/III. tekintetében soha nem volt jogutód. Ja, emlékeim szerint az NBH-t létrehozó Nbtv. nem rendezi a jogutódlást.

belekotty 2010.01.26. 14:46:00

@Barczi Imre: Lehet írni rá ha nincs rajta gyűrű, csak egy érzékelőt kell kiiktatni. 9600-as irássűrűség pedig van.

Barczi Imre 2010.01.26. 14:51:18

@belekotty: hát ezért is jó, ha az írásvédelemnek minél több szintje van.

Tudsz mutatni forrást félcollos 9 trackes 9600-as szalagokról? Én elhiszem, h van ilyen, de nem talákoztunk vele az irodalomban.

belekotty 2010.01.26. 14:51:26

@Barczi Imre: Akkor keress rá 9600 bpi-re, mert olyan is van. Én évekig használtam olyat.

TMM 2010.01.26. 14:51:46

@karandas: @Barczi Imre: @tiboru:

karandas épp azt próbálta elmondani, hogy mi van akkor, ha vki módosít az adatokon.

A válasz egyértelmű, nem is azzal vitázik, tehát a hash nem egyezik majd meg.

De ez nem csak ennyi következménnyel jár szerinte - és ez szintén megalapozott félelem -, hanem azzal is, hogy ha esetleg 5 éven belül nyilvánosságra hozzák az adatokat, akkor az érintett személyek joggal hivatkozhatnak arra, hogy kérem, a fájlokat módosították, hiszen
nem egyeznek a hash fájlok
tehát én nem voltam se ügynök, se semmi, stb.

Ha jól értettem, tiboru is ezt a gondolatmenetet követte a hivatkozott résznél.

Egyébként baromi érdekes lehetett ez a munka :)
Gratulálok az eredményekhez!

Márai Coelhó · anygyalszarny.blog.hu 2010.01.26. 15:40:20

@tiboru: Igen, jobb, ha nem is tudjuk. ;)
Az is igaz, hogy nem a rendszert, hanem az adatot kell minősíteni, de a titoktörvény épp a nemzetbiztonsági szolgálatoknak engedi meg, hogy a rendszereiket ÉS az azokban tárolt adatokat is titkosítsák. Az államtitokköri jegyzék szerint:
"115. A Hivatalok feladatainak ellátásához szükséges adatkezelés, a nyilvántartások rendszerei, eszközei és módszerei, valamint a bennük tárolt és az általuk szolgáltatott adatok.Az államtitokká minősítés leghosszabb érvényességi ideje: 80 év."

Barczi Imre 2010.01.26. 15:47:34

@belekotty: ebből nekem nem derül ki, h ezek ugyanazok a félcollos szalagok.

bunkó · http://bunko.blog.hu 2010.01.26. 15:49:11

@toodark: "véleményem szerint készíteni egy olyan adatállományt, aminek a hash-e is megegyezik és még értelmes adatokat is tartalmaz, és még a hossza is megegyezik - fizikai képtelenség."

Szerintem nem muszáj minden adatot variálni, talán elég, ha pl. rekordonként csak egy-egy mező (vagy annak is csak egy része) tartalmaz random adatot, az összes többi tartalom változatlan marad, ezáltal az adatbázis továbbra is értelmesnek tekinthető (és egy laikusnak nem is lesz soha gyanús pár furcsa karakter itt-ott, hiszen régi az adatbázis).
Így még a lementett adatállomány mérete sem változik (habár talán a hosszok nem is lettek hivatalosan dokumentálva).
Mindez megelőzhető két (eltérő metódusú) egyszerű hash generálásával. Az még szerintem is átverhetetlen.

Barczi Imre 2010.01.26. 15:56:54

@bunkó: mégegyszer, nem érted: akár egyetlen karaktert megváltoztatva már soha többé nem fogod az erdeti hasht visszakapni. Az SHA-2/512 nincs feltörve. Nem volt még ellene sikeres támadás. Majd pont most az NBH fogja. Nincs értelme egy másodlagos hash-nek - illetve ugyanúgy lehetne akkor törni is, ha kettő van, mintha egy lenne.

tiboru · http://blogrepublik.eu 2010.01.26. 15:57:01

@TMM:

Úgy van; ha akár a legapróbb (érdemi változást elő sem idéző) módosítás is bekövetkezik, máris megvan a védekezés, amit bármelyik bíróság elfogad majd...

karandas 2010.01.26. 15:57:33

@TMM: Igen, pontosan erre gondoltam. És ha már ennyire elmélyedtünk a hash témában, hadd írjam le a véleményemet a titkosítás feloldásával kapcsolatban.

Az arra való hivatkozás, hogy esetleg még aktív ügynököket dekonspirálna a lista, nettó hazugság. Egészen egyszerűen készíteni kéne egy hash táblát a nem dekonspirálandó ügynökök listájából, ill. az inkriminált szalagon lévő nevekről és akár egy független céggel "párbamazsoláztatva", majd megfésülve kaphatnánk egy olyan listát, amin olyanok szerepelnek, akik megérdemlik a nyilvánosságot és a társadalom ítéletét.

bunkó · http://bunko.blog.hu 2010.01.26. 15:59:05

Hír a jövőből: "Az eredeti szalagok és a biztonsági okokból számtalan példányban lemásolt ügynöklista valamennyi példánya az NBH azon páncélszekrényében volt, amelyről a 2010 április 11-én este kitört tűz során derült ki, hogy mégsem tűzbiztos."
:)

Barczi Imre 2010.01.26. 15:59:46

@karandas: és mi van azokkal, akik mindkét csoportba tartoznak? A főcsoportok közti mozgás teljesen normális volt.

Barczi Imre 2010.01.26. 16:16:38

@bunkó: elvileg nem egy fizikai helyen vannak tárolva az archív példányok. Legalábbis mi azt javasoltuk a számos legyártott papír valamelyikében, hogy két különböző kockázati helyen tárolják őket (tehát ha az egyik véd a földrengéstől, de nem véd nagyon a tűztől, akkor a másik legyen tűzbiztos).

2010.01.26. 16:17:11

@Axum: javaslom az 'Aardvark' bookmarklet használatát (szövegblokk kiválasztás, majd 'b' gomb)
A bookmarklet: javascript:document.getElementsByTagName('head')[0].appendChild(document.createElement('script')).setAttribute('src','http://www.karmatics.com/aardvark/loader.js')
egyéb források: www.marklets.com/Bookmarklets/Aardvark.aspx
karmatics.com/aardvark/

Egyébként egy nagyon hasznos dolog ez az aardvark.

Nash vs. Keynes 2010.01.26. 16:18:16

Jó lenne tudni hol van a többi szalag..
Amúgy köszönet a blogért és grat a sikeres munkához!

belekotty 2010.01.26. 16:18:17

Na most van ám egy kis gond. Ha ti a headerekben értelmes adatot, szöveget láttatok Linuxon, akkor valaki elvégezte az EBCDIC/ASCII konverziót. Ha az a fájlokon is megtörtént - ott sok bináris adat és pakolt decimális van - is megtörtént, akkor a lementett adat használhatatlan.

Barczi Imre 2010.01.26. 16:21:14

@belekotty: fő a bizalom :-) A betekintés természetesen EBCDIC konverzió után történt. Az archiválást ez nem érinti, hiszen a biteket úgy kell elmenteni, ahogy vannak, az EBCDIC/ASCII konverzió ráér a valódi feldolgozás pillanatáig. magyarul nem kell konvertálni, csak amikor belenézel, akkor a megjelenítő programnak megmondod, hogy ez most EBCDIC lesz, úgy mutassa.

Az MSzP szavazói maffia kezébe juttatták Magyaro-t 2010.01.26. 16:21:21

Baszki,

most komolyan, a wikipedia a magyar szakértelem forrása?

Barczi Imre 2010.01.26. 16:23:04

@Az MSzP szavazói maffia kezébe juttatták Magyaro-t: jobb híján az internet az, nem a wikipedia, a legtöbb használható anyag nem ott található, pl. régi szervizmanualokat sem a wikipediáról töltesz. Néhány esetben hasznos a wikipedia, de jóval tovább kell menni annál.

Gyalus 2010.01.26. 16:24:33

Egyszerûbb lett volna az élet, ha Ausztriában kibéreltek egy, az eredetihez hasonló rendszert. Mind a Siemens, mind a BM által akkoriban szintén használt IBM 4381 rendszer bõségesen tartalmazott (esetlegesen) sérült szalagok visszanyeréséhez eszközöket. Az egyik ilyen a hátramenetben történõ olvasás volt (másik fej, más beállítás), a másik, ennél fontosabb az úgynevezett korrektúra-olvasás. Ez azt jelentette, hogy a javító-olvasás során a berendezés felhasználta az adott abatblokk korábbi olvasásakor nyert hibainformációt. A szalag tárolandó információn kívül tartalmaz ugyanis byte-onkét egy "keresztparitást", blokkonként egy "hosszparitást" és 16 byte-onként valamint a blokk végén egy-egy CRC-t, ciklikus redundancia kódot. Szalaghiba (olvasási hiba) esetén a rendszer megadja a hiba helyét, majd javító olvasáskor utasítani lehet a _szalagvezérlõt_, hogy ezt a helyet hagyja figyelmen kívül és a paritás- illetve CRC információk alapján _számolja ki_, minek kell ott lennie. Egy vélhetõen hibás szalag olvasására (és átmásolására) felkészített program tehát a következõket teszi:

- olvas egy blokkot
- ha jó, átírja outputra és megy vissza a következõért.
- ha hibás, eltárolja az úgynevezett SENSE-Byte-okat, majd megkísérli az olvasást hátramenetben.
- ha a hátra-olvasás sikeres, átírja a blokkot outputra, az inputon elõre lép egy blokkot és megy új blokkot feldolgozni
- ha hibajelzés van, eltárolja a hátra-olvasás SENSE-byte-jait, az elõre-olvasáskor kapott sense információt egy "korrektúra-elõkészítés" paranccsal (Siemensnél : Korrektur Vorbereitung csatornaparancs)átadja a szalagvezérlõnek, majd megismétli az elõreolvasást, immár "korrektúra" módban.
- ha így sikeres, átírja a blokkot outputra és megy új blokkért
- ha sikertelen, akkor átadja a vezérlõnek a hátra-olvasás sense-információját egy "korrektúra-elõkészítés" paranccsal, majd megismétli az hátra-olvasást, immár "korrektúra" módban.
- ha sikeres, akkor átírja a blokkot outputra, az inputon lép egy blokkot elõre és megy a következõ blokkot feldolgozni.
- ha sikertelen, akkor ezt a mûveletsort meg lehet ismételni (célszerû megismételni) 5-10 alkalommal, mert közben a szalag feszessége, elhelyezkedése a fejek elõtt, ha kis mértékben is, de változik.

A fentiekhez természetesen Assembler program szükséges PIOCS kezeléssel és természetesen meg kell írni a megfelelõ csatornaprogramokat, de az egész nem több 1-2 kByte-nál.

Célszerû még tudni, hogy egy Siemens vagy IBM mainframe környezetben felírt logikai file legalább három fizikai file-t tartalmaz. Ezek közûl az utolsó, a trailer label lehetõséget ad a beolvasás/másolás teljeskörûségének ellenõrzésére.

Barczi Imre 2010.01.26. 16:27:00

@Gyalus: írtam, hogy ez miért nem ment. Titokvédelmi oka volt, a szalagokat nem lehetett kivinni egy osztrák külsős céghez.

Ha nem sikerült volna az olvasás, akkor persze lehet, hogy további alternatívákat is meg kellett volna vizsgálni.

(A 80 byte-os headerek és trailerek megvoltak rendben, igen.)

tiboru · http://blogrepublik.eu 2010.01.26. 16:27:22

@Márai Coelhó:

Esküszöm, nem kötözködni akarok, de azt nem látom a titokköri jegyzékben, hogy "a nyilvántartások léte, típusa, fajtája" is államtitokká lenne minősíthető.

Maga az adatkezelés, a rendszerek, eszközök, módszerek milyensége - persze, az adatokról nem is beszélve.

Amúgy szerintem nem kell kifejezett szakembernek lenni, hogy az ember (egy kis agyalás után, általános tájékozottsággal és érdeklődéssel) el bírja képzelni a nyilvántartások típusait :-)

De ez már majdnem OFF, úgyhogy gyorsan elnézést is kérek a bloggazdától.

halaloszto 2010.01.26. 16:27:22

Ahhoz, hogy tenylegg elhihessuk, hogy nem fogjak oket manipulalni, a hash-eket publikalni kellene. Kulonben ket ev mulva honnan fogom tudni, hogy az a hash az-e, mint ami eredetileg volt?

vajk

Barczi Imre 2010.01.26. 16:29:22

@halaloszto: megpróbálom valamilyen formában felrakni erre a blogra.

Mikorka Kálmán okleveles duguláselhárító kisiparos 2010.01.26. 16:29:50

@bunkó: Való igaz, hogy több helyen tett megfelelő változtatással előáll ugyanaz a hash, csak nem tudod meghatározni, hogy mik legyenek azok a változtatások.

Mikorka Kálmán okleveles duguláselhárító kisiparos 2010.01.26. 16:29:50

@belekotty: Ha létezett is 9600-as szalag, az nem volt szabványos: en.wikipedia.org/wiki/9_track_tape végén említik az ANSI INCITS 40-1993-at.

Gera 2010.01.26. 16:29:59

@bunkó: Szerintem senkinek nem kell különösebben félni attól, hogy bármi valaha nyilvánosságra kerül ezekből az adatokból. 20 évig gyakorlatilag semmi nem történt az ügyben, bármilyen kormányról volt is szó, erőteljesen akadályoztak minden ilyen törekvést.

twollah / bRoKEn hOPe, sUppLeX · http://freewaresoftwarenews.blogspot.com/ 2010.01.26. 16:30:08

Azert en kivancsi lennek ra, hogy mik azok a kurva titkos adatok amik csak 2060 utan tekinthetok meg.

84 eves leszek akkor.

Ki van ez talalva nagyon, hogy a felelosoket meg veletlenul se lehessen kerdore voni.

Márai Coelhó · anygyalszarny.blog.hu 2010.01.26. 16:49:05

@tiboru: Az adatkezelés rendszere, eszköze, módszere maga a nyilvántartás. Épp elég, ha az adatkezelési rendszerre vonatkozó adatok közül az idézett államtitokköri pont alapján államtitokká minősítik az "adatkezelő rendszer neve", az "adatkezelő rendszer adatköre" és az "adatkezelő rendszer rendeltetése" adatokat és máris államtitokká lett minősítve az egész, mert nem lehet tudni, hogy mi a neve, mi van benne és mire használják. Elnézést az offolásért.

karandas 2010.01.26. 17:07:27

@Barczi Imre:

Egyszerű a válasz, "A" kémtitokgazda, "B" ügynöktitokgazda.

"A" ad egy egymillió hash-kódból álló listát "B"-nek, "B" pedig nyilvánosságra hozza a listát az egyező hash kódokkal bíró ügynökök nélkül, a teljes lista pedig majd az utókor számára lesz hozzáférhető ;-)

bunkó · http://bunko.blog.hu 2010.01.26. 17:07:39

@Barczi Imre: "mégegyszer, nem érted: ...Az SHA-2/512 nincs feltörve. Nem volt még ellene sikeres támadás."

Én nem is feltörésről beszélek, hanem egy olyan kamu ügynöklista létrehozásáról, amelynek pont ugyanaz a hash-je. Nagyon-nagyon-nagyon nehéz, de nem lehetetlen: egy brutális teljesítményű számítógép vagy cluster kell hozzá (amilyen tán nincs is magyarországon) és/vagy soksok gépidő. Olyan sok gépidő, hogy ha már ma este nekiállnak, valószínűleg még akkor sem lesz meg áprilisig :)

Barczi Imre 2010.01.26. 17:16:48

@bunkó: de hát pont azt hívnák feltörésnek, ha sikerülne előállítani egy olyan filet, aminek a hashkódja ugyanannyi. De nem lehet előállítani ilyet, ez az én álltásom. Ha a világon - ahol ilyet tényleg próbálnak rendszeresen, közösségileg törni, plusz rengeteg elméleti szakember próbálkozik a brute force-nál optimálisabb támadások kieszelésével - nem sikerült, akkor nem hiszem, hogy itt fog.

"There are two meet-in-the-middle preimage attacks against SHA-2 with a reduced number of rounds. The first one attacks 41-round SHA-256 out of 64 rounds with time complexity of 2^253.5 and space complexity of 2^16, and 46-round SHA-512 out of 80 rounds with time 2^511.5 and space 2^3. The second one attacks 42-round SHA-256 with time complexity of 2^251.7 and space complexity of 2^12, and 42-round SHA-512 with time 2^502 and space 2^22."

bunkó · http://bunko.blog.hu 2010.01.26. 17:16:58

@Szárnyati Gézа: "Való igaz, hogy több helyen tett megfelelő változtatással előáll ugyanaz a hash, csak nem tudod meghatározni, hogy mik legyenek azok a változtatások"

Az iszonyatos mennyiségű próbálgatáshoz (fordított brute force) nagyonnagyon erős számítógép kell, hogy még ebben az évben (évszázadban?) meglegyen az eredmény. (ennél finomabb részleteket meg nyilvánosan inkább ne említsünk)

eszpee · http://bp.underground.hu 2010.01.26. 20:02:59

@Barczi Imre: Csináljatok egy hasht a hashről és azt publikáld itt. :)

Nash vs. Keynes 2010.01.27. 00:36:13

Azért ez most érdekes.
1. Ezek az adatok eddig is megvoltak az nbh-ban, és ennek az egésznek max. a történészek örülnek majd 60 év múlva.
2. Nem voltak meg a tekercsek, úgyhogy most veszettül visszaállítják böngészhető formába az adatbázist és megnézik ki hol van ezekből az emberekből most és mire lehet felhasználni őket a hon (párt) stb érdekében. Meglepne ha nem ez lenne.

Nash vs. Keynes 2010.01.27. 00:36:13

Amúgy simán lehetnek benne a belpolitikában komoly hullámokat keverő adatok, zsarolópotenciál. Pláne így választások előtt. Tényleg, miért pont most kerültek elő ezek a szalagok? Lehet erről tudni valamit?

Gyalus 2010.01.27. 15:04:01

@Barczi Imre: Üzemképes IBM 9221 van még az országban, VSA/ESA oprendszerrel, egyszerûbb lett volna ahhoz behozni egy magnót.

Titokvédelem: kis gépet kell bérelni üresen, disztributív szalagról emgindulni és a munka végén tárteszttel zárni... Ezt annak idején párszor megmutattam a REVA intézetieknek is, de ott sem érzékelték a dolog értelmét.

Mindegy, elment a hajó, de célszerû tudni, hogy csak Magyarországon selejtezik le azokat a berendezéseket, amiknek az adathordozóit késõbb jajdenagyon el kellene olvasni. Ilyen sem tõlünk nyugatra, sem keletre nem tesznek.

Még egy apróság: a 800 bpi-s irásmód NRZI. A sima NRZ 200 bpi-s volt, a Magyarországon elõforduló szalagegységek közûl a ZMB51 tudta.

Gyalus 2010.01.27. 15:48:08

Még egy apróság (hátha lesz még megmentendõ szalag :-))) ): A szalagok "sütése" helyett kíméletesebb és megszokott módszer volt mélyaknás vákuumú szalagegységen normál menetben (nem gyorstekeréssel!) néhányszor átpörgetni a szalagot. A hatás ugyanaz, de hõterhelés nélkül...

Barczi Imre 2010.01.27. 15:51:11

@Gyalus: ezt írtam, nem lehetett kivinni a házból, ez adottság volt, nem a mi döntésünk.

A sütésnek mondjuk annyi előnye van a "mélyaknás vákuumú szalagegységgel" szemben, h házilag is kivitelezhető, ha viszont be kéne szerezni egy ilyen egységet, nem tudom, hova kapnék :-)

Mikorka Kálmán okleveles duguláselhárító kisiparos 2010.01.28. 13:38:19

@Gyalus: "csak Magyarországon selejtezik le azokat a berendezéseket, amiknek az adathordozóit késõbb jajdenagyon el kellene olvasni. Ilyen sem tõlünk nyugatra, sem keletre nem tesznek."

www.computerworld.com/s/article/9134771/The_lost_NASA_tapes_Restoring_lunar_images_after_40_years_in_the_vault

nyomasek_bobo · http://sopron.e-cafe.hu 2010.02.02. 00:47:55

Remélem, valahogy a 19. szalag is eljut hozzátok egy hiteles lementés erejéig.

nol.hu/belfold/egy_hijan_tizekilenc_allambiztonsagi_magnesszalag

Az eddigi munkátokért minden elismerésem.

Gyalus 2010.02.02. 08:52:38

Azt írja az Index: "A nyilvántartásokat (neveket tartalmazó listákat, és a velük kapcsolatos iratok levéltári jelzetét) a nyolcvanas évektől azonban már Magyarországon is mágnesszalagokra rögzítették."

Már sokkal korábban is. Pl. 1974-75-ben az MNAK tárolta lemezen és szalagon is ezeknek az adatoknak nagy részét. A lemezek 7.25 MB-os bolgár cserélhetõ lemezek voltak (EC-5052, az IBM 2311-nek megfelelõek), ez volt az elsõdleges adathordozó (tán összesen két vagy három pack), a szalagokon ezeknek a mentése volt.

Gyalus 2010.02.02. 08:58:33

@Szárnyati Gézа: "It turns out that the original 2-in. tapes were available"... Vagyis ez a szalag nem az a szalag, valószínûleg valami AMPEX gépé.

Mikorka Kálmán okleveles duguláselhárító kisiparos 2010.02.02. 10:10:43

@Gyalus: Nem, de az a lényeg, hogy ott sem volt triviális a szalagok olvasása, miután megtalálták őket.

Poll 2010.02.03. 02:33:54

@Barczi Imre: "mégegyszer, nem érted: akár egyetlen karaktert megváltoztatva már soha többé nem fogod az erdeti hasht visszakapni."

Tehát azt állitod, hogy 40 mbyte adatot lehasheltél 64 byte-ba (sha 512 outputja) és nincs mégegy olyan 40 mbyte-os input ami ugyanezt a hash-t adja. Akkor feltaláltad a leghatékonyabb tömötitési algoritmust :))

Természetesen nagyon sok pontosan ugyanolyan méretű input van ami ugyanezt a hasht adja és kizárólag számitási kapacitás kérdése keresni egy másikat ami értelmes, hiányzik belőle pár adat, de ugyanezt a hasht adja. Főleg úgy, hogy maga az adatbázis formátum is ismeretlen a közvélemény számára igy akármilyen formátumú inputot lehet csinálni, akár olyat is aminek a végén pár kb zagyvaság van, csak hogy kijöjjön a hash. Ha ehhez hozzávesszük, hogy 50 éves titkositásról beszélünk én inkább azt mondanám, hogy meglepő volna, ha mondjuk 10 év múlva nem röhögve tudnának legenerálni egy hamisitott inputot és nem fogja a hash kimutatni a hamisitást.

"Az SHA-2/512 nincs feltörve. Nem volt még ellene sikeres támadás."

Ez mindössze annyit jelent, hogy matematikailag nincs benne (még nem találtak) könnyen kijátszható hibaát, de a hash-ek alap működésükből kifolyólag soha nem adnak egyedi outputot, mindig lehet találni másik inputot ami ugyanazt adja, csak iszonyatos erőforrás kell hozzá, hogy megtaláld. De a bruteforce pont ugyanúgy használható az SHA-512-re mint akármelyik hash-re.

Bizony nem lett volna hülyeség a többféle (akár 4-5) hash, az esély exponenciálisan csökken (és akár ki is záródhat mategmatikailag) hogy létezik hamisitott input ami 5 féle hash szerint is ugyanazt adja mint az eredeti adat. Ismét kiemelném, ne a mostani lehetőségeket nézzük, hanem képzeljük el milyen számitási kapacitása lehet egy államnak akárcsak 10 év múlva és ahhoz mérjük a problémát.

Barczi Imre 2010.02.03. 03:01:00

@Poll: ok, szamoljunk akkor kicsit. 2^512 kulonbozo hash ertek lehet, ez 10^154. Tfh ha husz evenkent ezerszeresere gyorsulnak a szamitogepek (ezzel felulbecslunk). Igy hatvan ev alatt egymilliardszor gyorsabb gepek lesznek, mint ma.

Tfh h van ma egy olyan szuperalgoritmusunk, ami 1 mp alatt egy 40 MB fajl hashet ki tudja szamolni (persze nincsen, de tfh). Ez azt jelenti, h hatvan ev mulva masodpercenkent egymilliard kulonbozo file-t tudunk kiprobalni masodpercenkent.

Tfh h 60 ev mulva egy szamitogepben egymilliard mag lesz (szinten eros tulzas). Tfh azt is, h egymilliard ilyen szamitogeppel az nbh csak ezt tori (szinten eros tulzas).

10^18 mag masodpercenkent 10^9 variaciot allit elo egyenkent, tehat osszesen 10^27 variacio /sec az elmeleti maximum. Ez esetben tehat 10^127 masodpercre van szuksegunk, azaz 10^121 ev kell minden variacio eloallitasahoz. A vilagegyetem jelenleg 10^10 eve letezik.

Ennyit a brute force-rol.

Termeszetesen lehet analizissel a brute force-hoz kepest kevesebb probalkozassal torni. Nem lehet persze tetszolegesen csokkenteni a probalkozasok szamat, egy x bites minta eseteben 2^(x/2), esetleg 2^(x/4) probalkozas is eleg lehet, de ennel kevesebb nem nagyon. Ha feltesszuk, hogy sikerul ilyet talalni, meg akkor is nagyon messze vagyunk idoben a torhetosegtol.

Egyebkent mit ertesz tobbfele hash alatt? Ezek eleg szabvanyos dolgok, nincs tul sok variacio.

Andró-Vaskó Sándor 2010.02.03. 13:45:54

Barczi Imrenek...:)

Erintett vagyok a magnesszalagok ugyeben. Csak azt nem tudom, hogy milyen evjarat van fenn rajtuk. 1980-1989 erdekel. Ez az idotartomany fent van? Ekkoriak a dosszieim. Amik eltuntek a leveltarbol, de itt meg kellene lenniuk.

Ugy olvastam mindenutt, hogy 1974 es nehany evvel utana. Ez nem tiszta. Lenne szives kicsit kitargyalni...pliiiz!

Poll 2010.02.05. 03:02:30

@Barczi Imre: "Tfh h van ma egy olyan szuperalgoritmusunk, ami 1 mp alatt egy 40 MB fajl hashet ki tudja szamolni (persze nincsen, de tfh). Ez azt jelenti, h hatvan ev mulva masodpercenkent egymilliard kulonbozo file-t tudunk kiprobalni masodpercenkent."

Ne viccelj, itt már elesett az egész számolgatás. 40 Mb-os input file röhögve befér a memóriába, a hash-elő algoritmusokat ma egy átlag gépen is inkább az input beolvasása korlátozza, nem a számitási kapacitás. (kipróbáltam egymagos 3 éves P4-en, egy 100 megás file md5 hash-e nincs 2 mp cache nélkül se, kb addig tart amig vinyóról - nemhogy memóriából - beolvassa)
Ezen kivül egy 40 megás állomány hashelése gyakorlatilag végtelen szinten párhuzamositható, magok és gépek milliárdjai között. A mai technológiával én azt mondom, hogy könnyedén megoldható akár sokmilliárd hash kiszámolása minden egyes másodpercben egy 40 megás inputra. És akkor innen kéne folytatni a szorozgatást az évtizedek múlva elérhető számitási kapacitásokkal, esetleg kvantum-számitógépeket is belevéve stb-stb. Nagyon is reális akár teljes brute-force végigvitele. (amire valószinűleg semmi szükség, félidőnél is egy rakás megfelelő input található)

"Egyebkent mit ertesz tobbfele hash alatt? Ezek eleg szabvanyos dolgok, nincs tul sok variacio. "

Azt a néhány szabványos dolgot :)
MD5, teljes SHA familia, whirlpool stb. Szinte biztos vagyok benne, hogy hiába van collision egyenként ezek mindegyikében, az valószinűleg matematikailag is kizárt, hogy akár a teljes brute-force végignézésével is lehetne találni két 40 megás inputot aminél többféle hash szerint sem mutatható ki az eltérés. (megcsinálni pedig nem lett volna 2 perc az összeset)

Barczi Imre 2010.02.05. 03:20:58

@Andro-Vasko Sandor: az adattartalmat nem ismerjuk, hiszen az titkos.

Barczi Imre 2010.02.05. 03:20:58

@Poll: termeszetesen feltettem, h memoriaban van a 40 MB. A hash kiszamitasahoz viszont szereny szamitasaim szerint minimum 40 millio orjalre van szukseg (valojaban joval tobbre, de ezt veszem elvi minimumnak). Ergo max. 2 nullat lehet levenni a vegebol, az nem olyan sok :-)

Szerintem tul van parazva ez a kerdes. Nem fogjak megtorni, nem realis. Pl azert, mert 2060-ban ez mar tenyleg nem erdekel senkit, legfeljebb - mondjuk - 2040-ben egy icipicit meg, hoppa, maris visszanyertunk harom nullat!!

Gyalus 2010.02.12. 01:17:28

@Szárnyati Gézа:

"However, the tapes were useless without compatible tape drives -- in this case, analog Ampex FR-900 reel-to-reel units."

"She finally got a call from an Air Force base that had four of the old drives. She stored them, along with documentation and spare parts, at her home in Sun Valley, Calif."

Ahogy késõbb leírják, javításokra szükség volt, mert 20 évig álltak a gépek, de megvolt hozzá minden eszköz.

2010.04.26. 11:49:30

Figyeljetek, ez nagyon érdekes, amiről vitatkoztok, de mi a nyavalya értelme volt 1990-ben mágnesszalagra írni adatokat? Ha jól értettem, az egyik dátum 1990.01.25 volt. Akkor már CD-re is archiválhattak volna? Mi értelme van adatbázisrekordokat archiválni? Kíváncsi vagyok mit kezdene most valaki egy Vax VMS alatt felírt RMS fájllal? Azért annak nem triviális a szerkezete, hacsak nincs meg hozzá a doksi. Vagy mondjuk egy BTrieve adatfájllal mit kezdene most valaki? Archiválni egyetlen típusú adatot van értelme, szövegfájlt. Vagy mondjuk XML-t. Vagy CSV-t. De végülis ez mind szöveg.

Egyébként én előbb megnéztem volna hány sáv van a szalagon, aztán készítettem volna egy annyi fejes olvasót, minden sávnak egy fej, aztán végighúztam volna az egész szalagot a fej előtt, és előbb leszedtem volna az analóg jelet. Ezzel aztán már ráér az ember maszatolni, utána már nem veszélyezteti a szalagot. És ezt az analóg jelet bármilyen elemzésnek alá lehetne vetni, aztán meg lehet próbálni digitálissá konvertálni, és így tovább. Tudtommal a Kürt is valahogy így csinálja az adatmentést, meg így lehet a törölt winchesterről is adatokat visszahozni.
Na mindegy, én csak okoskodok, de még mindig nem értem a 18 szalag, 40 MByte, 10 000 oldal mennyiségi összefüggését (jó, a 40 MByte az tényleg 10 000 oldal, már ha sima egybájtos karakterkódú szövegről van szó).
Ja, egyébként dolgoztam kis TPA-val, az a szalagon 12 bites egységeket használt. Na ott a 40 MByte nem 10 000 oldal.
süti beállítások módosítása