23. aprill 2007
Tähelepanu! Artikkel on enam kui 5 aastat vana ning kuulub väljaande digitaalsesse arhiivi. Väljaanne ei uuenda ega kaasajasta arhiveeritud sisu, mistõttu võib olla vajalik kaasaegsete allikatega tutvumine.

CD-dele kogutud ajaloost jääb auk

Meie aja digitaalsed dokumendid salvestatakse nullide ja ühtede jadana, mis saavad meile arusaadavaks seda koodi lugeda oskava tarkvara abil. Kuid kas me saame kindlad olla, et täna tehtud digifotod, tekstidokumendid ning videod on loetavad ka saja aasta pärast?

USS Nimitz on USA lennukikandja. Kõikvõimalike sel alusel olevate seadmete kohta on olemas põhjalikud joonised, mis aitavad vajadusel läbi viia hooldus- ja parandustöid. Et käes on 21. sajand, ei ole need joonised kantud mitte paberirullidele, vaid kirjutatud spetsiaalsetesse projekteerimisfailidesse, mida avavad CAD-programmid. Juba aastate eest avastasid mereväe insenerid probleemi – uuendatud tarkvara ei ava vanu faile nii nagu nad algselt tehtud olid, vahendas Popular Mechanics.

Muudatused ei ole suured, näiteks punktiir mõne pideva joone asemel, kuid nad on piisavad, et panna insenere muretsema. Isegi tühiseimgi muudatus võib omada kriitilist tähtsust aluse disainis, mis kannab kahte tuumareaktorit, 85 lennukit ning on ujuvaks koduks mitmele tuhandele inimesele.

Mõistagi ei vaeva selline probleem vaid USA mereväge. Varem või hiljem puutuvad sellega kokku kõik, kes mis tahes dokumente digitaalsel kujul säilitavad. Digitaalsed failid ei võta füüsiliselt ruumi ega kogu tolmu raamaturiiulil, neid on lihtne luua ning säilitada. Tavaliselt oleme me harjunud mõtlema neist kui millestki igavesest. Kui me ikka millegi CD-plaadile kirjutame, siis seal ta on ja kui just plaat ei hävine, siis saame oma info sealt igal-juhul kätte.

Tegelikkuses on asjad siiski pisut teisiti. Küllap mäletate diskette, mis veel viis aastat tagasi olid küllaltki tavalised andmekandjad. Kuid aeg läheb edasi, uutele arvutitele disketiseadmeid ei lisata ning kui teil juhtub tulema vajadus näiteks kümne aasta pärast saada kätte fail, mille te kunagi disketile salvestasite, siis seisate silmitsi ilmselt üsna suure probleemiga. Ja miks peaks CD-plaadi saatus teistsugune olema?

Erinevad asutused on juba mõnda aega probleemiga tegelenud, kuid suurt edu pole saavutatud. Eksperdid hoiatavad, et kui töötavat mehhanismi tänaste dokumentide homse jaoks säilitamiseks peagi välja ei mõelda, lõppeb see sellega, et jätame ajalukku lihtsalt tühja koha.

Üks digitaalajastu iroonilisi külgi seisneb selles, et arhiveerimine on lõppkokkuvõttes muutunud keerulisemaks kui varem. Me mitte ainult ei pea säilitama kõiki kettaid ja magnetlinte, mis andmeid kannavad, vaid peame ka tagama, et nad oleksid loetavad ka tuleviku tarkvara ja riistvara kasutades. "Enamik inimesi ei teadvusta endale tõsiasja, et digitaalsed andmed salvestatakse viisil, mis on inimesele arusaamatu," ütles RAND Corporationi arvutispetsialist Jeff Rothenberg, kelle ülesandeks on digiandmete säilitamine. "On vaja tarkvara, mis selle koodi meile mõistetavasse keelde tõlgiks. Tarkvara paraku vananeb ning ka arvutid, millega vastavad programmid ühilduvad, vananevad ning kantakse lõpuks maha."

Tark- ja riistvara vananemine pole ainus digitaalseid andmeid ähvardav tegur. Paljudel juhtudel võib isiklike andmete kaotamine olla lihtsalt kõvaketta riknemise tulemuseks. Samuti võib juhtuda, et hoides oma digifotosid ja e-kirju mõne ettevõtte serveris võite neist lihtsalt ilma jääda. Nii juhtus 2001. aastal inimestega, kes hoidsid oma fotosid PhotoPointis, mis ühel heal hetkel tegevuse lõpetas.

Tarkvara uuendused ilmuvad keskmiselt iga 18 kuu kuni kahe aasta tagant. Pahatihti ilmneb, et paljudel juhtudel ei ühildu uus versioon täielikult vanema versiooniga loodud failidega. Nii juhtus ilmselt USS Nimitzi jooniste ning paljude teiste tänaseks muudatustega loetavate või üldse loetamatuks muutunud failidega.

Ameerika arhivaaride ühingu ekspresident Richard Pearce-Moses võtab probleemi kokku järgnevalt: "Nulle ja ühtesid võime me tõesti igavesti säilitada, kuid kas nad tulevikus meile ka midagi ütlevad?"

Eelmisel aastal sõlmiti Lockheed Martiniga 308 miljoni dollariline leping töötamaks välja lahendused, mis aitavad tänaseid dokumente ka homme avada. Ülesanne pole lihtne. Arvestada tuleb umbes 4500 erineva failitüübiga, millest igaüks nõuab pisut erinevat lähenemist. Lihtsaks näiteks on e-kirjad. Kui kiri sisaldab vaid teksti, on lahendus võrdlemisi sirgjooneline. Aga mis siis saab, kui kirjaga on saadetud faile? Oletame näiteks, et tegemist on Exceli töölehega. Kas meil on vaja selle lehe funktsionaalsus säilitada või tuleks hoida alles vaid esitatud andmed?

Lockheedi valitud tee on nn migratsioonistrateegia ehk tõlkida kõik failid mõnda paindlikku keelde, näiteks XMLi, mis oleks loetav ka tulevikus. Siiski ei pea kõik eksperdid seda valikut parimaks võimalikuks. "Pigem tuleks üritada luua nn emulatsioonistrateegia, mis võimaldab tuleviku arvutitel käituda nii nagu nad oleks praegu kasutatavad," ütles Rothenberg. Tänapäeval kasutatavad populaarsed emulatsiooniprogrammid lubavad näiteks PC abil mängida PlayStation 2 jaoks loodud videomänge.

"Mulle tundub, et migratsioonistrateegia ei säilita originaali. Ta isegi ei ürita seda. Meile jääb vaid kellegi subjektiivne nägemus sellest, mis on oluline," lisas Rothenberg.

"Mulle näib, et suurkorporatsioonide huvides ei ole tegeleda ühildumatuse kaotamisega, pigem vastupidi," ütles Rothenberg. "Kui vaadata asjale küüniliselt, siis ei taha nad sellega tegeleda, sest see võimaldaks tarbijail tarkvara- ja riistvarauuenduste hankimist edasi lükata, mis aga tootjate rahakotile hästi ei mõjuks".

Kõigele vaatamata on siiski mõningaid positiivseid märke. 2005. aasta lõpus otsustas Microsoft avada Office paketi failitüüpide lähtekoodid ka teistele tootjatele. Seda seepärast, et Office saaks rahvusvahelise standardina sertifitseeritud. Otsus suurendab olulisel määral šansse, et tänased Wordi ja Exceli failid on loetavad ka tulevastele põlvkondadele.

Rahvusvaheline standardiorganisatsioon sertifitseeris hiljuti pikaajaliseks säilitamiseks mõeldud Adobe laialt kasutatava PDF-formaadi muudetud versiooni, mida nimetatakse PDF/A. Failitüüp säilitab kõik faili prinditavad osad, kuid heidab kõrvale välislingid, paroolid ja muud lisandid, mis võivad olla hetkel kasutatavad, kuid ei pruugi seda olla tulevikus, sest lingid vananevad ning paroolid ununevad.

Adobe töötab ka insenerigraafika ja digitaalfotode pikaajalise arhiveerimisega seotud probleemidega. "Küsimus ei ole ainult nö tähtsates dokumentides. See puudutab ka asju, mis on meile isiklikel põhjustel olulised. Minu ema säilitas perekonnafotosid kingakarpides. Meie enam nii ei tee, kuid mul on tohutult digifotosid ja ma tahan neile tulevikus ligi pääseda," märkis Melonie Warfel, kelle ülesandeks on Adobe ülemaailmsete standardite väljatöötamist koordineerida.

Loe ka teisi Novaatori uudiseid.

Autor: ituudised.ee - Äripäeva IKT uudiste teemaveeb

Liitu ITuudiste uudiskirjaga!
Liitumisega nõustud, et Äripäev AS kasutab sinu e-posti aadressi sulle uudiskirja saatmiseks. Saad nõusoleku tagasi võtta uudiskirjas oleva lingi kaudu. Loe oma õiguste kohta lähemalt privaatsustingimustest
Indrek KaldITuudised.ee toimetajaTel: 511 1112
Anne WellsReklaami projektijuhtTel: 5880 7755