Digitointisuunnitelma
Digitoinnin tulisi perustua organisaation johdon hyväksymään kokonaisstrategiaan ja sen perusteella laadittuun digitointisuunnitelmaan, jotta taataan esimerkiksi riittävät henkilö- ja IT-resurssit sekä digitoinnin tulosten pitkäaikainen hallinta. Digitoinnin suunnitteluun olisi sisällytettävä myös suunnitelma siitä, miten digitoituja ilmentymiä tullaan tarjoamaan käyttöön.
Digitointisuunnitelma ohjaa muun muassa digitoitavan aineiston valintaa, digitointijärjestystä sekä työtapoja. Organisaation luettelointiperiaatteet (kuvailupolitiikka) määrittää metatietojen käsittelyä. Työtä ja suunnittelua ohjaavat lisäksi organisaation kokoelma- ja säilytyspolitiikat.
Ulkoistetuissakin digitointihankkeissa pitää omassa organisaatioissa suunnitella moni asia, kuten aineiston valinta, laatukriteerit, laadunvalvonta ja -varmistus sekä toimittajan valinta.
Digitoinnin tulisi perustua mahdollisimman paljon avoimiin standardeihin ja muistiorganisaatioiden yhteisiin käytäntöihin. Avoimien standardien käyttö edistää muun muassa järjestelmien ja datan yhteentoimivuutta, aineistojen laajaa käyttöä sekä pitkäaikaissäilyttämistä.
Digitointiprosessissa analogisesta aineistosta luodaan digitaalinen ilmentymä, joka on alkuperäiseen verrattuna laadultaan niin häviötön kuin mahdollista. Tämä ilmentymä on pitkäaikaisesti säilytettävä tallekappale, josta voidaan muodostaa käyttökappaleita eri käyttötarkoituksia varten. Tällöin käyttötarkoitus määrittelee kunkin käyttökappaleen laadun vähimmäiskriteerit.
Digitoinnin lähtökohtia
Digitointia voidaan tehdä esimerkiksi seuraavista lähtökohdista:
- Analogisen aineiston kysyntä on suurta, jolloin digitaaliset ilmentymät laajentavat aineiston käyttömahdollisuuksia sekä suojaavat alkuperäistä aineistoa.
- Analoginen aineisto on haurasta, jolloin digitointi säätää alkuperäistä aineistoa vaurioitumiselta
- Analoginen aineisto on luonteeltaan sellaista, että digitointi on ainoa keino turvata sen pitkäaikainen säilyvyys ja käytettävyys (esimerkiksi magneettinauhalle tallennettu aineisto)
- Analogisen aineiston määrä on niin suuri, että se halutaan hävittää digitoimisen jälkeen (esimerkiksi viranomaisaineistot).
- Aineisto halutaan asettaa käytettäväksi uusilla tavoilla, esimerkiksi verkkopalveluina.
- Aineiston käyttöarvoa halutaan lisätä esimerkiksi tekstin- tai hahmontunnistamalla, linkittämällä tai tekoälyn avulla
Digitointisuunnitelman kannalta tärkeitä kysymyksiä
Digitoinnin tavoitteet
- Mitä tavoitteita aineiston digitoinnilla pyritään saavuttamaan?
- Minkälaisia käyttötarkoituksia digitoidulle aineistolle on suunniteltu?
- Parantaako digitointi saavutettavuutta eli jonkun tietyn ryhmän mahdollisuuksia käyttää tiettyä aineistoa?
- Helpottaako digitointi aineiston hakua ja selailua?
- Voidaanko aineistoa kokevia kuvailutietoja parantamalla ja tarjoamalla siitä katselukuvia edistää aineiston arvostusta ja käyttöä sekä yleisön mielenkiintoa sitä kohtaan?
- Edistääkö digitointi mahdollisuuksia käyttää aineistoa näyttelyissä, tutkimuksessa, oppimisessa tai opetuksessa?
Aineiston valinta
Alkuvaiheen digitointihankkeissa tavattiin poimia digitoitavaksi erityisen kiinnostavia historiallisia dokumentteja. Näin oli mahdollista saada nopeasti verkkoon sellaisia keskeisiä ja mahdollisimman näyttäviä asiakirjoja, joiden saatettiin katsoa olevan eduksi palvelun imagolle ja siten myös tarvittavalle rahoitukselle. Tällaisella sattumanvaraisesti verkkoon siirretyllä asiakirja-aineistolla ei kuitenkaan ole laajempaa kulttuuripoliittista arvoa.
On mahdotonta asettaa historiallisia dokumentteja kiistattomaan arvojärjestykseen, sillä mikä tahansa dokumentti saattaa tarjota tärkeää tutkimuksellista tietoa. Aineistojen digitoinnissa olisi hyvä noudattaa provenienssi-periaatetta ja digitoida järjestelmällisesti kokonaisia, jonkin tietyn toiminnan tuloksena syntyneitä aineistoja. Provenienssilla tarkoitetaan sitä, että tiedossa on aineiston ja sen omistussuhteiden täysi historia, sen löytymisestä tai valmistuksesta nykypäivään, minkä perusteella aineiston aitous tai omistajuus voidaan määritellä. Laajoja kokonaisuuksia korostava lähestymistapa on nykyisin keskeinen kansallisten digitointisuunnitelmien päämäärä.
Digitoitavan aineiston valintaan vaikuttavat esimerkiksi seuraavat kysymykset.
- Millaiset kokonaisuudet tai niiden osat ja millaisessa järjestyksessä voidaan ottaa digitoitavaksi?
- Miten aineiston kuntoluokitus ja konservointitarpeet vaikuttavat digitointitapaan ja -järjestykseen?
- Liittyykö aineistoon tekijänoikeudellisia, omistusoikeudellisia tai muita rajoituksia?
- Mitä etua aineiston digitoinnista on verrattuna alkuperäiseen aineistoon?
- Onko aineisto kuvailtu vähimmäistason kriteerit täyttävästi? Kuinka paljon työtä tarvitaan aineiston dokumentoinnin parantamiseksi?
- Onko aineisto riittävän hyvässä kunnossa digitoitavaksi?
- Tarvitseeko aineisto konservointia?
- Mitkä osat digitointityöstä ja aineiston valmistelusta suoritetaan organisaation omana työnä ja mitkä työt ulkoistetaan?
- Myös rahoittajilla ja aineiston omistajilla saattaa olla oma näkemyksensä ja intressinsä siihen mitä digitoidaan.
Digitoinnin suhde muihin prosesseihin
- Suositaanko koko kokoelman digitoimista kerralla vai digitoidaanko vain kokoelman osat sitä mukaa kuin niille on kysyntää tai suunniteltua käyttöä?
- Millaiset käyttötarkoituksiin aineistoa digitoidaan ja millaiset laatuvaatimukset digitoidulle aineistolle asetetaan?
- Onko digitointi preservoivaa vai restauroivaa?
- Mikä on kuvailun ja dokumentoinnin vähimmäistaso, jotta kokoelma voidaan ottaa digitoitavaksi?
- Mitkä kokoelma- tai arkistoluettelon tiedot kiinnitetään metatietoina tiedostoihin?
Teknologia ja digitoinnin tietotaito
- Onko organisaatiolla tarvittava tekninen osaaminen?
- Ulkoistetaanko digitointityö?
- Miten digitointiprosesseissa varmistetaan kokoelmiin liittyvä sisällön tuntemus ja ymmärrys?
- Onko metatietojen tuottaminen tai kokoelmanhallinta ulkoistettavissa edes osin?
- Voidaanko olemassa olevalla laitteistolla ja ohjelmistolla tuottaa tiedostoja, jotka täyttävät monipuoliselle käytölle ja pitkäaikaissäilytykselle asetetut vaatimukset?
- Mitä standardeja ja suosituksia noudatetaan?
Tekijänoikeudet
- Digitoidaanko aineistoa pelkästään kokoelmanhallinnan ja säilytyksen tarpeisiin?
- Onko digitoinnin tarkoituksena parantaa aineiston saavutettavuutta?
- Ovatko aineistoa koskevat käyttösisenssit tai tekijänoikeudet hankittu tai hankittavissa?
Digitaaliset resurssit
- Mitä tiedostomuotoja käytetään ja mitkä ovat niiden tekniset vaatimukset?
- Mihin käyttöön soveltuvia tiedostoja aiotaan valmistaa?
- Mitä metatietoja tiedostoihin liitetään?
- Miten digitoidun aineiston käyttö järjestetään?
- Ketkä aineistoa voivat käyttää?
- Kuinka kauan aineiston digitoinnin lasketaan kestävän?
Aineiston suojelu
- Joudutaanko aineistoa kuljettamaan eri toimipisteiden tai yritysten välillä?
- Joudutaanko aineisto vakuuttamaan?
- Soveltuvatko aineiston nykyiset pakkaukset kuljetukseen ja säilyttämiseen?
- Onko työtiloissa tai niiden yhteydessä turvallista säilytystilaa aineistolle?
- Miten huolehditaan tietosuojasta digitointiprosessin aikana?
- Soveltuuko digitointitapa valitulle materiaalille?
- Voiko aineiston digitoida suoraan vai pitääkö se ensin valokuvata, esimerkiksi isot teokset, helmiäispintaiset vedokset ja arat originaalit?
Metatiedot
Digitointi limittyy tiiviisti aineiston metadataan, sillä kuvailutiedot mahdollistavat digitoitujen ilmentymien tehokkaan hallinnan ja käytön. Digitoinnin yhteydessä syntyvän rakenteellisen kuvailutiedon automaattisesta haltuunotosta tai manuaalista täydentämisestä tulee huolehtia.
Digitoituihin ilmentymiin tulee liittää riittävästi metatietoja, esimerkiksi aineiston
- Pysyvä tunniste
- Sisältöön liittyvät kuvailutiedot
- Omistusoikeuksiin ja hallintaan liittyvät tiedot
- Immateriaalioikeuksiin liittyvät tiedot
- Jatkokäyttöä koskevat lisensointitiedot
- Tiedostojen teknisiä ominaisuuksia kuvaavat metatiedot
- Linkit esimerkiksi paikkoihin, tapahtumiin, ajanjaksoihin, ihmisiin ja esineisiin. Yhdistämällä digitaalinen tieto muihin lähteisiin lisätään merkittävästi materiaalin käyttömahdollisuuksia.
Pitkäaikaissäilytys
Organisaatiolla tulee olla suunnitelma digitaalisen tiedon säilyttämiseksi. Digitaalisen aineiston pitkäaikaissäilyttämisellä tarkoitetaan aineiston digitointiprosessissa luodun digitaalisen ilmentymän, joka on alkuperäiseen verrattuna laadultaan niin häviötön kuin mahdollista, säilyttämistä tallekappaleena. Käytettyjen tiedostomuotojen tulisi olla Kulttuuriperintö-PAS-palvelun tukemia säilytys- tai siirtokelpoisia formaatteja.
Luotettava pitkäaikaissäilyttäminen edellyttää sisällön eheyden aktiivista valvontaa ja monenlaisiin riskeihin varautumista. Tässä ovat keskeisessä asemassa metatiedot, jotka kuvailevat mm. aineiston sisällön, historian ja alkuperän, sekä tiedot siitä, miten informaatiota voidaan käyttää.
Kulttuuriperintöorganisaatiot voivat hyödyntää opetus- ja kulttuuriministeriön hallinnonalalle toteutettua yhteistä Kulttuuriperintö-PAS-palvelua, joka takaa arkistojen keskeisten kansallisten digitalisten tietovarantojen pitkäaikaissäilyttämisen. PAS-palvelun tehtävänä on huolehtia digitaalisessa muodossa olevan aineiston säilymisestä ehyenä ja käyttökelpoisena. PAS-palvelua hyödyntävien organisaatioiden tulee kyetä omissa taustajärjestelmissään tuottamaan siirtopaketteja aineiston pitkäaikaissäilytystä varten, mikä tarkoittaa eri metatietotyyppien hallintaa ja niiden sovittamista yhteen digitaalisen aineiston kanssa siirtopaketiksi.
Pitkäaikaissäilyttämiseen liittyviä kysymyksiä:
- Paljonko digitaalista dataa syntyy vuosittain?
- Onko tuotetun datan pitkäaikaistallennukseen riittävät resurssit: henkilökunta, laitteisto, ohjelmisto, rahoitus?
- Miten digitaalisen aineiston hallinta ja pitkäaikaissäilytys järjestetään?
- Mitä tiedostomuotoja pitkäaikaissäilytetään?
- Ovatko pitkäkaissäilytykseen tarkoitetut tiedostomuodot Kulttuuriperintö-PAS-palvelun tukemia säilytys- tai siirtokelpoisia formaatteja?
- Millä kriteereillä digitoitua aineistoa saa poistaa?
Laadunvarmistus
Laadun varmistaminen vaikuttaa digitointityön kaikkiin vaiheisiin. Se on enemmänkin koko digitointityötä koskeva työ- ja suhtautumistapa, kuin esimerkiksi ulkoinen testausjärjestelmä. Työprosessin laadun varmistaminen alkaa digitaalisen resurssin käyttötarkoitukseen perustuvien yksityiskohtien määrittelystä ja digitoitavan aineiston valintaa ohjaavien laatuvaatimusten asettamisesta. Myös työnkulun ohjeistuksen on oltava riittävän yksityiskohtainen ja työnkulun tulee olla testattu etukäteen. Jollei työnkulkua testata, voi olla vaikeaa laatia luotettavaa aikataulua prosessille. On myös tärkeää, että ohjeistuksessa käytetty terminologia on tarkoitukseen sopiva.
Laadunvarmistuksen objektiivisuutta voidaan parantaa tehtäviä automatisoimalla ja esimerkiksi kalibroimalla laitteistot. Automatisoitu laadunvarmistus soveltuu hyvin tiedostojen hallintaan: metatietojen tarkkailuun, kopioiden valmistukseen ja tiedostojen muutoshistoriaa koskevaan raportointiin. Meta- ja lokitietojen tuottamista kannattaa myös mahdollisuuksien mukaan automatisoida, koska siten voidaan välttää lyöntivirheitä.
Vaikka useimmat laatuongelmista johtuvat inhimillisestä virheestä, on viisasta suunnitella jonkinlainen ihmisen suorittama oikolukukierros osaksi digitointiprosessia.
Miksi digitoida äänitteitä?
Kun ääntä digitoidaan, voidaan puhua konversiosta eli aineiston muuntamisesta sopivaksi uuteen laitteisto- ja ohjelmistoympäristöön. Lähtökohtaisesti voidaan sanoa, että analoginen ääni digitoidaan kolmesta eri syystä.
- Sähköisen aineiston käyttäminen, hallinta ja muokkaaminen eri käyttötarkoituksia varten on alkuperäismedioiden käsittelyä helpompaa.
- Sähköisen aineiston käyttäminen säästää alkuperäistä analogista mediaa ylimääräiseltä rasitukselta.
- Digitointi pelastaa sisällön tuhoutuvilta medioilta. Mikäli digitointia ei tehdä ajoissa, saatetaan sisällöstä menettää osa tai jopa koko sisältö.
Aineiston käytön helpottaminen
- Digitaalisessa muodossa olevasta äänitteestä voidaan tehdä nopeasti ja helposti käyttökopioita eri käyttötarkoituksia ja jakelukanavia ajatellen.
- Verkon välityksellä voidaan tutkia laajoja aineistoja.
- Tallenteen sisällä liikkuminen on helpompaa, kun se on digitaalisessa muodossa.
- Analogisia toistolaitteita ei osata enää käyttää.
- Toistolaitteita ei ole enää saatavilla tai ne ovat huonossa kunnossa.
Alkuperäisen aineiston säästäminen ylimääräiseltä rasitukselta
Monet analogiset ääniteformaatit ovat alttiita rasitukselle niitä toistettaessa, esimerkiksi
- lieriöt ja pikalevyt kuluvat voimakkaasti jokaisella soittokerralla
- 78-kierroksen levyt kuluvat, erityisesti jos ei osata valita oikeaa neulaa ja neulan painoa
- asetaattinauhat ovat usein haurastuneet ja ne saattavat katkeilla
- polyesternauhoista saattaa irrota pintakerros, mikäli ne ovat kärsineet hydrolyysistä
- alku- ja loppunauhat sekä editointiteippaukset irtoavat, mistä aiheutuu ylimääräistä työtä
Tämän lisäksi monet analogiset toistolaitteet kuluvat käytössä, esimerkiksi nauhureiden äänipäät kuluvat nauhan hankauksen johdosta. Myös moottorit ja elektroniset komponentit kuluvat ajan ja käytön myötä.
Sisällön pelastaminen tuhoutumisvaarassa olevilta medioilta
- Tuhoutumisvaara on tärkeä syy digitointiin, sillä tuhoutuneiden medioiden sisältö on lopullisesti menetetty osittain tai täysin.
- Magneettinen informaatio rapautuu parhaimmissakin säilytysolosuhteissa jatkuvasti. Rapautumista ei voida estää, mutta sitä voidaan hidastaa oikeilla säilytysolosuhteilla.
- Lisäksi nauhat, lieriöt, pikalevyt ja muut mediat voivat kärsiä kemiallisista prosesseista.
- Erityisessä vaarassa ovat tietyt ongelmallisiksi osoittautuneet nauhatyypit ja ohuemmat nauhat, kuten C-kasetit.
- Digitointiin saadaan lisäaikaa, mikäli vielä digitoimatta oleva analoginen aineisto säilytetään mahdollisimman hyvissä olosuhteissa.
- Aineisto on pelastettava niin kauan kuin toistolaitteita ja niiden varaosia on vielä saatavilla.
- Myös magneettiselle tai optiselle medialle tallennetut digitaaliset aineistot kuten CD-R ja DVD-R-levyt, Minidisc-levykkeet ja DAT- sekä DV-nauhat tuhoutuvat ajan mittaan, joten ne tulisi siirtää pitkäaikaisen säilyttämisen kannalta turvalliselle tallennusalustalle.
Linkit
Quality Control Checklists For Digization Projects
Aineiston valinta
Preservation and Selection for Digitization – Northeast Document Concervation Center NEDCC
Collection Development Policy Guidelines – Dartmouth College Library
Selection for Digitization – Best Practices – Lucidea
Digitoinnin laadun varmistaminen
Quality Control for Media Digitization Projects – IASA
D5.3 Quality Management – Europeana
Digital Project Toolkit – UCLA Library