DIGITAALINEN ÄÄNI
Ääni mediana
Ääni on monipuolinen mediaelementti, joka mahdollistaa hyvin erityyppisiä lisämausteita mediaesityksiin. Ääni
voi olla esimerkiksi olennainen osa kerrontaa,
puhetta (avaa mp3 välilehdelle),
efektejä,
tunnelmaa luovaa taustaääntä,
tai vaikkapa taustamusiikkia.
Ääni on tärkeä elementti esimerkiksi elokuvissa ja peleissä, äänenkäyttö myös www-sivuilla on yleistynyt.
Ääni etenee aaltoliikkeenä välittäjäaineen, tyypillisesti ilman välityksellä. Värähtelytaajuudesta, eli värähdysten
lukumäärästä sekunnissa, käytetään nimitystä hertsi, Hz. Ihmiskorva pystyy yleensä kuulemaan värähtelyt välillä 20 Hz - 20 kHz.
Lopullinen kuuloaistimus syntyy aina vasta aivoissa.
Ääni tietokoneissa
Äänen digitointi tietokonekäsittelyä varten koostuu a) äänen analogisen signaalin muuttaminen (esim. mikrofonilla) digitaaliseksi,
b) näytteenotosta ja c) arvonmäärityksestä. Digitoidun
äänen laadun määräävät näytteenottotaajuus (sampling rate) sekä arvonmäärityksestä (bittinopeus, bitrate).
Myös äänen muunnoksessa käytettävä äänen voimakkuus vaikuttaa tulokseen. Liian pienellä äänentasolla (voimakkuudella)
talletettu ääni on altis häiriöille, kun taas liian suurilla tasoilla ääni "leikkautuu". Mitä suurempi näytteenottotaajuus
(sampling rate) sekä bitrate
sitä tarkemmin ääni tallentuu, ja sitä enemmän tilaa digitoitu ääni vie.
Näytteenotossa yleisesti
pätee se periaate, että näytteenottotason pitää olla kaksinkertainen verrattuna korkeimpaan lähdesignaalin arvoon,
jotta se pystytään toistamaan tarkasti. CD-tasoinen ääni on taajuudeltaan 44,1kHz mikä tarkoittaa 44100 näytettä
sekunnissa,
eikä tavallinen ihmiskorva kuule eroa CD-tasoisessa äänessä
sitä parempilaatuiseen verrattuna (huomaa, CD:n taajuus on noin kaksinkertainen ihmisen kuuloalueeseen nähden).
Bitrate kertoo sen, kuinka paljon informaatiota yhdelle ääninäytteelle voidaan tallentaa.
Yleensä näytteenottotaajuuden alentaminen resurssien säästämiseksi on
järkevämpää kuin bitraten vähentäminen. Erityyppisille äänille voi käyttää eri näytteenottotaajuuksia. Laadukas musiikin digitointi vaatii 44,1kHz
näytteenottotaajuuden, mutta koska puhe tapahtuu matalammalla taajuusalueella, riittää hyvään laatuun yleensä 11025Hz
näytteenottotaajuus.
 Kuvassa Audacityllä 32 bitratella (arvonmääritys) ja 44,1 kHz taajuudella
(näytteenottotaajuus) tallennettua mono-ääntä.
Äänenkäsittelyohjelmat esittävät äänet ns. aaltomuodossa (Waveform), joka kertoo lähinnä äänenvoimakkuudesta aikajanalla. Kuvasta
voi päätellä kysymyksessä olevan rytmikkään musiikin, ei paljon muuta. Ääntä on tässä tapauksessa tallennettu suoraan digitaalisesta lähteestä,
joten muunnosta ei ole tarvinnut tehdä (se on tehty joskus aiemmin).
Toistaakseen ääniä tietokone tarvitsee äänikortin sekä äänentoistolaitteiston. Nykyaikaisissa tietokoneissa äänikortti on
integroitu emolevylle, mutta vanhemmissa koneissa ei äänikortti ollut itsestäänselvyys. Äänentoistona pöytätietokoneissa on tyypillisesti
joko kuulokkeet tai kaiuttimet, jotka on kytketty äänikorttiin.
Äänenkäsittely
Käsittelemällä ääntä voidaan poistaa esimerkiksi kohina ja rasahdukset,
puhdistaa ääntä jotta sitä voitaisiin hyödyntää. Tämä
on monesti pitkäveteistä manuaalista työtä, jota varten
on kuitenkin olemassa nykyaikana tehokkaita apuneuvoja.
Voidaan myös muuttaa nauhoitusten dynamiikaa kompressoimalla ja
limitoimalla. Tällä tavoin nauhoituksen äänenvoimakkuus voidaan tasata
koko nauhoituksen ajalta samanlaiseksi. Esimerkkinä tästä voidaan ottaa
nykyiset hittiradiokanavat joissa kaikki äänimateriaali on jotakuinkin
yhtä voimakasta; radiosta saa selvää näin vaikka ajettaessa autoa kun
taustamelu on huomattava.
Vaikka cd-tasoisen äänen teoreettinen dynamiikka 96 desibeliä,
ei sitä voi toistaa mummon putkiradiolla tai pc-tietokoneen pahvikaiuttimilla.
Tämä kannattaa pitää mielessä luotaessa äänimaisemaa
vaikkapa verkkossa julkaistavaan flash-esitykseen. Jos äänimaisemaa
luodessasi käytössäsi on huippukaiuttimet jotka pystyvät
toistamaan hiljaisimmatkin vivahteet, perus pc:n multimediakaiuttimet
eivät pysty niitä kuitenkaan toistamaan. Kannattaa siis joko
luoda äänimaisema sellaisilla kaiuttimilla joilla se tullaan
esittämään, tai ainakin testata niillä lopuksi jotta
varmistutaan että kokonaisuus toimii. Hyödyntää voi
äänen tasojen tasaamista manuaalisesti tai kompressoimalla ja
limitoimalla ääntä.
Käsittelemällä ääntä voidaan myös luoda luonnollisen kuuloisia tiloja
kaikuefekteillä, vaikka alkuperäinen nauhoitus olisi tehty täysin kaiuttomassa
tilassa.
Voidaan myös manipuloida stereokuvaa, vaikkapa kuunnelmaa tehtäessä panoroida
ääniä eri puolille.
Yhdistelemällä erilaisia tekniikoita ja efektejä äänenkäsittelyssä
voidaan ääntä muokata loputtomiin.
Aina kun ääntä käsitellään, tehtiin se
sitten digitaalisesti tai analogisella studiokalustolla, ääni
kärsii laadullisesti. Analogisesti ääntä muokattaessa
ääni joutuu kulkemaan kymmenien johtometrien läpi miksauspöydän
ja efektilaitteiden väliä, ympäristön kohinaa ja häiriöitä
imien.
Mitä enemmän digitaaliselle äänelle tehdään
vaikkapa äänenkäsittelyohjelmassa operaatioita, sitä
enemmän alkuperäinen ääninäyte kärsii. Tämä
johtuu periaatteessa digitaalisen äänen luonteesta, se on vain
bittimääränsä ja näytteenottotaajuutensa mukainen
sarja näytteitä jotka yleensä a/d muunnin on luonnollisesta
äänestä ottanut.
Nostamalla äänen bittimäärää ja näytteenottotaajuutta
ongelma helpottaa hieman. Nykyaikaiset äänenkäsittelyohjelmat
yleensä käsittelevät 16-bittisenkin äänen sisäisesti
32-bittisenä.
Joka tapauksessa, digitaalistakaan ääntä ei kannata käsitellä
loputtomiin, mitä vähemmän erilaisia operaatioita tarvitsee
tehdä, sen parempi.
Pakkausformaatit
Suosituimmissa käyttöjärjestelmissä on oma "virallinen" tiedostomuotonsa äänelle. Windowsilla tämä on Wave(.wav) ja MacOS:lla AIFF.
MP3 on pakkausformaatti ja tiedostomuoto, joka on Internetin musiikkitiedostoissa nykyään käytetyin ja tunnetuin. Formaatteja on lukuisia,
ja myös videontallennusformaatteja (kuten AVI, OGG ja QuickTime) voi käyttää pelkästään äänen tallennukseen. Kaikki tiedostomuodot tukevat
erilaisia äänen pakkaustapoja. Esimerkiksi MP3:a käyttämällä päästään tyypillisesti kymmenkertaiseen pakkaustiheyteen äänen
laadun juurikaan kärsimättä.
Eri tiedostoformaatit tukevat pakkaamisessa erilaisia enkoodereita, ja nämä enkooderit käyttävät pakkaamiseen
erilaisia pakkausalgoritmeja.
Osa näistä on tarkoitettu nimenomaan tietyntyyppisen äänimateriaalin,
kuten puheäänen pakkaamiseen. Tällaisten erikoistuneiden koodekkien käyttö muunlaiseen äänimateriaaliin aiheuttaa yleensä
äänen laadun merkittävää heikkenemistä. Pakatun äänitiedoston "laatu"
riippuu siis monesta tekijästä: Valitusta tiedostoformaatista, enkooderista sekä pakkausasetuksista, ja tietenkin alkuperäisen
äänen laadusta.
Äänen pakkaaminen eli kompressointi on tarpeellista tiedonsiirtokapasiteetin rajallisuuden vuoksi.
Äänen pakkaamisen periaate on jättää tallennuksesta pois sellaiset äänet, jotka eivät vaikuta itse kuuloaistimukseen.
Tällaisia voivat olla erityisen hiljaiset äänet, tai sellaiset äänet jotka jäävät toisen äänen "alle" siten että
aivot eivät rekisteröi niitä. Puheen tapauksessa hiljaiset kohdat voi poistaa kokonaan, ja kuuloalueen ulkopuoliset
äänet voi tietenkin myös poistaa.
Lisää tietoa MP3- , WAV-
sekä OGG-formaateista
Suoratoisto (streaming)
Suoratoisto tarkoittaa sitä, että ääni (tai video) toistetaan päätteeltä sitä mukaa kun se tietokoneelle verkkoa pitkin tulee.
Suoratoistossa ei siis imuroida ensin koko tiedostoa ja aleta vasta tämän jälkeen toistamaan sitä. Analogiana voitaisiin pitää
eroa televisiolähetyksen katsomisessa ja videon vuokraamisessa. Esimerkiksi netin radiokanavat lähettävät äänidatan streamina.
Yksi yleisimmistä "striimaavista" mediaformaateista on Realmedia.
MIDI
MIDI (Musical Instruments Digital Interface) on tavallaan musiikin tallennusmuoto, jossa ei tallenneta äänidataa vaan ainoastaan
nuotit ja soitto-ohjeet. Sitä käytettiin alunperin erilaisten sähköisten instrumenttien (kuten syntetisaattoreiden)
kommunikointiprotokollana. MIDI on siis musiikin kommunikointimuoto. MIDI-tiedostot vievät todella vähän tilaa, mutta itse äänen laatu
riippuu soittavasta laitteesta (tietokoneiden tapauksessa äänikortista) ja sen sämpleistä ja niiden laadusta.
MOD on MIDIn ja tavallisen audiotiedoston "välimuoto",
jossa tiedoston mukana tulevat myös soittoon tarvittavat audiosämplet.
Stereo-ääni
Mono-signaalissa ääntä tulee yhdeltä kanavalta,
kun taas stereo tarkoittaa kahden äänikanavan käyttöä.
Stereo-ääni tallennetaan useammalla mikrofonilla. Miksaamalla äänet sopivalla tavalla
ja asetettaessa kaiuttimet sopivan etäälle toisistaan
(tai käyttämällä kuulokkeita), voidaan luoda illuusio eri soitinten erilaisesta sijainnista. Kaksi kuuloaistimena toimivaa
korvaa, jotka on tarkoitettu mahdollistamaan äänen suunnan aistimisen, mahdollistavat stereo-efektin hyödyntämisen.
Stereo-efekti siis tavallaan hyödyntää aivojen luomaa illuusiota tilasta. Äänilähde kuullaan olevan sillä puolella, mistä
se tulee voimakkaampana. Toistamalla stereosignaalia yhdestä äänilähteestä heikkenee äänen laatu signaalien pienten aikaerojen
sekoittuessa. Luonnollisesti mono-äänen tallentaminen stereona vie ainoastaan kaksinkertaisen määrän tilaa tuomatta ääneen
mitään uutta.
Muita termejä
Normalisointi on äänenkäsittelyohjelman ominaisuus, jolla kasvatetaan äänen voimakkuus maksimiin.
Desibeli on äänen voimakkuuden yksikkö. Normaalin puheen äänenvoimakkuus on 50-80dB.
Hertsi (Hz) on äänentaajuuden yksikkö. Digitalisoinnin yhteydessä alkuperäisestä äänimateriaalista
otettujen näytteiden määrää mitataan hertseissä (Hz=näyte/sekunti).
Äänen käyttö web-sivulla
Mitä hitaampi internet-yhteys, sitä heikomman kuuloista ääntä pystytään
yhteyden yli siirtämään reaaliajassa. Mitä uudempia äänenpakkausmenetelmiä
käytetään, sitä paremmalta hitaankin internet-yhteyden yli kuunneltu ääni
kuulostaa, mutta tehokkaammat kodekit vaativat tietokoneelta yhä enemmän
tehoja.
Äänen käytössä web-sivulla kannattaa olla varovainen. www.disney.com on esimerkki
sivustosta, jolla on paljon ääntä perustellusti. Sivusto on ikäänkuin virtuaalinen huvipuisto, Disneyland, täynnä värejä, elämyksiä
ja Disneyn hahmoja lapsille. Äänet ovat niin olennainen osa sivuston toiminnallisuutta, että sivustolta jopa puuttuu äänten vaimentamisen
mahdollisuus. Aikuiselle jota sivusto ei paljoa kiinnosta, alkaa äänimailma varmasti nopeasti häiritsemään, koska pelkkä hiiren
liikuttelu aiheuttaa kaikenlaisia kivoja ääniefektejä.
|