Ääni
Harjoitukset




|Kurssin perustiedot|   |Harjoitustyö|   |Oppimistehtävät|   |Tentti|   |Ohjelmistot|

|Aloitus ja Digitaalisuus| |Arkkitehtuuri| |Mediavalinnat|
|Hyperteksti ja HTML| |CSS|
|Bittikarttagrafiikka ja Kuvankäsittely|
|Ääni|



DIGITAALINEN ÄÄNI

Ääni mediana

Ääni on monipuolinen mediaelementti, joka mahdollistaa hyvin erityyppisiä lisämausteita mediaesityksiin. Ääni voi olla esimerkiksi olennainen osa kerrontaa, puhetta (avaa mp3 välilehdelle), efektejä, tunnelmaa luovaa taustaääntä, tai vaikkapa taustamusiikkia. Ääni on tärkeä elementti esimerkiksi elokuvissa ja peleissä, äänenkäyttö myös www-sivuilla on yleistynyt.

Ääni etenee aaltoliikkeenä välittäjäaineen, tyypillisesti ilman välityksellä. Värähtelytaajuudesta, eli värähdysten lukumäärästä sekunnissa, käytetään nimitystä hertsi, Hz. Ihmiskorva pystyy yleensä kuulemaan värähtelyt välillä 20 Hz - 20 kHz. Lopullinen kuuloaistimus syntyy aina vasta aivoissa.

Ääni tietokoneissa

Äänen digitointi tietokonekäsittelyä varten koostuu a) äänen analogisen signaalin muuttaminen (esim. mikrofonilla) digitaaliseksi, b) näytteenotosta ja c) arvonmäärityksestä. Digitoidun äänen laadun määräävät näytteenottotaajuus (sampling rate) sekä arvonmäärityksestä (bittinopeus, bitrate). Myös äänen muunnoksessa käytettävä äänen voimakkuus vaikuttaa tulokseen. Liian pienellä äänentasolla (voimakkuudella) talletettu ääni on altis häiriöille, kun taas liian suurilla tasoilla ääni "leikkautuu". Mitä suurempi näytteenottotaajuus (sampling rate) sekä bitrate sitä tarkemmin ääni tallentuu, ja sitä enemmän tilaa digitoitu ääni vie. Näytteenotossa yleisesti pätee se periaate, että näytteenottotason pitää olla kaksinkertainen verrattuna korkeimpaan lähdesignaalin arvoon, jotta se pystytään toistamaan tarkasti. CD-tasoinen ääni on taajuudeltaan 44,1kHz mikä tarkoittaa 44100 näytettä sekunnissa, eikä tavallinen ihmiskorva kuule eroa CD-tasoisessa äänessä sitä parempilaatuiseen verrattuna (huomaa, CD:n taajuus on noin kaksinkertainen ihmisen kuuloalueeseen nähden). Bitrate kertoo sen, kuinka paljon informaatiota yhdelle ääninäytteelle voidaan tallentaa. Yleensä näytteenottotaajuuden alentaminen resurssien säästämiseksi on järkevämpää kuin bitraten vähentäminen. Erityyppisille äänille voi käyttää eri näytteenottotaajuuksia. Laadukas musiikin digitointi vaatii 44,1kHz näytteenottotaajuuden, mutta koska puhe tapahtuu matalammalla taajuusalueella, riittää hyvään laatuun yleensä 11025Hz näytteenottotaajuus.

Kuvassa Audacityllä 32 bitratella (arvonmääritys) ja 44,1 kHz taajuudella (näytteenottotaajuus) tallennettua mono-ääntä. Äänenkäsittelyohjelmat esittävät äänet ns. aaltomuodossa (Waveform), joka kertoo lähinnä äänenvoimakkuudesta aikajanalla. Kuvasta voi päätellä kysymyksessä olevan rytmikkään musiikin, ei paljon muuta. Ääntä on tässä tapauksessa tallennettu suoraan digitaalisesta lähteestä, joten muunnosta ei ole tarvinnut tehdä (se on tehty joskus aiemmin).

Toistaakseen ääniä tietokone tarvitsee äänikortin sekä äänentoistolaitteiston. Nykyaikaisissa tietokoneissa äänikortti on integroitu emolevylle, mutta vanhemmissa koneissa ei äänikortti ollut itsestäänselvyys. Äänentoistona pöytätietokoneissa on tyypillisesti joko kuulokkeet tai kaiuttimet, jotka on kytketty äänikorttiin.

Äänenkäsittely

Käsittelemällä ääntä voidaan poistaa esimerkiksi kohina ja rasahdukset, puhdistaa ääntä jotta sitä voitaisiin hyödyntää. Tämä on monesti pitkäveteistä manuaalista työtä, jota varten on kuitenkin olemassa nykyaikana tehokkaita apuneuvoja.

Voidaan myös muuttaa nauhoitusten dynamiikaa kompressoimalla ja limitoimalla. Tällä tavoin nauhoituksen äänenvoimakkuus voidaan tasata koko nauhoituksen ajalta samanlaiseksi. Esimerkkinä tästä voidaan ottaa nykyiset hittiradiokanavat joissa kaikki äänimateriaali on jotakuinkin yhtä voimakasta; radiosta saa selvää näin vaikka ajettaessa autoa kun taustamelu on huomattava.

Vaikka cd-tasoisen äänen teoreettinen dynamiikka 96 desibeliä, ei sitä voi toistaa mummon putkiradiolla tai pc-tietokoneen pahvikaiuttimilla.

Tämä kannattaa pitää mielessä luotaessa äänimaisemaa vaikkapa verkkossa julkaistavaan flash-esitykseen. Jos äänimaisemaa luodessasi käytössäsi on huippukaiuttimet jotka pystyvät toistamaan hiljaisimmatkin vivahteet, perus pc:n multimediakaiuttimet eivät pysty niitä kuitenkaan toistamaan. Kannattaa siis joko luoda äänimaisema sellaisilla kaiuttimilla joilla se tullaan esittämään, tai ainakin testata niillä lopuksi jotta varmistutaan että kokonaisuus toimii. Hyödyntää voi äänen tasojen tasaamista manuaalisesti tai kompressoimalla ja limitoimalla ääntä.

Käsittelemällä ääntä voidaan myös luoda luonnollisen kuuloisia tiloja kaikuefekteillä, vaikka alkuperäinen nauhoitus olisi tehty täysin kaiuttomassa tilassa.

Voidaan myös manipuloida stereokuvaa, vaikkapa kuunnelmaa tehtäessä panoroida ääniä eri puolille.

Yhdistelemällä erilaisia tekniikoita ja efektejä äänenkäsittelyssä voidaan ääntä muokata loputtomiin.

Aina kun ääntä käsitellään, tehtiin se sitten digitaalisesti tai analogisella studiokalustolla, ääni kärsii laadullisesti. Analogisesti ääntä muokattaessa ääni joutuu kulkemaan kymmenien johtometrien läpi miksauspöydän ja efektilaitteiden väliä, ympäristön kohinaa ja häiriöitä imien.

Mitä enemmän digitaaliselle äänelle tehdään vaikkapa äänenkäsittelyohjelmassa operaatioita, sitä enemmän alkuperäinen ääninäyte kärsii. Tämä johtuu periaatteessa digitaalisen äänen luonteesta, se on vain bittimääränsä ja näytteenottotaajuutensa mukainen sarja näytteitä jotka yleensä a/d muunnin on luonnollisesta äänestä ottanut.

Nostamalla äänen bittimäärää ja näytteenottotaajuutta ongelma helpottaa hieman. Nykyaikaiset äänenkäsittelyohjelmat yleensä käsittelevät 16-bittisenkin äänen sisäisesti 32-bittisenä.

Joka tapauksessa, digitaalistakaan ääntä ei kannata käsitellä loputtomiin, mitä vähemmän erilaisia operaatioita tarvitsee tehdä, sen parempi.

Pakkausformaatit

Suosituimmissa käyttöjärjestelmissä on oma "virallinen" tiedostomuotonsa äänelle. Windowsilla tämä on Wave(.wav) ja MacOS:lla AIFF. MP3 on pakkausformaatti ja tiedostomuoto, joka on Internetin musiikkitiedostoissa nykyään käytetyin ja tunnetuin. Formaatteja on lukuisia, ja myös videontallennusformaatteja (kuten AVI, OGG ja QuickTime) voi käyttää pelkästään äänen tallennukseen. Kaikki tiedostomuodot tukevat erilaisia äänen pakkaustapoja. Esimerkiksi MP3:a käyttämällä päästään tyypillisesti kymmenkertaiseen pakkaustiheyteen äänen laadun juurikaan kärsimättä.

Eri tiedostoformaatit tukevat pakkaamisessa erilaisia enkoodereita, ja nämä enkooderit käyttävät pakkaamiseen erilaisia pakkausalgoritmeja. Osa näistä on tarkoitettu nimenomaan tietyntyyppisen äänimateriaalin, kuten puheäänen pakkaamiseen. Tällaisten erikoistuneiden koodekkien käyttö muunlaiseen äänimateriaaliin aiheuttaa yleensä äänen laadun merkittävää heikkenemistä. Pakatun äänitiedoston "laatu" riippuu siis monesta tekijästä: Valitusta tiedostoformaatista, enkooderista sekä pakkausasetuksista, ja tietenkin alkuperäisen äänen laadusta.

Äänen pakkaaminen eli kompressointi on tarpeellista tiedonsiirtokapasiteetin rajallisuuden vuoksi. Äänen pakkaamisen periaate on jättää tallennuksesta pois sellaiset äänet, jotka eivät vaikuta itse kuuloaistimukseen. Tällaisia voivat olla erityisen hiljaiset äänet, tai sellaiset äänet jotka jäävät toisen äänen "alle" siten että aivot eivät rekisteröi niitä. Puheen tapauksessa hiljaiset kohdat voi poistaa kokonaan, ja kuuloalueen ulkopuoliset äänet voi tietenkin myös poistaa.

Lisää tietoa MP3- , WAV- sekä OGG-formaateista

Suoratoisto (streaming)

Suoratoisto tarkoittaa sitä, että ääni (tai video) toistetaan päätteeltä sitä mukaa kun se tietokoneelle verkkoa pitkin tulee. Suoratoistossa ei siis imuroida ensin koko tiedostoa ja aleta vasta tämän jälkeen toistamaan sitä. Analogiana voitaisiin pitää eroa televisiolähetyksen katsomisessa ja videon vuokraamisessa. Esimerkiksi netin radiokanavat lähettävät äänidatan streamina. Yksi yleisimmistä "striimaavista" mediaformaateista on Realmedia.

MIDI

MIDI (Musical Instruments Digital Interface) on tavallaan musiikin tallennusmuoto, jossa ei tallenneta äänidataa vaan ainoastaan nuotit ja soitto-ohjeet. Sitä käytettiin alunperin erilaisten sähköisten instrumenttien (kuten syntetisaattoreiden) kommunikointiprotokollana. MIDI on siis musiikin kommunikointimuoto. MIDI-tiedostot vievät todella vähän tilaa, mutta itse äänen laatu riippuu soittavasta laitteesta (tietokoneiden tapauksessa äänikortista) ja sen sämpleistä ja niiden laadusta. MOD on MIDIn ja tavallisen audiotiedoston "välimuoto", jossa tiedoston mukana tulevat myös soittoon tarvittavat audiosämplet.

Stereo-ääni

Mono-signaalissa ääntä tulee yhdeltä kanavalta, kun taas stereo tarkoittaa kahden äänikanavan käyttöä. Stereo-ääni tallennetaan useammalla mikrofonilla. Miksaamalla äänet sopivalla tavalla ja asetettaessa kaiuttimet sopivan etäälle toisistaan (tai käyttämällä kuulokkeita), voidaan luoda illuusio eri soitinten erilaisesta sijainnista. Kaksi kuuloaistimena toimivaa korvaa, jotka on tarkoitettu mahdollistamaan äänen suunnan aistimisen, mahdollistavat stereo-efektin hyödyntämisen. Stereo-efekti siis tavallaan hyödyntää aivojen luomaa illuusiota tilasta. Äänilähde kuullaan olevan sillä puolella, mistä se tulee voimakkaampana. Toistamalla stereosignaalia yhdestä äänilähteestä heikkenee äänen laatu signaalien pienten aikaerojen sekoittuessa. Luonnollisesti mono-äänen tallentaminen stereona vie ainoastaan kaksinkertaisen määrän tilaa tuomatta ääneen mitään uutta.

Muita termejä

Normalisointi on äänenkäsittelyohjelman ominaisuus, jolla kasvatetaan äänen voimakkuus maksimiin. Desibeli on äänen voimakkuuden yksikkö. Normaalin puheen äänenvoimakkuus on 50-80dB. Hertsi (Hz) on äänentaajuuden yksikkö. Digitalisoinnin yhteydessä alkuperäisestä äänimateriaalista otettujen näytteiden määrää mitataan hertseissä (Hz=näyte/sekunti).

Äänen käyttö web-sivulla

Mitä hitaampi internet-yhteys, sitä heikomman kuuloista ääntä pystytään yhteyden yli siirtämään reaaliajassa. Mitä uudempia äänenpakkausmenetelmiä käytetään, sitä paremmalta hitaankin internet-yhteyden yli kuunneltu ääni kuulostaa, mutta tehokkaammat kodekit vaativat tietokoneelta yhä enemmän tehoja.

Äänen käytössä web-sivulla kannattaa olla varovainen. www.disney.com on esimerkki sivustosta, jolla on paljon ääntä perustellusti. Sivusto on ikäänkuin virtuaalinen huvipuisto, Disneyland, täynnä värejä, elämyksiä ja Disneyn hahmoja lapsille. Äänet ovat niin olennainen osa sivuston toiminnallisuutta, että sivustolta jopa puuttuu äänten vaimentamisen mahdollisuus. Aikuiselle jota sivusto ei paljoa kiinnosta, alkaa äänimailma varmasti nopeasti häiritsemään, koska pelkkä hiiren liikuttelu aiheuttaa kaikenlaisia kivoja ääniefektejä.





Ilmoittakaa toimimattomista tai epäilyttävistä linkeistä sähköpostilla eeva.leinonen (at) oulu.fi
Sivua päivitetty 15.2.2010


Creative Commons License
Tämän teosteoksen käyttöoikeutta koskee Creative Commons Nimi mainittava-Ei-kaupalliseen käyttöön-Sama lisenssi 1.0 Suomi-lisenssi.