Digital lyd

1 Februar 2015

Digitalisering

digitaliseringLyd er trykkforandringer i lufta med ein frekvens som vårt øyre kan oppfatta, dvs mellom 20 og 20000 Hz. Lyd er såkalte analoge signal. Det betyr at trykket forandrar seg kontinuerlig som ein funksjon av tida. Ein rein tone består av ein enkelt frekvens og ser ut som ein sinusfunksjon som den raude linje på figuren: (her er trykket på den vertikale aksen og tid på den horisontale)

Når vi skal lagra denne lyden så gjer vi det (som regel) ved å digitalisera den. Det betyr at vi måler (sampler) lydbølgen ved ein viss frekvens som kallast samplingfrekvensen. Samplingsfrekvensen fortel mao kor ofte vi måler, eller kor mange målingar vi har per sekund. Kvar måling har ein viss nøyaktighet, eller oppløysing, som er bestemt av kor mange bits vi bruker til å lagra målingen. Ved fire bits får vi 24 = 16 nivå som figuren viser. Med utgangspunkt i figuren, vil målingane våre vera: 7, 9, 11, 12, 13, 14, 14, 15, 15, 15, 14,  osv. Dette overset vi til binærtall slik :  0111, 1001, 1011, 1100, 1101, 1110, 1110, 1111, 1111, 1111, 1110, etc. Men fire bits er for lite for å gjengi musikk godt nok. Ein CD har 16 bits oppløysing, og det gir altså 216 = 65536 nivå. Sjå fleire eksempel på å oversetja frå tital-systemet til binære tall.

Aliasing

Når vi skal spilla av ei digital lydfil må vi gjera det motsette av å digitalisera, nemlig å gjera det analogt igjen. Då må vi gjenskapa - så godt vi klarer - det opprinnelige signalet. Eit av problema som oppstår når vi skal gjenskapa eit analogt signal frå det digitale som vi har sampla, er såkalt aliasing. Frå figuren nedanfor kan vi sjå at det raude signalet og det blå signalet har akkurat dei same verdiane sampla verdiane. Vi har altså to mulige analoge signal som passar med våre sampla verdiar. Det vil sei at det er umulig å rekonstruera det originale signalet. Løysinga er å sampla med ein høgare frekvens. Ein skulle tru at jo høgare samplingsfrekvens, jo betre resultat. Men det viser seg at hvis samplingsfrekvensen er meir enn dobbelt så stor* som den høgaste frekvensen vi treng å spela, så vil originalsignalet bli gjenskapt perfekt. Sidan mennesket ikkje kan høyra lydar høgare enn ca. 20 000 Hz, så vil ein samplingsfrekvens på 40 kHz vera nok. Dette er fremdeles debattert på nettet, men teoretisk skal CD-kvalitet med samplingsfrekvens på 44.1 kHz vera meir enn nok!

Fordeler med digital lyd

Datamengde

Eit mål for kor mykje data som blir sendt over ei linje eller behandla per tidsenhet er bitraten. Enheten er ofte oppgitt som bits per sekund bit/s. For lyd blir dette:

Bitrate = (oppløysing) x (samplingsfrekvens) x (antal kanalar)

Ein standard CD med samplingsfrekvens med 16 bits oppløsning, 44.1 kHz og 2 kanaler (stereo) gir altså bitraten: 16 x 44100 x 2 = 1411200 bits per sekund, eller 1411.2 kbit/s eller 1.4 Mbit/s. Av dette kan vi finna kor mykje plass ein typisk låt på tre minutt vil ta ukomprimert. Det blir rett og slett bitrate * varighet i sekund = 1411.2 kbit x 3 x 60 = 254016 kbit eller 31752 kB (B står for byte og er 8 bits) Eller omregna 31.7 MB. Ein CD som inneheld 74 min musikk har då plass til vel 783 MB data.

Komprimering

Ved å komprimera data kan ein få ned daramengden med opptil 90%, avhengig av format. Det som ligg på ein lyd CDen er altså ukomprimert lyd på formatet PCM, som tilsvarer WAV formatet. (Wav (wave) kan i teorien vera ulik PCM, men er i praksis nesten identisk) Dette er rett og slett ein sekvens med 0 og 1, der kvar gruppe med 16 bits representerer ein trykkverdi, slik vi har forklart over. Men ukomprimert lyd tar ganske mykje plass, både for nedlasting og lagring. Derfor fins det eit antal komprimerte formater. Nedanfor er ein oversikt over dei tre ulike typane vi kan treffa på, samt eksempel på format, og kor stor plass ein bestemt fil vil ta på dette formatet. (musikken er frå Bachs Brandenburg-konsertar, og varer i snaut 8 min.)

Som vi ser: MP3-fila tar her bare under ein tidel av plassen til den originale fila. Men dette kan variera sidan graden av komprimering kan variera.

Ripping og avspilling:

Det å kopiera eller oveføra lyd- eller bildedata over til ein harddisk kallast ripping. Som regel frå ein CD eller DVD. Som regel forandrar vi då formatet. Typisk er å laga MP3-filer frå ein CD. Det fins mange programmer for ripping, men ikkje alle klarer nødvendigvis det formatet du er ute etter. For ripping til FLAC, blir programmet EAC (Exact Audio Copy) anbefalt. For avspilling kan du bruka Foobar2000. Begge disse er gratis. Vil du betala litt kan du kjøpa jRiver Media Center som både både kan rippa og spela av dei fleste format.

HD-musikk

I dag kan du få kjøpt musikk som har både betre oppløysing og høgre samplingsfrekvens enn CD har. Du kan får samplingsfrekvensar på 48kHz, 96kHz og opp til 192 kHz med 24 bits oppløysing. Dette kallast High-Definition Music, eller HD-musikk. Det høyrest logisk ut at dette vil gi betre kvalitet på lyden. Men det er langt frå sikkert. Som sagt over vil alle lydar som har mindre enn halvparten av samplingsfrekvensen bli gjenskapt perfekt. Det tilseier at 44.1 kHz er nok. Det er også begrensingar på kor god oppløysing vi er i stand til å høyra.

Noter

* Dette fortel Nyquist-Shannon teoremet oss.

LES MEIR:

http://en.wikipedia.org/wiki/Audio_file_format
http://flac.sourceforge.net/
http://thewelltemperedcomputer.com/KB/WAV-FLAC.htm
http://people.xiph.org/~xiphmont/demo/neil-young.html
Red Book audio.