$Id: audio.html,v 1.28 2003/06/04 13:19:10 ltuuri Exp $

HYFL/PEs-R Puhedatan pakkaus, siistaus, aitous yms. -kurssilla k-2003

Häviöllinen pakkaus, psykoakustisesta puolesta... esim. Painter, Spanias: Perceptual Coding of Digital Audio

Pakkaus

Tässä ei häviötöntä datan pakkausta a la zip, gzip, bzip2 tai häviöttömiä, pakkaaviä äänitiedostomuotoja kuten FLAC WavPack Osa ohjelmista (ei Debianissa olevat) voivat olla hivenen hankalampia asentaa koska ovat myös musiikkia laittomasti kopioivien harrastajienkin suosiossa. Alla linkkejä sisältävät ovat kaikki kaikkien (käyttäjätunnuksellisten laillisiin tarkoituksiin!) käytettävissä Leniksellä :) Verkosta esimerkkiääniä eri pakkauksin: http://www.signalogic.com/index.pl?page=codec_samples Harmi kyllä ilmaiset ohjelmat kiinnostavimpien - puheen siirrossa ja arkistoinnissa käytettyjen, eniten pakkaavien menetelmiin on vaikea löytää ilmaisia ohjelmia; Tietoa verkossa kyllä löytyy, esim wiki Standardi: Enkoodaus/kompressio kaistanleveys G.711 PCM (A-Law/U-Law) 64 kbps (DS0) G.726 ADPCM 16, 24, 32, 40 kbps G.729 CS-ACELP 8 kbps G.728 LD-CELP 16 kbps G.723.1 CELP 6.3/5.3 kbps variable

Pakkausohjelmat

SoX (debian) SoX is a command line program that can convert most popular audio files to most other popular audio file formats. It can optionally change the audio sample data type and apply one or more sound effects to the file during this translation. bash$ sox -h [...] Supported file formats: aiff al au auto avr cdr cvs dat vms gsm hcom la lu maud nul ossdsp raw sb sf sl smp sndt sph 8svx sw txw ub ul uw voc vorbis wav wve http://sox.sourceforge.net Ogg Ogg Vorbis is a completely open, patent-free, professional audio encoding and streaming technology with all the benefits of Open Source. xiph.org/vorbis/ MPEG 1 Layer 3, "mp3" LAME Ain't an Mp3 Encoder, http://lame.sourceforge.net MpegPlus -> MusePack MusePack, musepack.net Enkooderi ja dekooderi, vain dekooderi on OpenSource MELP Mixed-Excitation Linear Predictive coding; 2400 b/s, hyvältä kuulostaa melp.org MPEG 4 VQF MP3:ea vastaavaa laatua tiivimmällä pakkauksella tavoittellut selvästi kuolemassa oleva tiedostomuoto, kokeilin allaolevia ja luovutin kun eivät toimineet kunnolla. Ilmeisesti selvyys ja stereokuva myös selvästi huonompia kuin mp3-muodossa; ei yleistynyt 3-4 vuotta sitten. TwinVQ DreamPlay DreamEnc MPEG 2/4 AAC (Advanced Audio Format) Ilmeisesti kaupalliset patenttikuviot viivyttävät kehitystä ja yleistä käyttöönottoa, tähän kokeiluun ei ollut saatavilla toimivia, ilmaisia ja laillisia ohjelmaversioita MPEG 4 HVXC, CELP, ... Esim. HVXC (Harmonic Vector Excitation) ja CELP (Code Excited Linear Prediction) ovat puheäänelle sovitettuja tiiviimpiä pakkausmuotoja joita olisi kiintoisaa kokeilla! Nykyään vielä kaupallisia, rautaan (DSP tai Apple Macintosh + QuickTime-ohjelmistoperhe) sidottuja tuotteita: Fraunhofer Apple MPEG 4 Structured Audio format https://en.wikipedia.org/wiki/MPEG-4_Structured_Audio Kehityksen seuranta ATT developer resources berkeley.edu/~lazzaro Opus codec Visio: Tulevat, äärimmilleen tiivistetyt muodot pakata, siirtää ja purkaa puhetta sekä kasvavat käytettävissä olevat laskentatehot mahdollistavat 1) viestinnän kannalta yhä useampien tärkeitten piirteitten irrotuksen 2) piirteitten siirron tiiviisti pakattuna, sisäisesti strukturoituna, helposti laajenneltavana ja käsiteltävänä datana, vrt. XML, http://www.oasis-open.org/cover/xml.html#applications jo nykyään; suuntana ja vasta edessä olevana kehityksenä kuitenkin ponnistaa pelkästä karkeasta annotoinnista ja ohjailusta yhä tarkempaan, foneettisesti hienojakoisempaan ja automaattisempaan kuvaukseen 3) purkua ohjelmin joiden toiminnallisuus tietyssä mielessä jopa ylittää parhaimmat nykyiset puhesynteesit

Varmistus

A) Klassiset, bitti-bitiltä- ja tarkistussummavertailut yhtä lailla ääni- kuin muillekin tiedostoille esim. verkkosiirron, CD:llä lähettämisen tms. onnistumisen toteamiseen: md5sum https://en.wikipedia.org/wiki/MD5 o laskee melko sutjakkaasti tarkistussummia mistä vain tiedostoista, käytössä yleisesti ohjelmien jakelussa verkon yli, käyttö näyttää tältä: bash$ md5sum LTu.wav de20da774658bd1b6ed2d4eb51b046c7 LTu.wav ^ o tämän voi siis tehdä ennen siirtoa, siirtää sekä tämän että äänen, ja generoida siirron kohdekoneessa uudestaan ja verrata oliko samat diff Jos verrattavat tiedostot ovat vierekkäin samassa koneessa, (tai näkyvillä verkon yli ikään kuin samassa koneessa, vrt. Windowsien c:-asema vs. verkolevyn r:-asema tms, tai esim. kovalevyllä ja CD:llä klassinen bitti bitiltä vertailu: bash$ diff LTu.wav LTu.ogg Binary files LTu.wav and LTu.ogg differ Praat Praat-kokeet jossa äänitiedoston näytteet muunnettiin esim. Excel-ystävälliseen tms. numeromuottoon (SoX:kin osaa) ja verrattiin ihan silmin tai uusin diff-komennoin kuten diff -u, sdiff -ls tai jopa vain Excelin molemmista piirtämiä eri värisiä käyriä tarkastellen B) Julkisiin avaimiin ja digitaalisiin allekirjoituksiin perustuva saadun tiedoston ja sen lähettäjän aitouden varmistus: PGP Kaupallinen, yleisimmin käytössä oleva. Pluginina toimimaan jopa Outlookissa. https://en.wikipedia.org/wiki/Pretty_Good_Privacy GPG OpenSource- ja GNU-lisenssillinen versio edellisestä gnupg.org

Eri käyttöjärjestelmät

Ylläolevat Posix / GNU -ohjelmat toimivat (tai ainakin saa helpohkosti toimimaan) MacOS X https://finkproject.org https://macports.org https://brew.sh Windowsit https://cygwin.com https://en.wikipedia.org/wiki/UnxUtils https://chocolatey.org https://git-scm.com Linuxit, BSD:t Usein mukana jakelussa suoraan, tai käännettävissä Praat