Na formáte záleží!

Tento článok sa snaží objasniť princípy kódovania audia a videa, prináša pohľad na ich najrozšírenejšie formáty a v neposlednom rade slúži ako základná pomôcka pri výbere toho správneho formátu pre vaše potreby.

V poslednom období sa často hovorí o rôznych typoch súborov a formátoch zvuku či videa. Zo svojich prenosných prehrávačoch si púšťame obľúbené skladby vo formátoch MP3, FLAC, či Vorbis bez toho, aby sme vôbec tušili čo tieto skratky znamenajú. U videa je situácia podobná, nakoľko aj tu existuje veľké množstvo formátov a z toho vyplývajúcich skratiek ako napríklad MPEG, H.264, HuffYUV, WMV a pod. Skúšali ste sa však zamyslieť nad tým, ako vôbec takýto digitálny obsah vzniká a čo mu predchádza?

Nenahraditeľný pomocníci

Formát súboru tak ako sa s ním stretávame dnes je konkrétny spôsob kódovania informácií za účelom ich uchovania v počítačovom súbore, alebo na nejakom inom médiu, napr. CD disku. Keďže pevný disk a v podstate akékoľvek pamäťové zariadenie, vie uchovávať iba bity, počítač musí poznať spôsob ako premieňať informácie na na nuly (0) a jednotky (1), a naopak. Tu nachádzajú svoje uplatnenie analógovo-číslicové (A/D) a číslicovo-analógové (D/A) prevodníky. D/A prevodníky sa dnes používajú všade tam kde je treba z digitálneho signálu vytvoriť signál analógový teda vo všetkých prehrávačoch (CD, MP3 prehrávače), zvukových kartách v počítačoch a pod. A/D prevodníky sa uplatňujú v nahrávacích štúdiách, v diktafónoch, či digitálnych telefónoch (GSM, UMTS). Najrozšírenejšou formou kódovania je pulzná kódová modulácia – PCM. Princíp PCM spočíva v pravidelnom odčítaní hodnoty signálu pomocou A/D prevodníka a jeho záznamu v binárnej podobe. Určujúcimi parametrami sú vzorkovacia frekvencia a jemnosť rozlíšenia jednotlivých hodnôt. Vzorkovacia frekvencia sa pohybuje od 44,1 kHz u zvukového CD po ešte vyššie hodnoty u profesionálnych záznamových zariadení a ovplyvňuje kvalitu reprodukovaného záznamu. U zvukového CD zaberie jedna minúta záznamu 44100 × 16 × 2 × 60 : 8 = 10 584 000 bajtov. Na osobným počítačoch sa preto na ukladanie zvukov používajú úspornejšie formáty MP3, FLAC a Vorbis, ktoré sú v porovnaní s PCM schopné dosiahnuť viac ako desaťnásobnej úspory miesta iba pri malom zhoršení subjektívnej kvality.

Dlhá cesta na CD – čko..

Než sa však z analógového signálu stane PCM zvuk, musí najprv prejsť vzorkovaním, kvantovaním a kódovaním. Vzorkovač zaznamenáva aktuálne hodnoty analógového signálu v pravidelných intervaloch s istou frekvenciou, kvantovaním sa namerané hodnoty “zaokrúhľujú” na najbližšiu úroveň amplitúdy každej vzorky. Pri kódovaní zvuku hudobného CD sa používa 16 bitové kódovanie – to znamená, že každá vzorka ja zakódovaná 16 – ticou jednotiek a núl – všetkých možných napäťových úrovní signálu. Čím je vyššia vzorkovacia frekvencia, tým kvalitnejší zvuk získame. Doteraz najkvalitnejší zvuk v CD kvalite so vzorkovacou frekvenciou 44,1kHz, 16bit stereo je prekonaný formátom DVD-Audio, kde vzorkovacia frekvencia je až 192kHz s 24 bitovým rozlíšením.

Moje meno je kodek

V súvislosti s formátmi zvuku sa často hovorí aj o kodekoch. Tie sa využívajú pre efektívnejšiu prácu s multimediálnymi súbormi a slúžia na zakódovanie a dekódovanie (na kompresiu a dekompresiu zvuku, alebo videa). Slovo kodek pochádza z angličtiny (codec) a je to skratka z dvoch slov COder a DECoder. Kodek. Je to ovládač, ktorý pridáva podporu pre nejaký konkrétny audio/video formát pre operačný systém. Vďaka kodeku operačný systém tento formát rozozná a dovolí ho prehrať (decode = dekóduje ho) alebo dovolí zmeniť ho na iný formát (encode = zakóduje). Kodek môže byť nejaký chip v prístroji, alebo softvérová knižnica v počítači, ktorá dokáže komprimovať aj dekomprimovať. Aby mohlo byť niečo nazvané kodekom musí spĺňať dve podmienky. Musí fungovať obidvoma smermi – kompresia aj dekompresia a musí sa jednať o konkrétnu implementáciu nejakého formátu. V záujme dosiahnuť čo najmenší objem dát výsledného streamu, sú často kodeky stratové. To znamená, že počas prevodu dochádza ku strate kvality signálu. Bezstratové kodeky sú lepšie, ale ich kompresné pomery sú malé. Príkladom kodeku je napr. DivX, XviD, LAME a pod. Niektoré multimediálne dátové toky musia obsahovať obidvoje – audio aj video dáta, a často aj nejakú formu metadát, ktoré zabezpečia ich synchronizáciu. Pre takýto multimediálny dátový tok je potrebné aby boli všetky tri zložky uložené spolu v prenositeľnej forme, v tzv. kontajneri. Príkladom takéhoto kontajnera je napr. AVI, ASF, MP4, MPG.

Formát – ktorý je najlepší?

Už vieme čo je kodek, poďme sa preto pozrieť na definíciu formátu. Aj formáty digitalizovaného zvuku delíme na nekomprimované (zaberajú na disku viac miesta) a komprimované, ktoré sú pri porovnateľnej kvalite menšie a sú vhodné aj na prenos po internete. Formáty bez kompresie ukladajú zvukové dáta v takej podobe ako boli získané digitalizáciou. Formáty s kompresiou tieto dáta ďalej upravujú. Kompresné formáty sa rozdeľujú na stratové a bezstratové. Bezstratové kompresie odstraňujú len istú časť dát tak, aby bolo možné vrátiť súbor do originálneho stavu. Stratové kompresie odstraňujú väčšie množstvo dát, takže sa nemôžeme vrátiť k pôvodnej kvalite. Príkladom stratového formátu je napr. MP3, Vorbis, WMA a pod. Príkladom bezstratového: FLAC, Monkey Audio, WavPack a iné.

Komprimujeme s rozumom

Jedným z najobľúbenejších a najrozšírenejších formátov komprimovaného zvuku je nepochybne stratový formát MP3. Najväčšou jeho slabinou je však jeho jasne obmedzená kvalita zvuku pri veľkosti výsledného súboru 10-16% z originálu. Kedže MP3 kompresia funguje na princípe znalostí psychoakustiky, v mp3 sa zložky zvuku ktoré by sme aj tak nepočuli, vymažú. Základná veličina, ktorá ovplyvňuje kvalitu mp3 súboru je tzv. bitrate – rýchlosť dátového toku. Čím je bitrate vyšší, tým je lepšia kvalita. U audio CD je bitrate 1,4 Mb/s, súbor mp3 s kvalitou považovanou za vyhovujúcu má bitrate 128 kb/s. Veľmi dôležitým faktorom vplývajúcim na kvalitu je aj vzorkovacia frekvencia. V tomto prípade platí, že čím vyššia frekvencia je použitá, tým vyššia bude aj kvalita výsledného súboru. V praxi sa bežne využíva frekvencia 44 kHz – voľba vyšších frekvencií je pre ľudské ucho prakticky nerozoznateľná.

Výber je na vás

Mnoho poslucháčov formát MP3 opúšťa a uprednostňuje bezstratový FLAC, ktorý žiadne dáta nevypúšťa. Princíp jeho fungovanie sa často prirovnáva ku komprimačným programom typu WinRAR alebo WinZip, s tým rozdielom, že FLAC pracuje s nižším stupňom kompresie (60-70 % z originálu) a špecializuje sa výhradne na hudbu. Medzi niekoľko funkčných a v praxi používaných systémov bezstratovej kompresie audio dát patrí aj systém Monkey’s Audio. Jeho najväčšou výhodou je dosahovanie tých najlepších kompresných pomerov pri stále prijateľných nárokoch na výkon počítača. Kvalita zvuku ostáva nezmenená, no veľkosť skomprimovaného súboru je takmer polovičná. Pri použití maximálnej kompresie tak možno jedno CD zredukovať na jeho polovičnú veľkosť. Na rozdiel od formátov so stratovou kompresiou je súbory možné kedykoľvek navrátiť do pôvodného stavu a to bez akejkoľvek straty kvality. Dobrou alternatívou bezstratovej kompresie dát je aj formát WawPack. Vďaka hybridnej kompresie dokáže vytvoriť dva súbory: jeden s kvalitnou kompresiou a druhý s dátami, ktoré boli stratené. Ďalšou jeho prednosťou je, že podporuje viackanálový zvuk a je preto vhodný najmä k ukladaniu hudby z DVD Audio diskov.

Značky: , , , , , , , , , ,

Pridaj komentár

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Zmeniť )

Twitter picture

You are commenting using your Twitter account. Log Out / Zmeniť )

Facebook photo

You are commenting using your Facebook account. Log Out / Zmeniť )

Connecting to %s


Follow

Get every new post delivered to your Inbox.