Čo určuje kvalitu digitálneho zvuku? Aké parametre určujú kvalitu digitálneho zvuku?

Domov / Záchrana dát

Zvuk je vlna šíriaca sa najčastejšie vo vzduchu, vode alebo inom prostredí s plynule sa meniacou intenzitou a frekvenciou.

Zvukové vlny (vibrácie vzduchu) môže človek vnímať pomocou sluchu vo forme zvuku, pričom rozlišuje hlasitosť a tón.

Čím viac intenzita zvuková vlna, čím hlasnejší je zvuk, čím vyššia je frekvencia vlny, tým vyššia je výška zvuku.


Závislosť hlasitosti, ako aj výšky zvuku, od intenzity a frekvencie zvukovej vlny

Hertz(označené Hz alebo Hz) - jednotka merania frekvencie periodických procesov (napríklad oscilácií). 1 Hz znamená jedno vykonanie takéhoto procesu za jednu sekundu: 1 Hz = 1/s.

Ak máme 10 Hz, znamená to, že máme desať vykonaní takéhoto procesu za jednu sekundu.

Ľudské ucho dokáže vnímať zvuk pri frekvenciách od 20 vibrácií za sekundu (20 Hz, nízky zvuk) do 20 000 vibrácií za sekundu (20 kHz, vysoký zvuk).

Okrem toho môže človek vnímať zvuk v širokom rozsahu intenzít, v ktorých je maximálna intenzita 1014-krát väčšia ako minimálna (stotisíc miliárd-krát).

Na meranie hlasitosti zvuku bola vynájdená a použitá špeciálna jednotka " decibel" (dB)

Zníženie alebo zvýšenie hlasitosti zvuku o 10 dB zodpovedá zníženiu alebo zvýšeniu intenzity zvuku 10-násobne.

Hlasitosť zvuku v decibeloch


Aby počítačové systémy mohli spracovať zvuk, musí byť nepretržitý zvukový signál prevedený do digitálnej, diskrétnej formy pomocou časového vzorkovania.

Na tento účel sa súvislá zvuková vlna rozdelí na samostatné malé dočasné úseky a pre každý takýto úsek sa nastaví určitá hodnota intenzity zvuku.

Plynulá závislosť hlasitosti zvuku od času A(t) je teda nahradená diskrétnou sekvenciou úrovní hlasitosti. Na grafe to vyzerá ako nahradenie hladkej krivky sekvenciou „krokov“.


Časové vzorkovanie zvuku


Mikrofón pripojený k zvukovej karte sa používa na nahrávanie analógového zvuku a jeho prevod do digitálnej podoby.

Čím hustejšie sú jednotlivé pruhy umiestnené na grafe, tým lepšia bude kvalita pôvodného zvuku.

Kvalita výsledného digitálneho zvuku závisí od počtu meraní úrovne hlasitosti zvuku za jednotku času, teda vzorkovacej frekvencie.

Vzorkovacia frekvencia zvuku je počet meraní hlasitosti zvuku za jednu sekundu.

Čím viac meraní sa vykoná za jednu sekundu (čím vyššia je vzorkovacia frekvencia), tým presnejšie „rebrík“ digitálneho audio signálu sleduje krivku analógového signálu.

Každému „kroku“ na grafe je priradená špecifická hodnota hlasitosti zvuku. Úrovne hlasitosti zvuku možno považovať za súbor možných stavov N(gradácie), na kódovanie je potrebné určité množstvo informácií ja, čo sa nazýva hĺbka kódovania zvuku.

Hĺbka kódovania zvuku je množstvo informácií potrebných na zakódovanie jednotlivých úrovní hlasitosti digitálneho zvuku.

Ak je známa hĺbka kódovania, počet úrovní hlasitosti digitálneho zvuku možno vypočítať pomocou všeobecného vzorca N=21.

Nech je napríklad hĺbka kódovania zvuku 16 bitov, v takom prípade sa počet úrovní hlasitosti zvuku rovná:

N = 2 I = 216 = 65 536.

Počas procesu kódovania je každej úrovni hlasitosti priradený vlastný 16-bitový binárny kód, najnižšia úroveň zvuku bude zodpovedať kódu 000000000000000 a najvyššia - 111111111111111.

Digitalizovaná kvalita zvuku


Čím vyššia je vzorkovacia frekvencia a hĺbka kódovania zvuku, tým kvalitnejšie bude znieť digitalizovaný zvuk a tým lepšie môžete digitalizovaný zvuk priblížiť pôvodnému zvuku.

Najnižšia kvalita digitalizovaného zvuku, zodpovedajúca kvalite telefonickej komunikácie, sa dosahuje pri vzorkovacej frekvencii 8000-krát za sekundu, hĺbke vzorkovania 8 bitov a zázname jednej zvukovej stopy (mono režim).

Najvyššiu kvalitu digitalizovaného zvuku, zodpovedajúcu kvalite audio CD, dosahuje vzorkovacia frekvencia 48 000-krát za sekundu, hĺbka vzorkovania 16 bitov a nahrávanie dvoch zvukových stôp (režim stereo).

Na to treba pamätať čím vyššia je kvalita digitálneho zvuku, tým väčší je informačný objem zvukového súboru.

Môžete jednoducho odhadnúť objem informácií digitálneho stereo zvukového súboru s dĺžkou zvuku 1 sekunda s priemernou kvalitou zvuku (16 bitov, 24 000 meraní za sekundu). Na tento účel je potrebné hĺbku kódovania vynásobiť počtom meraní za sekundu a vynásobiť 2 kanálmi (stereo zvuk):

16 bitov × 24 000 × 2 = 768 000 bitov = 96 000 bajtov = 93,75 kB.

Zvukové editory


Zvukové editory umožňujú zvuk nielen nahrávať a prehrávať, ale aj upravovať. Najvýraznejšie možno pokojne nazvať, ako napr Sony Sound Forge, Adobe Audition, GoldWave a ďalšie.

Digitalizovaný zvuk je vo zvukových editoroch prezentovaný v prehľadnej vizuálnej podobe, takže operácie kopírovania, presúvania a odstraňovania častí zvukovej stopy možno jednoducho vykonávať pomocou počítačovej myši.

Okrem toho sa môžete prekrývať, prekrývať audio stopy na seba (mixovať zvuky) a aplikovať rôzne akustické efekty (echo, prehrávanie v opačnom smere atď.).

Zvukové editory vám umožňujú zmeniť kvalitu digitálneho zvuku a veľkosť výsledného zvukového súboru zmenou vzorkovacej frekvencie a hĺbky kódovania. Digitalizovaný zvuk je možné uložiť nekomprimovaný do zvukových súborov v univerzálnom formáte WAV (formát Microsoft) alebo v komprimovaných formátoch OGG a MP3 (stratová kompresia).
Dostupné sú aj menej bežné, ale pozoruhodné formáty bezstratovej kompresie.

Pri ukladaní zvuku v komprimovaných formátoch sa vyradia zvukové frekvencie s nízkou intenzitou, ktoré sú pre ľudské vnímanie nepočuteľné a nepostrehnuteľné („nadmerné“), ktoré sa časovo zhodujú s frekvenciami zvuku s vysokou intenzitou. Použitie tohto formátu vám umožňuje komprimovať zvukové súbory desiatky krát, ale vedie k nezvratnej strate informácií (súbory nie je možné obnoviť v pôvodnej, pôvodnej podobe).

Hlavné parametre ovplyvňujúce kvalitu digitálneho zvukového záznamu sú:

§ Bitová kapacita ADC a DAC.

§ Vzorkovacie frekvencie ADC a DAC.

§ Jitter ADC a DAC

§ Oversampling

Dôležité sú aj parametre analógovej cesty zariadení na digitálny záznam zvuku a reprodukciu zvuku:

§ Odstup signálu od šumu

§ Faktor harmonického skreslenia

§ Intermodulačné skreslenie

§ Nerovnomerné amplitúdovo-frekvenčné charakteristiky

§ Vzájomné prenikanie kanálov

§ Dynamický rozsah

Technológia digitálneho záznamu zvuku

Digitálne nahrávanie zvuku sa v súčasnosti vykonáva v nahrávacích štúdiách, ktoré spravuje osobné počítače a iné drahé a kvalitné zariadenia. Pomerne široko rozvinutý je aj koncept „domáceho štúdia“, v ktorom sa používa profesionálne a poloprofesionálne nahrávacie zariadenie, ktoré vám umožňuje vytvárať vysokokvalitné nahrávky doma.

Zvukové karty sa používajú ako súčasť počítačov, ktoré vykonávajú spracovanie vo svojich ADC a DAC - najčastejšie v 24 bitoch a 96 kHz ďalšie zvýšenie bitovej hĺbky a vzorkovacej frekvencie prakticky nezvyšuje kvalitu záznamu;

Existuje celá trieda počítačových programov - zvukových editorov, ktoré vám umožňujú pracovať so zvukom:

§ nahrávanie prichádzajúceho audio streamu

§ vytvárať (generovať) zvuk

§ zmeniť existujúcu nahrávku (pridať vzorky, zmeniť zafarbenie, rýchlosť zvuku, vystrihnúť časti atď.)

§ prepísať z jedného formátu do druhého

§ konvertovať konvertovať rôzne zvukové kodeky

Niektorí jednoduché programy, umožňujú len konverziu formátov a kodekov.

Typy digitálnych audio formátov

Existujú rôzne koncepty zvukového formátu.

Formát na reprezentáciu zvukových údajov v digitálnej forme závisí od metódy kvantovania používanej digitálno-analógovým prevodníkom (DAC). V audiotechnike sú v súčasnosti najbežnejšie dva typy kvantizácie:

§ pulzná kódová modulácia

§ sigma-delta modulácia

Kvantovacia bitová hĺbka a vzorkovacia frekvencia sa často označujú pre rôzne zariadenia na záznam a prehrávanie zvuku ako formát digitálnej audio prezentácie (24 bit/192 kHz; 16 bit/48 kHz).

Formát súboru určuje štruktúru a funkcie prezentácie zvukových údajov, keď sú uložené na pamäťovom zariadení v počítači. Na odstránenie redundancie zvukových údajov sa na kompresiu zvukových údajov používajú zvukové kodeky. Existujú tri skupiny formátov zvukových súborov:

§ Nekomprimované zvukové formáty ako WAV, AIFF

§ audio formáty s bezstratovou kompresiou (APE, FLAC)

§ audio formáty využívajúce stratovú kompresiu (mp3, ogg)

Modulárne formáty hudobných súborov vynikajú. Vytvorené synteticky alebo zo vzoriek vopred nahraných živých nástrojov slúžia najmä na tvorbu modernej elektronickej hudby (MOD). Patrí sem aj formát MIDI, ktorý nie je zvukovým záznamom, no zároveň pomocou sekvencera umožňuje nahrávať a prehrávať hudbu pomocou špecifickej sady príkazov v textovej podobe.

Formáty digitálnych zvukových nosičov sa používajú ako pre masovú distribúciu zvukových záznamov (CD, SACD), tak aj pri profesionálnom zázname zvuku (DAT, minidisk).

Pri systémoch priestorového zvuku je tiež možné rozlíšiť zvukové formáty, ktoré sú najmä viackanálovým zvukovým sprievodom filmov. Takéto systémy majú celé rodiny formátov od dvoch veľkých konkurenčných spoločností, Digital Theater Systems Inc. - DTS a Dolby Laboratories Inc. - Dolby Digital.

Formát sa tiež nazýva počet kanálov vo viackanálových zvukových systémoch (5.1; 7.1). Spočiatku bol takýto systém vyvinutý pre kiná, ale následne bol rozšírený softvérový kodek

Zvukový kodek na úrovni programu

§ G.723.1 - jeden zo základných kodekov pre aplikácie IP telefónie

§ G.729 je proprietárny úzkopásmový kodek, ktorý sa používa na reprezentáciu digitálnej reči

§ Internet Low Bitrate Codec (iLBC) – populárny bezplatný kodek pre IP telefóniu (najmä pre Skype a Google Talk)

Zvukový kodek(angličtina) Zvukový kodek; audio kodér/dekodér) - počítačový program resp hardvér, určený na kódovanie alebo dekódovanie zvukových údajov.

Softvérový kodek

Zvukový kodek na úrovni programu je špecializovaná počítačový program, kodek, ktorý komprimuje (komprimuje) alebo dekomprimuje (dekomprimuje) digitálne zvukové údaje podľa zvukového formátu súboru alebo formátu streamovaného zvuku. Úlohou audio kodeku ako kompresora je poskytnúť audio signál so špecifikovanou kvalitou/presnosťou a najmenšou možnou veľkosťou. Kompresia znižuje množstvo priestoru potrebného na uloženie zvukových údajov a môže tiež znížiť šírku pásma kanála, cez ktorý sa zvukové údaje prenášajú. Väčšina audio kodekov je implementovaná ako softvérové ​​knižnice, ktoré spolupracujú s jedným alebo viacerými audio prehrávačmi, ako je QuickTime Player, XMMS, Winamp, VLC media player, MPlayer alebo Windows Media Player.

Populárne softvérové ​​zvukové kodeky podľa aplikácie:

§ MPEG-1 Layer III (MP3) – proprietárny kodek pre zvukové nahrávky (hudba, audioknihy atď.) pre počítačové vybavenie a digitálnych prehrávačov

§ Ogg Vorbis (OGG) - druhý najpopulárnejší formát, široko používaný v počítačové hry a v sieťach na zdieľanie súborov na prenos hudby

§ GSM-FR - prvý digitálny štandard kódovanie reči používané v telefónoch GSM

§ Adaptive multi rate (AMR) – záznam ľudského hlasu mobilné telefóny a ďalšie mobilné zariadenia

Zvuk– vlna s plynule sa meniacou amplitúdou a frekvenciou. Čím väčšia je amplitúda, tým je pre človeka hlasnejšia, čím väčšia je frekvencia, tým vyšší je tón.

Digitálny zvuk je analógový zvukový signál reprezentovaný diskrétnymi číselnými hodnotami jeho amplitúdy.

V jadre kódovanie zvuku Používanie počítačov je proces premeny vibrácií vzduchu na vibrácie elektrického prúdu a následné vzorkovanie analógového elektrického signálu.

Kódovanie a reprodukcia zvukových informácií sa vykonáva pomocou špeciálne programy(editori nahrávky).

Kvalita reprodukcie zakódovaného zvuku závisí od vzorkovacej frekvencie a jej rozlíšenia.

Digitalizácia zvuku - (alebo analógovo-digitálna konverzia) - technológia na konverziu analógu zvukový signál v digitálnej forme, ktorá sa vykonáva meraním amplitúdy signálu s určitým časovým krokom a následným zaznamenaním získaných hodnôt v číselnej forme.

Digitalizácia zvuku zahŕňa dva procesy:

    proces odberu vzoriek (vzorkovanie signálu v priebehu času);

    kvantizačný proces podľa amplitúdy.

Proces vzorkovania času - proces získavania hodnôt signálu, ktoré sú prevedené s určitým časovým krokom - vzorkovací krok .

Nazýva sa počet meraní veľkosti signálu vykonaných za jednu sekundu vzorkovacia frekvencia alebo vzorkovacia frekvencia, alebo vzorkovacia frekvencia(z anglického „ampling“ - „sampling“).

Čím menší je krok vzorkovania, tým vyššia je vzorkovacia frekvencia a tým presnejšie zobrazenie signálu dostaneme.

Proces amplitúdové kvantovanie - proces nahradenia skutočných hodnôt amplitúdy signálu hodnotami približnými s určitou presnosťou.

Kvantovanie– odber vzoriek podľa úrovne.

Predpokladá sa, že kvantizačné chyby vyplývajúce zo 16-bitovej kvantizácie zostávajú pre poslucháča takmer nepostrehnuteľné.

Každá z 2 N možných úrovní sa nazýva úroveň kvantizácie, a vzdialenosť medzi dvoma najbližšími kvantizačnými úrovňami sa nazýva kvantizačný krok.

Volá sa číslo N kvantizačná bitová hĺbka a čísla získané v dôsledku zaokrúhlenia hodnôt amplitúdy sú počíta alebo vzorky(z anglického „vzorka“ - „namerané“).

Kvantizačné chyby vyplývajúce zo 16-bitovej kvantizácie zostávajú pre poslucháča takmer neviditeľné.

Digitalizácia zvuku – zhrnutie:

Výhody: môžete zakódovať akýkoľvek zvuk (vrátane hlasu, píšťalky, šušťania, ...)

nevýhody: dochádza k strate informácií, veľkému objemu súborov

Hlavné parametre ovplyvňujúce kvalitu zvuku:

1. Bitová hĺbka- rozmer (počet bitov informácií kódovaných/dekódovaných pomocou ADC a DAC).

2. Vzorkovacia frekvencia- vzorkovacia frekvencia časovo spojitého signálu počas jeho vzorkovania (ADC), meraná v Hertzoch.

3. Hluk- nežiaduce fázové a/alebo frekvenčné náhodné odchýlky prenášaného signálu

Formáty zvukových súborov

      WAV(Tvar vlny audio formát), často bez kompresie (veľkosť!)

      MP3 (MPEG-1 Zvuk Vrstva 3 , kompresia zohľadňujúca ľudské vnímanie)

      A.A.C. (Pokročilé kódovanie zvuku, 48 kanálov, kompresia)

      WMA (Windows Media Audio, streamovanie zvuku, kompresia)

      OGG (Ogg Vorbis, otvorený formát, kompresia)

Odhaľovanie populárnych mýtov o digitálnom zvuku.

2017-10-01T15:27

2017-10-01T15:27

Audiofilský softvér

Poznámka: Pre lepšie pochopenie nižšie uvedeného textu vrelo odporúčam oboznámiť sa so základmi digitálneho zvuku.

Mnohé z nižšie uvedených bodov sú zahrnuté aj v mojej publikácii „Ešte raz o smutnej pravde: odkiaľ skutočne pochádza dobrý zvuk? .

Čím vyššia je bitová rýchlosť, tým lepšia je kvalita stopy.

Nie vždy je to tak. Najprv vám dovoľte pripomenúť, čo je bitray T(bitová rýchlosť, nie bitraid). Toto je vlastne rýchlosť prenosu dát v kilobitoch za sekundu počas prehrávania. To znamená, že ak vezmeme veľkosť stopy v kilobitoch a vydelíme ju trvaním v sekundách, dostaneme jej bitrate – tzv. file-based bitrate (FBR), zvyčajne sa príliš nelíši od bitovej rýchlosti audio streamu (dôvodom rozdielov je prítomnosť metadát v stope – tagy, vložené obrázky atď.).

Teraz si vezmime príklad: bitová rýchlosť nekomprimovaného zvuku PCM zaznamenaného na bežnom zvukovom disku CD sa vypočíta takto: 2 (kanály) × 16 (bitov na vzorku) × 44100 (vzorky za sekundu) = 1411200 (bps) = 1411,2 kbps. Teraz vezmeme a skomprimujeme stopu pomocou akéhokoľvek bezstratového kodeku („stratový“ - „bezstratový“, t. j. taký, ktorý nevedie k strate akýchkoľvek informácií), napríklad kodek FLAC. V dôsledku toho dostaneme bitrate nižší ako pôvodný, ale kvalita zostane nezmenená - tu je vaše prvé vyvrátenie.

Tu sa oplatí dodať ešte jednu vec. Výstupná bitová rýchlosť pri bezstratovej kompresii môže byť veľmi odlišná (spravidla je však nižšia ako u nekomprimovaného zvuku) - závisí to od zložitosti komprimovaného signálu, presnejšie od redundancie dát. Jednoduchšie signály sa teda budú komprimovať lepšie (t. j. máme menšiu veľkosť súboru za rovnakú dobu => nižší bitrate) a zložitejšie sa komprimujú horšie. To je dôvod, prečo má bezstratová klasická hudba nižší bitrate ako napríklad rock. Treba ale zdôrazniť, že bitrate tu v žiadnom prípade nie je ukazovateľom kvality zvukového materiálu.

Teraz si povedzme o stratovej kompresii (so stratami). Najprv musíte pochopiť, že existuje veľa rôznych kódovačov a formátov a dokonca aj v rámci toho istého formátu sa kvalita kódovania rôznych kódovačov môže líšiť (napríklad QuickTime AAC kóduje oveľa lepšie ako zastaraný FAAC), nehovoriac o nadradenosť moderných formátov (OGG Vorbis, AAC, Opus) nad MP3. Jednoducho povedané, z dvoch rovnakých stôp zakódovaných rôznymi kódovačmi s rovnakým bitrate bude jedna znieť lepšie a druhá horšie.

Okrem toho existuje niečo ako horná obálka. To znamená, že môžete zobrať skladbu vo formáte MP3 s bitovou rýchlosťou 96 kbps a previesť ju na MP3 320 kbps. Nielenže sa kvalita nezlepší (veď dáta stratené pri predošlom 96 kbit/s kódovaní sa nedajú vrátiť), dokonca sa ešte zhorší. Tu stojí za to zdôrazniť, že v každej fáze stratového kódovania (s akoukoľvek bitovou rýchlosťou a akýmkoľvek kódovačom) sa do zvuku vnáša určité skreslenie.

A ešte viac. Je tu ešte jedna nuansa. Ak je povedzme bitová rýchlosť zvukového toku 320 kbps, neznamená to, že všetkých 320 kbps bolo vynaložených na kódovanie práve v tej sekunde. Toto je typické pre kódovanie s konštantnou bitovou rýchlosťou a pre prípady, keď človek v nádeji na maximálnu kvalitu núti konštantnú bitovú rýchlosť, aby bola príliš vysoká (napríklad nastavenie 512 kbps CBR pre Nero AAC). Ako je známe, počet bitov pridelených konkrétnemu rámcu je regulovaný psychoakustickým modelom. Ale v prípade, že alokované množstvo je oveľa nižšie ako nastavený bitrate, ani zásobník bitov nešetrí (prečítajte si o pojmoch v článku „Čo sú CBR, ABR, VBR?“) - v dôsledku toho sme zbytoční „nulové bity“, ktoré jednoducho „dokončia“ » veľkosť rámca na požadovanú veľkosť (t. j. zväčšia veľkosť toku na špecifikovanú hodnotu). Mimochodom, to sa dá ľahko skontrolovať - ​​komprimujte výsledný súbor pomocou archivátora (najlepšie 7z) a pozrite sa na kompresný pomer - čím je vyšší, tým viac nulových bitov (pretože vedú k redundancii), tým viac plytvaného miestom.

Stratové kodeky (MP3 a iné) sú schopné vyrovnať sa s modernou elektronickou hudbou, ale nie sú schopné kvalitného kódovania klasickej (akademickej), živej, inštrumentálnej hudby

„Iróniou osudu“ je, že v skutočnosti je všetko presne naopak. Ako je známe, akademická hudba sa v drvivej väčšine prípadov riadi melodickými a harmonickými princípmi, ako aj inštrumentálnou skladbou. Z matematického hľadiska z toho vyplýva pomerne jednoduchá harmonická skladba hudby. Prevaha konsonancií teda vytvára menší počet sekundárnych harmonických: napríklad pre kvintu (interval, v ktorom sa základné frekvencie dvoch zvukov líšia jedenapolkrát), každá druhá harmonická bude spoločná pre tieto dva zvuky. , pre kvartu, kde sa frekvencie líšia o jednu tretinu - každá tretina atď. Okrem toho prítomnosť pevných frekvenčných pomerov v dôsledku použitia rovnakého temperamentu tiež zjednodušuje spektrálne zloženie klasickej hudby. Živé inštrumentálne zloženie klasiky určuje absenciu šumu charakteristického pre elektronickú hudbu, skreslenie, prudké skoky v amplitúde a absenciu nadbytku vysokofrekvenčných komponentov.

Vyššie uvedené faktory vedú k tomu, že klasickú hudbu je oveľa jednoduchšie komprimovať, predovšetkým čisto matematicky. Ak si pamätáte, matematická kompresia funguje tak, že eliminuje redundanciu (popisuje podobné časti informácií pomocou menšieho počtu bitov) a tiež vytvára predpovede (aka. prediktory predpovedať správanie signálu a potom sa zakóduje iba odchýlka skutočného signálu od predpovedaného - čím presnejšie sa zhodujú, tým menej bitov je potrebných na kódovanie). IN v tomto prípade Relatívne jednoduché spektrálne zloženie a harmónia určujú vysokú redundanciu, ktorej eliminácia poskytuje značný stupeň kompresie a malý počet zhlukov a šumových zložiek (čo sú náhodné a nepredvídateľné signály) určuje dobrú matematickú predvídateľnosť veľkej väčšiny informácií. A to ani nehovorím o relatívne nízkej priemernej hlasitosti klasických skladieb a častých intervaloch ticha, pre ktoré nie sú potrebné prakticky žiadne informácie na kódovanie. Vďaka tomu dokážeme bezstratovo komprimovať napríklad nejakú sólovú inštrumentálnu hudbu na bitrate pod 320 kbps (kódery TAK a OFR sú toho celkom schopné).

Takže po prvé, faktom je, že matematická kompresia, ktorá je základom bezstratového kódovania, je tiež jednou z fáz stratového kódovania (prečítajte si Pochopenie kódovania MP3). A po druhé, keďže stratový využíva Fourierovu transformáciu (rozklad signálu na harmonické), jednoduchosť spektrálneho zloženia dokonca dvojnásobne uľahčuje prácu kodéra. Výsledkom je, že pri porovnávaní originálnych a zakódovaných ukážok klasickej hudby v slepom teste s prekvapením zistíme, že nenájdeme žiadne rozdiely, a to ani pri relatívne nízkej bitovej rýchlosti. A vtipné je, že keď začneme úplne znižovať bitovú rýchlosť kódovania, prvá vec, ktorá odhalí rozdiely, je šum v pozadí v nahrávke.

Čo sa týka elektronickej hudby, kodéri to majú veľmi ťažké: šumové zložky majú minimálnu redundanciu a spolu s ostrými skokmi (nejaké pilovité impulzy) ide o extrémne nepredvídateľné signály (pre kodérov, ktorí sú „šití“ na prirodzené zvuky, ktoré sa správajú úplne inak), priama a inverzná Fourierova transformácia s odmietnutím jednotlivých harmonických psychoakustickým modelom nevyhnutne vytvára pre- a post-echo efekty, ktorých počuteľnosť nie je vždy pre kodéra ľahké posúdiť... Pridajte k tomu vysoká úroveň HF komponentov - a dostanete veľké množstvo zabijácke vzorky, s ktorými si pri stredne nízkych bitratech nevedia poradiť ani tie najpokročilejšie kódovače, napodiv, najmä medzi elektronickou hudbou.

Zábavné sú aj názory „skúsených poslucháčov“ a hudobníkov, ktorí pri úplnom nepochopení princípov stratového kódovania začnú tvrdiť, že počujú, ako sa nástroje v hudbe po kódovaní začínajú rozladiť, frekvencie plávajú , atď. Toto môže stále platiť pre predpotopné kazetové prehrávače s detonáciou, ale v digitálnom zvuku je všetko presné: frekvenčná zložka buď zostane, alebo sa zahodí, jednoducho nie je potrebné posunúť tonalitu. Navyše: prítomnosť hudobného ucha u človeka vôbec neznamená, že má dobrý frekvenčný sluch (napríklad schopnosť vnímať frekvencie >16 kHz, ktorá vekom mizne) a vôbec mu neuľahčuje hľadať artefakty stratového kódovania, keďže skreslenie Tieto majú veľmi špecifický charakter a vyžadujú si skúsenosť slepého porovnávania stratového zvuku – treba vedieť, čo a kde hľadať.

DVD-Audio znie lepšie ako Audio CD (24 bitov oproti 16, 96 kHz oproti 44,1 atď.)

Žiaľ, ľudia sa väčšinou pozerajú len na čísla a veľmi zriedka sa zamýšľajú nad vplyvom konkrétneho parametra na objektívnu kvalitu.

Najprv zvážime bitovú hĺbku. Tento parameter nie je zodpovedný za nič iné ako za dynamický rozsah, t.j. rozdiel medzi najtichším a najhlasnejším zvukom (v dB). V digitálnom zvuku je maximálna úroveň 0 dBFS (FS - plný rozsah) a minimum je obmedzené úrovňou šumu, t.j. v skutočnosti sa dynamický rozsah v absolútnej hodnote rovná úrovni šumu. Pre 16-bitový zvuk sa dynamický rozsah vypočíta ako 20 × log 10 2 16, čo sa rovná 96,33 vB. Zároveň je dynamický rozsah symfonického orchestra až 75 dB (väčšinou okolo 40-50 dB).

Teraz si predstavme reálne podmienky. Hladina hluku v miestnosti je cca 40 dB (nezabúdajte, že dB je relatívna hodnota. V tomto prípade sa prah počuteľnosti berie ako 0 dB), maximálna hlasitosť hudby dosahuje 110 dB (aby sa predišlo nepohodliu) – my dosiahnete rozdiel 70 dB. Ukazuje sa teda, že dynamický rozsah viac ako 70 dB je v tomto prípade jednoducho zbytočný. Teda s rozsahom nad resp hlasné zvuky dosiahne prah bolesti, príp tiché zvuky budú pohltené okolitým hlukom. Je veľmi ťažké dosiahnuť úroveň okolitého hluku menšiu ako 15 dB (keďže hlasitosť ľudského dýchania a iného hluku spôsobeného ľudskou fyziológiou je na tejto úrovni), výsledkom je rozsah 95 dB pre počúvanie hudby. úplne postačovať.

Teraz o vzorkovacej frekvencii (vzorkovacia frekvencia, vzorkovacia frekvencia). Tento parameter riadi časovú vzorkovaciu frekvenciu a priamo ovplyvňuje maximálnu frekvenciu signálu, ktorú možno opísať danou zvukovou reprezentáciou. Podľa Kotelnikovovej vety sa rovná polovici vzorkovacej frekvencie. To znamená, že pre obvyklú vzorkovaciu frekvenciu 44100 Hz je maximálna frekvencia zložiek signálu 22050 Hz. Maximálna frekvencia. ktorý je vnímaný ľudským uchom je mierne nad 20 000 Hz (a potom pri narodení; ako starneme, prah klesá na 16 000 Hz).

Najlepšie túto tému je popísané v článku 24/192 stiahnutí – prečo nedávajú zmysel.

Rôzne softvérové ​​prehrávače znejú odlišne (napr. foobar2000 je lepší ako Winamp atď.)

Aby ste pochopili, prečo to tak nie je, musíte pochopiť, čo je softvérový prehrávač. V podstate ide o dekodér, obslužné programy (voliteľné), výstupný plugin (do jedného z rozhraní: ASIO, DirectSound, WASAPI atď.) a samozrejme GUI ( GUI používateľ). Keďže dekodér v 99,9 % prípadov funguje podľa štandardného algoritmu a výstupný plug-in je len súčasťou programu, ktorý prenáša stream na zvukovú kartu cez jedno z rozhraní, jediným dôvodom rozdielov môže byť psovodov. Faktom však je, že obslužné nástroje sú zvyčajne predvolene vypnuté (alebo by mali byť vypnuté, pretože hlavná vec je dobrý hráč- byť schopný sprostredkovať zvuk v jeho „nepôvodnej“ podobe). V dôsledku toho tu môže byť jediný predmet porovnávania možnosti spracovanie a výstup, ktoré mimochodom veľmi často nie sú vôbec potrebné. Ale aj keď existuje taká potreba, potom ide o porovnanie procesorov a nie prehrávačov.

Rôzne verzie ovládačov znejú odlišne

Toto tvrdenie je založené na banálnej neznalosti princípov fungovania zvukovej karty. Vodič je softvér, potrebné pre efektívnu interakciu zariadenia s operačný systém, ktorý tiež zvyčajne poskytuje grafické používateľské rozhranie, ktoré vám umožní spravovať zariadenie, jeho nastavenia atď. Ovládač zvukovej karty zaisťuje, že zvuková karta bude rozpoznaná ako zvuková karta Zariadenia so systémom Windows, informuje OS o formátoch podporovaných kartou, zabezpečuje prenos nekomprimovaného PCM (vo väčšine prípadov) streamu na kartu a tiež umožňuje prístup k nastaveniam. Okrem toho, ak existuje softvérové ​​​​spracovanie (pomocou nástrojov CPU), ovládač môže obsahovať rôzne DSP (procesory). Preto po prvé, ak sú efekty a spracovanie vypnuté, ak ovládač neposkytuje presný prenos PCM na kartu, považuje sa to za hrubú chybu, kritickú chybu. A toto sa stáva extrémne zriedkavé. Na druhej strane rozdiely medzi ovládačmi môžu byť v aktualizácii algoritmov spracovania (prevzorkovače, efekty), aj keď sa to tiež nestáva často. Navyše dosiahnuť najvyššej kvality efekty a akékoľvek spracovanie ovládačov by malo byť stále vylúčené.

Aktualizácie ovládačov sú teda zamerané najmä na zlepšenie stability a odstránenie chýb pri spracovaní. Ani jedno ani druhé v našom prípade neovplyvňuje kvalitu prehrávania, preto v 999 prípadoch z 1000 nemá ovládač na zvuk žiadny vplyv.

Licencované zvukové CD znejú lepšie ako ich kópie

Ak sa počas kopírovania nevyskytli žiadne (závažné) chyby čítania/zápisu a optická mechanika zariadenie, na ktorom sa bude kopírovací disk prehrávať, nie sú problémy s jeho čítaním, potom je takéto tvrdenie chybné a ľahko vyvrátiteľné.

Režim kódovania Stereo poskytuje lepšiu kvalitu ako režim Joint Stereo

Táto mylná predstava sa týka hlavne LAME MP3, pretože všetky moderné kódovače (AAC, Vorbis, Musepack) používajú iba Spoločný stereo režim (a to už niečo hovorí)

Na začiatok je vhodné spomenúť, že režim Joint Stereo sa úspešne používa s bezstratovou kompresiou. Jeho podstata spočíva v tom, že pred kódovaním sa signál rozloží na súčet pravého a ľavého kanála (Mid) a ich rozdielu (Side) a následne dôjde k samostatnému kódovaniu týchto signálov. V limite (pre rovnakú informáciu v pravom a ľavom kanáli) sa dosiahne dvojnásobná úspora dát. A keďže vo väčšine hudby sú informácie v pravom a ľavom kanáli dosť podobné, táto metóda sa ukazuje ako veľmi účinná a umožňuje výrazne zvýšiť kompresný pomer.

Pri strate je princíp rovnaký. Ale tu, v režime konštantnej bitovej rýchlosti, sa kvalita fragmentov s podobnými informáciami v dvoch kanáloch zvýši (v limite, dvojnásobne) a pre režim VBR na takýchto miestach sa bitová rýchlosť jednoducho zníži (nezabudnite, že hlavnou úlohou režimu VBR je stabilne udržiavať špecifikovanú kvalitu kódovania s použitím najnižšej možnej bitovej rýchlosti). Keďže počas stratového kódovania má prioritu (pri distribúcii bitov) súčet kanálov, aby sa predišlo zhoršeniu stereo panorámy, dynamické prepínanie medzi spoločným stereo (stred/strana) a bežným (ľavý/pravý) rámovým stereom. režimov. Mimochodom, dôvodom tejto mylnej predstavy bola nedokonalosť prepínacieho algoritmu v starších verziách LAME, ako aj prítomnosť režimu Forced Joint, v ktorom nie je automatické prepínanie. IN najnovšie verzie Režim LAME Joint je štandardne povolený a neodporúča sa ho meniť.

Čím širšie spektrum, tým lepšia kvalita záznamu (o spektrogramoch, auCDtect a frekvenčnom rozsahu)

V súčasnosti je na fórach, žiaľ, veľmi bežné merať kvalitu stopy „pravítkom pomocou spektrogramu“. Je zrejmé, že kvôli jednoduchosti tejto metódy. Ako však ukazuje prax, v skutočnosti je všetko oveľa komplikovanejšie.

A tu je tá vec. Spektrogram vizuálne demonštruje rozloženie výkonu signálu na frekvenciách, ale nemôže poskytnúť úplný obraz o zvuku nahrávky, prítomnosti skreslení a kompresných artefaktov v ňom. Teda v podstate všetko, čo sa dá zo spektrogramu určiť, je frekvenčný rozsah(a čiastočne - hustota spektra v oblasti HF). To znamená, že v najlepšom prípade možno pomocou analýzy spektrogramu identifikovať konverziu smerom nahor. Porovnávať spektrogramy stôp získaných kódovaním rôznymi kodérmi s originálom je úplná absurdita. Áno, rozdiely v spektre sa dajú identifikovať, ale určiť, či (a do akej miery) ich bude ľudské ucho vnímať, je takmer nemožné. Netreba zabúdať, že úlohou stratového kódovania je zabezpečiť nerozoznateľný výsledok ľudské ucho z originálu (nie od oka).

To isté platí pre hodnotenie kvality kódovania analýzou výstupných stôp pomocou programu auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - to sú len shelly pre jedinečný konzolový program auCDtect). Algoritmus auCDtect tiež skutočne analyzuje frekvenčný rozsah a umožňuje vám iba určiť (s určitým stupňom pravdepodobnosti), či bola v niektorom zo štádií kódovania použitá kompresia MPEG. Algoritmus je prispôsobený pre MP3, takže je ľahké ho „oklamať“ pomocou kodekov Vorbis, AAC a Musepack, takže aj keď program napíše „100% CDDA“, neznamená to, že zakódovaný zvuk je 100% identický s pôvodným.

A návratom priamo k spektrám. Medzi niektorými „nadšencami“ je tiež populárna túžba deaktivovať dolnopriepustný filter v kódovači LAME za každú cenu. Existuje jasný nedostatok pochopenia princípov kódovania a psychoakustiky. Po prvé, kodér reže vysoké frekvencie len za jedným účelom – na uloženie dát a ich použitie na zakódovanie najpočuteľnejšieho frekvenčného rozsahu. Rozšírený frekvenčný rozsah môže mať fatálny vplyv na celkovú kvalitu zvuku a viesť k počuteľným artefaktom kódovania. Okrem toho je vypnutie cutoff pri 20 kHz vo všeobecnosti úplne neopodstatnené, pretože človek jednoducho nepočuje vyššie frekvencie.

Existuje určitá „magická“ predvoľba ekvalizéra, ktorá môže výrazne zlepšiť zvuk

To nie je úplne pravda, po prvé, pretože každá jednotlivá konfigurácia (slúchadlá, akustika, zvuková karta) má svoje vlastné parametre (najmä svoju amplitúdovo-frekvenčnú charakteristiku). A preto každá konfigurácia musí mať svoj vlastný, jedinečný prístup. Jednoducho povedané, takáto predvoľba ekvalizéra existuje, ale líši sa pre rôzne konfigurácie. Jeho podstata spočíva v úprave frekvenčnej odozvy dráhy, konkrétne v „vyrovnaní“ nežiaducich poklesov a prepätí.

Taktiež medzi ľuďmi, ktorí majú ďaleko k priamej práci so zvukom, je veľmi obľúbené nastavenie grafického ekvalizéra pomocou „tikety“, čo vlastne predstavuje zvýšenie úrovne nízkofrekvenčných a vysokofrekvenčných komponentov, no zároveň vedie k k tlmeniu vokálov a nástrojov, ktorých zvukové spektrum je v stredofrekvenčnej oblasti.

Pred konverziou hudby do iného formátu by ste ju mali dekomprimovať do formátu WAV

Hneď si všimnem, že WAV znamená PCM dáta (modulácia pulzného kódu) v kontajneri WAVE (súbor s príponou *.wav). Tieto údaje nie sú ničím iným ako sekvenciou bitov (núl a jednotiek) v skupinách po 16, 24 alebo 32 (v závislosti od bitovej hĺbky), z ktorých každý predstavuje binárny kód pre amplitúdu zodpovedajúcej vzorky (napr. 16 bitov v desiatkovom zápise sú to hodnoty od -32768 do +32768).

Faktom teda je, že každý zvukový procesor - či už je to filter alebo kodér - zvyčajne funguje iba s týmito hodnotami, tzn iba s nekomprimovanými údajmi. To znamená, že na konverziu zvuku z povedzme FLAC na APE stačí nevyhnutné Najprv dekódujte FLAC na PCM a potom zakódujte PCM na APE. Je to ako pri prebaľovaní súborov zo ZIP do RAR, najprv musíte rozbaliť ZIP.

Ak však použijete konvertor alebo len pokročilý kódovač konzoly, prechodná konverzia na PCM prebieha za behu, niekedy dokonca bez zápisu do dočasného súboru WAV. To je to, čo ľudí zavádza: zdá sa, že formáty sa konvertujú priamo z jedného do druhého, ale v skutočnosti musí mať takýto program dekodér vstupného formátu, ktorý vykonáva prechodnú konverziu na PCM.

Ručná konverzia na WAV vám teda neprinesie nič iné ako stratu času.

Čo bude určovať kvalitu digitalizovaného zvuku?

    Pre kvalitu digitálneho zvuku sú podstatné dve veci: kvalita pôvodnej zvukovej stopy a kvalita analógovo-digitálneho prevodníka.

    Čo sa týka kvality pôvodného soundtracku, všetko je približne jasné. Ak je zakrivený (s deformáciami) alebo hlučný, potom to žiadna digitalizácia nezlepší. To znamená, že je možné pomocou rôznych spracovaní, vrátane digitálnych, izolovať užitočný signál, ktorý sa používa pri izolácii reči na pozadí vonkajšieho šumu alebo pri izolácii bežného signálu na pozadí náhodného šumu (každý má pozerali filmy o spinoch, nie?), ale ak sa bavíme o hudobnom fonograme, teda o fonograme so širokým spektrom, tak všelijaké triky nepomôžu.

    Budeme teda predpokladať, že zvukový záznam je vysokej kvality.

    Potom už zostáva len ADC.

    Hlavným ukazovateľom je bitová hĺbka kódovania. Je jasné, že čím je väčší, tým je lepší, no na druhej strane je takýto prevodník zložitejší a drahší. Na úsvite digitálnej technológie (čo nebolo tak dávno...) bol 16-bitový výsledný záznam uznaný za optimálny z hľadiska pomeru cena/kvalita. S nižšou bitovou hĺbkou trpí dynamický rozsah digitálnej kópie zvukového záznamu - zvuky nízkej úrovne (pianissimo) tvoria len malú časť všetkých bitov, čo znamená, že je zrejmý postupný charakter zmeny signálu. A dolnopriepustné filtrovanie tu veľmi nepomôže (zmienky o Kotelnikovovej vete sú vítané, ale nesmieme zabúdať, že mlčky predpokladá perfektné analógovo-digitálny prevod, to znamená s nekonečne veľkou bitovou hĺbkou). Keďže akékoľvek spracovanie, dokonca aj v digitálnej podobe, dokáže efektívnu bitovú hĺbku iba znížiť, digitalizácia v štúdiách sa vykonávala a dodnes vykonáva s väčším počtom bitov.

    V súčasnosti už nie je nezvyčajné, že sa digitálne zvukové záznamy pripravujú s bitovou hĺbkou 24 bitov (super-Audio CD, Audio-DVD). S takouto hĺbkou bude možné naplno sprostredkovať dynamický rozsah akéhokoľvek hudobného diela, dokonca aj Ravelovho Bolera, ktoré začína sotva počuteľným partom malých bubnov a končí fortissimom s celým orchestrom.

    Tu máš. Okrem bitovej hĺbky sú dôležité aj ďalšie parametre ADC, predovšetkým nelinearita a šum. Najmä zvuky. Pretože obmedzujú efektívnu bitovú kapacitu prevodníka. Aký zmysel má týchto 24 bitov, ak posledných 8 bitov je hlučných, a preto nemajú žiadny význam? užitočné informácie... Hladina hluku moderných 24-bitových ADC môže dosiahnuť -115 dB pri vzorkovacej frekvencii nad 100 kHz, čo je už celkom slušné a rozdielová nelinearita sa meria v desaťtisícinách percenta. To znamená, že takéto riešenia ľahko presahujú možnosti ľudského ucha.

  • Bude to závisieť od troch hlavných parametrov:

    1. Vzorkovacia frekvencia. Obmedzuje šírku pásma prenášaných frekvencií: maximálna frekvencia prenášaného signálu je pod polovicou vzorkovacej frekvencie. V telefonovaní sa najčastejšie používa vzorkovacia frekvencia 8 kHz, čo dáva teoretické pásmo o niečo užšie ako 4 kHz (v praxi sa používa pásmo 300-3000 Hz). A štandard CD používa frekvenciu 44,1 kHz, čo umožňuje plne prenášať spektrum 20 Hz - 20 kHz. Zvýšenie vzorkovacej frekvencie nad tieto hodnoty nemá zmysel z hľadiska rozsahu prenášaných frekvencií, ale znižuje úroveň intermodulačného skreslenia. V štandarde DVD Audio je maximálna vzorkovacia frekvencia 192 kHz, niektoré dobré zvukové karty pre počítače tiež podporujú túto vzorkovaciu frekvenciu (šírka pásma prehrávaných a nahrávacích frekvencií sa líši od modelu k modelu). Ďalšie štandardné hodnoty sú 96, 48, 32, 22,05, 11,025 kHz.
    2. Bitová hĺbka kódovania. Od toho závisí dynamický rozsah – pri lineárnom kódovaní je rozdiel medzi plným švihom a minimálnym krokom 256-násobok pre 8 bitov a 65536-násobok pre 16 bitov, čo je 48, respektíve 96 dB. 48 dB je úprimne málo, to je úroveň dynamického rozsahu kompaktnej kazety a okrem úzkeho dynamického rozsahu vznikajú nepríjemné skreslenia, obzvlášť dobre počuteľné na tichých miestach - dôsledok transformácie hladkého signálu do stupňovitého. Pri 16-bitovej verzii je kvalita zvuku už celkom dobrá (to je bitová hĺbka, ktorú používa CD), ale v mnohých reálnych prípadoch nie ideálna - veľa klasických diel, ako aj ťažkej hudby si vyžaduje väčší DD. Vysokokvalitné systémy používajú 24-bitové kódovanie, hoci skutočný počet významných bitov nepresahuje 18-20. Nemá zmysel ďalej zvyšovať bitovú hĺbku.
    3. Metóda kódovania. To má dve strany. Prvým je samotná vzorkovacia stupnica. Zvyčajne je lineárny, ale môže byť aj logaritmický. To dáva zvýšenie dynamického rozsahu pri rovnakej bitovej hĺbke, ale úroveň skreslenia je vyššia ako pri rovnakom dynamickom rozsahu s lineárnou mierkou a vyššou bitovou hĺbkou. Druhým je použitie rôznych stratových kompresných algoritmov. V súvislosti s tým druhým sa objavuje pojem bitrate. Posledný je počet bitov potrebných na zakódovanie jednej sekundy zvuku. Prirodzene, bitová rýchlosť závisí od vzorkovacej frekvencie a bitovej hĺbky, ale aj od kompresného pomeru. Kompresia môže byť stratová alebo bezstratová. Bezstratová kompresia je v podstate obyčajná archivácia a nemá vplyv na zvuk. A so stratami, preto sú to straty. Kodér analyzuje zvukové informácie a zahodí údaje na základe psychoakustických úvah: strata toho, čo bude najmenej počuteľné. Teda slabý zvuk na pozadí silného, ​​slabé vysokofrekvenčné zvuky na pozadí silných stredofrekvenčných zvukov atď. Na strednej a vysoké frekvencie informácie o fáze môžu byť vyradené. Výsledkom je, že pri 4,5-násobnej kompresii nahrávky v CD kvalite (bitrate 320 kbps, mp3/Lame) je počuteľné zhoršenie nahrávky tak nepatrné, že bez dobrého vybavenia je veľmi ťažké rozoznať rozdiel. A pri bitrate 128 je už zhoršenie kvality zvuku zrejmé a mnohé nahrávky znejú jednoducho nepríjemne. Ale s plastovými reproduktormi alebo reproduktormi zabudovanými do prenosného počítača tento rozdiel nebudete počuť.

© 2024 ermake.ru -- O oprave PC - Informačný portál