Ինչն է որոշում թվային ձայնի որակը: Ո՞ր պարամետրերն են որոշում թվային ձայնի որակը:

Տուն / Տվյալների վերականգնում

Ձայնալիք է, որն առավել հաճախ տարածվում է օդում, ջրում կամ այլ միջավայրում՝ անընդհատ փոփոխվող ինտենսիվությամբ և հաճախականությամբ:

Մարդը կարող է ձայնի տեսքով ընկալել ձայնային ալիքները (օդի թրթռումները) ձայնի տեսքով՝ տարբերելով ձայնի ձայնը։

Որքան ավելի շատ ինտենսիվությունըձայնային ալիք, որքան բարձր է ձայնը, այնքան բարձր է ալիքի հաճախականությունը, այնքան բարձր է ձայնի բարձրությունը:


Ձայնի, ինչպես նաև ձայնի բարձրության կախվածությունը ձայնային ալիքի ինտենսիվությունից և հաճախականությունից

Հերց(նշվում է Հց-ով կամ Հց-ով) - պարբերական պրոցեսների հաճախականության չափման միավոր (օրինակ՝ տատանումներ): 1 Հց նշանակում է նման գործընթացի մեկ կատարում մեկ վայրկյանում՝ 1 Հց = 1/վ:

Եթե ​​մենք ունենք 10 Հց, ապա դա նշանակում է, որ մեկ վայրկյանում ունենք նման գործընթացի տասը կատարում։

Մարդու ականջը կարող է ձայնը ընկալել վայրկյանում 20 տատանումներից (20 Հերց, ցածր ձայն) մինչև 20000 թրթռում վայրկյանում (20 ԿՀց, բարձր ձայն) հաճախականությամբ:

Բացի այդ, մարդը կարող է ձայնը ընկալել ինտենսիվությունների լայն շրջանակում, որոնցում առավելագույն ինտենսիվությունը 1014 անգամ մեծ է նվազագույնից (հարյուր հազար միլիարդ անգամ):

Ձայնի ծավալը չափելու համար ստեղծվել և օգտագործվել է հատուկ միավոր « դեցիբել" (դԲ)

Ձայնի ծավալի նվազումը կամ ավելացումը 10 դԲ-ով համապատասխանում է ձայնի ինտենսիվության նվազմանը կամ ավելացմանը 10 անգամ:

Ձայնի ծավալը դեցիբելներով


Որպեսզի համակարգչային համակարգերը ձայնը մշակեն, շարունակական աուդիո ազդանշանը պետք է վերածվի թվային, դիսկրետ ձևի՝ օգտագործելով ժամանակի նմուշառում:

Դրա համար շարունակական ձայնային ալիքը բաժանվում է առանձին փոքր ժամանակավոր հատվածների, և յուրաքանչյուր այդպիսի հատվածի համար սահմանվում է ձայնի ինտենսիվության որոշակի արժեք:

Այսպիսով, ձայնի ծավալի շարունակական կախվածությունը A(t) ժամանակից փոխարինվում է բարձրության մակարդակների դիսկրետ հաջորդականությամբ: Գրաֆիկի վրա սա կարծես հարթ կորը փոխարինել է «քայլերի» հաջորդականությամբ:


Աուդիո ժամանակի նմուշառում


Ձայնային քարտին միացված խոսափողն օգտագործվում է անալոգային աուդիո ձայնագրման և այն թվային ձևի փոխակերպելու համար:

Որքան ավելի խիտ են դիսկրետ գծերը տեղադրված գրաֆիկի վրա, այնքան ավելի որակյալ դուք ի վերջո կկարողանաք վերստեղծել բնօրինակ ձայնը:

Ստացված թվային ձայնի որակը կախված է մեկ միավոր ժամանակում ձայնի ծավալի մակարդակի չափումների քանակից, այսինքն՝ նմուշառման հաճախականությունից:

Աուդիո նմուշառման արագությունմեկ վայրկյանում ձայնի ծավալի չափումների թիվն է:

Որքան շատ չափումներ կատարվեն մեկ վայրկյանում (որքան բարձր է նմուշառման հաճախականությունը), այնքան ավելի ճշգրիտ թվային աուդիո ազդանշանի «սանդուղքը» հետևում է անալոգային ազդանշանի կորին:

Գրաֆիկի յուրաքանչյուր «քայլին» վերագրվում է ձայնի ձայնի որոշակի մակարդակի արժեք: Ձայնի ծավալի մակարդակները կարելի է դիտարկել որպես հնարավոր վիճակների մի շարք Ն(գրադացիաներ), որոնց կոդավորման համար անհրաժեշտ է որոշակի քանակությամբ տեղեկատվություն Ի, որը կոչվում է աուդիո կոդավորման խորություն։

Աուդիո կոդավորման խորությունըտեղեկատվության քանակն է, որն անհրաժեշտ է թվային աուդիոյի դիսկրետ ձայնի մակարդակները կոդավորելու համար:

Եթե ​​կոդավորման խորությունը հայտնի է, ապա թվային ձայնի ծավալի մակարդակների թիվը կարող է հաշվարկվել ընդհանուր բանաձևով N=2I.

Օրինակ, թող ձայնի կոդավորման խորությունը լինի 16 բիթ, որի դեպքում ձայնի ձայնի մակարդակների թիվը հավասար է.

N = 2 I = 2 16 = 65,536:

Կոդավորման գործընթացում յուրաքանչյուր ձայնի ծավալի մակարդակին հատկացվում է իր 16-բիթանոց երկուական կոդը, ձայնի ամենացածր մակարդակը կհամապատասխանի 00000000000000000 կոդին, իսկ ամենաբարձրը՝ 1111111111111111:

Թվայնացված ձայնի որակ


Այսպիսով, որքան բարձր է նմուշառման հաճախականությունը և աուդիո կոդավորման խորությունը, այնքան բարձր որակով կհնչի թվայնացված ձայնը, և այնքան ավելի լավ կարող եք թվայնացված ձայնը մոտեցնել սկզբնական ձայնին:

Հեռախոսային կապի որակին համապատասխան թվայնացված ձայնի ամենացածր որակը ստացվում է վայրկյանում 8000 անգամ նմուշառման արագությամբ, 8 բիթ նմուշառման խորությամբ և մեկ աուդիո ուղու ձայնագրմամբ (մոնո ռեժիմ):

Ամենաբարձր որակի թվայնացված ձայնը, որը համապատասխանում է ձայնասկավառակի որակին, ձեռք է բերվում վայրկյանում 48000 անգամ նմուշառման արագությամբ, 16 բիթ նմուշառման խորությամբ և երկու աուդիո հետքերի ձայնագրմամբ (ստերեո ռեժիմ):

Պետք է հիշել, որ որքան բարձր է թվային ձայնի որակը, այնքան մեծ է ձայնային ֆայլի տեղեկատվական ծավալը.

Դուք կարող եք հեշտությամբ գնահատել թվային ստերեո աուդիո ֆայլի տեղեկատվության ծավալը 1 վայրկյան ձայնի տևողությամբ միջին ձայնի որակով (16 բիթ, 24000 չափումներ վայրկյանում): Դա անելու համար կոդավորման խորությունը պետք է բազմապատկվի վայրկյանում չափումների քանակով և բազմապատկվի 2 ալիքով (ստերեո ձայն).

16 բիթ × 24,000 × 2 = 768,000 բիթ = 96,000 բայթ = 93,75 ԿԲ:

Ձայնային խմբագիրներ


Ձայնային խմբագրիչները թույլ են տալիս ոչ միայն ձայնագրել և նվագարկել ձայնը, այլև խմբագրել այն: Ամենահայտնին կարելի է ապահով անվանել, ինչպես, օրինակ Sony Sound Forge, Adobe Audition, GoldWaveև ուրիշներ։

Թվայնացված ձայնը ներկայացված է ձայնային խմբագրիչներում հստակ տեսողական ձևով, ուստի աուդիո ուղու մասերը պատճենելը, տեղափոխելը և ջնջելը կարելի է հեշտությամբ կատարել համակարգչային մկնիկի միջոցով:

Բացի այդ, դուք կարող եք համընկնել, համընկնել աուդիո հետքերմիմյանց վրա (խառնել հնչյունները) և կիրառել տարբեր ակուստիկ էֆեկտներ (արձագանք, հետադարձ նվագարկում և այլն):

Ձայնային խմբագրիչները թույլ են տալիս փոխել թվային ձայնի որակը և վերջնական ձայնային ֆայլի չափը՝ փոխելով նմուշառման հաճախականությունը և կոդավորման խորությունը: Թվայնացված ձայնը կարող է չսեղմված պահվել աուդիո ֆայլերում ունիվերսալ WAV ձևաչափով (Microsoft ձևաչափ) կամ OGG, MP3 (կորուստ սեղմում) սեղմված ձևաչափերով:
Հասանելի են նաև ավելի քիչ տարածված, բայց ուշագրավ առանց կորուստների սեղմման ձևաչափեր:

Սեղմված ձևաչափերով ձայնը պահելու ժամանակ անտեսվում են ցածր ինտենսիվության ձայնային հաճախականությունները, որոնք մարդու ընկալման համար անլսելի և աննկատ («չափազանց») են, որոնք ժամանակին համընկնում են բարձր ինտենսիվության ձայնային հաճախականությունների հետ: Այս ձևաչափի օգտագործումը թույլ է տալիս սեղմել ձայնային ֆայլերտասնյակ անգամներ, բայց հանգեցնում է տեղեկատվության անդառնալի կորստի (ֆայլերը չեն կարող վերականգնվել իրենց սկզբնական, սկզբնական տեսքով):

Թվային աուդիո ձայնագրության որակի վրա ազդող հիմնական պարամետրերն են.

§ ADC-ի և DAC-ի բիթային հզորությունը:

§ ADC և DAC նմուշառման դրույքաչափերը:

§ Անհանգստություն ADC և DAC

§ Oversampling

Կարևոր են նաև թվային ձայնագրման և ձայնի վերարտադրման սարքերի անալոգային ուղու պարամետրերը.

§ Ազդանշան/աղմուկ հարաբերակցությունը

§ Հարմոնիկ աղավաղման գործոն

§ Ինտերմոդուլյացիայի աղավաղում

§ անհավասար ամպլիտուդա-հաճախական բնութագրեր

§ ալիքների փոխներթափանցում

§ Դինամիկ միջակայք

Թվային աուդիո ձայնագրման տեխնոլոգիա

Թվային աուդիո ձայնագրությունը ներկայումս իրականացվում է ձայնագրման ստուդիաներում անհատական ​​համակարգիչներև այլ թանկարժեք և որակյալ սարքավորումներ: Բավականին զարգացած է նաև «տնային ստուդիա» հասկացությունը, որում օգտագործվում են ձայնագրման պրոֆեսիոնալ և կիսապրոֆեսիոնալ սարքավորումներ, որոնք թույլ են տալիս տանը ստեղծել բարձրորակ ձայնագրություններ։

Ձայնային քարտերը օգտագործվում են որպես համակարգիչների մաս, որոնք կատարում են մշակում իրենց ADC-ներում և DAC-ներում.

Կա համակարգչային ծրագրերի մի ամբողջ դաս՝ ձայնային խմբագիրներ, որոնք թույլ են տալիս աշխատել ձայնի հետ.

§ ձայնագրել մուտքային աուդիո հոսքը

§ ստեղծել (առաջացնել) ձայն

§ փոխել գոյություն ունեցող ձայնագրությունը (ավելացնել նմուշներ, փոխել տեմբրը, ձայնի արագությունը, կտրված մասերը և այլն)

§ վերաշարադրել մի ձևաչափից մյուսը

§ փոխակերպել տարբեր աուդիո կոդեկներ

Ոմանք պարզ ծրագրեր, թույլ է տալիս միայն ձևաչափերի և կոդեկների փոխակերպում:

Թվային աուդիո ձևաչափերի տեսակները

Ձայնի ձևաչափի տարբեր հասկացություններ կան:

Ձայնային տվյալները թվային տեսքով ներկայացնելու ձևաչափը կախված է թվային-անալոգային փոխարկիչի (DAC) կողմից օգտագործվող քվանտացման մեթոդից: Աուդիո ճարտարագիտության մեջ ներկայումս առավել տարածված են քվանտացման երկու տեսակ.

§ զարկերակային կոդի մոդուլյացիա

§ սիգմա-դելտա մոդուլյացիա

Հաճախ քվանտացման բիթերի խորությունը և նմուշառման հաճախականությունը նշվում են աուդիո ձայնագրման և նվագարկման տարբեր սարքերի համար որպես թվային աուդիո ներկայացման ձևաչափ (24 բիթ/192 կՀց; 16 բիթ/48 կՀց):

Ֆայլի ձևաչափը որոշում է աուդիո տվյալների կառուցվածքը և ներկայացման առանձնահատկությունները, երբ դրանք պահվում են համակարգչի պահեստավորման սարքում: Աուդիո տվյալների ավելորդությունը վերացնելու համար աուդիո կոդեկները օգտագործվում են աուդիո տվյալները սեղմելու համար: Ձայնային ֆայլերի ձևաչափերի երեք խումբ կա.

§ Չսեղմված աուդիո ձևաչափեր, ինչպիսիք են WAV, AIFF

§ աուդիո ձևաչափեր՝ անկորուստ սեղմումով (APE, FLAC)

§ աուդիո ձևաչափեր՝ օգտագործելով կորստի սեղմում (mp3, ogg)

Մոդուլային երաժշտական ​​ֆայլերի ձևաչափերն առանձնանում են: Ստեղծված սինթետիկ կամ նախապես ձայնագրված կենդանի գործիքների նմուշներից՝ դրանք հիմնականում ծառայում են ժամանակակից էլեկտրոնային երաժշտության (MOD) ստեղծմանը։ Սա ներառում է նաև MIDI ձևաչափը, որը ձայնային ձայնագրություն չէ, բայց միևնույն ժամանակ, օգտագործելով sequencer, թույլ է տալիս ձայնագրել և նվագարկել երաժշտություն՝ օգտագործելով հրամանների հատուկ հավաքածու տեքստային ձևով:

Թվային աուդիո մեդիայի ձևաչափերն օգտագործվում են ինչպես ձայնագրությունների զանգվածային բաշխման համար (CD, SACD), այնպես էլ պրոֆեսիոնալ ձայնագրման համար (DAT, minidisc):

Շրջապատող ձայնային համակարգերի համար հնարավոր է նաև տարբերակել աուդիո ձևաչափերը, որոնք հիմնականում ֆիլմերի բազմալիքային աուդիո ուղեկցորդներ են։ Նման համակարգերն ունեն ձևաչափերի ամբողջ ընտանիքներ երկու խոշոր մրցակից ընկերություններից՝ Digital Theatre Systems Inc. - DTS և Dolby Laboratories Inc. - Dolby Digital:

Ձևաչափը նաև բազմալիք ձայնային համակարգերի ալիքների քանակն է (5.1; 7.1): Սկզբում նման համակարգը մշակվել է կինոթատրոնների համար, սակայն հետագայում ընդլայնվել է Software codec-ը

Աուդիո կոդեկ ծրագրի մակարդակով

§ G.723.1 - IP հեռախոսակապի հավելվածների հիմնական կոդեկներից մեկը

§ G.729-ը մասնավոր նեղաշերտ կոդեկ է, որն օգտագործվում է թվային խոսքի ներկայացման համար

§ Ինտերնետ ցածր բիթային կոդեկ (iLBC) - հայտնի անվճար կոդեկ IP հեռախոսակապի համար (մասնավորապես, Skype-ի և Google Talk-ի համար)

Աուդիո կոդեկ(անգլերեն) Աուդիո կոդեկ; աուդիո կոդավորիչ/ապակոդավորիչ) - համակարգչային ծրագիր կամ ապարատային, որը նախատեսված է աուդիո տվյալների կոդավորման կամ վերծանման համար:

Ծրագրային կոդեկ

Աուդիո կոդեկ ծրագրի մակարդակովմասնագիտացված է համակարգչային ծրագիր, կոդեկ, որը սեղմում է (սեղմում) կամ ապասեղմում (հեռացնում է) թվային աուդիո տվյալները՝ ըստ ֆայլի աուդիո ձևաչափի կամ հոսքային աուդիո ձևաչափի։ Աուդիո կոդեկի՝ որպես կոմպրեսորի խնդիրն է ապահովել ձայնային ազդանշան՝ սահմանված որակով/ճշգրտությամբ և հնարավորինս փոքր չափով: Սեղմումը նվազեցնում է աուդիո տվյալների պահպանման համար պահանջվող տարածությունը և կարող է նաև նվազեցնել ալիքի թողունակությունը, որով փոխանցվում են աուդիո տվյալները: Աուդիո կոդեկների մեծ մասն իրականացվում է որպես ծրագրային գրադարաններ, որոնք փոխազդում են մեկ կամ մի քանի աուդիո նվագարկիչների հետ, ինչպիսիք են QuickTime Player, XMMS, Winamp, VLC մեդիա նվագարկիչ, MPlayer կամ Windows Media Player:

Հանրաճանաչ ծրագրային աուդիո կոդեկներ ըստ հավելվածի.

§ MPEG-1 Layer III (MP3) - աուդիո ձայնագրությունների (երաժշտություն, աուդիոգրքեր և այլն) սեփական կոդեկ համակարգչային տեխնիկաև թվային նվագարկիչներ

§ Ogg Vorbis (OGG) - երկրորդ ամենատարածված ձևաչափը, որը լայնորեն օգտագործվում է համակարգչային խաղերև ֆայլերի փոխանակման ցանցերում՝ երաժշտություն փոխանցելու համար

§ GSM-FR - առաջինը թվային ստանդարտԽոսքի կոդավորում, որն օգտագործվում է GSM հեռախոսներում

§ Adaptive multi rate (AMR) - մարդու ձայնի ձայնագրում բջջային հեռախոսներև այլ շարժական սարքեր

Ձայն– անընդհատ փոփոխվող ամպլիտուդով և հաճախականությամբ ալիք: Որքան մեծ է ամպլիտուդը, այնքան բարձր է այն մարդու համար, որքան մեծ է հաճախականությունը, այնքան բարձր է հնչերանգը:

Թվային աուդիոանալոգային աուդիո ազդանշան է, որը ներկայացված է իր ամպլիտուդի դիսկրետ թվային արժեքներով:

Հիմնականում աուդիո կոդավորում Համակարգիչների օգտագործումը օդի թրթռումները էլեկտրական հոսանքի թրթիռների վերածելու և անալոգային էլեկտրական ազդանշանի հետագա նմուշառման գործընթացն է:

Աուդիո տեղեկատվության կոդավորումը և վերարտադրումն իրականացվում է օգտագործելով հատուկ ծրագրեր(ձայնագրող խմբագիրներ):

Կոդավորված աուդիո վերարտադրման որակը կախված է նմուշառման հաճախականությունից և դրա լուծումից:

Աուդիո թվայնացում - (կամ անալոգային-թվային փոխարկում) - անալոգային փոխակերպման տեխնոլոգիա ձայնային ազդանշանթվային ձևով, որն իրականացվում է ազդանշանի ամպլիտուդը որոշակի ժամանակային քայլով չափելով և այնուհետև ստացված արժեքները թվային ձևով գրանցելով։

Աուդիո թվայնացումը ներառում է երկու գործընթաց.

    նմուշառման գործընթաց (ժամանակի ընթացքում ազդանշանի նմուշառում);

    քվանտացման գործընթաց ամպլիտուդով։

Ժամանակի նմուշառման գործընթաց - ազդանշանի արժեքների ստացման գործընթացը, որոնք փոխակերպվում են որոշակի ժամանակային քայլով. նմուշառման քայլ .

Մեկ վայրկյանում կատարված ազդանշանի մեծության չափումների թիվը կոչվում է նմուշառման տոկոսադրույքըկամ նմուշառման հաճախականությունը, կամ նմուշառման տոկոսադրույքը(անգլերեն «ampling» - «նմուշառում»):

Որքան փոքր է նմուշառման քայլը, այնքան բարձր է նմուշառման հաճախականությունը և ազդանշանի ավելի ճշգրիտ ներկայացումը մենք կստանանք:

Գործընթացը ամպլիտուդի քվանտացում - իրական ազդանշանի ամպլիտուդի արժեքները որոշակի ճշգրտությամբ մոտավոր արժեքներով փոխարինելու գործընթացը:

Քվանտացում- նմուշառում ըստ մակարդակի:

Ենթադրվում է, որ 16-բիթանոց քվանտացման արդյունքում առաջացած քվանտացման սխալները գրեթե աննկատ են մնում լսողի համար:

2 N հնարավոր մակարդակներից յուրաքանչյուրը կոչվում է քվանտացման մակարդակը, և կոչվում է քվանտացման երկու մոտակա մակարդակների միջև եղած հեռավորությունը քվանտացման քայլ.

N թիվը կոչվում է քվանտացման բիթերի խորությունը, իսկ ամպլիտուդային արժեքների կլորացման արդյունքում ստացված թվերն են հաշվում էկամ նմուշներ(անգլերեն «նմուշից» - «չափված»):

16-բիթանոց քվանտացման արդյունքում առաջացած քվանտացման սխալները գրեթե անտեսանելի են մնում լսողի համար:

Աուդիո թվայնացում – ամփոփում.

Կողմերը: Դուք կարող եք կոդավորել ցանկացած ձայն (ներառյալ ձայնը, սուլիչը, խշխշոցը, ...)

Դեմ: կա տեղեկատվության կորուստ, ֆայլերի մեծ ծավալ

Ձայնի որակի վրա ազդող հիմնական պարամետրերը.

1. Բիթային խորություն- հարթություն (ADC-ի և DAC-ի կողմից կոդավորված/վերծանված տեղեկատվության բիթերի քանակը):

2. Նմուշառման հաճախականությունը- ժամանակի շարունակական ազդանշանի նմուշառման հաճախականությունը դրա նմուշառման ընթացքում (ADC), որը չափվում է Հերցով:

3. Աղմուկ- փոխանցվող ազդանշանի անցանկալի փուլային և/կամ հաճախականության պատահական շեղումներ

Աուդիո ֆայլերի ձևաչափեր

      WAV(Ալիքի ձև աուդիո ձևաչափը), հաճախ առանց սեղմման (չափի!)

      պատգամավոր3 (MPEG-1 Աուդիո Շերտ 3 , սեղմում` հաշվի առնելով մարդու ընկալումը)

      A.A.C. (Ընդլայնված աուդիո կոդավորում, 48 ալիք, սեղմում)

      WMA (Windows Media Audio,հոսքային աուդիո, սեղմում)

      ՕԳԳ (Օգ Վորբիս,բաց ձևաչափ, սեղմում)

Թվային աուդիոյի մասին հանրաճանաչ առասպելների ոչնչացում:

2017-10-01T15:27

2017-10-01T15:27

Audiophile's Software

ՆշումՍտորև բերված տեքստը ավելի լավ հասկանալու համար խորհուրդ եմ տալիս ծանոթանալ թվային աուդիոյի հիմունքներին:

Նաև ստորև բերված բազմաթիվ կետերը լուսաբանվում են իմ «Եվս մեկ անգամ տխուր ճշմարտության մասին. որտեղի՞ց է իսկապես լավ ձայնը» հրապարակման մեջ: .

Որքան բարձր է բիթերի արագությունը, այնքան ավելի լավ է ուղու որակը:

Սա միշտ չէ, որ այդպես է: Նախ հիշեցնեմ, թե ինչ է բիթրեյը Տ(բիտրեյթ, ոչ թե բիտրեյդ): Սա իրականում տվյալների արագությունն է կիլոբիթներով/վրկ նվագարկման ժամանակ: Այսինքն, եթե վերցնենք ուղու չափը կիլոբիթներով և բաժանենք տեւողության վրա վայրկյաններով, ապա կստանանք դրա բիթային արագությունը՝ այսպես կոչված։ ֆայլի վրա հիմնված բիթային արագություն (FBR), սովորաբար այն շատ չի տարբերվում աուդիո հոսքի բիթային արագությունից (տարբերությունների պատճառը ուղու մեջ մետատվյալների առկայությունն է՝ պիտակներ, ներկառուցված պատկերներ և այլն):

Հիմա եկեք օրինակ վերցնենք. սովորական Audio CD-ի վրա գրանցված չսեղմված PCM աուդիո բիթային արագությունը հաշվարկվում է հետևյալ կերպ՝ 2 (ալիքներ) × 16 (բիթ մեկ նմուշում) × 44100 (նմուշներ վայրկյանում) = 1411200 (բիտ/վ) = 1411,2 կբ/վ: Հիմա եկեք վերցնենք և սեղմենք հետքը ցանկացած անկորուստ կոդեկով («անկորուստ» - «անկորուստ», այսինքն՝ մեկը, որը չի հանգեցնում որևէ տեղեկատվության կորստի), օրինակ՝ FLAC կոդեկ։ Արդյունքում մենք կստանանք օրիգինալից ցածր բիթային արագություն, բայց որակը կմնա անփոփոխ. ահա ձեր առաջին հերքումը:

Այստեղ արժե ավելացնել ևս մեկ բան. Անկորուստ սեղմումով ելքային բիթային արագությունը կարող է շատ տարբեր լինել (բայց, որպես կանոն, այն ավելի քիչ է, քան չսեղմված աուդիոը) - դա կախված է սեղմված ազդանշանի բարդությունից, ավելի ճիշտ՝ տվյալների ավելորդությունից: Այսպիսով, ավելի պարզ ազդանշանները ավելի լավ կսեղմվեն (այսինքն, մենք ունենք ֆայլի ավելի փոքր չափ նույն տևողությամբ => ավելի ցածր բիթային արագություն), իսկ ավելի բարդ ազդանշանները ավելի վատ կսեղմվեն: Ահա թե ինչու անկորուստ դասական երաժշտությունն ավելի ցածր բիթ ունի, քան, ասենք, ռոքը: Բայց պետք է ընդգծել, որ այստեղ բիթային արագությունը ոչ մի կերպ ձայնային նյութի որակի ցուցիչ չէ։

Այժմ խոսենք կորուստներով սեղմման մասին: Նախ, դուք պետք է հասկանաք, որ կան շատ տարբեր կոդավորիչներ և ձևաչափեր, և նույնիսկ նույն ձևաչափում տարբեր կոդավորիչների կոդավորման որակը կարող է տարբերվել (օրինակ, QuickTime AAC-ը շատ ավելի լավ կոդավորում է, քան հնացած FAAC-ը), էլ չեմ խոսում: ժամանակակից ձևաչափերի (OGG Vorbis, AAC, Opus) գերազանցությունը MP3-ի նկատմամբ: Պարզ ասած, նույն բիթային արագությամբ տարբեր կոդավորիչների կողմից կոդավորված երկու միանման հետքերից մեկը կհնչի ավելի լավ, իսկ մյուսը` ավելի վատ:

Բացի այդ, կա նման բան ծրար. Այսինքն՝ կարելի է MP3 ձևաչափով 96 կբիթ/վրկ բիթային արագությամբ հետք վերցնել և այն վերածել MP3 320 կբ/վ։ Որակը ոչ միայն չի բարելավվի (ի վերջո, նախորդ 96 կբիթ/վրկ կոդավորման ժամանակ կորցրած տվյալները չեն կարող վերադարձվել), այն նույնիսկ կվատթարանա։ Այստեղ հարկ է նշել, որ կորստի կոդավորման յուրաքանչյուր փուլում (ցանկացած բիթային արագությամբ և ցանկացած կոդավորիչով) որոշակի քանակությամբ աղավաղում է ներմուծվում աուդիո:

Եվ նույնիսկ ավելին: Կա ևս մեկ նրբերանգ. Եթե, ասենք, աուդիո հոսքի բիթային արագությունը 320 կբ/վ է, դա չի նշանակում, որ բոլոր 320 կբիթ/վրկ-ն ծախսվել է հենց այդ վայրկյանին կոդավորման վրա։ Սա բնորոշ է հաստատուն բիթային արագությամբ կոդավորման համար և այն դեպքերի համար, երբ մարդը, հուսալով ստանալ առավելագույն որակ, ստիպում է մշտական ​​բիթերի արագությունը չափազանց բարձր լինել (օրինակ, 512 կբ/վ CBR սահմանել Nero AAC-ի համար): Ինչպես հայտնի է, որոշակի շրջանակին հատկացված բիթերի քանակը կարգավորվում է հոգեակուստիկ մոդելով: Բայց այն դեպքում, երբ հատկացված գումարը շատ ավելի ցածր է, քան սահմանված բիթային արագությունը, նույնիսկ բիթային ռեզերվուարը չի խնայում (կարդա՛ «Ի՞նչ են CBR, ABR, VBR» հոդվածում տերմինների մասին) - արդյունքում մենք դառնում ենք անօգուտ: «զրոյական բիթ», որոնք պարզապես «ավարտում են»» շրջանակի չափը պահանջվող չափին (այսինքն՝ մեծացնել հոսքի չափը մինչև նշվածը): Ի դեպ, սա հեշտ է ստուգել՝ սեղմել ստացված ֆայլը արխիվատորով (ցանկալի է 7z) և նայել սեղմման հարաբերակցությանը. որքան բարձր է այն, այնքան ավելի շատ զրոյական բիթ (քանի որ դրանք հանգեցնում են ավելորդության), այնքան ավելի վատնված տարածք:

Lossy կոդեկները (MP3 և այլն) ի վիճակի են հաղթահարել ժամանակակից էլեկտրոնային երաժշտությունը, բայց ունակ չեն դասական (ակադեմիական), կենդանի, գործիքային երաժշտության բարձրորակ կոդավորման:

Այստեղ «ճակատագրի հեգնանքն» այն է, որ իրականում ամեն ինչ ճիշտ հակառակն է։ Ինչպես հայտնի է, ակադեմիական երաժշտությունը դեպքերի ճնշող մեծամասնությունում հետևում է մեղեդային և հարմոնիկ սկզբունքներին, ինչպես նաև գործիքային ստեղծագործությանը։ Մաթեմատիկական տեսանկյունից դա հանգեցնում է երաժշտության համեմատաբար պարզ ներդաշնակ կազմության։ Այսպիսով, համահունչների գերակշռությունը առաջացնում է ավելի փոքր թվով երկրորդական ներդաշնակություն. օրինակ, հինգերորդի համար (միջակայում, որում երկու հնչյունների հիմնական հաճախականությունները տարբերվում են մեկուկես անգամ), յուրաքանչյուր երկրորդ ներդաշնակությունը ընդհանուր կլինի երկու հնչյունների համար: , չորրորդի համար, որտեղ հաճախականությունները տարբերվում են մեկ երրորդով՝ յուրաքանչյուր երրորդով և այլն։ Բացի այդ, ֆիքսված հաճախականության գործակիցների առկայությունը հավասար խառնվածքի կիրառման շնորհիվ պարզեցնում է նաև դասական երաժշտության սպեկտրալ կազմը։ Դասականների կենդանի գործիքային կոմպոզիցիան որոշում է էլեկտրոնային երաժշտությանը բնորոշ աղմուկի բացակայությունը, աղավաղումը, ամպլիտուդի կտրուկ թռիչքները, ինչպես նաև բարձր հաճախականության բաղադրիչների ավելցուկի բացակայությունը։

Վերը թվարկված գործոնները հանգեցնում են նրան, որ դասական երաժշտությունը շատ ավելի հեշտ է սեղմել, առաջին հերթին՝ զուտ մաթեմատիկորեն։ Եթե ​​հիշում եք, մաթեմատիկական սեղմումն աշխատում է՝ վերացնելով ավելորդությունը (նկարագրելով նմանատիպ տեղեկություններ՝ օգտագործելով ավելի քիչ բիթ) և նաև կանխատեսումներ անելով (aka. կանխատեսողներկանխատեսել ազդանշանի վարքագիծը, և այնուհետև կոդավորվում է միայն իրական ազդանշանի շեղումը կանխատեսվածից. որքան ավելի ճշգրիտ են դրանք համընկնում, այնքան ավելի քիչ բիթ է անհրաժեշտ կոդավորման համար): IN այս դեպքումՀամեմատաբար պարզ սպեկտրային կազմը և ներդաշնակությունը հանգեցնում են բարձր ավելորդության, որի վերացումը ապահովում է սեղմման զգալի աստիճան, իսկ պոռթկումների և աղմուկի փոքր քանակի բաղադրիչները (որոնք պատահական և անկանխատեսելի ազդանշաններ են) որոշում են տեղեկատվության ճնշող մեծամասնության լավ մաթեմատիկական կանխատեսելիությունը: . Եվ ես նույնիսկ չեմ խոսում դասական հետքերի համեմատաբար ցածր միջին ծավալի և լռության հաճախակի ընդմիջումների մասին, որոնց համար գործնականում ոչ մի տեղեկատվություն չի պահանջվում կոդավորելու համար: Արդյունքում, մենք կարող ենք անկորուստ սեղմել, օրինակ, որոշ սոլո գործիքային երաժշտություն մինչև 320 կբիթ/վրկ բիթերի արագություն (TAK և OFR կոդավորիչները բավականին ընդունակ են դրան):

Այսպիսով, նախ, փաստն այն է, որ անկորուստ կոդավորման հիմքում ընկած մաթեմատիկական սեղմումը նույնպես կորուստներով կոդավորման փուլերից մեկն է (կարդացեք Հասկանալով MP3 կոդավորումը): Եվ երկրորդը, քանի որ կորուստը օգտագործում է Ֆուրիեի փոխակերպումը (ազդանշանի տարրալուծումը ներդաշնակության), սպեկտրային կազմի պարզությունը նույնիսկ կրկնակի հեշտացնում է կոդավորողի աշխատանքը: Արդյունքում, համեմատելով բնօրինակ և կոդավորված դասական երաժշտության նմուշները կույր թեստում, մենք զարմացած ենք՝ պարզելով, որ չենք կարող որևէ տարբերություն գտնել, նույնիսկ համեմատաբար ցածր բիթային արագությամբ: Եվ զավեշտալին այն է, որ երբ մենք սկսում ենք ամբողջությամբ իջեցնել կոդավորման բիթերի արագությունը, առաջին բանը, որ բացահայտում է տարբերությունները, ձայնագրության ֆոնային աղմուկն է:

Ինչ վերաբերում է էլեկտրոնային երաժշտությանը, ապա կոդավորողներին այն շատ դժվար է. բոլորովին այլ կերպ), ուղղակի և հակադարձ Ֆուրիեի փոխակերպումը հոգեակուստիկ մոդելի կողմից անհատական ​​ներդաշնակությունների մերժմամբ անխուսափելիորեն տալիս է նախա- և հետ-էխո էֆեկտներ, որոնց լսելիությունը միշտ չէ, որ հեշտ է գնահատել կոդավորողը… HF բաղադրիչների բարձր մակարդակ - և դուք ստանում եք մեծ թվովմարդասպան նմուշներ, որոնց հետ նույնիսկ ամենաառաջադեմ կոդավորիչները չեն կարողանում հաղթահարել միջին և ցածր բիթերի արագությամբ, տարօրինակ կերպով, հատկապես էլեկտրոնային երաժշտության մեջ:

Զվարճալի են նաև «փորձառու ունկնդիրների» և երաժիշտների կարծիքները, ովքեր, կորստի կոդավորման սկզբունքների իսպառ չհասկանալով, սկսում են պնդել, որ լսում են, թե ինչպես են երաժշտության գործիքները կոդավորումից հետո սկսում լարվել, հաճախականությունները լողում են։ , և այլն: Սա դեռևս կարող է ճիշտ լինել պայթեցման հետ կապված ձայներիզների համար, բայց թվային ձայնագրության մեջ ամեն ինչ ճշգրիտ է. հաճախականության բաղադրիչը կա՛մ մնում է, կա՛մ անտեսվում է, պարզապես տոնայնությունը փոխելու կարիք չկա: Ավելին՝ մարդու երաժշտության ականջի առկայությունը ամենևին չի նշանակում, որ նա ունի լավ հաճախականության լսողություն (օրինակ՝ ավելի քան 16 կՀց հաճախականություններ ընկալելու ունակություն, որն անհետանում է տարիքի հետ) և ամենևին էլ չի հեշտացնում նրա որոնել կորստի կոդավորման արտեֆակտներ, քանի որ աղավաղումը Սրանք ունեն շատ հատուկ բնույթ և պահանջում են կորուստներով ձայնի կույր համեմատության փորձ. դուք պետք է իմանաք, թե ինչ և որտեղ նայել:

DVD-Audio-ն ավելի լավ է հնչում, քան Audio CD-ն (24 բիթ ընդդեմ 16-ի, 96 կՀց ընդդեմ 44.1-ի և այլն):

Ցավոք, մարդիկ սովորաբար նայում են միայն թվերին և շատ հազվադեպ են մտածում օբյեկտիվ որակի վրա որոշակի պարամետրի ազդեցության մասին:

Եկեք նախ դիտարկենք բիտի խորությունը: Այս պարամետրը պատասխանատու է ոչ այլ ինչի համար, քան դինամիկ տիրույթը, այսինքն՝ ամենահանգիստ և ամենաբարձր ձայների տարբերությունը (dB-ով): Թվային աուդիոում առավելագույն մակարդակը 0 dBFS է (FS - ամբողջական սանդղակ), իսկ նվազագույնը սահմանափակվում է աղմուկի մակարդակով, այսինքն՝ իրականում դինամիկ տիրույթը բացարձակ արժեքով հավասար է աղմուկի մակարդակին: 16-բիթանոց ձայնի համար դինամիկ միջակայքը հաշվարկվում է որպես 20 × log 10 2 16, որը հավասար է 96,33 վԲ: Միևնույն ժամանակ, սիմֆոնիկ նվագախմբի դինամիկ տիրույթը կազմում է մինչև 75 դԲ (հիմնականում մոտ 40-50 դԲ):

Հիմա պատկերացնենք իրական պայմանները։ Սենյակում աղմուկի մակարդակը մոտ 40 դԲ է (մի մոռացեք, որ դԲ-ն հարաբերական արժեք է: Այս դեպքում լսելիության շեմը վերցվում է 0 դԲ), երաժշտության առավելագույն ծավալը հասնում է 110 դԲ-ի (անհարմարությունից խուսափելու համար) - մենք ստացեք 70 դԲ տարբերություն: Այսպիսով, պարզվում է, որ 70 դԲ-ից ավելի դինամիկ տիրույթն այս դեպքում պարզապես անօգուտ է։ Այսինքն՝ վերևի միջակայքով կամ բարձր ձայներկհասնի ցավի շեմին, կամ հանգիստ հնչյուններկլանվի շրջակա աղմուկից: Շատ դժվար է հասնել շրջակա միջավայրի աղմուկի 15 դԲ-ից պակաս մակարդակի (քանի որ մարդու շնչառության և մարդու ֆիզիոլոգիայի հետևանքով առաջացած այլ աղմուկի ծավալը այս մակարդակի վրա է), արդյունքում ստացվում է երաժշտություն լսելու 95 դԲ միջակայք։ լիովին բավարար լինել:

Այժմ նմուշառման հաճախականության մասին (նմուշառման հաճախականություն, նմուշառման արագություն): Այս պարամետրը վերահսկում է ժամանակի նմուշառման հաճախականությունը և ուղղակիորեն ազդում է ազդանշանի առավելագույն հաճախականության վրա, որը կարող է նկարագրվել տվյալ աուդիո ներկայացմամբ: Կոտելնիկովի թեորեմի համաձայն, այն հավասար է նմուշառման հաճախականության կեսին։ Այսինքն, 44100 Հց սովորական նմուշառման հաճախականության համար ազդանշանի բաղադրիչների առավելագույն հաճախականությունը 22050 Հց է: Առավելագույն հաճախականությունը. որը ընկալվում է մարդու ականջի կողմից մի փոքր ավելի բարձր է 20000 Հց-ից (և այնուհետև ծննդյան ժամանակ, երբ մենք մեծանում ենք, շեմը իջնում ​​է մինչև 16000 Հց):

Լավագույնը այս թեմանընդգրկված է 24/192 հոդվածում ներբեռնումներ - ինչու դրանք իմաստ չունեն:

Ծրագրային ապահովման տարբեր նվագարկիչներ տարբեր կերպ են հնչում (օրինակ՝ foobar2000-ն ավելի լավն է, քան Winamp-ը և այլն)

Հասկանալու համար, թե ինչու դա այդպես չէ, դուք պետք է հասկանաք, թե ինչ է ծրագրային նվագարկիչը: Ըստ էության, սա ապակոդավորիչ է, մշակիչներ (ըստ ցանկության), ելքային պլագին (ինտերֆեյսներից մեկի համար՝ ASIO, DirectSound, WASAPI և այլն), և իհարկե GUI ( GUIօգտագործող): Քանի որ ապակոդավորիչը 99,9% դեպքերում աշխատում է ստանդարտ ալգորիթմի համաձայն, և ելքային plug-in-ը ծրագրի միայն մի մասն է, որը հոսքը փոխանցում է ձայնային քարտին միջերեսներից մեկի միջոցով, տարբերությունների միակ պատճառը կարող է լինել. բեռնաթափողներ. Բայց փաստն այն է, որ մշակողները սովորաբար անջատված են լռելյայնորեն (կամ պետք է անջատվեն, քանի որ հիմնականը լավ խաղացող- կարողանալ ձայնը փոխանցել իր «անբասիր» ձևով): Արդյունքում, այստեղ համեմատության միակ առարկան կարող է լինել հնարավորություններըվերամշակում և ելք, որոնք, ի դեպ, շատ հաճախ ընդհանրապես անհրաժեշտ չեն։ Բայց եթե նույնիսկ նման անհրաժեշտություն կա, ապա սա պրոցեսորների համեմատություն է, այլ ոչ թե խաղացողների։

Վարորդի տարբեր տարբերակները տարբեր են հնչում

Այս հայտարարությունը հիմնված է ձայնային քարտի շահագործման սկզբունքների անտեղյակության վրա: Վարորդն է ծրագրային ապահովում, անհրաժեշտ է սարքի հետ արդյունավետ փոխազդեցության համար օպերացիոն համակարգ, որը սովորաբար տրամադրում է նաև գրաֆիկական ինտերֆեյս, որը թույլ է տալիս կառավարել սարքը, դրա կարգավորումները և այլն: Ձայնային քարտի դրայվերը ապահովում է, որ ձայնային քարտը ճանաչվի որպես ձայնային քարտ: Windows սարքեր, տեղեկացնում է ՕՀ-ին քարտի կողմից աջակցվող ձևաչափերի մասին, ապահովում է չսեղմված PCM (շատ դեպքերում) հոսքի փոխանցումը դեպի քարտ, ինչպես նաև հնարավորություն է տալիս մուտք գործել դեպի կարգավորումներ։ Բացի այդ, եթե կա ծրագրային մշակում (օգտագործելով պրոցեսոր), վարորդը կարող է պարունակել տարբեր DSP-ներ (պրոցեսորներ): Հետևաբար, առաջին հերթին, երբ էֆեկտներն ու մշակումն անջատված են, եթե վարորդը չի տրամադրում ճշգրիտ PCM փոխանցում քարտին, դա համարվում է կոպիտ սխալ, կրիտիկական սխալ: Եվ սա տեղի է ունենում չափազանց հազվադեպ. Մյուս կողմից, վարորդների միջև տարբերությունները կարող են լինել վերամշակման ալգորիթմների թարմացման մեջ (resamplers, effect), թեև դա նույնպես հաճախ չի լինում: Ավելին, հասնելու համար ամենաբարձր որակըազդեցությունները և վարորդի ցանկացած մշակումը դեռ պետք է բացառվեն:

Այսպիսով, վարորդների թարմացումները հիմնականում ուղղված են կայունության բարելավմանը և մշակման սխալների վերացմանը: Ո՛չ մեկը, ո՛չ մյուսը մեր դեպքում չի ազդում նվագարկման որակի վրա, հետևաբար 1000-ից 999-ի դեպքում վարորդը ձայնի վրա չի ազդում։

Լիցենզավորված աուդիո ձայնասկավառակներն ավելի լավ են հնչում, քան դրանց պատճենները

Եթե ​​պատճենահանման ընթացքում ոչ մի (ճակատագրական) կարդալու/գրելու սխալներ տեղի չեն ունեցել և օպտիկական սկավառակսարք, որի վրա կխաղարկվի պատճենահանման սկավառակը, այն կարդալու հետ կապված խնդիրներ չկան, ապա նման հայտարարությունը սխալ է և հեշտությամբ հերքվում է:

Ստերեո կոդավորման ռեժիմն ավելի լավ որակ է տալիս, քան Joint Stereo-ն

Այս սխալ պատկերացումը հիմնականում վերաբերում է LAME MP3-ին, քանի որ բոլոր ժամանակակից կոդավորիչները (AAC, Vorbis, Musepack) օգտագործում են միայնՀամատեղ ստերեո ռեժիմ (և սա արդեն ինչ-որ բան է ասում)

Սկզբից հարկ է նշել, որ Joint Stereo ռեժիմը հաջողությամբ օգտագործվում է անկորուստ սեղմումով: Դրա էությունը կայանում է նրանում, որ նախքան կոդավորումը ազդանշանը տարրալուծվում է աջ և ձախ ալիքների գումարի (Mid) և դրանց տարբերության (Side), այնուհետև տեղի է ունենում այդ ազդանշանների առանձին կոդավորում: Սահմանաչափում (աջ և ձախ ալիքների նույն տեղեկատվության համար) ստացվում է կրկնակի տվյալների խնայողություն: Եվ քանի որ երաժշտության մեծ մասում աջ և ձախ ալիքների տեղեկատվությունը բավականին նման է, այս մեթոդը շատ արդյունավետ է ստացվում և թույլ է տալիս զգալիորեն մեծացնել սեղմման գործակիցը։

Կորստի դեպքում սկզբունքը նույնն է. Բայց այստեղ, անընդհատ բիթային արագության ռեժիմում, երկու ալիքներում նմանատիպ տեղեկատվություն ունեցող բեկորների որակը կբարձրանա (սահմանում, կրկնակի), իսկ VBR ռեժիմի համար նման վայրերում բիթերի արագությունը պարզապես կնվազի (մի մոռացեք, որ հիմնական խնդիրը VBR ռեժիմը կայուն կերպով պահպանում է նշված կոդավորման որակը՝ օգտագործելով հնարավոր ամենացածր բիթային արագությունը): Քանի որ կորստի կոդավորման ժամանակ առաջնահերթությունը (բիթերը բաշխելիս) տրվում է ալիքների գումարին, որպեսզի խուսափեն ստերեո համայնապատկերի վատթարացումից, համատեղ ստերեոյի (միջին/կողային) և սովորական (ձախ/աջ) շրջանակի վրա հիմնված ստերեոյի միջև։ ռեժիմները օգտագործվում են. Ի դեպ, այս թյուրիմացության պատճառը LAME-ի հին տարբերակներում անջատման ալգորիթմի անկատարությունն էր, ինչպես նաև Forced Joint ռեժիմի առկայությունը, որում ավտոմատ անջատում չկա։ IN վերջին տարբերակները LAME Joint ռեժիմը լռելյայն միացված է, և խորհուրդ չի տրվում փոխել այն:

Որքան լայն է սպեկտրը, այնքան ավելի լավ է ձայնագրման որակը (սպեկտրոգրամների, auCDtect-ի և հաճախականության տիրույթի մասին)

Մեր օրերում, ֆորումներում, ցավոք, շատ տարածված է ուղու որակը չափել «սպեկտրոգրամ օգտագործող քանոնով»։ Ակնհայտ է, որ այս մեթոդի պարզության շնորհիվ: Բայց, ինչպես ցույց է տալիս պրակտիկան, իրականում ամեն ինչ շատ ավելի բարդ է։

Եվ ահա բանը. Սպեկտրոգրամը տեսողականորեն ցույց է տալիս ազդանշանային հզորության բաշխումը հաճախականությունների վրա, բայց չի կարող ամբողջական պատկերացում տալ ձայնագրության ձայնի, դրա մեջ աղավաղումների և սեղմման արտեֆակտների առկայության մասին: Այսինքն՝ ըստ էության այն ամենն է, ինչ կարելի է որոշել սպեկտրոգրամից հաճախականության տիրույթ(և մասամբ - սպեկտրի խտությունը HF տարածաշրջանում): Այսինքն՝ լավագույն դեպքում սպեկտրոգրամի վերլուծությամբ կարելի է վերափոխում հայտնաբերել։ Տարբեր կոդավորիչներով կոդավորմամբ ստացված հետքերի սպեկտրոգրամները բնօրինակի հետ համեմատելը կատարյալ անհեթեթություն է։ Այո, դուք կարող եք բացահայտել սպեկտրի տարբերությունները, բայց որոշելը, թե արդյոք (և որքանով) դրանք կընկալվեն մարդու ականջի կողմից, գրեթե անհնար է: Չպետք է մոռանալ, որ կորստի կոդավորման խնդիրն անտարբերելի արդյունք ապահովելն է մարդկային ականջբնօրինակից (ոչ աչքով):

Նույնը վերաբերում է կոդավորման որակը գնահատելուն՝ auCDtect ծրագրով ելքային հետքերը վերլուծելով (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect. սրանք ընդամենը կեղևներ են auCDtect եզակի վահանակի ծրագրի համար): auCDtect ալգորիթմը նաև իրականում վերլուծում է հաճախականությունների տիրույթը և թույլ է տալիս միայն որոշել (որոշակի հավանականությամբ)՝ արդյոք MPEG սեղմումը կիրառվել է կոդավորման որևէ փուլում: Ալգորիթմը հարմարեցված է MP3-ի համար, ուստի հեշտ է «խաբել» այն Vorbis, AAC և Musepack կոդեկների օգնությամբ, այնպես որ, եթե նույնիսկ ծրագիրը գրի «100% CDDA», դա չի նշանակում, որ կոդավորված աուդիոը 100% է: նույնական է բնօրինակին:

Եվ անմիջապես վերադառնալով սպեկտրներին: Որոշ «էնտուզիաստների» մոտ կա նաև տարածված ցանկություն՝ ամեն գնով անջատելու LAME կոդավորման ցածր անցումային ֆիլտրը: Այստեղ ակնհայտորեն բացակայում է կոդավորման և հոգեակուստիկայի սկզբունքները: Նախ, կոդավորիչը կրճատում է բարձր հաճախականությունները միայն մեկ նպատակով՝ պահպանել տվյալները և օգտագործել դրանք առավել լսելի հաճախականությունների տիրույթը կոդավորելու համար: Ընդլայնված հաճախականության տիրույթը կարող է ճակատագրական ազդեցություն ունենալ ձայնի ընդհանուր որակի վրա և հանգեցնել ձայնային կոդավորման արտեֆակտների: Ավելին, 20 կՀց-ով անջատման անջատումն ընդհանրապես լիովին անհիմն է, քանի որ մարդը պարզապես չի կարող լսել ավելի բարձր հաճախականություններ:

Կա որոշակի «կախարդական» հավասարիչի նախադրյալ, որը կարող է զգալիորեն բարելավել ձայնը

Սա ամբողջովին ճիշտ չէ, նախ, քանի որ յուրաքանչյուր անհատական ​​կոնֆիգուրացիա (ականջակալներ, ակուստիկա, ձայնային քարտ) ունի իր սեփական պարամետրերը (մասնավորապես, դրա ամպլիտուդա-հաճախական բնութագիրը): Եվ հետևաբար, յուրաքանչյուր կոնֆիգուրացիա պետք է ունենա իր ուրույն, յուրահատուկ մոտեցումը։ Պարզ ասած, նման հավասարիչի նախադրյալ գոյություն ունի, բայց այն տարբերվում է տարբեր կոնֆիգուրացիաների համար: Դրա էությունը կայանում է նրանում, որ կարգավորվի ուղու հաճախականության արձագանքը, այն է՝ «հարթեցնել» անցանկալի անկումները և ալիքները:

Նաև այն մարդկանց շրջանում, ովքեր հեռու են ձայնի հետ ուղղակիորեն աշխատելուց, շատ տարածված է գրաֆիկական հավասարիչի տեղադրումը «տիզով», ինչը իրականում ներկայացնում է ցածր հաճախականության և բարձր հաճախականության բաղադրիչների մակարդակի բարձրացում, բայց միևնույն ժամանակ հանգեցնում է. վոկալի և գործիքների խլացում, որոնց ձայնային սպեկտրը գտնվում է միջին հաճախականության շրջանում։

Երաժշտությունը մեկ այլ ձևաչափի փոխարկելուց առաջ դուք պետք է ապասեղմեք այն WAV-ի

Անմիջապես նշեմ, որ WAV նշանակում է PCM տվյալներ (զարկերակային կոդի մոդուլյացիա) WAVE կոնտեյներով (*.wav ընդլայնմամբ ֆայլ): Այս տվյալները ոչ այլ ինչ են, քան բիթերի (զրոներ և միավորներ) հաջորդականություն 16, 24 կամ 32 խմբերում (կախված բիթերի խորությունից), որոնցից յուրաքանչյուրը ներկայացնում է համապատասխան նմուշի ամպլիտուդի երկուական կոդը (օրինակ՝ 16 բիթ տասնորդական նշումով սրանք արժեքներ են -32768-ից մինչև +32768):

Այսպիսով, փաստն այն է, որ ցանկացած ձայնային պրոցեսոր՝ լինի դա զտիչ, թե կոդավորիչ, սովորաբար աշխատում է միայնայս արժեքներով, այսինքն միայնչսեղմված տվյալների հետ: Սա նշանակում է, որ աուդիո, ասենք, FLAC-ից APE-ի փոխակերպելու համար դուք պարզապես անհրաժեշտՍկզբում վերծանեք FLAC-ը PCM-ի, այնուհետև կոդավորեք PCM-ը APE-ի: Դա նման է ֆայլերը ZIP-ից RAR-ի վերափաթեթավորմանը, նախ պետք է բացել ZIP-ը:

Այնուամենայնիվ, եթե դուք օգտագործում եք փոխարկիչ կամ պարզապես առաջադեմ կոնսոլային կոդավորիչ, PCM-ի միջանկյալ փոխարկումը տեղի է ունենում անմիջապես, երբեմն նույնիսկ առանց ժամանակավոր WAV ֆայլի գրելու: Սա այն է, ինչ մոլորեցնում է մարդկանց. թվում է, թե ձևաչափերը ուղղակիորեն փոխարկվում են մեկից մյուսը, բայց իրականում նման ծրագիրը պետք է ունենա մուտքային ձևաչափի ապակոդավորիչ, որը միջանկյալ փոխակերպում է PCM:

Այսպիսով, WAV-ի ձեռքով փոխակերպումը ձեզ բացարձակապես ոչինչ չի տա, քան ժամանակի վատնում:

Ի՞նչը կորոշի թվայնացված ձայնի որակը:

    Թվային ձայնի որակի համար երկու բան էական է` բնօրինակ սաունդթրեքի որակը և անալոգային թվային փոխարկիչի որակը:

    Ինչ վերաբերում է բնօրինակ սաունդթրեքի որակին, ապա ամեն ինչ մոտավորապես պարզ է։ Եթե ​​այն կոր է (աղավաղումներով) կամ աղմկոտ, ապա ոչ մի թվայնացում այն ​​չի բարելավի: Դե, այսինքն, հնարավոր է տարբեր մշակման միջոցով, ներառյալ թվայինը, մեկուսացնել օգտակար ազդանշան, որն օգտագործվում է արտաքին աղմուկի ֆոնի վրա խոսքը մեկուսացնելիս կամ պատահական աղմուկի ֆոնի վրա սովորական ազդանշան մեկուսացնելիս (բոլորն ունեն. սպինների մասին ֆիլմեր եմ դիտել, չէ՞), բայց եթե խոսքը երաժշտական ​​հնչյունագրի, այսինքն՝ լայն սպեկտրով հնչյունագրի մասին է, ապա բոլոր տեսակի հնարքները չեն օգնի։

    Այսպիսով, մենք կենթադրենք, որ հնչյունագիրը բարձրորակ է։

    Հետո մնում է միայն ADC-ն:

    Այստեղ հիմնական ցուցանիշը կոդավորման բիթերի խորությունն է: Հասկանալի է, որ որքան մեծ է, այնքան լավ, բայց մյուս կողմից, այնքան բարդ և թանկ է նման փոխարկիչը։ Թվային տեխնոլոգիայի արշալույսին (որը ոչ այնքան վաղուց էր...), 16-բիթանոց վերջնական ձայնագրությունը ճանաչվեց օպտիմալ գին/որակ հարաբերակցության առումով։ Ավելի ցածր բիթային խորությամբ տուժում է հնչյունագրի թվային պատճենի դինամիկ տիրույթը. ցածր մակարդակի հնչյունները (pianissimo) կազմում են բոլոր բիթերի միայն մի փոքր մասը, ինչը նշանակում է, որ ազդանշանի փոփոխության աստիճանական բնույթը նկատելի է դառնում: Եվ ցածր անցումային զտումը այստեղ շատ չի օգնի (Կոտելնիկովի թեորեմի հիշատակումը ողջունելի է, բայց չպետք է մոռանալ, որ դա լռելյայն ենթադրում է. կատարյալանալոգային-թվային փոխակերպում, այսինքն՝ անսահման մեծ բիթային խորությամբ): Քանի որ ցանկացած մշակում, նույնիսկ թվային ձևով, կարող է միայն նվազեցնել բիթերի արդյունավետ խորությունը, ստուդիաներում թվայնացումը եղել և շարունակվում է մինչ օրս իրականացվել ավելի մեծ թվով բիթերով:

    Մեր օրերում այլևս հազվադեպ չէ թվային հնչյունագրերի պատրաստումը 24 բիթ խորությամբ (սուպեր-Աուդիո CD, Աուդիո-DVD): Նման մի փոքր խորությամբ հնարավոր կլինի ամբողջությամբ փոխանցել ցանկացած երաժշտական ​​ստեղծագործության դինամիկ տիրույթը, նույնիսկ Ռավելի Բոլերոն, որը սկսվում է թմբուկի հազիվ լսելի մասից և ավարտվում ֆորտիսիմոյի ամբողջ նվագախմբի հետ:

    Ահա դուք գնացեք: Բացի բիթերի խորությունից, կարևոր են նաև ADC-ի այլ պարամետրերը, հիմնականում ոչ գծայինությունը և աղմուկը: Հատկապես աղմուկներ. Քանի որ դրանք սահմանափակում են փոխարկիչի արդյունավետ բիթային հզորությունը: Ի՞նչ իմաստ ունեն այս 24 բիթերը, եթե դրանցից վերջին 8-ը աղմկոտ են և, հետևաբար, չեն կրում որևէ մեկը: օգտակար տեղեկատվություն... Ժամանակակից 24-բիթանոց ADC-ների աղմուկի մակարդակը կարող է հասնել -115 դԲ 100 կՀց-ից բարձր նմուշառման արագության դեպքում, սա արդեն բավականին պարկեշտ է, և դիֆերենցիալ ոչ գծայինությունը չափվում է տոկոսի տասը հազարերորդականներով: Այսինքն՝ նման լուծումները հեշտությամբ գերազանցում են մարդու ականջի հնարավորությունները։

  • Դա կախված կլինի երեք հիմնական պարամետրերից.

    1. Նմուշառման տոկոսադրույքը. Այն սահմանափակում է փոխանցվող հաճախականությունների թողունակությունը. փոխանցվող ազդանշանի առավելագույն հաճախականությունը նմուշառման հաճախականության կեսից ցածր է: Հեռախոսակապում առավել հաճախ օգտագործվում է 8 կՀց նմուշառման հաճախականություն, որը տալիս է 4 կՀց-ից մի փոքր ավելի նեղ տեսական գոտի (գործնականում օգտագործվում է 300-3000 Հց գոտի)։ Իսկ CD ստանդարտն օգտագործում է 44,1 կՀց հաճախականություն, ինչը հնարավորություն է տալիս ամբողջությամբ փոխանցել 20 Հց - 20 կՀց սպեկտրը։ Այս արժեքներից վեր նմուշառման արագության բարձրացումը իմաստ չունի փոխանցվող հաճախականությունների տիրույթի առումով, բայց դա նվազեցնում է միջմոդուլյացիայի խեղաթյուրման մակարդակը: DVD Audio ստանդարտում նմուշառման առավելագույն հաճախականությունը 192 կՀց է, որոշ լավ աուդիո քարտեր նույնպես աջակցում են այս նմուշառման հաճախականությանը (նվագարկման և ձայնագրման հաճախականությունը տարբերվում է մոդելից): Այլ ստանդարտ արժեքներն են 96, 48, 32, 22.05, 11.025 կՀց:
    2. Կոդավորման բիթերի խորությունը: Դինամիկ տիրույթը կախված է դրանից՝ գծային կոդավորման դեպքում լրիվ ճոճման և նվազագույն քայլի միջև տարբերությունը 8 բիթերի համար 256 անգամ է, իսկ 16 բիթերի համար՝ 65536 անգամ, ինչը համապատասխանաբար 48 և 96 դԲ է։ 48 դԲ-ն անկեղծորեն ցածր է, սա կոմպակտ ձայներիզների դինամիկ տիրույթի մակարդակն է, և բացի այդ, նեղ դինամիկ միջակայքից բացի, տհաճ աղավաղումներ են առաջանում, հատկապես հանգիստ վայրերում հստակ լսելի են՝ հարթ ազդանշանի փոխակերպման հետևանք։ աստիճանականի մեջ։ 16-բիթանոց ձայնի որակն արդեն բավականին լավ է (սա ձայնասկավառակի բիթի խորությունն է), բայց շատ իրական դեպքերում իդեալական չէ. շատ դասական ստեղծագործություններ, ինչպես նաև ծանր երաժշտություն, պահանջում են ավելի մեծ DD: Բարձրորակ համակարգերն օգտագործում են 24-բիթանոց կոդավորում, թեև նշանակալի բիթերի իրական թիվը չի գերազանցում 18-20-ը: Բիթերի խորությունը հետագայում ավելացնելու իմաստ չկա:
    3. Կոդավորման մեթոդ. Սրա երկու կողմ կա. Առաջինը ինքնին նմուշառման սանդղակն է: Այն սովորաբար գծային է, բայց կարող է լինել նաև լոգարիթմական: Սա տալիս է դինամիկ տիրույթի աճ նույն բիթային խորությամբ, բայց աղավաղման մակարդակը ավելի բարձր է, քան նույն դինամիկ տիրույթում գծային մասշտաբով և ավելի բարձր բիթային խորությամբ: Երկրորդը տարբեր կորուստներով սեղմման ալգորիթմների օգտագործումն է: Վերջինիս հետ կապված ի հայտ է գալիս բիտրեյթ հասկացությունը։ Վերջինս ձայնի մեկ վայրկյան կոդավորման համար անհրաժեշտ բիթերի քանակն է: Բնականաբար, բիթային արագությունը կախված է նմուշառման հաճախականությունից և բիթերի խորությունից, ինչպես նաև սեղմման հարաբերակցությունից: Սեղմումը կարող է լինել կորստի կամ անկորուստ: Անկորուստ սեղմումը, ըստ էության, սովորական արխիվացում է և չի ազդում ձայնի վրա: Իսկ կորուստներով, դրա համար էլ կորուստներ են։ Կոդավորիչը վերլուծում է աուդիո տեղեկատվությունը և հեռացնում է տվյալները՝ առաջնորդվելով հոգեակուստիկ նկատառումներով. այն, ինչ ամենաքիչը լսելի կլինի: Այսինքն՝ թույլ ձայն ուժեղի ֆոնին, թույլ բարձր հաճախականություն՝ ուժեղ միջին հաճախականության ձայների ֆոնին եւ այլն։ Միջին վրա և բարձր հաճախականություններփուլային տեղեկատվությունը կարող է անտեսվել: Արդյունքում, երբ ձայնագրությունը սեղմվում է ձայնասկավառակի որակով 4,5 անգամ (բիտրեյթ 320 կբ/վ, mp3/Կաղ), ձայնագրության լսելի վատթարացումն այնքան աննշան է, որ առանց լավ սարքավորումների, շատ դժվար է տարբերությունը նկատել։ Իսկ 128 բիթային արագությամբ ձայնի որակի վատթարացումն արդեն ակնհայտ է, և շատ ձայնագրություններ հնչում են պարզապես տհաճ: Բայց նոութբուքի մեջ ներկառուցված պլաստիկ բարձրախոսներով կամ բարձրախոսներով դուք չեք լսի այս տարբերությունը:

© 2024 ermake.ru -- Համակարգչի վերանորոգման մասին - Տեղեկատվական պորտալ