Ce este sunetul 3D? Câteva lucruri de știut despre formatele de sunet surround

Deoarece majoritatea oamenilor nu sunt experți în tehnologia audio/video, alegerea formatelor de sunet surround poate fi o sarcină foarte dificilă pentru ei. Prin urmare, am decis să caracterizăm toate formatele audio universale.

Pentru început, este necesar să luăm în considerare câțiva termeni și concepte generale.

Audio pe 5.1 canale- cel mai comun format audio. Include șase canale audio - cinci lățime de bandă completă (față, spate, stânga, dreapta și centru) cu o gamă de frecvență de 3-20.000 Hz și o frecvență joasă limitată (LFE) 2-120 Hz. Există, de asemenea, sisteme surround 6.1 și 7.1, care diferă de 5.1 prin faptul că au canale suplimentare cu lățime de bandă completă.

Sunet separat (Discret)- are, de asemenea, mai multe canale de redare a semnalului, toate sunt independente unele de altele și semnalul nu se amestecă în timpul redării.

Format matrice- informațiile audio sunt înregistrate pe un număr mic de canale, iar în timpul redării sunt decodificate (convertite) și redate printr-un număr mai mare de canale audio. Canalele separate recreează mai precis mediul acustic surround, dar codarea matriceală vă poate mulțumi și cu calitatea sunetului.

Compresie fără pierderi- majoritatea formatelor de sunet surround sunt comprimate astfel încât să fie mici și să poată fi înregistrate disc DVDși sau ar putea fi difuzat televiziune prin satelit. Dar acum multe Blu-ray-uri dețin mult mai multe informații, astfel încât sunetul este fără pierderi și calitatea se potrivește cu înregistrarea originală de studio.

Cu cât calitatea acestor formate este mai mare, cu atât sunetul emis este mai detaliat.

Audio pe 5.1 canale

După cum am spus mai sus, sunetul pe 5.1 canale este cel mai comun în sistemele home theater de astăzi. Există două formate principale care se bazează pe sisteme 5.1.

Dolby ® Digital

Dolby Digital a devenit rapid popular cu filmele pe DVD. De asemenea, este utilizat în prezent în HDTV și jocuri video. Deși Dolby Digital este, în linii mari, doar o metodă de codificare a informațiilor într-un format digital, termenul în sine este adesea folosit pentru a se referi la audio 5.1. Prin urmare, când luăm în considerare Dolby Digital, ne vom concentra pe 5.1.

Spre deosebire de formatele anterioare de sunet surround, audio Dolby Digital 5.1 este un sistem separat cu mai multe canale. Cu șase canale independente, semnalul audio este reprodus foarte precis. De asemenea, beneficiați de un canal de bas dedicat (subwoofer) pentru o reproducere de calitate a basului.

La fel ca Dolby Digital, DTS oferă 5.1 canale semnal digital. Cu toate acestea, formatul DTS este comprimat mai puțin decât Dolby Digital atunci când este înregistrat. Rezultatul este un sunet ceva mai precis. Dar, în timp ce majoritatea receptoarelor AV acceptă atât Dolby Digital, cât și DTS la fel de bine, majoritatea DVD-urilor și a jocurilor video sunt codificate în Dolby Digital.

Audio pe 6.1 canale

În timp ce 5.1 este cel mai popular format și majoritatea sistemelor home theater vândute astăzi sunt sisteme 5.1, 6.1 este, de asemenea, comun. Sistemul 6.1 oferă un efect de prezență și mai mare decât 5.1. Să ne uităm la principalele opțiuni de codare din 6.1.

DTS-ES folosește tehnologiile digitale multicanal existente pentru a reproduce DTS pe 5.1 canale, dar adaugă un canal surround central separat, cu lățime de bandă completă. Deși majoritatea filmelor sunt codificate în EX Dolby Digital, dar ES DTS este încă în uz, deci receptoare moderne 6.1 va suporta ambele formate.

Dolby Digital EX și THX Surround EX

Dolby Labs, în colaborare cu THX, a venit cu propria lor soluție pentru problema de codificare a sunetului surround pe 6.1 canale. În esență, au făcut același lucru ca și DTS-ES - adăugând un canal central surround matrice pentru a oferi un spațiu de sunet complet de 360 ​​de grade. Dacă aveți un sistem cu 7.1 canale, semnalul audio va ajunge la ambele difuzoare din spate.

Multe DVD-uri sunt codificate în EX Dolby Digital și au un . De asemenea, dacă redați un DVD Dolby Digital 5.1, decodorul Dolby Digital EX sau THX Surround EX va simula în continuare sunetul surround 6.1 prin procesarea informațiilor pe canalele separate din spate și trimite pista audio matrice către difuzoarele din spate.

7.1 canale audio

Pe lângă formatele HD, modern Formate Blu-ray acceptă audio mai detaliat. Majoritatea playerelor Blu-ray pot reda 7.1, iar unele dintre ele chiar garantează nicio pierdere audio la decodare. Deși playerul și receptorul pot descifra aceste noi tipuri de sunet surround, este important să rețineți că nu toate discurile sunt înregistrate în aceste formate. Prin urmare, atunci când cumpărați filme Blu-Ray sau jocuri video, verificați informațiile despre ce codecuri audio au fost folosite la înregistrarea informațiilor, pentru ca ulterior să nu fiți dezamăgiți de calitatea sunetului. Vă puteți conecta playerul la receptor utilizând ieșiri audio analogice sau compatibile HDMI 1.3.

Compresie fără pierderi

Cele mai recente formate de sunet surround de înaltă definiție, Dolby TrueHDȘi DTS-HD Master Audio oferă redare de până la 7,1 canale audio fără pierderi. Pe lângă adăugarea a două canale surround suplimentare pentru formatele standard Dolby Digital și DTS, sistemele Dolby TrueHD și DTS-HD Master Audio sunt codificate cu mai multe informații despre canal. De fapt, calitatea acestor formate este identică cu cea a înregistrărilor originale de studio. Direcționalitatea îmbunătățită a sunetului și claritatea efectelor fac sunetul și mai realist.

Formate suplimentare cu 7.1 canale separate

Este posibil să observați că unele discuri Blu-ray sunt codificate cu alte formate surround 7.1 separate. De exemplu, Dolby Digital Plus de la DTS și Dolby Laboratories și DTS-HD (înaltă definiție). Aceste formate oferă sunet prin canale independente 7.1. Ele oferă o experiență mai captivantă decât 5.1 Dolby Digital și DTS, dar nu fără pierderi precum Dolby TrueHD și DTS-HD Master Audio. Receptoarele care acceptă formate de sunet fără pierderi pe 7.1 canale pot reda și Dolby Digital Plus și DTS-HD la înaltă definiție.

Decodare matrice surround pentru surse mai vechi

Când utilizați o conexiune analogică stereo la receptor sau conectați echipamente vechi, cum ar fi un VCR, convertorul poate utiliza unul dintre următoarele tipuri de procesare pentru a decoda semnalul.

Dolby Pro Logic II include două canale surround independente cu lățime de bandă completă, trei canale surround matrice și un canal de bas dedicat pentru subwoofer. Multe dintre cele mai recente modele acceptă și procesarea Pro Logic IIx, care poate converti semnalul audio la 7.1.

Receptoarele cu Dolby Pro Logic II și IIx pot adăuga intensitate suplimentară la mii de filme VHS și emisiuni TV înregistrate în stereo sau Dolby Surround cu 4 canale. Multe convertoare au, de asemenea moduri speciale care decodifică muzica stereo în sunet surround.

DTS Neo: 6 este practic identic cu Pro Logic II - este doar o metodă de procesare dezvoltată de DTS pentru decodarea audio stereo pe două canale în 5.1 sau 6.1. Și la fel ca Pro Logic II oferă efectul sunet spațial.

Canale „Înălțime” pentru scena sonoră

Unele receptoare oferă un nou format de sunet surround Dolby Pro Logic IIz. Adaugă două canale de „înălțime” scenei de sunet. Aceste difuzoare sunt de obicei montate pe perete deasupra difuzoarelor frontale din stânga și din dreapta.

Un receptor cu Pro Logic IIz poate împărți semnalul audio în scenele frontale. Trimite sunet direcțional către difuzoarele dvs. frontale și audio omnidirecțional (zgomot de fundal, extra, fani de stadion) către canalele de „înălțime”.

Procesarea semnalului digital DSP

Uneori, producătorii oferă propriile lor sisteme de procesare specializate, adesea denumite DSP, pe lângă suportul altor formate. Multe sisteme home theater folosesc procesarea digitală a semnalului pentru a crea o scenă sonoră (care simulează un mediu acustic, cum ar fi o sală de concert sau un stadion) și pentru a controla cu precizie informațiile coloana sonoră multicanal. Această funcție poate fi numită diferit, în funcție de compania producătorului. Numele acestei funcții poate fi găsit în instrucțiunile de utilizare a receptorului sau a sistemului home theater.

Termenul „sunet 3D” a fost folosit atât de des în diverse tehnici încât acum este greu de înțeles ce înseamnă exact. Acesta poate fi un simplu algoritm de extensie de bază stereo și, de exemplu, o înregistrare binaurală pentru căști. Prin urmare, Auro subliniază că, în înțelegerea sa, sunetul 3D este sunet în trei dimensiuni, atunci când dispunerea difuzoarelor este realizată de-a lungul a trei axe perpendiculare (x, y, z), iar înregistrarea și mixarea se realizează pe baza acestui aranjament de sistem. Despre ce se întâmplă în interiorul pistelor Auro și de ce compania belgiană a decis să recâștige piața de la Dolby Atmos și DTS:X, și vor fi discutate.

Istorie

Totul a început cu un apel telefonic în martie 2005. Producătorul german Tom Hapke a avut ideea de a face un mix audio 2+2+2 și l-a abordat pe Wilfried Van Baelen, șeful studioului belgian Galaxy, să o facă. Wilfried a fost inițial sceptic cu privire la idee: această configurație presupunea un circuit quadrafonic cu două canale suplimentare instalate mai sus decât cele frontale, și părea justificată în dublarea filmelor, dar nu înțelegea ce ar beneficia muzica de pe urma a două canale frontale suplimentare. Până am ascultat clasicii în acest format.

Sunetul s-a dovedit a fi mai profund, mai transparent, mai voluminos decât în ​​configurația „plată” 5.1 și l-a determinat pe Wilfried să experimenteze. Deoarece albumul trebuia înregistrat în formatele 2 + 2 + 2, 5.1 și 2.0, a luat schema 5.1 ca punct de plecare și i-a adăugat o pereche de canale frontale, dar după aceea a simțit un dezechilibru: 6 canale erau responsabile. pentru emisfera din față, în timp ce din spate - doar 2. Decizia lui a fost simplă - adăugați mai multe mai multe canale, iar spatele a primit și o pereche suplimentară de difuzoare situate puțin mai sus. Configurația a crescut la formatul 9.1, dar nu și-a pierdut compatibilitatea cu formatul 5.1.


Potrivit lui Wilfried, ceea ce a experimentat a fost comparabil cu prima sa expunere la sunetul quadrafonic. Difuzoarele chiar au dispărut, era o senzație de prezență la locul unde s-a făcut înregistrarea.

Acest experiment a marcat începutul unei istorii de cinci ani a dezvoltării formatului Auro 3D.

De la ureche la creier

Wilfried a început să studieze principiile aparatului auditiv pentru a înțelege de ce, adăugând o dimensiune suplimentară a sunetului, percepția lui asupra sunetului s-a schimbat atât de mult și de unde a venit acest sentiment de imersiune. Drept urmare, el a aflat că o astfel de impresie atotcuprinzătoare este creată de un câmp difuz în spate.

După cum știți, atunci când mixați în stereo, se folosește foarte des tehnica tranziției sunetului de la un canal la altul, ceea ce creează iluzia că sursa se mișcă într-un plan orizontal. Wilfried, continuându-și experimentele, a vrut să obțină un efect similar în plan vertical, dar nu a reușit. La început, a crezut că problema era în echipament, dar totul s-a dovedit a fi mai interesant: a auzit efectul dorit înclinând capul în lateral și apropiindu-se de difuzoare.


Concluzia este că modelul de radiații al auzului uman tinde mai mult spre planul orizontal și, deoarece oamenii nu au ureche pe ceafă, nu putem procesa componenta verticală în consecință. În localizarea sunetului, o persoană este ajutată de diferența de nivel al semnalelor, diferența de timp de percepție a semnalului de către urechea stângă și dreaptă și de semnalele reflectate. De fapt, 90% dintre sunetele pe care urechea umană le percepe sunt reflexii tridimensionale ale semnalului original. Iar difuzoarele situate la nivelul capului reproduc exact acele semnale care sunt ulterior reflectate de la podea.

După canale, după obiecte

Formatul Auro-3D, spre deosebire de Dolby Atmos și DTS:X concurente, nu este orientat pe obiecte, ci pe canal. Pentru a obține un „sunet învăluitor” celor două straturi de difuzoare - clasicul și al doilea, situate la un unghi de 30 de grade față de orizont - Wilfried a adăugat un al treilea, instalat direct deasupra ascultătorului. Acest al treilea strat de acustică a fost numit „vocea lui Dumnezeu” și a adăugat o a treia dimensiune sunetului - înălțimea. Dacă în configurațiile teatrale standard, chiar și în Dolby Atmos și DTS:X, ascultătorul este înconjurat de un strat sferic de sunet, atunci în Auro-3D este, parcă, învăluit de o emisferă cu drepturi depline.


În tehnologia de înregistrare a obiectelor, fiecare sursă de sunet este înregistrată separat, în timp ce în cazul canal-cu-canal sunetul este distribuit între diferite canale și apoi adăugat împreună în coloane. De exemplu, atunci când înregistrați sunetul unui drum aglomerat într-un format orientat pe obiecte, nu va fi posibilă izolarea obiectelor în mișcare în sine - mașini, biciclete, oameni - pentru utilizare ulterioară, nu va fi posibilă obținerea tridimensională. sunet reflectat de aceste obiecte, precum și direct. Într-un sistem canal cu canal, această problemă este rezolvată prin simplificare și aici intră în joc componenta verticală.

Al treilea strat de difuzoare din Auro 3D creează un „câmp stereo vertical” în jurul ascultătorului și pentru orice aranjare a acusticii în Auro 3D. În sine, al treilea strat nu ajută la localizare - ajută la reproducerea elicopterelor, navelor stelare și a efectelor meteorologice care zboară deasupra capului, dar auzul uman nu este foarte receptiv la sunetele care vin direct de sus și, în general, puține informații sonore provin de acolo, din tavan. Evoluția este de vină pentru asta: s-a întâmplat ca cel mai adesea, în zorii omenirii, pericolul să vină aproximativ de la același nivel la care se afla persoana, și nu de sus, și de aceea creierul a procesat intens sunetele reflectate din pământul.

Formatul Auro 3D, chiar și într-o configurație redusă, cu mai puține straturi audio, este capabil să reproducă poziționarea verticală a surselor de sunet și, prin urmare, se adaptează perfect la o mare varietate de încăperi și sisteme. În plus, Auro 3D este singurul format audio 3D de pe piață care acceptă un proces de masterizare bazat pe mixare pe toate canalele pe care formatele de înregistrare a obiectelor nu nu pot. De fapt, Auro 3D este singurul format de pe piață pentru muzică în 3D. În același timp, în era formatelor comprimate - MP3, AAC și altele - Auro 3D are o calitate de 24 de biți / 96 kHz.

Pe fiecare dispozitiv

Tehnologia Auro-3D Engine include decodor Auro-Codec și upmixer Auro-Matic. Cu ajutorul acestor doi algoritmi se realizează universalitatea sistemului. Decodorul recunoaște și decodifică audio nativ în format Auro-3D, în timp ce upmixer-ul folosește un algoritm de upmixing pentru distribuția audio de la mono, stereo, 5.1 și 7.1 la Auro-3D, cu condiția, desigur, să fie disponibil numărul necesar de canale. Adică filmele deja înregistrate pe Blu-ray sau chiar DVD, și muzica editată în stereo, pot fi apreciate într-un format nou, maxim tridimensional.


Tehnologia tradițională upmix folosește modificări în egalizarea spectrului și adaugă algoritmi de reflexie. Când au dezvoltat Auro-Matic, inginerii nu au vrut să audă reverberații inutile sau inexactități de fază, dar au vrut să transmită sunetul cât mai aproape posibil de modul în care autorul l-a auzit și a intenționat. Și au dezvoltat algoritmi legați de HRTF (Head Related Transfer Function) - o tehnologie care ține cont de modul în care urechea umană percepe sunetele în condiții naturale. Posesorii de iPhone și iPad pot evalua funcționarea algoritmului citind aplicația Beautifyer (din păcate, nu este disponibilă în Rusia).


La un moment dat, Auro-Technologies s-a confruntat cu o problemă interesantă: dezvoltatorii de echipamente nu au căutat să implementeze tehnologia Auro-3D din cauza faptului că nu exista conținut corespunzător, iar creatorii de conținut nu au folosit formatul Auro-3D datorită faptului că nu era nimic pe ea. trebuia să se reproducă. Prin urmare, compania a decis să lanseze independent un receptor care acceptă Auro-3D, iar de-a lungul timpului, alții au urmat exemplul. Acum, pe lângă linia de produse StormAudio, tot mai mulți producători au introdus Auro-3D în echipamentele lor AV: printre aceștia se numără Denon, Marantz, Steinway Lyngdorf, Macintosh, Trinnov, Theta Digital, StormAudio, ATI și Datasat.


Interfață de setări de instalare Auro-3D în procesorul Trinnov Altitude 32

Pe lângă sistemele audio și sistemele audio de acasă și non-home, Auro-3D și-a luat locul în industria auto. Împreună cu Continental, dezvoltatorii au creat un sistem de sunet 3D unic încorporat în mașină, iar primele mașini echipate cu sistemul Auro-3D vor vedea lumina zilei în 2017. Câmpul sonor al unui astfel de plan schimbă atmosfera pentru șofer, îi permite să se relaxeze și să se simtă mai confortabil și chiar, potrivit unora, parcă ar extinde spațiul interior. Potrivit lui Wilfried, atunci când ascultăm muzică în 3D, creierul nostru se încordează mai puțin decât atunci când procesează o coloană sonoră stereo - de aici și confortul suplimentar.


Mașină Porsche Panamera cu un sistem Burmester instalat care poate funcționa cu sunet Auro-3D

Acum există deja aproximativ 200 de albume înregistrate în format Auro 9.1 și destul de multe - în format 10.1, folosind cel mai înalt canal. Domeniul de aplicare al acestui canal este destul de specific - este necesar să se reproducă exact acele sunete care vin direct de sus, iar în muzică nu există de obicei obiecte situate deasupra ascultătorului. Nici măcar înregistrările concertelor live nu au nevoie de „vocea lui Dumnezeu”, deoarece sălile de concerte tind să aibă mai puține reflexii. Printre cele două sute de albume în format 9.1 se numără nu numai compoziții clasice, ci și jazz, rock și artiști populari și chiar muzică de dans.


Formatul va captura și dispozitivele mobile. Combinat cu tehnologia binaurală Auro-3D pentru dispozitive mobile va putea crea un sunet captivant tridimensional imediat într-un smartphone și să-l transfere în căști: sistemul este capabil atât să decodeze conținutul original Auro-3D, cât și să reda întreaga bibliotecă stereo, filme și alte fișiere media în format audio Auro-3D folosind upmix.


Interfață Wwise cu opțiuni pentru lucrul cu sunetul Auro-3D

Jocurile video ies în evidență. Tehnologia Auro-3D vă va permite să creați peisaje sonore care le vor oferi jucătorilor o experiență complet diferită. Compania a colaborat cu Audio-Kinetics și a încorporat formatul în software-ul Wwise pentru crearea de sunet pentru jocurile pentru computer. Versiunea AuroWwise acceptă sunet 3D pentru medii interactive și jocuri păstrând în același timp totul funcţionalitate. Primul joc Auro-3D va fi Get Even, care va fi lansat în primăvara lui 2017. Cu difuzoare, însă, conform lui Wilfried, acest sunet încă nu poate fi comparat.

De câte difuzoare ai nevoie?

Pentru home theater, configurația minimă recomandată este 9.1, soluția optimă este 11.1, iar în sălile deosebit de mari ar trebui folosit Auro 13.1. Este nevoie de aceeași cantitate de spațiu ca și pentru amplasarea optimă a sistemelor 5.1 și 7.1. Dezvoltatorii au testat Auro-3D într-o varietate de medii - tavan înalt, tavan jos, medii uscate și umede și au realizat că sistemul este cu adevărat flexibil.


Acum există un nou format AuroMax - este un format hibrid, orientat pe canal și pe obiecte care utilizează o configurație de la 20.1 la 26.1. Formatul AuroMax este o dezvoltare comună a Auro-Technologies, Barco și Iosono și este folosit în cinematografe cu drepturi depline. În home theater, potrivit dezvoltatorilor, nu este nevoie de o astfel de configurație maximă, dar cuvântul clientului este lege. Adevărat, locul va necesita chiar mai mult decât versiunea cu 13.1 canale.

Potrivit lui Wilfried, nici măcar un milion de vorbitori nu vor putea reproduce lumea din jurul nostru în mod natural - urechile noastre sunt prea deștepte pentru a fi atât de înșelați. Prin urmare, scopul Auro-3D nu este de a folosi cât mai multe canale posibil, ci mai degrabă de a obține cel mai învăluitor sunet cu cele mai puține difuzoare. Prin urmare, nu ar trebui să încercați să instalați o configurație de 26.1 canale într-un cinema mic - pur și simplu nu va avea sens, efectul canalelor suplimentare nu va bloca efortul, nervii și banii cheltuiți pentru instalare. Este mai bine să te descurci cu versiunea cu 11.1 canale.

Pentru cinematografe cu ecran lat și studiouri de film

În 2011, Wilfried a început un parteneriat cu producătorul belgian de echipamente video Barco. Această firmă a început să folosească sistemele Auro-3D în echipamentele sale cinematografice și, în același an, a instalat pentru prima dată sistemul Auro 11.1. Primul film în acest format a fost Red Tails, regizat de George Lucas. Peste 550 de cinematografe sunt acum echipate cu sisteme Auro 11.1 by Barco și AuroMax din întreaga lume.


În Rusia de astăzi, sala principală de premieră „Octombrie” și 27 de cinematografe din Moscova și alte orașe sunt echipate cu un astfel de sunet. Echipamentul Auro-3D a fost deja instalat în două studiouri - Pifagor și Neva-Film. În total, peste 100 de studiouri din întreaga lume creează și dublează filme în formatul Auro-11.1 by Barco.

În primul rând, formatul este bun pentru că este mai ieftin pentru studiouri și cinematografe. Site-ul oficial al Auro-3D indică următoarele avantaje:

Fără taxă de licență

Efort minim de distribuție

Abilitatea de a utiliza conținutul creat în acest format pe Auro-11.1 de către sistemele Barco

Treceți cu ușurință de la DCP la o calitate echivalentă pe Blu-ray

Ușurința conversiei ulterioare

Abilitatea de a înregistra în Auro-11.1 de către Barco direct pe platou

Nu este nevoie de mastering și chei DCP suplimentare

Canalele suplimentare sunt codificate direct în master 5.1 (7.1)

Compatibilitate deplină cu mix în 5.1 (7.1)

Nu este nevoie să pierdeți timpul cu rescrierea suplimentară într-un format diferit

Abilitatea de a utiliza funcția „up mix” pentru filme finite în format stereo, 5.1, 7.1 pentru redare în Auro-11.1 de la Barco

Unde este conținutul?

La început, când formatul era la început, era puțin conținut. Dar acum situația s-a schimbat: în formatul Auro-3D există atât muzică, cât și filme. Listele de filme și muzică, precum și viitoarele lansări în cinematografe, sunt postate pe site-ul web Auro-3D.

Acest articol se bazează pe teza mea pe tema „Dezvoltarea principiilor imitației sunetului surround în domeniul divertismentului”, Departamentul tehnologia Informatiei, MAI 2011. Pentru adaptarea textului, s-au decupat statisticile seci, limbajul a fost mai animat, sunt introduse referiri la cărți și articole pe care le pot recomanda. Întrebările ridicate vor fi de interes pentru cei care încă studiază mecanismele de localizare a sunetului. Partea software a articolului nu este afectată. Pentru un interes suplimentar, partea practică a creării unui manechin de microfon binaural nu este decupată din articol.

Vreau să-mi exprim recunoștința lui Boris Klimov pentru crearea de ilustrații exclusive, precum și Nadezhda Gurskaya pentru analiza și editarea textului.

Introducere

scopul principal realitate virtuala„cufundă” o persoană în spațiul jocului, acțiunea de pe ecran (film, desene animate, cinema 5D) atât de mult încât pentru un timp uită de realitatea lumii din jurul său.

Despre conceptele de „Immersion”, precum și „Suspensia Necredinței” în legătură cu sunetul și muzică, vezi cartea Winifred Phillips - A Composer's Guide to Game Music.

Sunetul surround este o garanție că o persoană poate simți efectul „prezenței”. Percepția spațiului sonor, evident, era solicitată cu mult înainte de apariția instrumentelor de înregistrare a sunetului: de-a lungul secolelor, au fost create încăperi, cum ar fi temple, teatre, săli de concerte, în care ascultătorul era „cufundat” în spațiul sonor prin crearea. un efect acustic natural – reverberație. Studiile științifice ale comportamentului acusticii în sălile de concert de către Bose au arătat că aproximativ 11% ajunge direct la ascultător, procentul rămas de sunet vine sub formă reflectată de pereți, podele și tavane și alte obiecte din jurul ascultătorului, creând astfel volumul sunetului. Din punct de vedere informativ, 25% din informațiile despre lumea înconjurătoare primite de o persoană cad pe sunet.

Abordarea sunetului în cinematografele moderne îl învață pe ascultător că sunetul poate și ar trebui să fie de înaltă calitate și realist. Dezvoltatorii profesioniști de aplicații moderne de jocuri dedică până la 40% din buget și resurse umane temporare lucrului cu sunetul. Pe de altă parte, unii dezvoltatori de jocuri și aplicații trebuie să fie convinși să investească timp și bani pentru a implementa sunet de înaltă calitate.

Pe tema diferitelor abordări, este interesant să citiți articolele „Sounding of computer games” părțile 1 și 2 de la Christopher (căutate liber pe Internet).

Percepția umană a sunetului

Auzul uman este capabil să perceapă sunetul în intervalul de la 16-20 Hz la 15-20 kHz. Sunetele cu o frecvență sub 20-30 Hz (infrasunete) sunt percepute nu de organul auzului, ci prin atingere, de exemplu, prin vibrația suprafețelor. Frecvențele valorilor extreme inferioare ale spectrului sonor pot fi percepute prin rezonanțe ale organelor interne ale unei persoane. La intensitate scăzută, sunetul de joasă frecvență are un impact emoțional suplimentar (de exemplu, popularul efect de sub drop).

O scădere a intervalului de frecvențe audibile este asociată cu modificări ale urechii interne și cu dezvoltarea pierderii auzului neurosenzorial legat de vârstă. Până la vârsta de 60 de ani, intervalul sonor la limita superioară nu devine mai mare de 10-12 kHz. Întrucât principalul contingent al sectorului de divertisment este tinerii, ar trebui să se țină seama pe deplin de gama percepută de ureche. Dar un specialist în sunet ar trebui să aibă și un auz complet, să audă caracterul nefiresc și incomplet al timbrului și să fie capabil să identifice rezonanțe. Și ceea ce nu este lipsit de importanță - protejează-ți auzul de suprasolicitare. Mulți oameni din industria sunetului muzical se confruntă cu stres constant din cauza echipamentelor de amplificare și a instrumentelor acustice puternice (ca mine, în mai mult de 12 ani de cânt la instrumente de percuție). O persoană modernă este expusă la efectele negative ale zgomotului ambiental, care îi reduce sensibilitatea, atenuează limitele superioare de frecvență înainte de pierderea naturală a auzului. Nu neglijați protecția auditivă, cum ar fi dopurile pentru urechi. Sunetele de joasă frecvență pot avea, de asemenea, un efect negativ.

Detalii despre impactul negativ al sunetului (inclusiv tehnic) pot fi găsite în cartea lui G. Chadd - Sound.

Percepția sunetului este individuală, depinde de configurația (forma) auriculului, de caracteristicile fiziologice, de vârstă și de starea psihologică la un anumit moment. În sfera considerată a percepției sunetului depinde și de:
- medii de redare (difuzoare ale dispozitivului de redare, căști, difuzoare, sisteme multicanal),
- sala de ascultare
- calitatea mijloacelor de transformare (de exemplu, implementarea procesorului de sunet, a motorului),
- aderarea la principiile creării imaginii sonore corecte atunci când vine vorba de design sonor.

Mecanisme de localizare a surselor de sunet de către auzul uman

Capacitatea unei persoane de a localiza o sursă de sunet în spațiu se bazează pe principiul auzului binaural. Structura binaurală (din lat. bini - „doi” și auricula – „ureche”) a sistemului auditiv constă în percepția diferită a semnalelor sonore care au venit la urechea dreaptă și stângă. Algoritm de localizare a sursei de sunet:
- semnalul sonor provenit de la sursa sonoră și de reflexiile încăperii pătrunde în partea externă a sistemului auditiv, unde configurația auriculare permite transmiterea semnalului deja procesat în frecvență către canalul auditiv extern;
- semnalul trece în timpanul unei persoane, mecanismele urechii interne intră în vigoare,
- din urechea internă, informațiile intră în părțile creierului, unde, pe baza analizei comparației semnalelor primite de la fiecare dintre canalele auditive, se trag concluzii despre localizarea sursei sonore.

Creierul uman compară informațiile care provin din timpane cu informațiile care sunt deja stocate în memorie.

Orez. 1. Structura părții externe a sistemului auditiv uman

Detalii despre structura auzului extern și intern și multe alte lucruri pot fi găsite în cartea lui Irina Aldoshina și Roy Pritts - Acustica muzicală, capitolul „Percepția sunetului. Fundamentele psihoacusticii»

Pentru a determina localizarea unei surse de sunet în spațiu, sistemul auditiv folosește principalele mecanisme de localizare: prin diferența de timp, prin diferența de intensitate, prin diferența de spectru amplitudine-frecvență. Mecanismele auxiliare includ reflexiile sonore din corpul și umerii unei persoane, reverberația, ocluzia (sunetul trecut printr-un obstacol), obstrucția (sunetul filtrat de un obstacol), efectul Doppler, efectul Haas (efectul de precedență). Nu uitați de efectul percepției psihologice: dacă sursa din spațiul vizibil nu se potrivește cu sunetul sau dacă sincronismul este perturbat, calitatea localizării scade brusc.

Este necesar să se determine poziția spațială a sursei de sunet în prezența interferenței sunetului. Există mecanisme naturale de imunitate la zgomot a sistemului auditiv. Una dintre ele se manifestă în eliberarea deghizată binaurală. Fenomenul este că este mai ușor să localizați un semnal audio pe un fundal de interferență statică (de exemplu, zgomot ambiental).

Câteva cuvinte despre transparența sunetului. Permiteți-mi să vă dau un exemplu celebru. Imaginează-ți mai multe desene de contur ale animalelor suprapuse una peste alta. Recunoașterea desenelor combinate în spațiu este cu atât mai dificilă, cu atât formele animalelor descrise sunt mai apropiate (termenul formă are același sens ca și în semnalul sonor). Dacă aceste desene sunt distanțate în spațiu, atunci sarcina de a determina animalul după formă devine mult mai ușoară.

Localizare diferență de timp (localizare fază)

Acest mecanism funcționează la frecvențe de la 300 Hz la 1,5 kHz. Datorită diferenței dintre poziția urechii stângi și a urechii drepte, sunetul provenit de la o sursă situată în unghi față de direcția frontală petrece un timp diferit pentru a ajunge la timpane.


Orez. 2. Exemplu schematic de localizare a fazei

Cu același timp necesar pentru a ajunge la semnalul urechii stângi și drepte, acest mecanism va localiza sursa în azimutul de 0 și 180 de grade. timpuri diferite atingerea timpanelor duce la apariţia unui defazaj. Sistemul auditiv distinge o schimbare de fază de până la 10-15 grade. Cu o creștere a frecvenței și, în consecință, cu o scădere a lungimii undei sonore, defazarea semnalelor care au venit din aceeași sursă către urechi diferite crește. De îndată ce schimbarea atinge o valoare apropiată de jumătate din lungimea undei sonore, mecanismul încetează să funcționeze. Creierul uman nu poate determina fără ambiguitate dacă semnalul sonor dintr-unul dintre canalele auditive rămâne în urmă celuilalt sau, dimpotrivă, este înaintea acestuia.

Diferența maximă de timp corespunzătoare deplasării complete a sursei de sunet la dreapta sau la stânga nu poate fi mai mare de 630 µs.

Distanța dintre urechea dreaptă și stângă a unui adult este de 0,15 m-0,20 m, dacă luăm valoarea medie pentru podea. Cu o sursă care emite o undă sonoră cu o frecvență de 20 Hz și o viteză a sunetului de 340 m / s, lungimea de undă va fi de 17 m. În consecință, dacă o persoană se întoarce la sursă pe o parte, atunci schimbarea de fază a semnalelor care a venit la o ureche și apoi la cealaltă, va fi aproximativ 1,1% din întreaga perioadă a undei de 20 Hz (localizarea la frecvențe atât de joase este imposibilă). Fiziologic, acuratețea localizării depinde de mărimea capului, adică de distanța dintre urechi. Cu cât această distanță este mai mare, cu atât este mai mare diferența dintre semnalele sonore din fiecare ureche.

Atunci când sunetul este emis de o sursă situată la un anumit unghi față de direcția frontală, nivelul presiunii sonore pe timpane din diferite urechi va fi diferit. Acest lucru se datorează faptului că o ureche va fi, așa cum ar fi, „în umbră” creată de cap și, de asemenea, faptului că undele sonore de peste 1000 Hz se descompun relativ repede în spațiu.


Orez. 3. Exemplu schematic de localizare după nivel de intensitate

Acest mecanism este destul de eficient, dar în gama de frecvențe sonore de la 1600 Hz. La o lungime a undei sonore comparabilă cu diametrul unui cap uman, cea mai îndepărtată ureche de sursă încetează să se afle în „umbra acustică”, ceea ce se datorează fenomenului de difracție a undelor sonore de pe suprafața capului. În același timp, s-a dezvăluit experimental că capacitatea auzului uman de a determina unghiul dintre două surse în plan orizontal în intervalul de frecvență de 1500-2000 Hz este redusă drastic.

Acest mecanism ajută la determinarea distanței până la sursa de sunet. Cu toate acestea, nivelul sunetului dintr-o sursă slabă, dar apropiată poate fi același cu cel al unei surse puternice, dar îndepărtate. În astfel de condiții, localizarea este facilitată de următorul mecanism.

Localizare prin diferența în spectrul amplitudine-frecvență

Mecanismul se bazează pe capacitatea creierului de a analiza scăderile și creșterile anumitor frecvențe într-un semnal complex. Sunetul care vine la un unghi de 90° conține atât componente de joasă frecvență, cât și de înaltă frecvență, iar în spectrul sunetului care acționează asupra urechii îndepărtate, vor exista mai puține componente de înaltă frecvență - efectul de ecranare al capului. În plus, semnalul sonor este reflectat diferit față de părțile auriculare, are loc amplificarea și atenuarea diferitelor părți ale spectrului sonor.

Acest mecanism este responsabil pentru localizarea planului față-spate și a planului vertical. Studiul acțiunii de filtrare a capului și a auriculelor ascultătorului a făcut posibilă introducerea conceptului de benzi de purtare. La localizare, o persoană nu analizează întregul spectru al sunetului primit, ci doar se modifică în anumite frecvențe. Astfel de benzi au evoluat, auzul și-a dezvoltat propriul sistem de urmărire și avertizare a pericolului, localizând destul de precis de unde provine amenințarea.

Schimbările în benzile de la 16 la 500 Hz și de la 2 la 6 kHz sunt responsabile pentru localizarea surselor de sunet frontale. Banda de la 0,7 la 2 kHz - modificarea timbrului surselor care pot fi situate în spate.

Un semnal cu o compoziție spectrală complexă este localizat mai bine, iar senzația de direcție „față-spate” este formată în principal din acele benzi de direcție în care este concentrată cea mai mare parte a puterii semnalului. Tonurile pure, care practic nu apar în natură, sunt localizate mai rău decât semnalele complexe. Astfel, tonurile pure de peste 8000 Hz sunt greu de localizat. De asemenea, este imposibil să se determine locația surselor de sunet de joasă frecvență - mai puțin de 150 Hz.

Localizarea în plan vertical este mult mai proastă decât în ​​cel orizontal. Fără un impact psihologic, vizual, este aproape imposibil să se creeze o imitație a unui obiect care ar trebui să fie amplasat, de exemplu, deasupra. Acest sunet ar trebui să fie cel puțin familiar și așteptat.

Gibson D. în cărțile și videoclipurile sale prezintă conceptul de aranjare verticală a instrumentelor într-un mix muzical în funcție de înălțimea lor (tesitura) sau formant (zona de tonuri parțiale îmbunătățite), deoarece tehnica de reproducere a sunetului este construită pe același principiu în plan vertical. Datorită încrucișării acustice cu anumite limite, semnalul complex este împărțit în benzi de frecvență. Într-un sistem cu trei căi, woffer-ul de frecvență joasă este situat în partea de jos, driverul de mijloc pentru gama medie este situat în partea de mijloc, iar tweeter-ul este situat în partea de sus a sistemului pentru transmisia de frecvență înaltă. Iar sub-wofferul transmite o parte din informații prin podea. Această abordare este interesantă, dar nu este potrivită pentru multe sisteme, de exemplu, când se utilizează căști sau orice alt sistem fără separare a benzilor.

Mai multe informații despre principiile descrise pot fi găsite în cartea Gibson D. - A Visual Guide to Recording and Producing.

Cu toate acestea, reducerea intensității frecvențelor joase ajută psihoacustic la „ridicare” obiectului, pentru a-l face mai ușor.

Mutarea sursei de sunet

Până în anii 1960, studiul capacității umane de a localiza o sursă de sunet în spațiu s-a preocupat în principal de sursele de sunet staționare. După aceea, a început studiul percepției umane și al surselor de sunet în mișcare: au fost determinate principalele caracteristici ale percepției.

În cursul cercetărilor, s-a dovedit că pentru ca o persoană să simtă mișcarea sunetului, este nevoie de un anumit timp - o fereastră de timp. Acesta variază de la 0,08 la 0,12 s. Pentru a localiza un sunet scurt nemișcat (de exemplu, un clic cu o durată de aproximativ 0,001 s) este destul de ușor.

De asemenea, o persoană poate distinge viteza de mișcare a unei surse de sunet: cu cât este mai mare (în anumite limite), cu atât această capacitate este mai subțire. Dacă sursa de sunet se mișcă cu o viteză de 90°/s (mișcare pe o jumătate de perimetru în fața capului subiectului), o persoană distinge o modificare a vitezei cu 15%; și la o viteză de mișcare de 360 ​​° / s - cu 5,5%.

Dacă sursa este nemișcată, atunci, pentru a o localiza, o persoană face în mod subconștient micro-mișcări ale capului, care măresc precizia determinării poziției sursei în spațiu cu un ordin de mărime.

efecte

Pentru a transmite plauzibil sunetul dintr-o sursă în mișcare, este necesar să se țină seama de (efectul modificării frecvenței sunetului de la sursă atunci când acesta se mișcă neradial față de ascultător). În funcție de sentimentul subiectiv al efectului, sunetul își schimbă tonul brusc - devine mai ridicat când obiectul se apropie și mai scăzut când este îndepărtat. În sfera jocului, efectul Doppler joacă un rol semnificativ. Mai ales când vine vorba de simulatoare auto și alte aplicații legate de mișcarea rapidă a obiectelor. Efectul Doppler este un plugin comun pentru secvențiere și, de asemenea, din câte știu, există în multe motoare de sunet.

Unul dintre principalele efecte ale creării spațiului este efectul de reverberație (procesul de reflecție repetată a semnalului sonor de pe diferite suprafețe cu scăderea treptată a intensității acestuia). Reverb-ul simulat are o serie de parametri - timpul de reflexie timpurie, timpul de reflexie târziu, rata de decaiment, raportul procentual dintre semnalul „uscat” și cel procesat. Acești parametri indică dimensiunea camerei și locul sursei de sunet în ea în raport cu ascultătorul. În munca mea, folosesc exclusiv reverb-uri convoluționale (convoluționale), aplicând acestora impulsuri reale de cameră. Fără a intra în detalii ale tehnologiei, impulsul în sine este o „turnărie” de zgomot a camerei (fișier wav), care modulează fișierul de sunet original, plasându-l astfel în spațiul simulat. Tehnologiile convoluționale au fost folosite de mult în industria muzicală, ca în shell-ul Kontakt (4,5) de la NI, o reverb convoluțional cu un set de impulsuri este inclusă în lista de efecte standard.

Sisteme de sunet. sistem binaural

Există două abordări principale pentru organizarea sistemelor moderne de sunet în cameră: sisteme cu mai multe canale și sisteme cu două canale (inclusiv căști). În sistemele multicanal, sunetul este transmis de la monitoare plasate în fața și în spatele (sau în jurul) ascultătorului.

Detalii despre sistemele monofonice, binaurale, stereofonice și multicanal și subtilitățile acestora pot fi găsite în cartea lui Yu. Kovalgin - Stereophonic Broadcasting and Sound Recording.

Pentru a spori efectul spațial, producătorii încearcă să promoveze conceptul de sisteme nu mai cu cinci, ci șase, șapte și chiar nouă canale. O creștere a numărului de canale necesită complexitatea muncii unui inginer de sunet, o creștere a numărului sisteme acustice, fire de comutare, utilizarea de amplificatoare mai complexe și, prin urmare, vă permite să creșteți veniturile din vânzări.
Nu toți consumatorii au nevoie de sisteme audio multicanal. Pentru unii, acest lucru este inacceptabil din motive economice, cineva nu poate aloca o cameră într-o zonă rezidențială pentru un sistem home entertainment. Cineva, din motive evidente, preferă să folosească căștile (noaptea, când se deplasează în transport etc.).

Doar două urechi oferă unei persoane toate informațiile necesare despre obiect, ceea ce înseamnă că doar două difuzoare sunt suficiente pentru a-l transmite. Când se utilizează înregistrarea binaurală, sursele de sunet aparente în cazul utilizării căștilor sunt scoase din capul ascultătorului în locul în care se află sursele de sunet reale. În schimb, atunci când ascultați semnale stereo convenționale prin căști, sursele de sunet aparente sunt simțite a fi situate în interiorul capului ascultătorului.

Apariția reverberației face dificilă evaluarea azimutului surselor de sunet aparente în regiunea din spate, unde ascultătorii indică adesea direcția corespunzătoare din față a oglinzii în loc de direcția adevărată. Acest fenomen apare mai ales când timpul standard de reverberație în camera de ascultare depășește 0,3 s.

Este posibilă transmiterea corectă a informațiilor spațiale în timpul redării folosind două monitoare, dar chiar și o deplasare ușoară (aproximativ 9-15 cm) a centrului capului ascultătorului la stânga sau la dreapta din acest punct duce la faptul că localizarea sunetului aparent surse este imposibilă în afara focalizării axelor monitorului.

La poziția optimă de ascultare, un sistem binaural oferă un sunet care este preferat cu încredere decât stereo convențional. Aplicația sa este însă foarte limitată: redare cu căști, echipamente portabile pentru difuzare și reproducere a sunetului, simulare pe computer. Sistemul de sunet binaural nu este foarte potrivit pentru condițiile de ascultare colectivă.

La redarea unui semnal binaural printr-un sistem de difuzoare, din cauza semnalului canalului drept care intră în urechea stângă a ascultătorului și invers, are loc diafonia.

În realitățile de proiectare a sunetului jocului, fișierele audio binaurale înregistrate nu sunt utilizate, deoarece este imposibil să-și schimbe poziția în spațiu, nu există o sursă virtuală și un ascultător virtual, aceasta nu este o simulare.

Algoritmi

Algoritmul principal care folosește mecanismele de bază ale localizării sunetului uman este implementat în HRTF (Head Related Transfer Functions - funcții ale sunetului în mișcare față de ascultător. Cantitativ, HRTF sunt determinate de transformarea Fourier integrală inversă a coeficienților numite HRIR (Head Related). Răspunsul la impuls), care, în prima aproximare, sunt determinate de raportul presiunilor asupra membranei timpanice a urechii unei unde sonore în spațiul liber (câmp liber) și în spațiul real, ținând cont de capul unei persoane, auricule, corpul lui și alte obstacole.

HRTF este o funcție complexă cu patru variabile: trei coordonate spațiale și o frecvență. Când se utilizează coordonate sferice pentru a determina distanța față de sursele de sunet mai mare de un metru, se presupune că sursele de sunet sunt în câmpul îndepărtat (câmp îndepărtat), valoarea HRTF scade invers cu distanța. Majoritatea măsurătorilor HRTF se fac în câmpul îndepărtat, în timp ce numărul de variabile este redus la trei: azimut (azimut), înălțime (altitudine) și frecvență (frecvență). Efectul HRTF depinde de intervalul de frecvență al semnalului procesat: numai sunetele cu valori ale componentei de frecvență între 3000 Hz și 10000 Hz pot fi interpretate cu succes folosind funcțiile HRTF. Dacă semnalul sursă nu conține o anumită frecvență care afectează diferența dintre funcțiile HRTF din față și din spate, atunci un astfel de semnal nu va fi niciodată localizat în direcția față-spate.

HRTF a fost simulat folosind manechinul KEMAR (Knowless Electronics Manikin for Audit Research) și o ureche digitală specială dezvoltată de Sensaura. Microfoanele sunt plasate în urechile manechinului, iar difuzoarele sunt plasate în jurul manechinului, rezultând o înregistrare a ceea ce aude fiecare „ureche”. Rezultatele obținute din această simulare sunt folosite pentru a completa baza de date HRTF, care poate fi apoi utilizată pentru a selecta în mod interactiv parametrii la redarea sunetului 3D poziționat (mai mult de 1100 de HRTF-uri au fost acumulate în baza de date Sensaura). Necesitatea unei astfel de baze de date se explică, în primul rând, prin diferența dintre dimensiunile și formele capului și auricularelor manechinului și potențialului ascultător și, în al doilea rând, prin așa-numita zonă de punct dulce determinată de acești parametri, în care efectul sonor este corect recreat în plan vertical şi sunetul corect este garantat.determinarea amplasării surselor de sunet în spaţiu. Cu cât este mai mare punctul dulce, cu atât mai multă libertate are ascultătorul. Prin urmare, dezvoltatorii caută în mod constant modalități de a crește aria de aplicare a punctului favorabil.

La implementarea tehnologiilor cu HRTF, QSound se bazează nu numai pe metode matematice, ci și pe aprobarea ascultătorilor (au fost susținute aproximativ 550.000 de astfel de audiții). După o serie de experimente, specialiștii Sensaura au stabilit că HRTF în forma sa pură „funcționează” doar când este redat prin căști. Modelarea sunetului în acest caz este o sarcină banală: fiecare difuzor își controlează urechea corespunzătoare. Cu toate acestea, atunci când același sunet este redat prin difuzoare, urechea dreaptă aude și un sunet menit să „înșele” urechea stângă în ceea ce privește tridimensionalitatea și invers. Pentru a elimina acest fenomen, la sunet trebuie adăugate calcule suplimentare de compensare. Au fost dezvoltați algoritmi de compensare de succes, ei se numesc Transaural Cross-talk Cancellation (TCC). Problema a fost rezolvată cu ajutorul unei alte idei de la inginerii Sensaura. Constă în faptul că funcțiile HRTF funcționează doar pentru urechea medie, deoarece sunt derivate folosind un singur manechin sau citirile medii ale unui grup mare de oameni. Sensaura a dezvoltat un model digital al urechii, în care puteți seta parametrii auriculei. Folosind acest model digital, prin combinarea diferiților parametri, puteți reproduce forma aproape oricărei urechi. Driverul digital de ureche rezultat funcționează astfel: atunci când este instalat, o persoană ascultă o serie de sunete de testare și ajustează parametrii driverului pentru a experimenta cât mai bine sunetul tridimensional. Parametrii individuali ai ascultătorului sunt înregistrați într-un „profil” special, care este ulterior utilizat de aplicații.

Dezvoltarea sistemelor de sunet surround - de la mono la 3D

În prezent, stereofonia cu două canale a devenit deja o modalitate clasică de transmitere și reproducere a sunetului. Scopul reproducerii sunetului stereofonic este de a reproduce cât mai precis posibil imaginea sonoră. Localizarea sunetului este doar un mijloc de a obține un sunet mai bogat și mai natural. Cu toate acestea, transmiterea informațiilor spațiale de către cele mai comune sisteme „clasice” cu două canale are o serie de dezavantaje, ceea ce încurajează designerii să creeze diverse sisteme de sunet surround.

Ascultătorul din sala de concert aude nu numai sunetul direct care vine de la instrumentele individuale ale orchestrei, ci și din direcții diferite (inclusiv din spate), sunet difuz (difuz) reflectat de pereții și tavanul camerei, ceea ce creează efectul de spațiu și completează impresia de ansamblu. Întârzierea cu care sunetul difuz ajunge la urechile ascultătorului și compoziția sa spectrală depind de mărimea și proprietățile acustice ale încăperii. Cu două canale transferul de informații, creat de sunet difuz, se pierde în mare măsură, iar în cazul unei înregistrări de studio, poate să nu fie prezent inițial.

Urechea umană localizează cel mai bine sursele de sunet în plan orizontal. În același timp, sunetele care vin din spate, în lipsa unor informații suplimentare, sunt localizate mai rău. Vederea, inclusiv vederea periferică, este principalul sens al determinării locației obiectelor, prin urmare, fără informații vizuale, capacitatea de a evalua poziția sunetului în plan vertical și distanța acestuia de noi este slabă și mai degrabă individuală. În parte, acest lucru poate fi explicat prin caracteristicile anatomice individuale ale auriculelor. La redarea înregistrărilor, informațiile vizuale sunt absente, așa că orice tehnologie de sunet pentru piața de masă care pretinde a fi „sunet surround” este forțată să creeze ceva mediu și să compromită în mod deliberat.

Multe metode pot fi folosite pentru a reproduce sau sintetiza „efectul hall”. La mijlocul anilor '50, Philips, Grundig, Telefunken au testat sistemele de redare tridimensionale 3D și Raumton. Transmisia sunetului era monofonică, dar difuzoarele suplimentare (de obicei încorporate, mai rar la distanță), care radiau sunetul lateral sau în sus, creau impresia unui spațiu mare datorită sunetului reflectat de pereți și tavan. Deoarece întârzierea semnalului de eco în spațiile casnice este destul de mică, reverberatoarele cu arc au fost utilizate ulterior în canal pentru amplificarea semnalelor suplimentare pentru a o crește. Aceste sisteme, datorită complexității tehnice semnificative pentru acea perioadă, nu au rezistat mult pe piață și au părăsit rapid scena.

Ulterior, au fost dezvoltate sisteme ambiofonice pentru a transmite sunetul difuz, care au fost folosite în principal în cinema. Canalul (sau canalele) adiționale pentru transmiterea sunetului difuz în astfel de sisteme au o putere mai mică decât cele principale, iar domeniul lor de frecvență corespunde benzii de frecvență a semnalului difuz (aproximativ 300...5000 Hz). Radiația difuzoarelor suplimentare ar trebui să fie difuzată, pentru care acestea sunt direcționate către pereții sau tavanul camerei de ascultare.

Complexitatea standardizării și problemele tehnice cu înregistrarea și transmiterea semnalelor pe trei, patru sau mai multe canale au dus la faptul că stereofonia cu două canale a devenit principalul sistem de înregistrare și transmitere a sunetului timp de mulți ani. Dar încercările de a crea sisteme de sunet surround nu s-au oprit. Dezvoltarea ambiofoniei a fost cuadrafonia (reproducerea sunetului pe patru canale), care a atins apogeul în popularitate în prima jumătate a anilor '70. Spre deosebire de sistemul ambiofonic, aici toate canalele de reproducere a sunetului sunt echipate în mod egal. Quadafonia discretă (completă), care oferă efectul maxim de prezență, necesită patru canale de transmisie a sunetului și, prin urmare, s-a dovedit a fi incompatibilă cu mijloacele tehnice de înregistrare și difuzare a sunetului care existau la acea vreme.

Pentru a depăși acest obstacol, au fost create mai multe sisteme de cuadrafonie matricială (în terminologia de atunci - cvasi-quadrafonie), în care semnalele originale a patru canale au fost matriceate pentru transmisie pe două canale, iar în timpul redării, semnalele originale au fost restaurate. prin transformări sumă-diferență și fără un decodor a fost posibil să se reproducă semnal stereo normal. Deoarece niciunul dintre aceste sisteme nu a fost complet quad sau pe deplin compatibil cu stereofonia cu două canale datorită pătrunderii mari a semnalului de la canal la canal, aplicarea lor practică a fost limitată și interesul pentru ele a dispărut rapid.

Nu au existat câștigători în „războiul standardelor” sistemelor quad, ideea a murit în siguranță, principiile au fost uitate, dar termenul a rămas. Prin urmare, acum puțini oameni sunt jenați de faptul că „ceva” care are patru canale de amplificare și patru difuzoare se numește cu mândrie „sistem quad”. Cu toate acestea, acest lucru este fundamental greșit, deoarece sursa semnalului rămâne cu două canale, iar semnalele canalelor din față și din spate cu această construcție a sistemului diferă între ele numai în ceea ce privește nivelul, adică se folosește principiul panning.

Panarea a fost utilizată pe scară largă în producția stereo de la mijlocul anilor 1950 pentru a poziționa semnalele audio monofonice „stânga/dreapta/mijlocul” câmpului sonor. La panning, nu există niciun efect asupra frecvenței și fazei semnalului, se modifică doar nivelul semnalului mono furnizat fiecărui canal stereo. Panarea la mai multe canale (în cazul înregistrărilor cu mai multe canale) se face într-un mod similar. Cu toate acestea, atunci când se determină direcția către sursa de sunet, aparatul nostru auditiv folosește nu numai diferența de intensitate a semnalelor sonore, ci și schimbarea de fază dintre ele, iar efectul schimbării de fază asupra preciziei localizării sursei de sunet este cel mai mare. pronunțată în intervalul de frecvență de la aproximativ 500 la 3000 Hz. (Din nou, gama de frecvență a sunetului difuz!).

Prin urmare, simpla panoare nu oferă fidelitatea dorită a sunetului. Efectele stereo („sunet de rulare”, legare de sunet „stânga-dreapta” etc.) ale primelor înregistrări stereo au devenit rapid plictisitoare. Prin urmare, cele mai bune înregistrări ale instrumentelor electronice în studio în anii 60 au fost realizate folosind tehnologia microfonului, ceea ce explică natura „live” a sunetului: Introducerea multicanalului complet electronic (fără utilizarea microfoanelor) înregistrarea instrumentelor cu amestecarea ulterioară, facilitând munca inginerului de sunet, a distrus în același timp atmosfera sălii. Ulterior, acest fapt a început să fie luat în considerare la efectuarea înregistrărilor de studio, deși nu a existat o revenire completă la tehnologia microfonului.

Când se utilizează o schemă de redare pe două canale, zona principală de localizare efectivă a surselor de sunet aparent (PSZ) este situată în fața ascultătorului și acoperă un spațiu de aproximativ 180 de grade în plan orizontal. Cele două canale frontale nu sunt capabile să reproducă adecvat sunete ale căror surse sunt în realitate situate în spate și în plan vertical, dacă nu există suport sub formă de semnale suplimentare. Utilizarea difuzoarelor din spate în combinație cu panoramă sonoră funcționează bine cu sursele de sunet în fața și în spatele ascultătorului și mai slab cu poziția laterală. Cu toate acestea, panoramă sonoră singură nu va oferi niciodată o poziționare acceptabilă a surselor de sunet în plan vertical.

În timpul dezvoltării sistemelor matrice, s-a dovedit că o parte semnificativă a informațiilor spațiale este conținută în semnalul de diferență (semnal de informații stereo), care poate fi alimentat la difuzoarele canalului din spate fie în formă pură, fie amestecat cu o anumită proporție de semnale frontale. În cel mai simplu caz, acest lucru nu necesită nici măcar canale de amplificare suplimentare, iar semnalele pot fi matriceate la ieșirea amplificatorului:

Așa s-au născut mai multe sisteme pseudo-quadrafonice, care i-au alungat complet pe „adevărații arieni” de pe piață la mijlocul anilor ’70. Se deosebeau unul de celălalt doar prin modalitățile de obținere a unui semnal de diferență. Cu toate acestea, triumful lor a fost și de scurtă durată, ceea ce a fost explicat prin deficiențele purtătorului de semnal - discul de vinil și banda magnetică. Zgomotul necorelat al canalelor stânga și dreapta nu a fost scăzut, ceea ce, în combinație cu nivelul relativ scăzut al semnalului de diferență, a înrăutățit foarte mult raportul semnal-zgomot în canalele din spate.

Un alt dezavantaj, nu mai puțin semnificativ sisteme similare- nicio dependență a nivelului semnalului din spate de natura coloanei sonore. Cu un nivel scăzut al semnalului din spate, efectul spațial este greu de sesizat, cu creșterea nivelului, apare o întrerupere a scenei sonore și fragmentele sale se deplasează înapoi (efectul de „înconjurare de orchestră”, ceea ce nu corespunde la realitate).

La redarea înregistrărilor „live” (având o distribuție naturală a componentelor de sumă, diferență și fază), acest dezavantaj a fost nesemnificativ, dar pe majoritatea fonogramelor de studio, canalele din spate au introdus erori semnificative în poziția CIZ. Pentru a depăși acest neajuns, sistemele de sunet surround timpurie au încercat să folosească panoramă automată. Semnalele de control au fost obținute de la nivelul informațiilor spațiale - o creștere a nivelului de semnale de diferență a dus la o creștere a câștigului în canalele din spate. Cu toate acestea, modelul de panning adoptat a fost foarte grosier, drept urmare erorile de control ale expanderului au dus la o schimbare haotică a nivelului semnalelor din spate (efectul „respirație grea”).

Interesul pentru sistemele de sunet surround a reapărut odată cu apariția mediilor digitale, nivelul propriului zgomot este neglijabil și chiar și procesarea semnalului analogic va degrada cu greu domeniul dinamic al sistemului. Dezvoltarea metodelor de procesare digitală a semnalului a dus la crearea procesoarelor digitale de sunet (Digital Sound Processor - DSP).

Dezvoltate inițial pentru sistemele home theater, procesoarele de sunet surround au început recent să fie utilizate activ în sistemele audio auto. Utilizarea lor poate îmbunătăți semnificativ sunetul din mașină, astfel încât acestea sunt produse nu numai sub formă de dispozitive DSP separate, ci fac și parte din reportofoare radio relativ ieftine. Setările procesorului vă permit să selectați cei mai optimi parametri pentru poziția de ascultare selectată.

Există o serie de metode care permit echipamentelor să reproducă sunetul localizat în spațiu cu un număr limitat de difuzoare. Diferite metode de implementare au puncte tari și puncte slabe, așa că este important să înțelegem diferențele fundamentale dintre principalele metode de procesare a semnalului. In nucleu sisteme moderne sunetul surround (Dolby Surround, Dolby Pro-Logic, Q-Sound, Curcle Surround și altele) este aceeași idee de conversie sumă-diferență, completată de metode „proprietare” de procesare a semnalului (atât analog, cât și digital). Adesea sunt uniți prin denumirea comună „3D-systems” („renașterea” termenului de acum patruzeci de ani!).

Înainte de a analiza principiile implicate în procesarea semnalelor audio în sistemele de sunet surround, să recapitulăm procesul tipic de înregistrare. În primul rând, se realizează o înregistrare care are multe canale individuale — instrumente, voci, efecte sonore și așa mai departe. În timpul mixării, pentru fiecare pistă audio, nivelul volumului și locația sursei audio sunt controlate pentru a obține rezultatul dorit. În cazul înregistrării stereo, rezultatul mixării este două canale, pentru sistemele surround numărul de canale este mai mare (de exemplu, 6 canale pentru formatul Dolby Digital/AC-3 „5.1”). În orice caz, fiecare canal constă din semnale care sunt destinate a fi direcționate către difuzoare individuale atunci când utilizatorul ascultă. Fiecare dintre aceste semnale este rezultatul amestecării complexe a semnalelor sursei originale.

În continuare, are loc procesul de codificare a canalelor primite după mixare și, ca rezultat, se obține un flux digital (bitstream). În timpul redării, decodorul procesează fluxul digital, împărțindu-l în canale individuale și transmițându-le pentru redare către sistemele de difuzoare. Pentru sistemele de sunet surround cu mai multe canale (discrete), este posibil să se simuleze sisteme acustice reale (modul Phantom). Dacă aveți doar două difuzoare, atunci canalele subwoofer (woofer) și central (dialog) sunt pur și simplu adăugate simultan la ambele canale de ieșire. Canalul din spate stânga este adăugat la canalul de ieșire din stânga, canalul din spate din dreapta la canalul de ieșire din dreapta.

Amintiți-vă că panoarea afectează doar amplitudinea semnalului audio. Conversia audio în sistemele 3D moderne include informații suplimentare despre amplitudinea și diferența de fază/întârzierea dintre canalele de ieșire din fluxul audio. De obicei, cantitatea de procesare depinde de frecvența semnalului, deși unele efecte sunt create folosind întârzieri simple.

Ce metode sunt folosite pentru a procesa semnalul audio? În primul rând, aceasta este extinderea bazei stereo (Stereo Expansion), care este produsă prin influențarea semnalului stereo diferențial al canalelor frontale. Această metodă poate fi considerată clasică și se aplică în primul rând înregistrărilor stereo convenționale.

Procesarea semnalului poate fi fie analogică, fie digitală. În al doilea rând, Positional 3D Audio (sunet 3D localizat). Această metodă funcționează pe multe canale audio individuale și încearcă să localizeze individual fiecare semnal în spațiu. În al treilea rând, Virtual Surround (sunet surround virtual) este o metodă de redare a înregistrărilor pe mai multe canale folosind un număr limitat de surse de sunet, de exemplu, redarea sunetului pe cinci canale pe două difuzoare. Evident, ultimele două metode sunt aplicabile doar mediilor audio multicanal (înregistrări în format DVD, AC-3), ceea ce nu este foarte important pentru sistemele auto până acum.

Închide lista diverse metode reverb artificial. Pe măsură ce sunetul se propagă prin spațiu, acesta poate fi reflectat sau absorbit de diferite obiecte. Sunetele reflectate într-un spațiu mare pot crea de fapt un ecou clar distins, dar într-un spațiu limitat există o combinație de multe sunete reflectate, astfel încât să le auzim ca o singură secvență care urmează sunetul original și se estompează, iar gradul de atenuare este diferite pentru frecvențe diferite și depinde direct de proprietățile mediului.

Procesoarele digitale de sunet utilizează un model de reverberație generalizat, care reduce controlul procesului de reverberație la setarea parametrilor cheie (timpul de întârziere, numărul de reflexii, rata de dezintegrare, modificarea compoziției spectrale a semnalelor reflectate). Astfel, sunt implementate modurile sala, live, stadion etc. Simularea este destul de realistă. Procesoarele analogice folosesc linii de întârziere a semnalului în acest scop. Controlul parametrilor de reverb în acest caz este mult mai complicat, așa că de obicei există un singur mod de funcționare fix.

Desigur, este dificil de descris caracteristicile structurale ale tuturor sistemelor de sunet surround existente, dar munca lor se bazează pe principiile luate în considerare - diferența este doar în detaliile algoritmilor și setul de moduri (presetări). Prin urmare, cel mai bun consilier atunci când alegeți un procesor de sunet este propriul dvs. auz.

Ce este sunetul surround și cum funcționează

Majoritatea dispozitivelor ieftine și nu foarte sunet de astăzi, inclusiv plăcile de sunet pentru computerele multimedia personale, vă permit să redați sunet în modul „Sunet 3D” sau „Surround”, care poate fi tradus ca „sunet surround”. Ce este și de ce este nevoie?

Sistemele de sunet surround au fost dezvoltate pentru că calitatea sunetului oferită de un sistem stereo convențional sau de căști nu mai satisface ascultătorul cu discernământ. Deși sistemele stereo creează efectul de sunet surround datorită sintezei unei panorame de surse de sunet imaginare (MS) între două difuzoare (Fig. 1), sunetul stereo are totuși un dezavantaj semnificativ. Panorama stereo este plată și limitată de unghiul dintre direcțiile către difuzoare.

Figura 1. Panoramă stereo

O astfel de sondare este în mare parte lipsită de naturalețea inerentă a ceea ce se realizează într-un câmp sonor real, atunci când o persoană este capabilă să perceapă surse reale din aproape toate direcțiile, atât în ​​plan orizontal, cât și vertical, și să estimeze, deși uneori cu erori, distanta fata de sursele de sunet. Se crede că percepția sunetelor din diferite direcții și distanțe este importantă nu numai ca fapt al locației lor spațiale. Creează pentru ascultător o senzație de volum sonor (câmp sonor tridimensional), îmbogățește semnificativ timbrele instrumentelor muzicale și vocilor, restabilind procesul de reverberație caracteristic sălii primare (sala de concerte). Stereofonia obișnuită creează efectul sunetului spațial într-o zonă foarte limitată în fața ascultătorului, nu permite dezvăluirea completă a caracteristicilor numite ale percepției sunetului într-un câmp sonor real și, prin urmare, reduce calitatea sunetului.

De asemenea, sistemele Quad nu oferă o simulare completă a câmpului sonor real. În primul rând, cu quadrafonie, nu se obține o panoramă stereo circulară - ascultătorul simte panorama stereo obișnuită în fața lui și panorama stereo din spate în spatele lui. În al doilea rând, toate sursele de sunet imaginare sunt situate în același plan și pe linia dintre difuzoare, adică. nu există adâncime și, de fapt, nu există sunet surround de dimensiunea a 3-a și tridimensional (Fig. 2).


Figura 2. Panoramă quad

De asemenea, căștile stereo nu vă permit să obțineți sunetul natural al fonogramei reproduse. Cert este că impresia lățimii infinite a bazei stereo și localizarea clară a imaginii sonore în interiorul capului ascultătorului nu poate satisface iubitorii de muzică pretențioși. Pentru a elimina efectul de localizare a sunetului în interiorul capului, scheme similare cu cele prezentate în Fig. 3.


Figura 3. Diagrama bloc a unui dispozitiv de sunet surround pentru telefoane stereo

Aici, semnalele canalelor stânga și dreapta prin dispozitivele de intrare A1 și A2 sunt furnizate, respectiv, către divizoarele de tensiune A3 și A6 și către intrările canalelor transversale, constând din linii de întârziere (LZ) A4, A5, potrivire. dispozitivele A8, A9 și filtre trece-jos (LPF) Z1 , Z2. De la divizoarele A3, A6, semnalele sunt transmise corectoarelor de răspuns în frecvență A7 și A10 și apoi la una dintre intrările sumatoarelor, iar de la acestea la intrările amplificatoarelor de putere pentru telefoane stereo. Astfel, la ieșirea fiecărui canal, se formează un semnal, constând dintr-un semnal atenuat și corectat al propriului canal și un semnal întârziat și corectat corespunzător al altui canal.

Astfel de dispozitive, realizate sub formă de set-top box-uri sau dispozitive încorporate, sunt în prezent echipate cu multe centre muzicale. Este interesant că astfel de dispozitive pot fi implementate pur metode software folosind procesarea semnalului digital în timp real. Cititorii care au un computer personal cu o placă de sunet full-duplex (din păcate, programul nu funcționează bine cu plăcile fabricate de Creative Labs din Singapore.) pot descărca unul dintre aceste programe de aici. Programul, în plus, vă permite să adăugați efecte de reverb pentru camere mici, medii și mari, ecou, ​​chorus, flanger și are un egalizator destul de bun care îmbunătățește semnificativ reproducerea frecvențelor joase (20...60 Hz) până la mijloc. telefoane stereo de calitate. Toate efectele funcționează în timp real chiar și pe cele foarte ieftine plăci de sunet fără procesoare DSP, de exemplu pe OPTi-931 sau Acer S23.

Cea mai avansată metodă de simulare a unui câmp sonor tridimensional real este transmisia binaurală a sunetului. Metoda binaurală constă în faptul că informaţia sonoră este percepută de microfoane plasate în auricularele unei persoane sau?un cap artificial? - un model care simulează percepția auditivă umană. Semnalele de la fiecare microfon sunt amplificate de amplificatoare separate de joasă frecvență și reproduse de telefoane stereo. În mod ideal, un astfel de sistem vă permite să creați o iluzie completă de sunet natural.

Se pare că duce ascultătorul din camera de ascultare în camera de unde se realizează transmisia. Cu toate acestea, îl poți asculta pe deplin doar cu ajutorul telefoanelor stereo și cu condiția ca capul tău să fie folosit ca model pentru crearea unui cap artificial. Cititorii pot asculta fișiere WAV audio demonstrative binaurale, descărcându-le pe Internet de pe servere


www.geocities.com/SiliconValley/Pines/7899

La redarea unui semnal binaural prin difuzoare, din cauza semnalului canalului drept care intră în urechea stângă a ascultătorului și invers, apare diafonia, anulând în cele din urmă toate avantajele reproducerii sunetului binaural. Aceste neajunsuri pot fi eliminate în mare măsură cu ajutorul unui dispozitiv special de procesare a semnalului audio care vă permite să obțineți un efect binaural atunci când ascultați o înregistrare binaurală prin difuzoare. Astfel de dispozitive se numesc procesoare bifonice. Înregistrarea este realizată din microfoane amplasate într-un cap artificial și este reprodusă după procesare de către un procesor bifonic, în care valoarea calculată cu precizie a semnalului fazat, întârziat și corectat în frecvență al canalului stâng este scăzută din semnalul din dreapta. canal și invers. Schema structurala procesorul bifonic, dezvoltat pentru prima dată de JVC, este prezentat în Fig. 4.


Figura 4. Diagrama bloc a unui procesor binaural

Este format din amplificatoare de semnal pentru canalele stânga și dreapta A1, A2, care amplifică semnalele de la microfoanele instalate în capul artificial A0, liniile de întârziere D1, D2, defazatoarele U1, U2 și sumatoarele E1, E2. După procesarea de către un procesor bifonic, semnalele care vin de la difuzoare către urechile ascultătorului sunt însumate astfel încât urechea stângă să audă doar semnalele canalului stâng, iar cea dreaptă - canalul drept. Astfel, se poate spune că efectul bifonic este asemănător cu cel binaural și diferă de acesta doar prin modul în care este reprodusă înregistrarea binaurală.

Și deși zona în care se manifestă clar este mică, dar, fiind în limitele sale, ascultătorul poate avea o idee despre distanța până la sursele sonore și poziția relativă a acestora în spațiu în momentul înregistrării, ceea ce nu poate fi atins. cu reproducere stereofonică a sunetului, care dă o idee doar despre locația surselor de sunet pe linia dintre difuzoare. O altă proprietate interesantă a unui procesor bifonic este posibilitatea extinderii bazei stereo a înregistrărilor stereo convenționale cu ajutorul acestuia. Aceasta este ceea ce se înțelege de obicei prin „3DSound”. Și dacă sistemul vă permite să creșteți unghiul imaginar dintre direcțiile către difuzoarele de sunet (Fig. 1) până la 180 de grade, atunci un astfel de sistem se numește „Surround” și panorama sonoră creată pentru acesta va fi aceeași ca atunci când ascultând telefoane stereo, dar fără concentrarea surselor de sunet imaginare în capul ascultătorului. Desigur, un procesor bifonic poate fi implementat exclusiv în software folosind tehnici de procesare a semnalului digital în timp real.