FMUSER безжично предаване на видео и аудио по-лесно!

[имейл защитен] WhatsApp + 8618078869184
Език

    Аудио обработка-1 основни знания

     

    звуков


    Отнася се до звуковите вълни със звукова честота между 20 Hz и 20 kHz, които могат да бъдат чути от човешкото ухо.

    Ако добавите съответна звукова карта към компютъра - звуковата карта, която често казваме, можем да запишем всички звуци и акустичните характеристики на звука, като нивото на звука, могат да се съхраняват като файлове на твърдия диск на компютъра диск. И обратно, ние също можем да използваме определена аудио програма за възпроизвеждане на съхранения аудио файл, за да възстановим записания преди това звук.

     

    1 Формат на аудио файл
    Форматът на аудио файла се отнася конкретно до формата на файла, съхраняващ аудио данните. Има много различни формати.

    Общият метод за получаване на аудио данни е да се вземе проба (квантува) аудио напрежението за фиксиран интервал от време и да се съхранява резултатът с определена разделителна способност (например всяка проба от CDDA е 16 бита или 2 байта). Интервалът на вземане на проби може да има различни стандарти. Например CDDA използва 44,100 48,000 пъти в секунда; DVD използва 96,000 2 или XNUMX XNUMX пъти в секунда. Следователно [честота на дискретизация], [разделителна способност] и броят на [каналите] (например XNUMX канала за стерео) са ключовите параметри на формата на аудио файла.

     

    1.1 Загуба и загуба
    Според производствения процес на цифровото аудио, аудио кодирането може да бъде само безкрайно близо до естествените сигнали. Поне сегашната технология може само това. Всяка схема за цифрово аудио кодиране има загуби, тъй като не може да бъде възстановена напълно. В компютърните приложения най-високото ниво на вярност е PCM кодирането, което се използва широко за запазване на материалите и оценяване на музиката. Използва се в компактдискове, DVD и наши общи WAV файлове. Следователно PCM се превърна в кодиране без загуби по конвенция, тъй като PCM представлява най-доброто ниво на вярност в цифровия звук.

     

    Има два основни типа аудио файлови формати:

    Формати без загуби, като WAV, PCM, TTA, FLAC, AU, APE, TAK, WavPack (WV)
    Загубени формати, като MP3, Windows Media Audio (WMA), Ogg Vorbis (OGG), AAC

     


    Въвеждане на 2 параметъра


    2.1 Честота на вземане на проби


    Отнася се за броя на звуковите проби, получени в секунда. Звукът всъщност е вид енергийна вълна, така че има и характеристиките на честота и амплитуда. Честотата съответства на оста на времето, а амплитудата - на оста на нивото. Вълната е безкрайно гладка и струната може да се разглежда като съставена от безброй точки. Тъй като пространството за съхранение е относително ограничено, точките на низа трябва да бъдат взети по време на процеса на цифрово кодиране.

     

    Процесът на вземане на проби е да се извлече честотната стойност на определена точка. Очевидно е, че колкото повече точки се извличат за една секунда, толкова повече информация за честотата се получава. За да се възстанови формата на вълната, колкото по-висока е честотата на дискретизация, толкова по-добро е качеството на звука. Колкото по-реална е реставрацията, но в същото време тя заема повече ресурси. Поради ограничената разделителна способност на човешкото ухо не може да се различи твърде висока честота. Често се използва честотата на вземане на проби от 22050, 44100 вече е CD качество на звука, а вземането на проби над 48,000 96,000 или 24 XNUMX вече не е от значение за човешкото ухо. Това е подобно на XNUMX кадъра в секунда във филмите. Ако е стерео, пробата се удвоява и файлът се удвоява почти.

     

    Според теорията на Nyquist за вземане на проби, за да се гарантира, че звукът не е изкривен, честотата на вземане на проби трябва да бъде около 40kHz. Не е нужно да знаем как е възникнала тази теорема. Трябва само да знаем, че тази теорема ни казва, че ако искаме да запишем сигнал точно, нашата честота на дискретизация трябва да бъде по-голяма или равна на два пъти максималната честота на аудио сигнала. Не забравяйте, че това е максималната честота.

     

    В областта на цифровия звук често използваните честоти на дискретизация са:

    8000 Hz - честотата на дискретизация, използвана от телефона, която е достатъчна за човешката реч
    Честота на вземане на проби от 11025 Hz, използвана от телефона
    Честота на дискретизация 22050 Hz, използвана в радиоразпръскването
    32000 Hz честота на дискретизация за цифрова видеокамера miniDV, DAT (LP режим)
    44100 Hz-Audio CD, също често използван като честота на дискретизация за MPEG-1 аудио (VCD, SVCD, MP3)
    Честота на вземане на проби от 47250 Hz, използвана от търговските PCM рекордери
    48000 Hz честота на дискретизация за цифров звук, използван в miniDV, цифрова телевизия, DVD, DAT, филми и професионален аудио
    Честота на вземане на проби от 50000 Hz, използвана от търговските цифрови записващи устройства
    96000 Hz или 192000 Hz - честотата на дискретизация, използвана за DVD-Audio, някои LPCM DVD аудио записи, BD-ROM (Blu-ray Disc) аудио записи и HD-DVD (High Definition DVD) аудио записи


    2.2 Брой битове за вземане на проби
    Броят на битовете за вземане на проби се нарича още размер на извадката или броят на битовете за квантуване. Това е параметър, използван за измерване на колебанията на звука, тоест разделителната способност на звуковата карта или може да се разбира като разделителната способност на звуковата карта, обработена от звуковата карта. Колкото по-голяма е стойността, толкова по-висока е разделителната способност и по-реалистичен е звукът, записан и възпроизведен. Битът на звуковата карта се отнася до двоичните цифри на цифровия звуков сигнал, използван от звуковата карта при събиране и възпроизвеждане на звукови файлове. Битът на звуковата карта обективно отразява точността на описанието на цифровия звуков сигнал на входния звуков сигнал. Общите звукови карти са предимно 8-битови и 16-битови. Днес всички масови продукти на пазара са 16-битови и по-нови звукови карти.

     

    Всяка извадка от данни записва амплитудата и точността на вземане на проби зависи от броя на битовете за вземане на проби:

    1 байт (т.е. 8 бита) може да записва само 256 числа, което означава, че амплитудата може да бъде разделена само на 256 нива;
    2 байта (т.е. 16 бита) могат да бъдат толкова малки, колкото 65536, което вече е CD стандарт;
    4 байта (т.е. 32 бита) могат да разделят амплитудата на 4294967296 нива, което е наистина ненужно.
    2.3 Брой канали
    Тоест броят на звуковите канали. Общите моно и стерео (двуканални) сега са се развили до четири-звуков съраунд (четириканален) и 5.1-канален.

     

    2.3.1 Моно
    Mono е относително примитивна форма на възпроизвеждане на звук и ранните звукови карти го използват по-често. Моно звукът може да се прозвучи само с един високоговорител, а някои също се обработват в два високоговорителя за извеждане на един и същ звуков канал. Когато монофоничната информация се възпроизвежда през два високоговорителя, ясно можем да почувстваме, че звукът е от два високоговорителя. Невъзможно е да се определи конкретното местоположение на звуковия източник, който се предава на ушите ни от средата на високоговорителя.

     

    2.3.2 стерео
    Бинауралните канали имат два звукови канала. Принципът е, че когато хората чуят звук, те могат да преценят конкретната позиция на звуковия източник въз основа на фазовата разлика между лявото и дясното ухо. Звукът се разпределя към два независими канала по време на процеса на запис, за да се постигне добър ефект на локализация на звука. Тази техника е особено полезна при оценката на музиката. Слушателят може ясно да различи посоката, от която идват различните инструменти, което прави музиката по-въображаема и по-близка до преживяването на място.

     

    В момента най-често се използват два гласа. В караоке едното е за възпроизвеждане на музика, а другото е за гласа на певеца; във VCD, единият е дублаж на мандарин, а другият дублира на кантонски.

     

    2.3.3 Четиритонов съраунд
    Четириканален съраунд дефинира четири звукови точки, предна лява, предна дясна, задна лява и задна дясна и публиката е заобиколена от тях. Също така се препоръчва да се добави субуфер, за да се засили обработката на възпроизвеждането на нискочестотни сигнали (това е причината, поради която 4.1-каналните високоговорители са широко популярни днес). Що се отнася до цялостния ефект, четириканалната система може да донесе на слушателите съраунд звук от множество различни посоки, може да получи слуховото преживяване в различни среди и да даде на потребителите чисто ново изживяване. В днешно време четириканалната технология е широко интегрирана в дизайна на различни звукови карти от среден до висок клас, превръщайки се в основната тенденция на бъдещото развитие.

     

    2.3.4 5.1 канал
    5.1 канали са широко използвани в различни традиционни театри и домашни кина. Някои от по-известните формати за компресиране на звукозапис, като Dolby AC-3 (Dolby Digital), DTS и др., Се основават на звуковата система 5.1. Каналът ".1" е специално проектиран канал за субуфер, който може да произвежда субуфери с честотен диапазон от 20 до 120 Hz. Всъщност звуковата система 5.1 идва от съраунд 4.1, разликата е, че добавя централен блок. Това централно устройство отговаря за предаването на звуковия сигнал под 80 Hz, което е полезно за укрепване на човешкия глас при гледане на филма и за концентриране на диалога в средата на цялото звуково поле, за да се увеличи общия ефект.

     

    Понастоящем много онлайн музикални плейъри, като QQ Music, предоставят 5.1-канална музика за пробно слушане и изтегляне.

     

    2.4 рамка
    Концепцията за аудио кадри не е толкова ясна, колкото видео кадри. Почти всички формати за кодиране на видео могат просто да възприемат кадъра като кодирано изображение. Аудио рамката обаче е свързана с кодиращия формат, който се прилага от всеки стандарт за кодиране.

     

    Например, в случай на PCM (некодирани аудио данни), той изобщо не се нуждае от концепцията за кадри и може да бъде възпроизведен според честотата на дискретизация и точността на дискретизацията. Например за двойно аудио със скорост на дискретизация 44.1kHZ и точност на дискретизация 16 бита, можете да изчислите, че битрейтът е 44100162bps, а аудио данните в секунда са фиксирани 44100162/8 байта.

     

    Рамката amr е относително проста. Той предвижда, че на всеки 20ms аудио е кадър и всеки кадър от аудио е независим и е възможно да се използват различни алгоритми за кодиране и различни параметри на кодиране.

     

    MP3 рамката е малко по-сложна и съдържа повече информация, като честота на дискретизация, битова скорост и различни параметри.

     

    2.5 цикли
    Броят на кадрите, необходими на аудио устройство за обработка в даден момент, както и достъпът до данните на аудио устройството и съхранението на аудио данни се основават на това устройство.

     

    2.6 Режим на череп
    Методът за съхранение на цифров аудио сигнал. Данните се съхраняват в непрекъснати кадри, т.е. първо се записват проби от левия канал и проби от десния канал на кадър 1 и след това започва записването на кадър 2.

     

    2.7 Режим без преплитане
    Първо, запишете пробите от левия канал на всички кадри в период и след това запишете всички проби от десния канал.

     

    2.8 битова скорост (битрейт)
    Битрейт се нарича още битрейт, който се отнася до количеството данни, възпроизведени от музика в секунда. Единицата се изразява с бит, който е двоичен бит. bps е битрейт. b е бит (бит), s е втори (втори), p е всеки (на), един байт е еквивалентен на 8 двоични бита. Тоест размерът на файла на 4-минутна песен от 128bps се изчислява по този начин (128/8) 460 = 3840kB = 3.8MB, 1B (Byte) = 8b (bit), обикновено mp3 е полезен при около 128 bit скорост и вероятно е Размерът е около 3-4 BM.

     

    В компютърните приложения най-високото ниво на вярност е PCM кодирането, което се използва широко за съхранение на материали и оценяване на музиката. CD, DVD и нашите общи WAV файлове се използват. Следователно PCM се превърна в кодиране без загуби по конвенция, тъй като PCM представлява най-доброто ниво на вярност в цифровия звук. Това не означава, че PCM може да осигури абсолютна вярност на сигнала. PCM може да постигне само максимална безкрайна близост.

     

    За да се изчисли битрейтът на PCM аудио поток е много лесна задача, стойност на честотата на дискретизация × стойност на размера на дискретизация × номер на канала в секунда. WAV файл с честота на дискретизация 44.1KHz, размер на дискретизация 16bit и двуканално PCM кодиране, скоростта му на данни е 44.1K × 16 × 2 = 1411.2Kbps. Нашият общ аудио CD използва PCM кодиране и капацитетът на CD може да побере само 72 минути музикална информация.

     

    Двуканалният PCM кодиран аудио сигнал изисква 176.4KB пространство за 1 секунда и около 10.34M за 1 минута. Това е неприемливо за повечето потребители, особено за тези, които обичат да слушат музика на компютъра. Заетост на диска, има само два метода, индекс за намаляване на дискретизацията или компресия. Не е препоръчително да се намалява индексът на вземане на проби, затова експертите са разработили различни схеми за компресия. Най-оригиналните са DPCM, ADPCM, а най-известният е MP3. Следователно скоростта на кодиране след компресиране на данни е много по-ниска от оригиналния код.

     

    2.9 Примерно изчисление
    Например дължината на файла на "Windows XP startup.wav" е 424,644 22050 байта, което е във формата "16HZ / XNUMXbit / stereo".

    Тогава скоростта на предаване в секунда (битова скорост, наричана още битова скорост, честота на дискретизация) е 22050162 = 705600 (bps), преобразувана в байтова единица е 705600/8 = 88200 (байта в секунда), време за възпроизвеждане: 424644 (Общо байтове) / 88200 (байта в секунда) ≈ 4.8145578 (секунди).

     

    Но това не е достатъчно точно. Файлът WAVE (* .wav) в стандартния PCM формат има поне 42 байта информация за заглавието, които трябва да бъдат премахнати при изчисляване на времето за възпроизвеждане, така че има: (424644-42) / (22050162/8) ≈ 4.8140816 ( секунди). Това е по-точно.

     

    3 PCM аудио кодиране
    PCM означава импулсна кодова модулация. В PCM процеса, входящият аналогов сигнал се семплира, квантува и кодира, а двоичното кодирано число представлява амплитудата на аналоговия сигнал; след това приемащият край възстановява тези кодове до оригиналния аналогов сигнал. Тоест A / D преобразуването на цифрово аудио включва три процеса: вземане на проби, квантуване и кодиране.

     

    Скоростта на приемане на гласов PCM е 8kHz, а броят на битовете за вземане на проби е 8bit, така че скоростта на кодиране на гласовия цифров кодиран сигнал е 8bits × 8kHz = 64kbps = 8KB / s.

     

    3.1 Принципи на аудио кодирането
    Всеки, който има определена електронна основа, знае, че звуковият сигнал, събран от сензора, е аналогова величина, но това, което използваме в реалния процес на предаване, е цифрова величина. И това включва процеса на преобразуване на аналогов в цифров. Аналоговият сигнал трябва да премине през три процеса, а именно вземане на проби, квантуване и кодиране, за да се реализира технологията за импулсна кодова модулация (PCM, Pulse Coding Modulation) на дигитализация на гласа.

     

    Процес на преобразуване


    3.1.1 Вземане на проби
    Вземането на проби е процесът на извличане на проби (честота на вземане на проби) от аналогов сигнал с честота, която е повече от 2 пъти широчината на честотната лента на сигнала (Lequist Sampling Theorem) и превръщането му в дискретен сигнал за дискретизация по оста на времето.
    Честота на вземане на проби: Броят на пробите, извлечени от непрекъснат сигнал в секунда, за да се образува дискретен сигнал, изразен в херци (Hz).


    проба:
    Например честотата на дискретизация на аудио сигнала е 8000hz.
    Може да се разбере, че пробата на горната фигура съответства на кривата на промяната на напрежението с времето на фигурата за 1 секунда, след това по-ниската 1 2 3 ... 10, тъй като трябва да има 1-8000 точки, т.е. второто е разделено на 1 части и след това ги извадете на свой ред Стойността на напрежението, съответстваща на това 8000 точково време.

     

    3.1.2 Количествено определяне
    Въпреки че дискретизираният сигнал е дискретен сигнал на оста на времето, той все още е аналогов сигнал и неговата стойност на извадката може да има безкраен брой стойности в рамките на определен диапазон от стойности. Методът „закръгляване“ трябва да бъде приет за „закръгляване“ на примерните стойности, така че примерните стойности в рамките на определен диапазон от стойности да бъдат променени от безкраен брой стойности на краен брой стойности. количествено определяне.

     

    Брой битове за дискретизация: отнася се до броя битове, използвани за описване на цифровия сигнал.
    8 бита (8 бита) представляват 2 до 8-ма мощност = 256, 16 бита (16 бита) представляват 2 до 16-та степен = 65536;

     

    проба:
    Например, обхватът на напрежението, събран от аудио сензора, е 0-3.3V, а номерът за вземане на проби е 8 бита (бит)
    Тоест, ние разглеждаме 3.3V / 2 ^ 8 = 0.0128 като точност на квантуване.
    Разделяме 3.3v на 0.0128 като стъпкова ос Y, както е показано на фигура 3, 1 2 ... 8 става 0 0.0128 0.0256 ... 3.3 V
    Например стойността на напрежението на точката за вземане на проби е 1.652V (между 1280.128 и 1290.128). Закръгляваме го до 1.65 V и съответното ниво на квантуване е 128.

     

    3.1.3 Кодиране
    Квантуваният сигнал за дискретизация се трансформира в серия от десетични цифрови кодови потоци, подредени според последователността на дискретизация, т.е. десетичния цифров сигнал. Една проста и ефективна система за данни е система с двоичен код. Следователно десетичният цифров код трябва да се преобразува в двоичен код. Според общия брой на десетичните цифрови кодове може да се определи броят на битовете, необходим за двоично кодиране, т.е. дължината на думата (брой битове за вземане на проби). Този процес на трансформиране на квантувания пробен сигнал в двоичен кодов поток с дадена дължина на думата се нарича кодиране.

     

    проба:
    Тогава горните 1.65V съответстват на ниво на квантуване от 128. Съответната двоична система е 10000000. Тоест резултатът от кодирането на точката на вземане на проби е 10000000. Разбира се, това е метод на кодиране, който не отчита положителните и отрицателните стойности и има много видове методи за кодиране, които изискват специфичен анализ на конкретни проблеми. (PCM кодирането на аудио формат е A-law 13 polyline encoding)

     

    3.2 PCM аудио кодиране
    PCM сигналът не е претърпял никакво кодиране и компресиране (компресиране без загуби). В сравнение с аналоговите сигнали, той не се влияе лесно от бъркотията и изкривяването на преносната система. Динамичният обхват е широк и качеството на звука е доста добро.

     

    3.2.1 PCM кодиране
    Използваното кодиране е кодиране A-law 13 polyline.
    За подробности вижте: PCM гласово кодиране

     

    3.2.2 Канал
    Каналите могат да бъдат разделени на моно и стерео (двуканални).

    Всяка пробна стойност на PCM се съдържа в цяло число i, а дължината на i е минималният брой байта, необходим за побиране на определената дължина на пробата.

     

    Размер на пробата Формат на данните Минимална стойност Максимална стойност
    8-битов PCM неподписан int 0 225
    16-битов PCM int -32767 32767

     

    За моно звукови файлове данните за дискретизация са 8-битово кратко цяло число (кратко int 00H-FFH) и данните за дискретизация се съхраняват в хронологичен ред.


    Двуканален стерео звуков файл, всеки дискретизиращ данни е 16-битово цяло число (int), горните осем бита (ляв канал) и долните осем бита (десен канал) съответно представляват два канала, а данните за дискретизация са в хронологичен ред Депозит в алтернативен ред.
    Същото важи и когато броят на битовете за вземане на проби е 16 бита и съхранението е свързано с реда на байтовете.


    PCM формат на данните
    Всички мрежови протоколи използват големия ендиански начин за предаване на данни. Следователно, големият endian метод се нарича още мрежов байт ред. Когато два хоста с различен байт ред комуникират, те трябва да бъдат преобразувани в мрежов байт ред преди изпращане на данни преди предаване.

     

    4 G.711
    По принцип PCM, аналоговият сигнал претърпява известна обработка (като амплитудно компресиране), преди да бъде дигитализиран. Веднъж дигитализиран, PCM сигналът обикновено се обработва допълнително (като компресиране на цифрови данни).

     

    G.711 е стандартен алгоритъм за мултимедиен цифров сигнал (компресия / декомпресия), който mизлъчва импулсния код от ITU-T. Това е техника за вземане на проби за цифровизиране на аналогови сигнали, особено за аудио сигнали. PCM взема сигнал 8000 пъти в секунда, 8KHz; всяка проба е 8 бита, общо 64Kbps (DS0). Има два стандарта за кодиране на нивата на вземане на проби. Северна Америка и Япония използват стандарта Mu-Law, докато повечето други страни използват стандарта A-Law.

     

    A-law и u-law са два метода за кодиране на PCM. A-law PCM се използва в Европа и моята страна, а Mu-law се използва в Северна Америка и Япония. Разликата между двете е методът на квантуване. Законът A използва 12-битово квантуване, а законът u използва 13-битово квантуване. Честотата на вземане на проби е 8KHz и двете са 8bit методи за кодиране.

     

    Просто разбиране: PCM са оригиналните аудио данни, събрани от аудио оборудване. G.711 и AAC са два различни алгоритма, които могат да компресират PCM данни до определено съотношение, като по този начин спестяват честотна лента при мрежово предаване.

     

     

     

     

    Избройте всички Въпрос

    прякор

    Имейл

    въпроси

    Нашата друг продукт:

    Професионален пакет оборудване за FM радиостанция

     



     

    Хотелско IPTV решение

     


      Въведете имейл, за да получите изненада

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org -> африкаанс
      sq.fmuser.org -> албански
      ar.fmuser.org -> арабски
      hy.fmuser.org -> Арменски
      az.fmuser.org -> азербайджански
      eu.fmuser.org -> баски
      be.fmuser.org -> белоруски
      bg.fmuser.org -> Български
      ca.fmuser.org -> каталунски
      zh-CN.fmuser.org -> китайски (опростен)
      zh-TW.fmuser.org -> Китайски (традиционен)
      hr.fmuser.org -> хърватски
      cs.fmuser.org -> чешки
      da.fmuser.org -> датски
      nl.fmuser.org -> Холандски
      et.fmuser.org -> естонски
      tl.fmuser.org -> филипински
      fi.fmuser.org -> финландски
      fr.fmuser.org -> Френски
      gl.fmuser.org -> галисийски
      ka.fmuser.org -> грузински
      de.fmuser.org -> немски
      el.fmuser.org -> Гръцки
      ht.fmuser.org -> хаитянски креолски
      iw.fmuser.org -> иврит
      hi.fmuser.org -> хинди
      hu.fmuser.org -> Унгарски
      is.fmuser.org -> исландски
      id.fmuser.org -> индонезийски
      ga.fmuser.org -> ирландски
      it.fmuser.org -> Italian
      ja.fmuser.org -> японски
      ko.fmuser.org -> корейски
      lv.fmuser.org -> латвийски
      lt.fmuser.org -> Литовски
      mk.fmuser.org -> македонски
      ms.fmuser.org -> малайски
      mt.fmuser.org -> Малтийски
      no.fmuser.org -> Norwegian
      fa.fmuser.org -> персийски
      pl.fmuser.org -> полски
      pt.fmuser.org -> португалски
      ro.fmuser.org -> Romanian
      ru.fmuser.org -> руски
      sr.fmuser.org -> сръбски
      sk.fmuser.org -> словашки
      sl.fmuser.org -> Словенски
      es.fmuser.org -> испански
      sw.fmuser.org -> суахили
      sv.fmuser.org -> шведски
      th.fmuser.org -> Thai
      tr.fmuser.org -> турски
      uk.fmuser.org -> украински
      ur.fmuser.org -> урду
      vi.fmuser.org -> Виетнамски
      cy.fmuser.org -> уелски
      yi.fmuser.org -> Идиш

       
  •  

    FMUSER безжично предаване на видео и аудио по-лесно!

  • Контакти

    Адрес
    No.305 Стая HuiLan Сграда No.273 Huanpu Road Гуанджоу Китай 510620

    Мейл:
    [имейл защитен]

    Тел / WhatApps:
    +8618078869184

  • Категории

  • Бюлетин

    ПЪРВО ИЛИ ПЪЛНО ИМЕ

    E-mail

  • разтвор PayPal  Western UnionЦентралната банка на Китай
    Мейл:[имейл защитен]   WhatsApp: +8618078869184 Skype: sky198710021 Пиши си с мен
    Copyright 2006-2020 Powered By www.fmuser.org

    Свържи се с нас