FMUSER безжично предаване на видео и аудио по-лесно!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> африкаанс
sq.fmuser.org -> албански
ar.fmuser.org -> арабски
hy.fmuser.org -> Арменски
az.fmuser.org -> азербайджански
eu.fmuser.org -> баски
be.fmuser.org -> белоруски
bg.fmuser.org -> Български
ca.fmuser.org -> каталунски
zh-CN.fmuser.org -> китайски (опростен)
zh-TW.fmuser.org -> Китайски (традиционен)
hr.fmuser.org -> хърватски
cs.fmuser.org -> чешки
da.fmuser.org -> датски
nl.fmuser.org -> Холандски
et.fmuser.org -> естонски
tl.fmuser.org -> филипински
fi.fmuser.org -> финландски
fr.fmuser.org -> Френски
gl.fmuser.org -> галисийски
ka.fmuser.org -> грузински
de.fmuser.org -> немски
el.fmuser.org -> Гръцки
ht.fmuser.org -> хаитянски креолски
iw.fmuser.org -> иврит
hi.fmuser.org -> хинди
hu.fmuser.org -> Унгарски
is.fmuser.org -> исландски
id.fmuser.org -> индонезийски
ga.fmuser.org -> ирландски
it.fmuser.org -> Italian
ja.fmuser.org -> японски
ko.fmuser.org -> корейски
lv.fmuser.org -> латвийски
lt.fmuser.org -> Литовски
mk.fmuser.org -> македонски
ms.fmuser.org -> малайски
mt.fmuser.org -> Малтийски
no.fmuser.org -> Norwegian
fa.fmuser.org -> персийски
pl.fmuser.org -> полски
pt.fmuser.org -> португалски
ro.fmuser.org -> Romanian
ru.fmuser.org -> руски
sr.fmuser.org -> сръбски
sk.fmuser.org -> словашки
sl.fmuser.org -> Словенски
es.fmuser.org -> испански
sw.fmuser.org -> суахили
sv.fmuser.org -> шведски
th.fmuser.org -> Thai
tr.fmuser.org -> турски
uk.fmuser.org -> украински
ur.fmuser.org -> урду
vi.fmuser.org -> Виетнамски
cy.fmuser.org -> уелски
yi.fmuser.org -> Идиш
(1) Излишна информация за видео сигнал
Вземайки за пример формата на YUV компонент за запис на цифрово видео, YUV представлява съответно сигнали за яркост и два цветови разлики. Например, за съществуваща pal TV система, честотата на вземане на проби за яркост на сигнала е 13.5 MHz; честотната лента на хроматичния сигнал обикновено е половината или по-малка от сигнала за яркост, който е 6.75 MHz или 3.375 MHz. Като вземем за пример честотата на вземане на проби от 4: 2: 2, Y сигналът приема 13.5 MHz, цветният сигнал U и V се вземат от 6.75 MHz, а сигналът за вземане на проби се квантува с 8 бита, след което може да се изчисли скоростта на кодиране на цифровото видео както следва:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216Mbit / s
Ако такова голямо количество данни се съхранява или предава директно, ще бъде трудно да се използва технология за компресия, за да се намали скоростта на предаване. Цифровият видео сигнал може да се компресира според две основни условия:
L. излишък на данни. Например пространствена излишък, излишък във времето, излишък на структурата, излишък на информационна ентропия и т.н., тоест има силна корелация между пикселите на изображението. Премахването на тези излишъци не води до загуба на информация и е компресия без загуби.
L. визуална излишък. Някои характеристики на човешките очи, като праг на дискриминация на яркостта, визуален праг, са различни по чувствителност към яркост и наситеност, което прави невъзможно въвеждането на подходящи грешки в кодирането и няма да бъдат открити. Визуалните характеристики на човешките очи могат да се използват за обмен за компресиране на данни с определени обективни изкривявания. Това компресиране е със загуби.
Компресията на цифровия видео сигнал се основава на горните две условия, което прави видео данните силно компресирани, което е благоприятно за предаване и съхранение. Общите методи за цифрово видео компресиране са смесено кодиране, което е да комбинира преобразуващо кодиране, оценка на движението и компенсация на движението и ентропийно кодиране за компресиране на кодиране. Обикновено преобразуващото кодиране се използва за елиминиране на вътрешнокадровата излишност на изображението, а оценката на движението и компенсацията на движението се използват за премахване на междукадровата излишност на изображението, а ентропийното кодиране се използва за допълнително подобряване на ефективността на компресиране. Следните три метода за кодиране на компресия са представени за кратко.
а) Метод за кодиране чрез компресия
(б) Трансформиращо кодиране
Функцията на преобразуващото кодиране е да трансформира сигнала на изображението, описан в пространствения домейн, в честотната област и след това да кодира трансформираните коефициенти. Най-общо казано, изображението има силна корелация в пространството и превръщането в честотна област може да реализира декорелация и концентрация на енергия. Общото ортогонално преобразуване включва дискретно преобразуване на Фурие, дискретно косинусно преобразуване и така нататък. Дискретно косинусно преобразуване се използва широко при компресиране на цифрово видео.
Дискретно косинусово преобразуване се нарича DCT преобразуване. Той може да трансформира блока с изображения на L * l от космически домейн в честотен домейн. Следователно, в процеса на компресиране на изображението и кодиране, основано на DCT, изображението трябва да бъде разделено на блокове с изображения, които не се припокриват. Да предположим, че размерът на изображението е 1280 * 720, той е разделен на 160 * 90 блока с изображения с размер 8 * 8, без да се припокрива под формата на мрежа. Тогава DCT трансформацията може да се извърши за всеки блок с изображения.
След разделянето на блока, всеки 8 * 8 точков блок с изображения се изпраща към кодера на DCT и 8 * 8 образният блок се трансформира от пространствения домейн в честотния домейн. Фигурата по-долу показва пример за блок с изображение от 8 * 8, в който числото представлява стойността на яркостта на всеки пиксел. От фигурата може да се види, че стойностите на яркостта на всеки пиксел в този блок с изображения са относително еднакви, особено стойността на яркостта на съседните пиксели не е много голяма, което показва, че сигналът на изображението има силна корелация.
Действителен блок с изображения 8 * 8
Следващата фигура показва резултатите от DCT трансформацията на блока на изображението в горната фигура. От фигурата може да се види, че след трансформацията на DCT нискочестотният коефициент в горния ляв ъгъл концентрира много енергия, докато енергията на високочестотния коефициент в долния десен ъгъл е много малка.
Коефициентите на блока на изображението след трансформация на DCT
Сигналът трябва да бъде количествено определен след трансформацията на DCT. Тъй като човешките очи са чувствителни към нискочестотни характеристики на изображенията, като цялостната яркост на обектите, а не към високочестотните детайли в изображението, така че в процеса на предаване, високочестотната информация може да се предава по-малко или не, само нискочестотната част. Процесът на квантуване намалява предаването на информация чрез количествено определяне на коефициентите на нискочестотна област и грубо квантуване на коефициентите във високочестотна област, което премахва високочестотната информация, която не е чувствителна към човешките очи. Следователно квантуването е процес на компресия със загуба и основната причина за увреждането на качеството при кодирането на видео компресия.
Процесът на количествено определяне може да бъде изразен чрез следната формула:
Сред тях FQ (U, V) представлява DCT коефициента след квантуване; f (U, V) представлява DCT коефициент преди квантуване; Q (U, V) представлява матрица за претегляне на квантоване; q е стъпка на квантуване; кръг се отнася до консолидация и стойността, която трябва да се изведе, се приема като най-близката целочислена стойност.
Изберете разумно коефициента на квантуване и резултатът след квантуване на преобразувания блок на изображение е показан на фигурата.
DCT коефициент след количествено определяне
Повечето от DCT коефициентите се променят на 0 след квантуване, докато само няколко коефициента са ненулеви стойности. Понастоящем само тези ненулеви стойности трябва да бъдат компресирани и кодирани.
(б) Ентропийно кодиране
Ентропийното кодиране се нарича, тъй като средната дължина на кода след кодирането е близка до стойността на ентропията на източника. Ентропийното кодиране се осъществява чрез VLC (кодиране с променлива дължина). Основният принцип е да се даде кратък код на символа с висока вероятност в източника и да се даде дълъг код на символа с малка вероятност за поява, така че да се получи по-късата средна дължина на кода статистически. Кодирането с променлива дължина обикновено включва код на Хофман, аритметичен код, код за изпълнение и др. Кодирането с дължина на изпълнение е много прост метод за компресиране, ефективността му на компресиране не е висока, но скоростта на кодиране и декодиране е бърза и все още е широко използвана, особено след преобразуването на кодирането, като се използва дългосрочно кодиране, има добър ефект.
Първо, AC коефициентът, непосредствено след изходния DC коефициент на квантователя, се сканира в Z-тип (както е показано в стрелката). Z-сканирането трансформира двуизмерния коефициент на квантуване в едномерна последователност и след това продължава кодирането на дължината на изпълнението. И накрая, друг код с променлива дължина се използва за кодиране на данните след кодиране на изпълнение, като кодиране на Хофман. Чрез този вид кодиране с променлива дължина, ефективността на кодирането се подобрява допълнително.
(в) Оценка на движението и компенсация на движението
Оценката на движението и компенсацията на движението са ефективни методи за елиминиране на корелацията на посоката във времето на последователностите на изображението. Методите за преобразуване DCT, квантуване и ентропия кодиране, описани по-горе, се основават на едно кадърно изображение. Чрез тези методи може да се премахне пространствената корелация между пикселите в изображението. Всъщност, в допълнение към пространствената корелация, сигналът на изображението има и временна корелация. Например за цифрово видео със статичен фон, като излъчване на новини и малко движение на основната част от картината, разликата между всяка картина е много малка и корелацията между изображенията е много голяма. В този случай не е необходимо да кодираме всяко изображение на кадър поотделно, а можем да кодираме само променените части на съседни видеокадри, за да намалим допълнително количеството данни. Тази работа се реализира чрез оценка на движението и компенсация на движението.
Технологията за оценка на движението обикновено разделя текущото входно изображение на няколко малки подблока на изображението, които не се припокриват, например, размерът на изображението на кадъра е 1280 * 720. Първо, той е разделен на 40 * 45 блока с изображения с 16 * 16 размера, които не се припокриват помежду си под формата на решетка и след това, в рамките на прозореца за търсене на предишното изображение или последното изображение, намерете блок за всеки блок от изображение, за да намерите един блок от изображение в обхвата на прозорец за търсене Най-сходният блок с изображения. Процесът на търсене се нарича оценка на движението. Чрез изчисляване на информацията за позицията между най-сходния блок на изображението и блока на изображението може да се получи вектор на движение. По този начин текущият блок на изображението може да бъде изваден от най-сходния блок на изображението, посочен от вектора за движение на референтното изображение, и може да бъде получен остатъчен блок на изображението. Тъй като всяка стойност на пиксела в остатъчния образен блок е много малка, при кодиране на компресия може да се получи по-високо съотношение на компресия. Този процес на изваждане се нарича компенсация на движението.
Тъй като референтното изображение е необходимо, за да се използва за оценка на движението и компенсация на движението в процеса на кодиране, е много важно да изберете референтно изображение. Като цяло кодерът разделя всеки входящ образ на кадър на три различни типа според различните референтни изображения: I (вътрешен) кадър, B (предсказване на насочване) кадър и P (предсказване) кадър. Както е показано на фигурата.
Типична последователност на структурата на кадрите I, B, P
Както е показано на фигурата, I frame използва само данните в рамката за кодиране и не се нуждае от оценка на движението и компенсация на движението по време на процеса на кодиране. Очевидно, тъй като I frame не елиминира корелацията на посоката на времето, степента на компресия е относително ниска. В процеса на кодиране, P кадърът използва преден I кадър или P кадър като референтно изображение за компенсация на движението, всъщност той кодира разликата между текущото изображение и референтното изображение. Режимът на кодиране на B кадър е подобен на P кадър, единствената разлика е, че той трябва да използва преден I кадър или P кадър и по-късен I кадър или P кадър, за да предскаже по време на процеса на кодиране. По този начин, всяко кодиране на P кадър трябва да използва едно изображение на кадър като референтно изображение, докато кадър B се нуждае от два кадъра като еталон. За разлика от това, B кадърът има по-високо съотношение на компресия от P кадъра.
(г) Смесено кодиране
Документът представя няколко важни метода за видео компресия и кодиране. В практическо приложение тези методи не са разделени и обикновено се комбинират, за да се постигне най-добрият ефект на компресия. Следващата фигура показва модела на хибридно кодиране (т.е. преобразуващо кодиране + оценка на движението и компенсация на движението + ентропийно кодиране). Моделът се използва широко в MPEG1, MPEG2, H.264 и други стандарти. От фигурата можем да видим, че първоначалното входно изображение първо трябва да бъде разделено на блокове, блокът на изображението, получен от блока, ще бъде изваден от прогнозирано изображение след компенсация на движението, за да се получи различното изображение x, и след това се извършват DCT трансформация и квантуване за блока на различното изображение. Квантуваните изходни данни имат две различни места: едното е да ги изпрати на ентропийния кодер за кодиране, а кодираният кодов поток се извежда в кеш Запазете в устройството и изчакайте предаването. Друго приложение е да се противопостави на количествено определяне и да се обърне промяната на сигнал x ', което добавя изходния блок на изображението с компенсация на движението, за да се получи нов сигнал за предсказуемо изображение и изпраща нов блок с предсказващо изображение към паметта на кадрите.
|
Въведете имейл, за да получите изненада
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> африкаанс
sq.fmuser.org -> албански
ar.fmuser.org -> арабски
hy.fmuser.org -> Арменски
az.fmuser.org -> азербайджански
eu.fmuser.org -> баски
be.fmuser.org -> белоруски
bg.fmuser.org -> Български
ca.fmuser.org -> каталунски
zh-CN.fmuser.org -> китайски (опростен)
zh-TW.fmuser.org -> Китайски (традиционен)
hr.fmuser.org -> хърватски
cs.fmuser.org -> чешки
da.fmuser.org -> датски
nl.fmuser.org -> Холандски
et.fmuser.org -> естонски
tl.fmuser.org -> филипински
fi.fmuser.org -> финландски
fr.fmuser.org -> Френски
gl.fmuser.org -> галисийски
ka.fmuser.org -> грузински
de.fmuser.org -> немски
el.fmuser.org -> Гръцки
ht.fmuser.org -> хаитянски креолски
iw.fmuser.org -> иврит
hi.fmuser.org -> хинди
hu.fmuser.org -> Унгарски
is.fmuser.org -> исландски
id.fmuser.org -> индонезийски
ga.fmuser.org -> ирландски
it.fmuser.org -> Italian
ja.fmuser.org -> японски
ko.fmuser.org -> корейски
lv.fmuser.org -> латвийски
lt.fmuser.org -> Литовски
mk.fmuser.org -> македонски
ms.fmuser.org -> малайски
mt.fmuser.org -> Малтийски
no.fmuser.org -> Norwegian
fa.fmuser.org -> персийски
pl.fmuser.org -> полски
pt.fmuser.org -> португалски
ro.fmuser.org -> Romanian
ru.fmuser.org -> руски
sr.fmuser.org -> сръбски
sk.fmuser.org -> словашки
sl.fmuser.org -> Словенски
es.fmuser.org -> испански
sw.fmuser.org -> суахили
sv.fmuser.org -> шведски
th.fmuser.org -> Thai
tr.fmuser.org -> турски
uk.fmuser.org -> украински
ur.fmuser.org -> урду
vi.fmuser.org -> Виетнамски
cy.fmuser.org -> уелски
yi.fmuser.org -> Идиш
FMUSER безжично предаване на видео и аудио по-лесно!
Контакти
Адрес
No.305 Стая HuiLan Сграда No.273 Huanpu Road Гуанджоу Китай 510620
Категории
Бюлетин