Евразийский сервер публикаций

Евразийский патент № 042232

   Библиографические данные
(11)042232    (13) B1
(21)202090186

 [ A ]   [ B ]   [ C ]   [ D ]   [ E ]   [ F ]   [ G ]   [ H ] 

Текущий раздел: H     


Документ опубликован 2023.01.25
Текущий бюллетень: 2023-01  
Все публикации: 042232  
Реестр евразийского патента: 042232  

(22)2016.08.24
(51) H04S 1/00 (2006.01)
H04S 3/00 (2006.01)
H04S 7/00(2006.01)
(43)A2 2020.09.30 Бюллетень № 09  тит.лист, описание 
A3 2020.12.30 Бюллетень № 12  тит.лист, описание 
(45)B1 2023.01.25 Бюллетень № 01  тит.лист, описание 
(31)62/209,735; 15189094.4
(32)2015.08.25; 2015.10.09
(33)US; EP
(62)201890576; 2016.08.24
(71)ДОЛБИ ИНТЕРНЕШНЛ АБ (NL); ДОЛБИ ЛАБОРАТОРИС ЛАЙСЭНЗИН КОРПОРЕЙШН (US)
(72)Бребарт Дирк Йерун, Купер Дэвид М. (AU), Самуэльссон Лейф Дж., Коппенс Йерун (SE), Уилсон Ронда Джой (US), Пурнхаген Хейко (SE), Штальман Александр (DE)
(73)ДОЛБИ ИНТЕРНЕШНЛ АБ (NL); ДОЛБИ ЛАБОРАТОРИС ЛАЙСЭНЗИН КОРПОРЕЙШН (US)
(74)Носырева Е.Л. (RU)
(54)КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ЗВУКА С ИСПОЛЬЗОВАНИЕМ ПАРАМЕТРОВ ПРЕОБРАЗОВАНИЯ ПРЕДСТАВЛЕНИЯ
   Формула 
(57) 1. Способ кодирования входного аудиопотока, содержащего одну или более звуковых составляющих, отличающийся тем, что каждая звуковая составляющая связана с пространственным местоположением, причем способ включает этапы
представления первого представления потока воспроизведения указанного входного аудиопотока, причем указанное первое представление потока воспроизведения представляет собой набор из M1 сигналов, предназначенных для воспроизведения первой системой воспроизведения звука;
представления второго представления потока воспроизведения указанного входного аудиопотока, при этом указанное второе представление потока воспроизведения представляет собой набор из двух сигналов, предназначенных для воспроизведения второй системой воспроизведения звука, при этом одно из первого представления потока воспроизведения и второго представления потока воспроизведения представляет собой представление для громкоговорителей и при этом одно из первого представления потока воспроизведения и второго представления потока воспроизведения представляет собой эховое или безэховое бинауральное представление;
определения набора параметров преобразования, пригодных для преобразования промежуточного представления потока воспроизведения, которое представляет собой набор из M3 сигналов, в приближение второго представления потока воспроизведения, при этом набор параметров преобразования образует матрицу усиления размером M3´2, которая при применении непосредственно к промежуточному представлению потока воспроизведения матричным умножением образует указанное приближение второго представления потока воспроизведения, и причем промежуточное представление потока воспроизведения представляет собой одно из первого представления потока воспроизведения и результата понижающего микширования первого представления потока воспроизведения;
причем параметры преобразования определяются путем минимизации величины разницы между вторым представлением потока воспроизведения и приближением второго представления потока воспроизведения, образованного применением параметров преобразования к промежуточному представлению потока воспроизведения; и
кодирования первого представления потока воспроизведения и указанного набора параметров преобразования для передачи в декодер.
2. Способ по п.1, отличающийся тем, что указанные параметры преобразования являются переменными во времени и/или зависящими от частоты.
3. Способ по любому из предыдущих пунктов, отличающийся тем, что M1=2.
4. Способ по любому из пп.1-2, отличающийся тем, что M1>2, M3=2, и при этом способ дополнительно включает образование промежуточного представления потока воспроизведения путем понижающего микширования первого представления потока воспроизведения в двухканальное представление.
5. Способ декодирования представлений потока воспроизведения из потока данных, причем способ включает этапы
приема и декодирования первого представленного представления потока воспроизведения, при этом указанное первое представленное представление потока воспроизведения представляет собой набор из M1 сигналов, предназначенных для воспроизведения первой системой воспроизведения звука;
приема и декодирования набора параметров преобразования, пригодных для преобразования промежуточного представления потока воспроизведения, которое представляет собой набор из M3 сигналов, в приближение второго представленного представления потока воспроизведения, при этом указанное второе представленное представление потока воспроизведения представляет собой набор из двух сигналов, предназначенных для воспроизведения второй системой воспроизведения звука, при этом набор параметров преобразования образуют матрицу усиления размером M3´2, которая при применении непосредственно к промежуточному представлению потока воспроизведения матричным умножением образует указанное приближение второго представления потока воспроизведения;
при этом одно из первого представленного представления потока воспроизведения и второго представленного представления потока воспроизведения представляет собой представление для громкоговорителей, и при этом одно из первого представленного представления потока воспроизведения и второго представленного представления потока воспроизведения представляет собой эховое или безэховое бинауральное представление, и причем промежуточное представление потока воспроизведения представляет собой одно из первого представленного представления потока воспроизведения и результата понижающего микширования первого представленного представления потока воспроизведения;
причем параметры преобразования определяются кодером для обеспечения того, что величина разницы между вторым представленным представлением потока воспроизведения и приближением второго представленного представления потока воспроизведения, образованного применением параметров преобразования к промежуточному представлению потока воспроизведения, является минимальной; и
применения указанных параметров преобразования к указанному промежуточному представлению потока воспроизведения для получения указанного приближения второго представленного представления потока воспроизведения.
6. Способ по п.5, отличающийся тем, что указанные параметры преобразования являются переменными во времени и/или зависящими от частоты.
7. Способ по п.5, отличающийся тем, что M1=2.
8. Способ по любому из пп.5, 6, отличающийся тем, что M1>2, M3=2, и при этом способ дополнительно включает образование промежуточного представления потока воспроизведения путем понижающего микширования первого представленного представления потока воспроизведения в двухканальное представление.
9. Способ по п.8, отличающийся тем, что первое представленное представление потока воспроизведения представляет собой окружающее или погружающее представление, такое как представление в формате 5.1, 7.1 или 7.1.4.
10. Способ по п.8, отличающийся тем, что первое представленное представление потока воспроизведения представляет собой представление в формате 2.1, и при этом указанный этап понижающего микширования включает преобразование представления в формате 2.1 в стереофоническое представление в формате 2.0 в соответствии с уравнениями
Lo = a*L + b*LFE
Ro = a*R + b*LFE
где L, R и LFE обозначают левый и правый каналы полной полосы пропускания и канал низкочастотных эффектов декодированного представления в формате 2.1, при этом a и b представляют собой соответствующие постоянные.
11. Способ по п.5, отличающийся тем, что приближение второго представленного представления потока воспроизведения представляет собой безэховое бинауральное представление и при этом способ дополнительно включает
прием и декодирование одного или более дополнительных наборов параметров преобразования, пригодных для преобразования промежуточного представления потока воспроизведения в один или более входных сигналов процесса имитирования акустической среды;
применение одного или более дополнительных наборов параметров преобразования к промежуточному представлению потока воспроизведения для генерирования одного или более входных сигналов процесса имитирования акустической среды;
применение одного или более входных сигналов процесса имитирования акустической среды к одному или более процессам имитирования акустической среды для получения одного или более сигналов имитированной акустической среды и
комбинирование одного или более сигналов имитированной акустической среды с приближением второго представленного представления потока воспроизведения.
12. Способ по п.5, отличающийся тем, что он дополнительно включает
прием и декодирование одного или более наборов параметров оценки диалоговых сигналов, пригодных для преобразования промежуточного представления потока воспроизведения в один или более оценочных диалоговых сигналов;
применение одного или более наборов параметров оценки диалога к промежуточному представлению потока воспроизведения для генерирования одного или более оценочных диалоговых сигналов;
вычитание одного или более оценочных диалоговых сигналов из промежуточного представления потока воспроизведения для получения одного или более сигналов с подавленным диалогом;
применение одного или более сигналов с подавленным диалогом к одному или более процессам имитирования акустической среды для получения одного или более сигналов имитированной акустической среды и
комбинирование одного или более сигналов имитированной акустической среды с приближением второго представленного представления потока воспроизведения.
13. Кодер для кодирования входного аудиопотока, содержащего одну или более звуковых составляющих, причем каждая звуковая составляющая связана с пространственным местоположением, причем кодер содержит
первый блок представления для представления первого представления потока воспроизведения указанного входного аудиопотока, при этом указанное первое представление потока воспроизведения представляет собой набор из M1 сигналов, предназначенных для воспроизведения первой системой воспроизведения звука;
второй блок представления для представления второго представления потока воспроизведения указанного входного аудиопотока, при этом указанное второе представление потока воспроизведения представляет собой набор из двух сигналов, предназначенных для воспроизведения второй системой воспроизведения звука, при этом одно из первого представления потока воспроизведения и второго представления потока воспроизведения представляет собой представление для громкоговорителей и при этом одно из первого представления потока воспроизведения и второго представления потока воспроизведения представляет собой эховое или безэховое бинауральное представление;
блок определения параметров преобразования для определения набора параметров преобразования, пригодных для преобразования промежуточного представления потока воспроизведения, которое представляет собой набор из M3 сигналов, в приближение второго представления потока воспроизведения, при этом набор параметров преобразования образует матрицу усиления размером M3´2, которая при применении непосредственно к промежуточному представлению потока воспроизведения матричным умножением образует указанное приближение второго представления потока воспроизведения, причем промежуточное представление потока воспроизведения представляет собой одно из первого представления потока воспроизведения и результата понижающего микширования первого представления потока воспроизведения, и причем параметры преобразования определяются путем минимизации величины разницы между вторым представлением потока воспроизведения и приближением второго представления потока воспроизведения, образованного применением параметров преобразования к промежуточному представлению потока воспроизведения; и
блок кодирования для кодирования первого представления потока воспроизведения и указанного набора параметров преобразования для передачи в декодер.
14. Декодер для декодирования представлений потока воспроизведения из потока данных, причем декодер содержит
блок базового декодера, выполненный с возможностью
приема и декодирования первого представленного представления потока воспроизведения, при этом указанное первое представленное представление потока воспроизведения представляет собой набор из M1 сигналов, предназначенных для воспроизведения первой системой воспроизведения звука, и
приема и декодирования набора параметров преобразования, пригодных для преобразования промежуточного представления потока воспроизведения, которое представляет собой набор из M3 сигналов, в приближение второго представленного представления потока воспроизведения, при этом указанное второе представленное представление потока воспроизведения представляет собой набор из двух сигналов, предназначенных для воспроизведения второй системой воспроизведения звука, при этом набор параметров преобразования образует матрицу усиления размером M3´2, которая при применении непосредственно к промежуточному представлению потока воспроизведения матричным умножением образует указанное приближение второго представления потока воспроизведения, при этом одно из первого представленного представления потока воспроизведения и второго представленного представления потока воспроизведения представляет собой представление для громкоговорителей, и при этом одно из первого представленного представления потока воспроизведения и второго представленного представления потока воспроизведения представляет собой эховое или безэховое бинауральное представление, и причем промежуточное представление потока воспроизведения представляет собой одно из первого представленного представления потока воспроизведения и результата понижающего микширования первого представленного представления потока воспроизведения, причем параметры преобразования определяются кодером для обеспечения того, что величина разницы между вторым представленным представлением потока воспроизведения и приближением второго представления потока воспроизведения, образованного применением параметров преобразования к промежуточному представлению потока воспроизведения, является минимальной; и
матричный умножитель для применения указанных параметров преобразования к указанному промежуточному представлению потока воспроизведения для получения указанного приближения второго представленного представления потока воспроизведения.
15. Внутренний носитель данных, на котором хранится компьютерный программный продукт кодера, содержащий сегменты компьютерного программного кода, которые при их исполнении в компьютерном процессоре вызывают выполнение компьютерным процессором способа по любому из пп.1-12.
Zoom in