Представлено новий звуковий кодек TSAC – він в рази ефективніший за MP3

Звуковий кодек TSAC використовує для стиснення алгоритми штучного інтелекту.

Широко відомий у вузьких колах розробник Фабріс Беллар, засновник проєктів FFmpeg, QEMU тощо, представив аудіокодек TSAC, покликаний забезпечити якість звуку, яку не можна відрізнити від оригіналу, під час передання каналами з наднизьким бітрейтом.

За основу TSAC було взято кодек Descript, що долучає для стиснення алгоритми штучного інтелекту. У модифікованій версії було додано підтримку стереорежиму, але, головне, вдалося домогтися відтворюваності результатів на різному обладнанні завдяки застосуванню детермінованої генеративної моделі Transformer.

Численні тести підтвердили високу ефективність TSAC навіть під час пакування складних музичних творів. Так, 3,5-хвилинна стереодоріжка з частотою дискретизації 44,1 кГц після компресії займає всього 192 Кб. Для порівняння, 1 хвилинний MP3-файл потребує 960 Кб дискового простору, а 3,5 хв. – 3360 Кб. Таким чином, новий кодек у 17,5 раза ефективніший за MP3.

Розробник опублікував на своєму сайті готові збірки як для Linux, так і для Windows. Хоча стиснення можливе силами одного лише CPU, для прискорення процесу рекомендується використовувати відеокарти NVIDIA Ampere, Ada і Hopper з як мінімум 4 ГБ VRAM.

Хоча перспектива застосування TSAC у месенджерах очевидна, обмежені обчислювальні потужності мобільних пристроїв поки що стримують цей напрямок. Однак, у майбутньому цю перешкоду безумовно буде подолано.

Більше публікацій за темою