26 березня 2026 року Mistral AI представила Voxtral TTS — відкриту модель перетворення тексту в мовлення з підтримкою 9 мов та копіюванням голосу за 3 секунди.
Ця технологія дозволяє створювати природне звучання для голосових помічників. Модель працює швидше за конкурентів і коштує менше. Вона може функціонувати на звичайному ноутбуці без хмарних серверів. Це робить технологію доступною для малих компаній та розробників.
Як працює копіювання голосу за 3 секунди
Voxtral TTS потребує лише 3 секунди аудіо для створення копії голосу. Раніше такі системи вимагали кілька хвилин запису. Тепер процес став значно простішим. Модель аналізує тембр, інтонацію та ритм мовлення. Потім відтворює ці характеристики у новому тексті. У тестах Voxtral переміг ElevenLabs Flash у 68,4% випадків. Це стосується багатомовного копіювання голосу. Особливо сильні результати в іспанській та хінді. Модель підтримує англійську, французьку, німецьку, іспанську, голландську, португальську, італійську, хінді та арабську мови.
Затримка становить 70 мілісекунд при генерації. Людське вухо майже не помічає такої паузи. Для діалогових систем це критично важливо. Розмова відчувається природною без штучних затримок.
Як почати використовувати Voxtral TTS вже зараз безкоштовно
- Увійдіть до console.mistral.ai.
- Перейдіть до розділу Audio → Text-to-speech.
- Насолоджуйтесь!
Плейграунд дозволяете перетворювати до 4000 символів англомовного тексту на аудіо за одну операцію, тож ви можете почати користуватися новим TTS прямо зараз.
Де використовуватимуть нову технологію
Бізнес вже знайшов застосування для Voxtral TTS. Голосові агенти в клієнтській підтримці стають поширеними. Банки використовують технологію для повідомлень про транзакції. Автомобільні системи інтегрують голосових помічників для безпеки водіння.
- Клієнтська підтримка та кол-центри
- Фінансові послуги та банкінг
- Автомобільні голосові системи
- Переклад мовлення в реальному часі
- Доступність для людей з вадами зору
Модель має 4 мільярди параметрів і важить небагато. Одна графічна карта H200 обслуговує 30 користувачів одночасно. Це знижує витрати на інфраструктуру для компаній. Вартість API становить $0,016 за 1000 символів тексту. Mistral AI планує отримати €1 млрд доходу у 2026 році. Voxtral TTS є частиною цієї стратегії росту. Компанія вже підписала партнерство з Accenture для корпоративних клієнтів. Ринок технологій перетворення тексту в мовлення оцінюється у $5,7 млрд.
