🎤 Mistral запустила Voxtral Transcribe 2
Представлены две новые модели преобразования речи в текст: для пакетной и потоковой обработки.
Voxtral Mini Transcribe V2 обеспечивает точность до 4% ошибок в распознавании (WER) и поддерживает 13 языков с диаризацией, контекстным байзингом и пометками по словам. Voxtral Realtime работает с задержкой от 200 мс, что идеально для голосовых агентов. Модель с открытыми весами (Apache 2.0) и 4B параметрами эффективно запускается на edge-устройствах. Обе модели доступны через API и в Mistral Studio.
Voxtral Mini в 3 раза быстрее ElevenLabs Scribe v2 и на 20% дешевле, при этом превосходит GPT-4o mini и Gemini 2.5 Flash по точности.
#mistralai #speech2text #voxtral #ai_transcription #realtime_ai #open_weights