gpt-realtime в проде. Speech-to-speech модель, с интеграцией с SIP и MCP, умеет слушать инструкции из голоса, реагировать на перебивания и выдавать широкий эмоциональный диапазон. Ну и картинки тоже понимает.

#speech #ai