Чип Taalas: радикальное ускорение и удешевление работы нейросетей

Стартап Taalas представил специализированное оборудование, которое работает в 74 раза быстрее решений Nvidia при запуске модели Llama 3. Вместо использования универсальных графических процессоров компания «зашивает» архитектуру конкретной нейросети прямо в кремний.

Это позволяет достичь скорости в 17 000 токенов в секунду и радикально снизить стоимость эксплуатации — до долей цента за миллион токенов. Для развития продуктов это открывает путь к созданию сложных систем из множества взаимодействующих ИИ-агентов и внедрению функций глубокого поиска, где модели нужно мгновенно генерировать огромные объемы текста для рассуждений.

Следить за развитием проекта можно в X или через официальную рассылку.

Ссылка: https://x.com/AlphaSignalAI @AIandproducts