3 простых шага: Как развернуть LLM на своём ноутбуке без GPU
Гениальная идея может прийти: 1. Когда глушат мобильный интернет. 2. Когда летишь в самолёте над Атлантикой. 3. В горах, пустынях Африки и в самых отдалённых уголках планеты.
В этом посте про то как запустить: [ Mistral7B | 4+ ГБ на диске | 8+ ГБ оперативки ] И независимо общаться с нейросетями без ограничений по токенам. В самом конце будет ссылка на репозиторий с простым чек-листом от начала до конца.
Способ 1. Быстрый старт с ollama. Одна команда в терминале, модель скачивается сама, интерактивный чат сразу готов. Преимущества: - «Запустил — общаюсь — забыл» это то, что тебе нужно - Ты впервые запускаешь LLM локально и хочешь понять, что это такое - Нужен быстрый чат с моделью без настройки параметров
Способ 2. Тотальный контроль и масштаб с llama.cpp. Скрипты в репозитории читают конфигурацию из JSON, запускают сервер и возвращают потоковый ответ. Преимущества: - Интеграция с проектом - Глубокая настройка параметров и управление ресурсами - Потоковая генерация и отображение в реальном времени
Чек-лист-репозиторий как развернуть нейросеть на своём ПК: https://github.com/malikkhubiev/llama.cpp-mistral.7b
Инсайт: Всё чаще мне приходится разрабатывать проект по внедрению мощных нейросетей on-premise (на своих серверах) для крупного бизнеса. Локальная развёртка LLM - ваш первый шаг к серьёзным проектам.
Будущее AI — ближе к вашему серверу, чем кажется.
· 03.06
Локальные модели имеет смысл запускать в случае если железо подходящее, без GPU только для ознакомления. Либо как примитивный FAQ-бот для приложения но здесь нужен RAG с FAISS или любой другой векторной бд. Основной минус компактных локальных модели без GPU это низкая скорость.
ответить
коммент удалён
· 05.06
С точки зрения скорости FAISS - шикарное решение.
Какая локалка тебе прям нравится на GPU?
ответить
ответ удалён
· 05.06
Китайские локальные модели Qwen
ответить
ответ удалён
· 05.06
Китайцы хороши в коде и математике.
По данным тестов 2026 года, Qwen 3 7B набирает 76.0% в бенчмарке HumanEval (проверка качества кода), пока Mistral 7B показывает 68.2%.
ответить
ответ удалён