πŸš€ llama.cpp ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» ΠΌΠ΅Π½Π΅Π΄ΠΆΠ΅Ρ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ

Появилась Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ динамичСски Π·Π°Π³Ρ€ΡƒΠΆΠ°Ρ‚ΡŒ ΠΈ ΠΏΠ΅Ρ€Π΅ΠΊΠ»ΡŽΡ‡Π°Ρ‚ΡŒΡΡ ΠΌΠ΅ΠΆΠ΄Ρƒ модСлями Π±Π΅Π· пСрСзапуска сСрвСра.

Π Π΅ΠΆΠΈΠΌ Ρ€ΠΎΡƒΡ‚Π΅Ρ€Π° Π² llama.cpp позволяСт ΡƒΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ нСсколькими GGUF-модСлями ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ. КаТдая модСль запускаСтся Π² ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠΌ процСссС β€” сбой ΠΎΠ΄Π½ΠΎΠΉ Π½Π΅ влияСт Π½Π° Π΄Ρ€ΡƒΠ³ΠΈΠ΅. Π‘Π΅Ρ€Π²Π΅Ρ€ автоматичСски ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² кэшС ΠΈΠ»ΠΈ ΡƒΠΊΠ°Π·Π°Π½Π½ΠΎΠΉ ΠΏΠ°ΠΏΠΊΠ΅. МодСли Π·Π°Π³Ρ€ΡƒΠΆΠ°ΡŽΡ‚ΡΡ ΠΏΠΎ Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Π½ΠΈΡŽ, Π° ΠΏΡ€ΠΈ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ΅Π½ΠΈΠΈ Π»ΠΈΠΌΠΈΡ‚Π° (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ4) старыС Π²Ρ‹Π³Ρ€ΡƒΠΆΠ°ΡŽΡ‚ΡΡ ΠΏΠΎ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΡƒ LRU. МоТно ΡƒΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ Ρ‡Π΅Ρ€Π΅Π· API: запросы /models/load, /models/unload, /models ΠΈ ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Π΅ OpenAI-совмСстимыС Π²Ρ‹Π·ΠΎΠ²Ρ‹ с ΠΏΠΎΠ»Π΅ΠΌ model. ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‚ΡΡ Π³Π»ΠΎΠ±Π°Π»ΡŒΠ½Ρ‹Π΅ ΠΈ ΠΏΠ΅Ρ€ΡΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ настройки Ρ‡Π΅Ρ€Π΅Π· preset-Ρ„Π°ΠΉΠ»Ρ‹.

ДоступСн автоматичСский ΠΈ Ρ€ΡƒΡ‡Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ, идСально для A/B-тСстирования ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ.

#llama_cpp #model_management #local_llm #api #gguf #AI

πŸš€ llama.cpp ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» ΠΌΠ΅Π½Π΅Π΄ΠΆΠ΅Ρ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ
Появилась Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ динамичСски Π·Π°Π³Ρ€ΡƒΠΆΠ°Ρ‚ΡŒ ΠΈ ΠΏΠ΅Ρ€Π΅ΠΊΠ»ΡŽΡ‡Π°Ρ‚ΡŒΡΡ ΠΌΠ΅ΠΆΠ΄Ρƒ модСлями Π±Π΅Π· пСрСзапуска сСрвСра.
Π Π΅ΠΆΠΈΠΌ Ρ€ΠΎΡƒΡ‚Π΅Ρ€Π° Π² llama | Π‘Π΅Ρ‚ΠΊΠ° β€” ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ ΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ hh.ru