πŸš€ Ray Serve ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ асинхронный Π²Ρ‹Π²ΠΎΠ΄ ΠΈ кастомноС ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅

Ray Serve анонсировал Π½ΠΎΠ²Ρ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ для Π³ΠΈΠ±ΠΊΠΎΠΉ ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΉ ΠΏΠΎΠ΄Π°Ρ‡ΠΈ ИИ-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

Π”ΠΎΠ±Π°Π²Π»Π΅Π½Ρ‹ асинхронный Π²Ρ‹Π²ΠΎΠ΄, кастомная ΠΌΠ°Ρ€ΡˆΡ€ΡƒΡ‚ΠΈΠ·Π°Ρ†ΠΈΡ запросов, ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΎΠ΅ автоскСйлинг ΠΈ внСшнСС ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ. Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ Π΄ΠΎΠ»Π³ΠΈΠ΅ Π·Π°Π΄Π°Ρ‡ΠΈ (транскрибация, Π²ΠΈΠ΄Π΅ΠΎ) Π±Π΅Π· Ρ‚Π°ΠΉΠΌΠ°ΡƒΡ‚ΠΎΠ², Π½Π°ΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ запросы ΠΏΠΎ кастомным ΠΏΡ€Π°Π²ΠΈΠ»Π°ΠΌ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, кэш-Π°Ρ„Ρ„ΠΈΠ½ΠΈΡ‚Π΅Ρ‚) ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½Π΅ ΠΏΠΎ Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠ΅, Π° ΠΏΠΎ Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌ β€” Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠ°ΠΌ, Π³Π»ΡƒΠ±ΠΈΠ½Π΅ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΠΈ ΠΈΠ»ΠΈ GPU-Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠ΅. Π’Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ ΡƒΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ числом Ρ€Π΅ΠΏΠ»ΠΈΠΊ Ρ‡Π΅Ρ€Π΅Π· внСшниС скрипты.

Компании, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Fano AI ΠΈ Huawei, ΡƒΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ эти Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ для слоТных ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½ΠΎΠ² с Π°ΡƒΠ΄ΠΈΠΎ ΠΈ LLM.

#ray #ray_serve #mlops #ai_infra #autoscaling #async_inference

πŸš€ Ray Serve ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ асинхронный Π²Ρ‹Π²ΠΎΠ΄ ΠΈ кастомноС ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅
Ray Serve анонсировал Π½ΠΎΠ²Ρ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ для Π³ΠΈΠ±ΠΊΠΎΠΉ ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΉ ΠΏΠΎΠ΄Π°Ρ‡ΠΈ ИИ-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ | Π‘Π΅Ρ‚ΠΊΠ° β€” ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ ΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ hh.ru