@drxim

· AI / LLM ops lead UTC+3

Основатель ZATVA. 12 лет SRE и DevOps. Веду команду, держу руку на on-call ротации, отвечаю за архитектуру клиентских деплоев. Дежурю по GPU-инференсу и LLM-сервингу.

vLLM GPU ops Triton CUDA Ray Kubernetes

GitHub → ← Вся команда

что делаю в ZATVA

GPU-инференс и LLM-сервинг: on-call по vLLM и Triton, автоскейл и ревью costs на prod. Дежурство в смене UTC+3 (00:00 → 08:00 UTC). На discovery-созвонах работаю напрямую с CTO/фаундерами, без sales-прослойки.

С чем больше всего работаю последние годы: vLLM и Triton инференс на A100/H100, мульти-GPU автоскейл, тюнинг KV-cache и батчинга, оптимизация GPU-costs.

бэкграунд

Классический сисадмин с 90ых на FreeBSD, BSDi и RedHat в интернет-провайдере. Дальше в инфре и SRE в высоконагруженных бэкенд-сервисах, потом уход в Web3- и AI-инфраструктуру. С 2024 года работаем как команда ZATVA на контракте.

Самый быстрый путь обсудить техдетали или собрать стек под проект - GitHub или Telegram через страницу контактов.