DevOps Engineer - AI Infrastructure & Orchestration

DevOps Engineer - AI Infrastructure & Orchestration

Poland

200 - 250 PLN / godzina
Łódź
Poznań
Kraków
Warszawa
Kubernetes
OpenShift
GPU
MLOps
vLLM
Prometheus
Grafana
Python
Bash
CI/CD

Hexjobs Insights

DevOps Engineer w obszarze AI Infrastructure & Orchestration. Obowiązki: deployment, orkiestracja GPU, automatyzacja, monitoring. Wymagane doświadczenie w DevOps, Kubernetes i vLLM.

Słowa kluczowe

Kubernetes
OpenShift
GPU
MLOps
vLLM
Prometheus
Grafana
Python
Bash
CI/CD

Benefity

  • Duża swoboda pracy zdalnej
  • Długofalowe stabilne zatrudnienie
  • Szansa na uczestniczenie w kluczowych projektach dla dużej firmy
  • Atrakcyjne wynagrodzenie adekwatne do umiejętności

W ITLT pomagamy naszym zaprzyjaźnionym firmom przekształcać ambitne pomysły w cyfrową rzeczywistość.Z nastawieniem na wyzwania, ciekawość technologii i zwinność - współtworzymy wyjątkowe rozwiązania IT.Aktualnie poszukujemy osób na stanowisko: DevOps Engineer (AI Infrastructure & Orchestration)Konkrety:Stawka: 200-250 (SENIOR) / 250-275 PLN/h na FV (EXPERT - powyżej wymagań)Miejsce pracy/praca zdalna: Praca zdalna (Remote)Wymiar pracy: FulltimeSektor: AI/TelcoProjekt: On-prem LLM platform - orkiestracja i monitoring vLLM na GPU clusterzeZespół: 6-8os.Proces rekrutacji: 1-etapowy (spotkanie zdalne via MS Teams). Sporadycznie możliwe dodatkowe krótkie spotkanie - połączone z decyzjąSzacowany czas trwania projektu: Długoterminowy/BezterminowyCzas pracy/Strefa czasowa: Standardowe polskie godziny pracyTechnologie na projekcie: Kubernetes (OpenShift), vLLM, NVIDIA GPU (H100/H200/B300), Prometheus, Grafana, ELK, OpenTelemetry, Python, Bash, Go, GitLab CI, Jenkins, ArgoCD, bare metalDo Twoich głównych obowiązków na tym stanowisku należeć będzie:Deployment i utrzymanie vLLM na Openshift Kubernetes (bare-metal GPU)Orkiestracja i optymalizacja GPU (NVIDIA)Automatyzacja lifecycle modeli (HF/S3: pull, versioning, hot-swap)HPA (queue depth, GPU memory)Tuning vLLM (performance, batching, memory)Metryki inference (tokeny, latency, errors) + tracking zużycia per user/API keyGrafana dashboards (GPU, TTFT, RPS, koszty, quota)Alerting (GPU failures, latency, anomalies)API Gateway (NGINX: auth, rate limit, routing)Security + isolation + audit loggingMonitoring stack (Prometheus, Grafana, ELK, OpenTelemetry)Automatyzacja (Python/Bash/Go)CI/CD (GitLab CI, Jenkins, ArgoCD)SLA 99.9%, >70% GPU utilization, MTTR reductionTa oferta będzie idealna dla Ciebie, jeśli posiadasz:Min. 5+ lat doświadczenia w DevOps/SREMin. 2 lata doświadczenia w MLOps lub AI InfrastructureDoświadczenie w deploymencie vLLM w środowisku produkcyjnymZnajomość PagedAttention i continuous batching (vLLM)Bardzo dobra znajomość Kubernetes i OpenshiftDoświadczenie w infrastrukturze GPU NVIDIA (CUDA drivers, container toolkit, debugging)Umiejętność zarządzania i debugowania środowisk GPUDoświadczenie w budowie systemów observability od zeraUmiejętność tworzenia custom Prometheus exportersBardzo dobra znajomość Python (automation, tooling)Znajomość Bash i GoDoświadczenie w pracy z CI/CD (GitLab CI, Jenkins, ArgoCD)Doświadczenie w środowiskach on-prem / bare-metal Nice to have:Znajomość GPU orchestration w Kubernetes (device plugins NVIDIA)Znajomość model quantization (AWQ, GPTQ) Znajomość FinOps dla AI infrastructureZnajomość vector databases (Milvus, Qdrant)Warto do nas dołączyć, ponieważ oferujemy:Dużą swobodę pracy zdalnejDługofalowe stabilne zatrudnienieSzansę na uczestniczenie w kluczowych projektach dla dużej firmy działającej w bardzo stabilnym sektorzeAtrakcyjne wynagrodzenie (adekwatne do umiejętności i doświadczenia)Benefity (Lux Med, MultiSport...) W razie pytań pingnij śmiało na Linkedin'ie do Kuby

Wyświetlenia: 1
Opublikowana3 dni temu
Wygasaza 3 miesiące
Źródło
Logo

Podobne oferty, które mogą Cię zainteresować

Na podstawie "DevOps Engineer - AI Infrastructure & Orchestration"

Nie znaleziono ofert, spróbuj zmienić kryteria wyszukiwania.