doświadczenie w programowaniu przy użyciu Pythona,
znajomość podstaw inżynierii oprogramowania, w tym: praktyczne doświadczenie w korzystaniu z systemu kontroli wersji Git, umiejętność programowania obiektowego, tworzenie testów jednostkowych i integracyjnych z wykorzystaniem pytest,
doświadczenie w inżynierii danych,
znajomość praktycznych umiejętności związanych z pracą przy bazach danych,
znajomość biblioteki huggingface oraz pytorch/tensorflow,
umiejętności niezbędne do produkcyjnego wdrożenia rozwiązań opartych na sztucznej inteligencji, w tym tworzenia skalowalnych potoków przetwarzania, znajomość zagadnień związanych z konteneryzacją i skalowaniem, a także kwestiami bezpieczeństwa,
biegła znajomość konsoli Linux (w tym podstawowa obsługa edytora Vim), w tym umiejętność tworzenia i analizowania skryptów Bash/shell (sh) do automatyzacji zadań, a także doświadczenie w pracy z serwerami zdalnymi za pomocą SSH.
Mile widziane
znajomość rozwiązań chmurowych do tworzenia i uruchamiania rozwiązań opartych na danych (AWS, GCP),
znajomość frameworków webowych typu FastAPI, Flask, Django,
Znajomość frameworków do kolejkowania i przetwarzania asynchronicznego, takich jak RabbitMQ i Celery,
znajomość problematyki przetwarzania języka naturalnego,
znajomość problematyki analizy obrazów,
doświadczenie w obszarze Document AI.
Twój zakres obowiązków
pozyskiwanie, wstępna analiza i przetwarzanie danych
tworzenie zbiorów uczących i współpraca z anotatorami,
modelowanie danych na podstawie zbiorów treningowych,
tworzenie rozwiązań opartych na metodach uczenia maszynowego, w szczególności w obszarze Document AI i/lub przetwarzania języka naturalnego (NLP) i/lub analizy obrazów (CV),
fine-tuning istniejących modeli (m.in. YOLO),
ewaluacja rozwiązań sztucznej inteligencji i testowanie produkcyjne,
inżynieria danych w procesie uczenia maszynowego,
implementacja produktów opartych na modelach uczenia maszynowego,
produkcyjne wdrażanie produktów opartych na modelach uczenia maszynowego.