Кариери

L3 Support инженер

Full Time Job
София Тех Парк, проект българска Фабрика за изкуствен интелект BRAIN++
Валидна до: 2025-12-24

Позиция: L3 Support инженер
Компания: София Тех Парк, проект Българска Фабрика за Изкуствен Интелект BRAIN++
Локация: София Тех Парк, София, България
Тип: Пълен работен ден
Докладва на: Operations & Customer Support Director

 

Позиция

Търсим L3 Support инженер за поддръжка на инфраструктура за изкуствен интелект (ИИ) от най-висок клас (Kubernetes, SLURM, NVIDIA NVL72 GPU, клъстериран сторидж и облачни агенти). Ролята е последно ниво на ескалация за сложни инциденти и изисква дълбоко разбиране на цялостния технологичен стек – от хардуер и контейнеризация до приложения на Python и C/C++/Fortran.

 

Основни отговорности

  • Да участва в анализа и разрешаването на инциденти, свързани с Kubernetes и SLURM клъстери, разпределение на GPU ресурси, CUDA грешки, сторидж и облачни агенти.
  • Участва в мониторинг и оптимизация на производителността на GPU, сторидж, CPU data pipelines и AI приложения, включително профилиране и тюнинг на Python и C/C++/Fortran код.
  • Диагностика на проблеми с подове, възли, опашки и GPU разпределение в Kubernetes/SLURM.
  • Анализ на логове, core dumps и stack traces за приложения на Python и C/C++/Fortran.
  • Оптимизация на GPU натоварвания, I/O към сториджа, CPU-GPU трансфер и предварителна обработка на данни.
  • Поддръжка на конфигурации “infrastructure as code”, политики за сигурност, RBAC, PKI, ключове и сертификати.
  • Участие в дежурства (on-call) за критични инциденти и документиране на процедури и пост-мортеми.

 

Технологичен стек

  • Работната среда включва много компонентен Kubernetes клъстер, SLURM за HPC/AI задачи, NVIDIA NVL72 GPU инфраструктура и клъстерирани системи за съхранение (files/S3, HDF5, NetCDF).
  • Използват се NVIDIA HPC SDK, cuDNN, NVIDIA Container Toolkit, както и DNN библиотеки като ZenDNN и oneDNN, плюс богат набор инструменти за мониторинг, профилиране и отстраняване на проблеми.
  • Kubernetes, Helm, Kustomize, NVIDIA device plugins, NVIDIA container runtime.
  • SLURM с GPU разпределение и интеграция на контейнери.
  • Python за автоматизация, мониторинг и AI pipelines, плюс BOLT оптимизация на интерпретатора.
  • C/C++/Fortran с CMake, LLVM/Clang, LTO, NVIDIA HPC SDK (cuBLAS, cuFFT, cuSPARSE, cuRAND и др.).
  • HDF5/NetCDF инструменти, Prometheus/Grafana, nvidia-smi, Nsight, CI/CD и IaC (Terraform, Ansible).

 

 

Идеалният кандидат

Търсим човек с силен опит в работа с комплексни разпределени системи, който се чувства уверено както в инфраструктурата (Kubernetes, GPU, сторидж, облак), така и в кода (Python, C/C++/Fortran).

Необходими са много добра техническа дълбочина, умения за анализ на коренни причини и желание за работа в среда на cutting-edge AI и пост-квантова криптография.

  • Опит с администриране и troubleshooting на Kubernetes и/или SLURM клъстери.
  • Практически опит с GPU изчисления (CUDA, NVIDIA екосистема) и профилиране на производителност.
  • Умения по Python и поне един от C/C++/Fortran за отстраняване на грешки и оптимизация на приложения.
  • Познания по криптография, PKI, генератори на случайни числа, криптографски хешове, блокчейн и времеви печати са силно предимство.
  • Готовност за участие в дежурства и работа по критични инциденти.

 

Какво предлагаме

  • Водеща роля в изграждането на националната фабрика за ИИ и шанс да бъдете част от екипа на София Тех Парк и работа с инфраструктура от най-ново поколение за ИИ фабрика, с най-нови GPU платформи и инструменти, и директно влияние върху производителността и надеждността на критични ИИ проекти.
  • Позицията дава възможност за дълбока специализация в GPU, HPC, криптография и системен дизайн, както и за взаимодействие с вътрешни инженерни екипи и външни клиенти по реални високоточни натоварвания.
  • Участие в европейски програми и проекти, като Български Университети и научни организации и институти (вкл. партньорство с INSAIT), българската държавна администрация и бизнес среди.

 

_________
Краен срок: 24.12.2025 г.

Повече информация и подаване на документи: [email protected]

Проект № 101250707 – BRAIN++ се изпълнява в рамките споразумение за финансиране с European HighPerformance Computing Joint Undertaking, European Commission.

София Тех Парк е първият научно-технологичен парк в България. Той е хъб за изследователи, иновативни стартиращи предприятия и зрели технологични компании от България и региона. Паркът управлява и развива уникална среда за подпомагане и растеж на малки и средни фирми чрез предоставяне на ноу-хау, възможности за работа в мрежа и достъп до нови технологии в три ключови области: информационни и комуникационни технологии, науки за живота и чиста енергия.

Имате нужда от повече информация?

Ние сме тук за да ви помогнем.