Позиция: L3 Support инженер
Компания: София Тех Парк, проект Българска Фабрика за Изкуствен Интелект BRAIN++
Локация: София Тех Парк, София, България
Тип: Пълен работен ден
Докладва на: Operations & Customer Support Director
Позиция
Търсим L3 Support инженер за поддръжка на инфраструктура за изкуствен интелект (ИИ) от най-висок клас (Kubernetes, SLURM, NVIDIA NVL72 GPU, клъстериран сторидж и облачни агенти). Ролята е последно ниво на ескалация за сложни инциденти и изисква дълбоко разбиране на цялостния технологичен стек – от хардуер и контейнеризация до приложения на Python и C/C++/Fortran.
Основни отговорности
- Да участва в анализа и разрешаването на инциденти, свързани с Kubernetes и SLURM клъстери, разпределение на GPU ресурси, CUDA грешки, сторидж и облачни агенти.
- Участва в мониторинг и оптимизация на производителността на GPU, сторидж, CPU data pipelines и AI приложения, включително профилиране и тюнинг на Python и C/C++/Fortran код.
- Диагностика на проблеми с подове, възли, опашки и GPU разпределение в Kubernetes/SLURM.
- Анализ на логове, core dumps и stack traces за приложения на Python и C/C++/Fortran.
- Оптимизация на GPU натоварвания, I/O към сториджа, CPU-GPU трансфер и предварителна обработка на данни.
- Поддръжка на конфигурации “infrastructure as code”, политики за сигурност, RBAC, PKI, ключове и сертификати.
- Участие в дежурства (on-call) за критични инциденти и документиране на процедури и пост-мортеми.
Технологичен стек
- Работната среда включва много компонентен Kubernetes клъстер, SLURM за HPC/AI задачи, NVIDIA NVL72 GPU инфраструктура и клъстерирани системи за съхранение (files/S3, HDF5, NetCDF).
- Използват се NVIDIA HPC SDK, cuDNN, NVIDIA Container Toolkit, както и DNN библиотеки като ZenDNN и oneDNN, плюс богат набор инструменти за мониторинг, профилиране и отстраняване на проблеми.
- Kubernetes, Helm, Kustomize, NVIDIA device plugins, NVIDIA container runtime.
- SLURM с GPU разпределение и интеграция на контейнери.
- Python за автоматизация, мониторинг и AI pipelines, плюс BOLT оптимизация на интерпретатора.
- C/C++/Fortran с CMake, LLVM/Clang, LTO, NVIDIA HPC SDK (cuBLAS, cuFFT, cuSPARSE, cuRAND и др.).
- HDF5/NetCDF инструменти, Prometheus/Grafana, nvidia-smi, Nsight, CI/CD и IaC (Terraform, Ansible).
Идеалният кандидат
Търсим човек с силен опит в работа с комплексни разпределени системи, който се чувства уверено както в инфраструктурата (Kubernetes, GPU, сторидж, облак), така и в кода (Python, C/C++/Fortran).
Необходими са много добра техническа дълбочина, умения за анализ на коренни причини и желание за работа в среда на cutting-edge AI и пост-квантова криптография.
- Опит с администриране и troubleshooting на Kubernetes и/или SLURM клъстери.
- Практически опит с GPU изчисления (CUDA, NVIDIA екосистема) и профилиране на производителност.
- Умения по Python и поне един от C/C++/Fortran за отстраняване на грешки и оптимизация на приложения.
- Познания по криптография, PKI, генератори на случайни числа, криптографски хешове, блокчейн и времеви печати са силно предимство.
- Готовност за участие в дежурства и работа по критични инциденти.
Какво предлагаме
- Водеща роля в изграждането на националната фабрика за ИИ и шанс да бъдете част от екипа на София Тех Парк и работа с инфраструктура от най-ново поколение за ИИ фабрика, с най-нови GPU платформи и инструменти, и директно влияние върху производителността и надеждността на критични ИИ проекти.
- Позицията дава възможност за дълбока специализация в GPU, HPC, криптография и системен дизайн, както и за взаимодействие с вътрешни инженерни екипи и външни клиенти по реални високоточни натоварвания.
- Участие в европейски програми и проекти, като Български Университети и научни организации и институти (вкл. партньорство с INSAIT), българската държавна администрация и бизнес среди.
_________
Краен срок: 24.12.2025 г.
Повече информация и подаване на документи: [email protected]
Проект № 101250707 – BRAIN++ се изпълнява в рамките споразумение за финансиране с European High–Performance Computing Joint Undertaking, European Commission.
София Тех Парк е първият научно-технологичен парк в България. Той е хъб за изследователи, иновативни стартиращи предприятия и зрели технологични компании от България и региона. Паркът управлява и развива уникална среда за подпомагане и растеж на малки и средни фирми чрез предоставяне на ноу-хау, възможности за работа в мрежа и достъп до нови технологии в три ключови области: информационни и комуникационни технологии, науки за живота и чиста енергия.