Приложение на Python, которое захватывает видеопоток с открытой веб-камеры и выполняет обнаружение объектов в режиме реального времени на GPU. Для этого используется предварительно обученная Single Shot Detection (SSD) модель с Inception V2 и оптимизацией TensorRT. Приложение предназначено для запуска на сервере с GPU и в качестве видеопотока использует онлайн-трансляцию с камеры, находящейся в открытом доступе (кафе магазина S.I.P. Scootershop в Ландсберге, Германия). Приложение распознаёт объекты на видео и обводит их ограничивающими рамками, выводя также тип объекта (метку класса).
Войдите на облачный сервер через терминальную сессию с флагом -Y (проброс графической подсистемы "X11 Forwarding"):
ssh -Y [email protected]
Приложение предназначено для развёртывания на системе Ubuntu 16.04 и требует предустановки следующих пакетов:
sudo apt-get install cmake python3 python3-pip python3-venv
Ниже приведены команды для клонирования репозитория и сборки:
git clone --recursive [email protected]:dmikushin/detectrt.git
cd detectrt
mkdir build
cd build
cmake ..
make -j4
Приложение запускается из папки сборки build
:
./detectrt