Giter Site home page Giter Site logo

sadevans / test_lipreading Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 57.42 MB

Курсовой проект по теме "Анализ эффективности архитектур визуального распознавания речи"

Python 99.82% Shell 0.18%
lipnet lipreading pytorch resnet auto-avsr visual-speech-recognitopn

test_lipreading's Introduction

Курсовой проект по теме "Анализ эффективности архитектур визуального распознавания речи"

  • дописать нормально импорт общего скрипта метрик

  • дописать скрипт формирования таблички + построения графиков ?

  • дописать скрипт для скачивания предобученной модели

  • возможно добавить еще несколько архитектур моделей

Клонирование репозитория

Для локальной работы склонируйте репозиторий с помощью команды:

git clone https://github.com/sadevans/test_lipreading.git

После этого перейдите в рабочую директорию:

cd test_lipreading

Установка необходимых зависимостей

Необходимо создать виртуальную среду:

python -m venv venv

Далее активируйте свиртуальную среду:

source venv/bin/activate

Модель auto-vsr требует установки дополнительных пакетов. Скачать их придется с помощью клонирования соответствующих реплзиториев. Для начала установите пакет fairseq. Для этого необходимо запустить ряд команд в своем терминале:

cd auto_vsr/
git clone https://github.com/pytorch/fairseq
cd fairseq/
pip install --editable ./
cd ..

Далее установите пакеты face-recognition и face-alignment. Для этого поочереди склонируйте репозитории и установите все необходимые зависимости.

git clone https://github.com/hhj1897/face_alignment.git
cd face_alignment
pip install -e .

Потом:

git clone https://github.com/hhj1897/face_detection.git
cd face_detection
git lfs pull
pip install -e .
cd ..

Проверьте, что в папке auto-vsr появились fairseq, face-alignment и face-recognition.

После этого можно установить основные зависимости:

pip install -r requirements.txt

Не забудьте обновить пакет hydra-core

pip install hydra-core --upgrade

test_lipreading's People

Contributors

sadevans avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.