HW 4 Tf-Idf с использованием Spark DataFrame API
Описание задания (последний слайд)
Решение
Ссылка на Google Colab только для просмотра, а не запуска т. к. на GitHub бывают проблемы с отображением.
Как запустить
Скачать данные, распаковать, csv файл добавить в data
.
Выполнить:
docker compose up --build
Подключиться к Jupyter Lab по http://localhost:8888
Используется команда для Compose V2