Giter Site home page Giter Site logo

vkakt / apartment_market_spb Goto Github PK

View Code? Open in Web Editor NEW
1.0 0.0 0.0 2.5 MB

Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир

Jupyter Notebook 100.00%
histogram boxplot scatterplot

apartment_market_spb's Introduction

apartment_market_SPB

Описание проекта: для анализа получена таблица формата *.csv, собранная из данных сервиса Яндекс Недвижимость — архив объявлений за несколько лет о продаже квартир в Санкт-Петербурге и соседних населённых пунктах. Необходимо обработать данные для анализа и выявить закономерности. Каждая квартира описана количественными и категориальными значениями. Какие-то из них заполняли пользователи, какие-то заполнялись картографическим методом.

Проблемы в данных: в ходе работы, мы столкнулись с некорректным заполнением некоторых строк, а именно:

  • Данные представлены в неподходящем для анализа типе. Вещественные значения вместо целочисленных, объектные вместо временных. Мы произвели замену типов для корректной работы.
  • В данных присутствует много пропусков, самые значительные, которые могу помешать анализу и ответу на поставленные вопросы – расстояния. Эти данные заполняются картографическим методом и видимо в нем присутствует какой-то сбой. По частоте пропусков второе место занимает – удаленность от ближайшего парка.
  • А первое место в пропусках у категориального значения «апартаменты». Почти 21 тысяча пропусков это 88%, слишком много, чтобы быть уверенными, что, логически заполняя отсутствующие значения, мы не ошиблись.
  • В 3181 строках отсутствует значение количества дней размещения объявления. Мы не стали врать в таких данных, приукрашивая значения и для этого анализа заменили пропущенные значения заглушкой.
  • Также проблемными стали данные, заполняемые пользователем: количество балконов, высота потолков, площади. Помимо пропусков эти данные содержат аномальные значения, которые пришлось удалить из общей базы данных. В ходе обработки базы данных и решения проблем с пропущенными или аномальными значеними, от изначального набора данных мы оставили 99,15 %, заменив логически данные там, где было возможно.

Рекомендации: проверить картографический метод заполнения данных, внести все населенные пункты в базы данных, исключить возможность пропусков значений в расстояниях. Необходимо усилить контроль за вводимыми пользователями данными. Высоту потолков можно было бы привести к диапазонным категориям. Или ввести в данные год постройки дома, с предложением для пользователя, публикующего объявление, типичного значения по планировке квартиры выбранного дома.

Вывод По предложенной базе данных мы составили описание самой продаваемой квартиры по данным Яндекс Недвижимости:

Площадь такой квартиры составляет 40-45 кв.м, из нее кухонная зона занимает 7 кв.м. Цена стоимости за один квадратный метр составляет 100 000,00 рублей, и общая цена такой квартиры – 3,5 миллиона рублей. Это однокомнатная квартира с высотой потолка 2,6 метра, расположенная на 2 этаже пятиэтажного дома и удалена от центра города Санкт-Петербург на 14,7 км.

Можно утверждать, что быстрее всего продаются квартиры, размещенные в марте, январе или октябре - вполне реально найти покупателей за 44 дня. Однако, не советуем размещать объявления о продаже в начале лета - май, июнь. На общую цену квартиры сильное значение оказывает площадь самой квартиры и удаленность от центра города. Чем больше площадь, тем больше будет и стоимость, но чем дальше от центра, тем ниже будет цена.

apartment_market_spb's People

Contributors

vkakt avatar

Stargazers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.