Giter Site home page Giter Site logo

u107 / ukraine_dictionary Goto Github PK

View Code? Open in Web Editor NEW

This project forked from slavkaa/ukraine_dictionary

0.0 0.0 0.0 279.17 MB

Словник слів українською (слова, словоформи, синтаксичні данні, літературні джерела)

ukraine_dictionary's Introduction

Словник слів українською

Слова, словоформи, морфологічні данні, посилання на приклади вживання; у планах: тлумачення, синоніми, антоніми.

База створюється для полегшення роботи програмістів, якім потрібно мати достовірну, актуальну базу слів української мови. Наприклад, для створення ігор зі словами: гра Шибениця, ШІ для гри Єрудит, данні для ігор на складання слів з літер, на пошук слів серед літер, для сриптів автоматизованого складання кросвордів.

Ліцензія

Дозволяється, безоплатно, будь-якій особі, що отримала копію цього програмного забезпечення та супутньої документації (надалі Продукт), використовувати Продукт без обмежень, зокрема без обмежень, прав на використання, копіювання, змінювання, доповнення, публікацію, поширення, субліцензування та / або продаж (змінених та оброблених) копій Продукта, також як і особам, яким надається цей Продукт, за дотримання наступних умов: Вищезгадані авторські права та ці умови мають бути включені в усі копії або значущі частини нового Продукту Дійсне програмне забезпечення надається «як є», без гарантій будь-якого виду, прямих або непрямих, включаючи, але не обмежуючись, гарантіями комерційної вигоди, відповідності його конкретному призначенню й відсутності порушення прав. У жодному разі автори або власники авторських прав не відповідають за будь-якими судовими позовами, щодо збитків або інших претензій, чи дій договору, цивільного правопорушення або інших, що виникають поза, або у зв'язку з програмним забезпеченням або використанням чи іншими діями програмного забезпечення. https://uk.wikipedia.org/wiki/%D0%9B%D1%96%D1%86%D0%B5%D0%BD%D0%B7%D1%96%D1%8F_MIT https://opensource.org/licenses/MIT

Поточний стан

  • Версія v.10.
  • 29 897 слів у 405 363 словоформах (відмінки, роди, часи ...).

Для порівняння: Український орфографічний словник містить приблизно 175 000 слів (уклали В. В. Чумак [та ін.]; за ред. В. Г. Скляренка. — Вид. 9-е, переробл. і доповн. — Київ: Дніпро, 2009. — 1011 с. — «Словники України». — ISBN 978-966-507-260-7).

Для кожного слова вказана частина мови і характеристики притаманні цій частині мови. Слова об'єднані так, шоб можна було легко знайти всі форми слова з їх характеристиками. Також вказані тексти, в яких кожне слово було знайдене.

Дякую відкритим бібліотекам, за тексти класичних українських творів:

  • ukrlib.com.ua
  • onlyart.org.ua
  • taras-shevchenko.com.ua
  • taras-shevchenko.in.ua
  • t-shevchenko.name
  • ua-lib.ru

Дякую онлайн словнику, за джерело данних про словоформи і морфологічні ознаки слів:

  • slovnyk.ua

Документація

Опист структури бази данних (БД) у WIKI проекту.

Історія змін

Плани на майбутнє

Данна база вирізняється тим, що буде будуватися на основі лексики знайденої в літературних і побутових текстах.

В планах:

  • обробити твори Шевченка
  • обробити твори Гончара
  • додати тлумачення до кожного слова
  • додати таблицю з частотами вживання слова у кожному конкретному тесті, і в усіх тестах загалом
  • Додати посилання на синоніми і антоніми між словарними статтями
  • виокремити слова пові'язані з календарем: дні тиждня, місяці
  • виокремити назви всіх країн світу
  • виокремити словник імен
  • виокремити словник міст
  • виокремити словник географічних топонімів взагалі
  • виокремити словник назв живності
  • виокремити словник назв музичних інструментів
  • виокремити словник назв професій

Контанки

[email protected]

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.