Giter Site home page Giter Site logo

wapmorgan / morphos Goto Github PK

View Code? Open in Web Editor NEW
782.0 40.0 102.0 793 KB

A morphological solution for Russian and English language written completely in PHP. Provides classes to inflect personal names, geographical names, decline and pluralize nouns, generate cardinal and ordinal numerals, spell out money amounts and time intervals. / Морфологическая библиотека для английского и русского языков. Склоняет имена собственные, названия географических объектов, склонение и плюрализация имен собственных и другое.

Home Page: http://wapmorgan.github.io/Morphos/

License: MIT License

PHP 99.31% Dockerfile 0.55% Makefile 0.14%
morphology pluralization russian-specific english-specific names humanizer react russian numeral ordinal

morphos's Introduction

Morphos

A morphological solution for Russian and English language written completely in PHP and delivered as a PHP library or docker image to integrate in non-PHP stack.

Latest Stable Version License Total Downloads Daily Downloads Latest Unstable Version

Tests & Quality: Build Status Scrutinizer Code Quality Code Coverage

Features

  • [✓] Inflection of Personal names (Фамилия, Имя, Отчество) (Russian)
  • [✓] Inflection of Geographical names (Страны/Города) (Russian)
  • [✓] Declension/Pluralization of nouns and adjectives (Russian, English)
  • [✓] Generation numerals of numbers (количественные и порядковые) (Russian, English)
  • [✓] Spelling out amounts of money (Russian)
  • [✓] Spelling out time units and intervals (Russian, English)

Table of contents

  1. Installation
  2. Quick start
  3. Documentation
  4. Contributing

Installation

As PHP library

  • Download library through composer:
composer require wapmorgan/morphos

or install via adapter:

As a separate service

The server starts in a container from docker image and listens 8080 port for GET-requests.

Integrate service into your stack (for example, docker compose)

services:
  morphos:
    image: wapmorgan/morphos:3.2.29
    ports:
      - 8093:8080

or standalone container:

docker run --env NUM_WORKERS=4 --rm --publish 8093:8080 -v wapmorgan/morphos:3.2.29

Tip: adjust NUM_WORKERS env variable if you will send a lot of load to service. By default, it's 4.

There are API: marks in documentation for functions, that exposed as service endpoints. Just pass them the same arguments as to PHP-functions/methods.

Quick Start

Russian

// Inflect russian names:
morphos\Russian\inflectName('Иванов Петр', 'родительный') => 'Иванова Петра'

// Inflect geographical names:
morphos\Russian\GeographicalNamesInflection::getCase('Москва', 'родительный') => 'Москвы'

// Pluralize russian nouns and adjectives:
morphos\Russian\pluralize(10, 'новый дом') => '10 новых домов'

// Generate russian cardinal numerals:
morphos\Russian\CardinalNumeralGenerator::getCase(567, 'именительный') => 'пятьсот шестьдесят семь'

// Generate russian ordinal numerals:
morphos\Russian\OrdinalNumeralGenerator::getCase(961, 'именительный') => 'девятьсот шестьдесят первый'

// Generate russian time difference
morphos\Russian\TimeSpeller::spellDifference(time() + 3600, morphos\TimeSpeller::DIRECTION) => 'через 1 час'

// other functions described in README-ru.md

English

// Pluralize english nouns:
morphos\English\pluralize(10, 'house') => '10 houses'

// Generate english cardinal numerals:
morphos\English\CardinalNumeralGenerator::generate(567) => 'five hundred sixty-seven'

// Generate english ordinal numerals:
morphos\English\OrdinalNumeralGenerator::generate(961) => 'nine hundred sixty-first'

// Generate english time difference
morphos\English\TimeSpeller::spellDifference(time() + 3600, morphos\TimeSpeller::DIRECTION) => 'in 1 hour'

Documentation

Contributing

See CONTRIBUTING.md for this.

morphos's People

Contributors

alexlcdee avatar altapo avatar b1rdex avatar bsv-hub avatar dastanaron avatar denysdesign avatar detrenasama avatar dixstonz3 avatar docentbf avatar igusev avatar leshakhov avatar nalorokk avatar nappsel avatar p1997d avatar prgrant avatar prokhorovsimbirsoft avatar ssboev avatar wapmorgan avatar zuzest avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

morphos's Issues

Двойные Фамилии

склоняется только последняя часть фамилии. А на http://morphos.tech дефис удаляется
Соколов-Микитов Иван Сергеевича
Кучера-Бози Людмила
Копусов-Долинин Алексей Иванович
Мартен-Люган Аньес

Великие Луки

Неверное склонение некоторых названий.

array(6) {
    ["nominative"]=> string(23) "Великие Луки" 
    ["genitive"]=> string(25) "Великие Луков" 
    ["dative"]=> string(25) "Великие Лукам" 
    ["accusative"]=> string(23) "Великие Луки" 
    ["ablative"]=> string(27) "Великие Луками" 
    ["prepositional"]=> string(25) "Великие Луках"
}
кого, чего? | Р: | Великих Лук |  
кому, чему? | Д: | Великим Лукам |  
кого, что? | В: | Великие Луки |  
кем, чем? | Т: | Великими Луками |  
о ком, о чём? | П: | о Великих Луках |  

Алматы

Добрый день.

Так уж случилось, что город Алма-ата официальные органы Республики Казахстан в официальном русском варианте называют Алматы. От них это перетекло в употребление в РФ. Алматы - в итоге, после всех споров, не склоняемый топоним.
https://ru.wiktionary.org/wiki/%D0%90%D0%BB%D0%BC%D0%B0%D1%82%D1%8B
Однако сейчас ваша отличная библиотека его склоняет.
Не могли бы вы это исправить?

Добавить параметр $case к NounPluralization::pluralize()

Как склонять в множественом числе?

Желательный пример:

NounPluralization::pluralize('цвет', 7, false, 'prepositional'); // -> цветах

Я экспериментировал с этим методом, но не уверен в правильности для всех падежей:

    // @file morphos/src/Russian/NounPluralization.php

    public static function pluralize($word, $count = 2, $animateness = false, $case = NULL)
    {
        $case = isset($case) ? self::canonizeCase($case) : self::RODIT;

        // меняем местами аргументы, если они переданы в старом формате
        if (is_string($count) && is_numeric($word)) {
            list($count, $word) = [$word, $count];
        }

        // для адъективных существительных правила склонения проще:
        // только две формы
        if (self::isAdjectiveNoun($word)) {
            if (self::getNumeralForm($count) == self::ONE)
                return $case == self::RODIT ? $word : NounDeclension::getCase($word, $case, $animateness);
            else
                return NounPluralization::getCase($word, $case, $animateness);
        }

        switch (self::getNumeralForm($count)) {
            case self::ONE:
                return $case == self::RODIT ? $word : NounDeclension::getCase($word, $case, $animateness);
            case self::TWO_FOUR:
                if ( $case != self::PREPOSITIONAL ) {
                    return NounDeclension::getCase($word, $case, $animateness);
                }
            case self::FIVE_OTHER:
                // special case for YEAR >= 5
                if ($word === 'год') {
                    return 'лет';
                }

                return NounPluralization::getCase($word, $case, $animateness);
        }
    }

Склонение городов, заканчивающихся на "ры"

elseif (S::slice($name, -2) == 'ры') {
// Чебоксары, Холмогоры, Кашары
$prefix = S::name(S::slice($name, 0, -1));
return [
self::IMENIT => $prefix.'ы',
self::RODIT => $prefix.'',
self::DAT => $prefix.'ам',
self::VINIT => $prefix.'ы',
self::TVORIT => $prefix.'ами',
self::PREDLOJ => $prefix.'ах',
];
}

Неверное склонение городов с окончанием на "Р" и "О"

Неверное склонение городов с окончанием на "Р" в предложном падеже: например, "КраснодарУ", а должно быть "КраснодарЕ". По сути, все названия, кроме оканчивающихся на "бор/яр" пишутся неправильно. Примеры городов с окончание на "Р" можно посмотреть здесь. Спасибо!

Склонение сложных ФИО

пример с неверным склонением

Сатыбалды-Уулу Салмонбек Сардарбекович

выход - Ь вместо Е:

Родительный кого? чего? Сатыбалды-Уулу Салмонбька Сардарбековича
Дательный кому? чему? Сатыбалды-Уулу Салмонбьку Сардарбековичу
Винительный кого? что? Сатыбалды-Уулу Салмонбька Сардарбековича
Творительный кем? чем? Сатыбалды-Уулу Салмонбьком Сардарбековичем
Предложный о ком? о чем? о Сатыбалды-Уулу Салмонбьке Сардарбековиче

Карандаш

Неправильно склоняет "Карандаш" в родительном падеже :)
карандашя -> карандаша

Не верное склонение Республика Крым

Родительный падеж: должно быть "Республики Крым".
Сейчас склоняет "Республики Крыма".
Остальные падежи не проверял, проверьте по возможности, Крым именно в такой связке не склоняется.

Несколько ошибок

Ошибки в склонении существительных:

Библиотекарь
Делопроизводитель
Преподаватель
Представитель
Производитель
Слесарь
Строитель
Учитель
Крупье

Ошибки в склонении геогр.названий:

Должны склоняться:
Барановичи
Ивацевичи
Ганцевичи
Ляховичи
Смолевичи
Ивацевичи
Житковичи
Калинковичи
Климовичи
Костюковичи
Осиповичи
Бешенковичи
Белыничи
Глубокое (Герб Глубокого — изображение в серебряном поле)
Круглое (по данным на 1 января 2016 года в Круглом)

Не должны склоняться:
Жодино
Березино (Днем города в Березино считается день освобождения)
Иваново
Вороново
Дятлово

Все падежи с ошибкой:
Каменец
Лунинец
Городок(город) (В Городке издаётся районная газета)
Новогрудок
Островец (активное расширение жилого фонда Островца)

Неправильный род.падеж:
Столбцы
Пружаны
Мосты
Ошмяны
Горки
Чаусы
Марьина Горка
Червень (На 1989 год в составе г. Червеня)
Орша - орф.ошибка(Оршы)

Разное:
Старые Дороги (В 1871 году помещик Гогенлоэ в Старых Дорогах основал смолокурню)
Ушачи (Гетто в Ушачах)
Буда-Кошелево(Первая часть не должна склоняться)

Incorrect country name morph in Russian

When trying to get country names in Russian it have two issues:

  1. It changes the character case to lowercase. Is is incorrect behaviour for abbreviation. Character case must be the same as in input string. We can't show names like usa or uae to customers, they must be in uppercase as in input string.
  2. Abbreviation country names become incorrect in Dat case: США transforms to сше, ОАЭ transforms to оаи.
    I think it is the common case of using this library to morph canonical country names in Russian and it is unusable now.

Краснодар

Библиотека установлена из composer перед написанием поста.
Не корректно склоняет Краснодар
use morphos\Russian\GeographicalNamesInflection; var_dump( GeographicalNamesInflection::getCases('Краснодар') );
array(6) { ["nominative"]=> string(18) "Краснодар" ["genitive"]=> string(20) "Краснодара" ["dative"]=> string(20) "Краснодару" ["accusative"]=> string(18) "Краснодар" ["ablative"]=> string(22) "Краснодаром" ["prepositional"]=> string(20) "Краснодару" }

При этом в демке на вашем сайте склоняет корректно, Предложный - Краснодаре

Ошибка склонения

Ошибка склонения "спальня"

pluralize($num, 'спальня')

1 спальня - OK
2 спальни - OK
3 спальни - OK
4 спальни - OK
5 спальнй - ?
6 спальнй - ?
7 спальнй - ?
8 спальнй - ?
9 спальнй - ?
10 спальнй - ?
11 спальнй - ?
12 спальнй- ?

Неверное склонение городов

Местный падеж

Привет! В русском языке есть такая штука как местный падеж https://ru.wikipedia.org/wiki/Местный_падеж. Я подумал, что было бы круто реализовать его поддержку в Вашей библиотеке.

Фактически написать необходимый код могу я, а после могу следать в Вам пулл-реквест. Однако я хотел бы узнать, может быть у Вас есть какое-либо видение как это было бы лучше сделать (я имею в виду реализацию в классах)?

Ханты-Мансийск

При склонении в предложный падеж получается "Хантах-Мансийске"

Неправильно склоняет

Возможно ли добавить исключение?
Частный случай:

Слово: Электрический
Слово необходимо в множественном числе. Выдает: ЭлектрическЫе
Как решить такой вопрос?

Ошибка склонения - ванная

1 ванная - OK
2 ванной - ?
3 ванной - ?
4 ванной -?
5 ванных - OK
6 ванных - OK
7 ванных - OK
8 ванных - OK
9 ванных - OK
10 ванных - OK
11 ванных - OK
11 ванных - OK

неправильно сколняет Правила дорожного движения

Именительный кто? что? | Правила Дорожного Движения
Родительный кого? чего? | Правилы Дорожного Движении
Дательный кому? чему? | Правиле Дорожного Движении
Винительный кого? что? | Правилу Дорожного Движению
Творительный кем? чем? | Правилой Дорожного Движенией
Предложный о ком? о чем? | Правиле Дорожного Движении

Области

Добавьте возможность склонять области.
Например: "Московская область", "Ставрапольский край"

Ай-Даниль

Неправильное склонение Ай-Даниль во всех падежах. Не правильно склоняется Ай

Египет

var_dump(
    morphos\Russian\GeographicalNamesInflection::getCases('Египет')
);
array(6) {
  ["nominative"]=>
  string(12) "Египет"
  ["genitive"]=>
  string(14) "Египета"
  ["dative"]=>
  string(14) "Египету"
  ["accusative"]=>
  string(12) "Египет"
  ["ablative"]=>
  string(16) "Египетом"
  ["prepositional"]=>
  string(14) "Египете"
}

Склонение должности

А как просклонять, например, "Генеральный директор" или "Начальник финансового департамента"?

Morphos – Cross-Site Scripting (XSS)

Product: Morphos
Download: https://github.com/wapmorgan/Morphos
Vunlerable Version: 2.4.1 and probably prior
Tested Version: 2.4.1
Author: ADLab of Venustech

Advisory Details:
A Cross-Site Scripting (XSS) was discovered in “Morphos 2.4.1”, which can be exploited to execute arbitrary code.
The vulnerability exists due to insufficient filtration of user-supplied data in the “word” HTTP POST parameter passed to the “Morphos-master/web/index.php” URL. An attacker could execute arbitrary HTML and script code in a browser in the context of the vulnerable website.
The exploitation example below uses the "alert()" JavaScript function to see a pop-up messagebox:
Poc:
Post: word= " /><script>alert(1)</script><input text="type
To
http://localhost/.../Morphos-master/web/index.php

morphos\S::setEncoding('utf-8') лишнее

В моем проэкте encoding проставляется в зависимости от настроек и сесии.
Фаил src/initialization.php мешает в некоторых модулях или просто повторяет то что и так делает фреймворк.

Но что оссобенно привлекло мое внимание это то что vendor/wapmorgan/morphos/src/S.php вызывается ооочень часто, даже чаше vendor/autoload.php, даже там где библиотека не используется.

Может стоит просто упомянуть в документации что Morphos работает только на 'utf-8' и посоветовать вызов morphos\S::setEncoding('utf-8');, а src/initialization.php удолить из autoload?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.