Files
neuron/dist/morphology-gez.c
will.anderson 48ecd83421 fix: restore elb build — import paths, morphology deps, C master declarations header
- Fix wrong ELP import paths in soul.el, elp-input.el, studio.el
  (../foundation/elp/src → ../foundation/el/elp/src)
- Add missing import "morphology.el" to all 29 language morphology modules
- Recompile all affected dist/*.c with correct cross-module declarations
- Add dist/elp-c-decls.h: C-level master forward declarations for ELP package
  (enables elb --force-include to resolve undeclared cross-module calls)
2026-05-08 19:43:57 -05:00

606 lines
16 KiB
C

#include <stdint.h>
#include <stdlib.h>
#include "el_runtime.h"
el_val_t str_ends(el_val_t s, el_val_t suf);
el_val_t str_last_char(el_val_t s);
el_val_t str_last2(el_val_t s);
el_val_t str_last3(el_val_t s);
el_val_t str_drop_last(el_val_t s, el_val_t n);
el_val_t is_vowel(el_val_t c);
el_val_t morph_apply_suffix(el_val_t base, el_val_t suffix);
el_val_t en_irregular_plural(el_val_t word);
el_val_t en_irregular_singular(el_val_t word);
el_val_t en_irregular_verb(el_val_t base);
el_val_t en_verb_3sg(el_val_t base);
el_val_t en_should_double_final(el_val_t base);
el_val_t en_verb_past(el_val_t base);
el_val_t en_verb_gerund(el_val_t base);
el_val_t en_pluralize_regular(el_val_t singular);
el_val_t en_verb_form(el_val_t base, el_val_t tense, el_val_t person, el_val_t number);
el_val_t agree_determiner(el_val_t det, el_val_t noun);
el_val_t morph_pluralize(el_val_t noun, el_val_t profile);
el_val_t morph_map_canonical(el_val_t verb, el_val_t code);
el_val_t morph_conjugate(el_val_t verb, el_val_t tense, el_val_t person, el_val_t number, el_val_t profile);
el_val_t morph_inflect(el_val_t word, el_val_t features, el_val_t profile);
el_val_t pluralize(el_val_t singular);
el_val_t singularize(el_val_t plural);
el_val_t verb_form(el_val_t base, el_val_t tense, el_val_t person, el_val_t number);
el_val_t irregular_plural(el_val_t word);
el_val_t irregular_singular(el_val_t word);
el_val_t gez_str_ends(el_val_t s, el_val_t suf);
el_val_t gez_str_len(el_val_t s);
el_val_t gez_str_drop_last(el_val_t s, el_val_t n);
el_val_t gez_slot(el_val_t person, el_val_t number);
el_val_t gez_slot_g(el_val_t person, el_val_t gender, el_val_t number);
el_val_t gez_kwn_perfect(el_val_t slot);
el_val_t gez_kwn_imperfect(el_val_t slot);
el_val_t gez_is_copula(el_val_t verb);
el_val_t gez_conjugate_copula(el_val_t tense, el_val_t slot);
el_val_t gez_hlw_perfect(el_val_t slot);
el_val_t gez_hlw_imperfect(el_val_t slot);
el_val_t gez_hbl_perfect(el_val_t slot);
el_val_t gez_hbl_imperfect(el_val_t slot);
el_val_t gez_ray_perfect(el_val_t slot);
el_val_t gez_ray_imperfect(el_val_t slot);
el_val_t gez_qwl_perfect(el_val_t slot);
el_val_t gez_qwl_imperfect(el_val_t slot);
el_val_t gez_generic_perfect(el_val_t base3sg, el_val_t slot);
el_val_t gez_generic_imperfect(el_val_t base3sg, el_val_t slot);
el_val_t gez_known_verb(el_val_t verb, el_val_t tense, el_val_t slot);
el_val_t gez_conjugate(el_val_t verb, el_val_t tense, el_val_t person, el_val_t number);
el_val_t gez_is_fidel(el_val_t noun);
el_val_t gez_decline(el_val_t noun, el_val_t gram_case, el_val_t number);
el_val_t gez_noun_phrase(el_val_t noun, el_val_t gram_case, el_val_t number, el_val_t definite);
el_val_t gez_map_canonical(el_val_t verb);
el_val_t gez_str_ends(el_val_t s, el_val_t suf) {
return str_ends_with(s, suf);
return 0;
}
el_val_t gez_str_len(el_val_t s) {
return str_len(s);
return 0;
}
el_val_t gez_str_drop_last(el_val_t s, el_val_t n) {
el_val_t len = str_len(s);
if (n >= len) {
return EL_STR("");
}
return str_slice(s, 0, (len - n));
return 0;
}
el_val_t gez_slot(el_val_t person, el_val_t number) {
if (str_eq(person, EL_STR("first"))) {
if (str_eq(number, EL_STR("plural"))) {
return 4;
}
return 0;
}
if (str_eq(person, EL_STR("second"))) {
return 1;
}
if (str_eq(number, EL_STR("plural"))) {
return 5;
}
return 2;
return 0;
}
el_val_t gez_slot_g(el_val_t person, el_val_t gender, el_val_t number) {
el_val_t base = gez_slot(person, number);
if (str_eq(person, EL_STR("third"))) {
if (str_eq(number, EL_STR("singular"))) {
if (str_eq(gender, EL_STR("f"))) {
return 3;
}
}
}
return base;
return 0;
}
el_val_t gez_kwn_perfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x88\x86\xe1\x8a\x95\xe1\x8a\xa9");
}
if (slot == 1) {
return EL_STR("\xe1\x88\x86\xe1\x8a\x95\xe1\x8a\xa8");
}
if (slot == 2) {
return EL_STR("\xe1\x88\x86\xe1\x8a\x90");
}
if (slot == 3) {
return EL_STR("\xe1\x88\x86\xe1\x8a\x90\xe1\x89\xb5");
}
if (slot == 4) {
return EL_STR("\xe1\x88\x86\xe1\x8a\x95\xe1\x8a\x90");
}
return EL_STR("\xe1\x88\x86\xe1\x8a\x91");
return 0;
}
el_val_t gez_kwn_imperfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x8a\xa5\xe1\x88\x86\xe1\x8a\x95");
}
if (slot == 1) {
return EL_STR("\xe1\x89\xb5\xe1\x88\x86\xe1\x8a\x95");
}
if (slot == 2) {
return EL_STR("\xe1\x8b\xad\xe1\x88\x86\xe1\x8a\x95");
}
if (slot == 3) {
return EL_STR("\xe1\x89\xb5\xe1\x88\x86\xe1\x8a\x95");
}
if (slot == 4) {
return EL_STR("\xe1\x8a\x95\xe1\x88\x86\xe1\x8a\x95");
}
return EL_STR("\xe1\x8b\xad\xe1\x88\x86\xe1\x8a\x91");
return 0;
}
el_val_t gez_is_copula(el_val_t verb) {
if (str_eq(verb, EL_STR("kwn"))) {
return 1;
}
if (str_eq(verb, EL_STR("\xe1\x88\x86\xe1\x8a\x90"))) {
return 1;
}
if (str_eq(verb, EL_STR("hona"))) {
return 1;
}
if (str_eq(verb, EL_STR("be"))) {
return 1;
}
return 0;
return 0;
}
el_val_t gez_conjugate_copula(el_val_t tense, el_val_t slot) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_kwn_imperfect(slot);
}
return gez_kwn_perfect(slot);
return 0;
}
el_val_t gez_hlw_perfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x88\x80\xe1\x88\x8e\xe1\x8a\xa9");
}
if (slot == 1) {
return EL_STR("\xe1\x88\x80\xe1\x88\x8e\xe1\x8a\xa8");
}
if (slot == 2) {
return EL_STR("\xe1\x88\x80\xe1\x88\x8e");
}
if (slot == 3) {
return EL_STR("\xe1\x88\x80\xe1\x88\x88\xe1\x8b\x88\xe1\x89\xb5");
}
if (slot == 4) {
return EL_STR("\xe1\x88\x80\xe1\x88\x8e\xe1\x8a\x90");
}
return EL_STR("\xe1\x88\x80\xe1\x88\x89");
return 0;
}
el_val_t gez_hlw_imperfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x8a\xa5\xe1\x88\x80\xe1\x88\x89");
}
if (slot == 1) {
return EL_STR("\xe1\x89\xb5\xe1\x88\x80\xe1\x88\x89");
}
if (slot == 2) {
return EL_STR("\xe1\x8b\xad\xe1\x88\x80\xe1\x88\x89");
}
if (slot == 3) {
return EL_STR("\xe1\x89\xb5\xe1\x88\x80\xe1\x88\x89");
}
if (slot == 4) {
return EL_STR("\xe1\x8a\x95\xe1\x88\x80\xe1\x88\x89");
}
return EL_STR("\xe1\x8b\xad\xe1\x88\x80\xe1\x88\x8d\xe1\x8b\x89");
return 0;
}
el_val_t gez_hbl_perfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0\xe1\x8a\xa9");
}
if (slot == 1) {
return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0\xe1\x8a\xa8");
}
if (slot == 2) {
return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0");
}
if (slot == 3) {
return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0\xe1\x89\xb5");
}
if (slot == 4) {
return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0\xe1\x8a\x90");
}
return EL_STR("\xe1\x88\xb0\xe1\x8c\xa1");
return 0;
}
el_val_t gez_hbl_imperfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x8a\xa5\xe1\x88\xb0\xe1\x8c\xa5");
}
if (slot == 1) {
return EL_STR("\xe1\x89\xb5\xe1\x88\xb0\xe1\x8c\xa5");
}
if (slot == 2) {
return EL_STR("\xe1\x8b\xad\xe1\x88\xb0\xe1\x8c\xa5");
}
if (slot == 3) {
return EL_STR("\xe1\x89\xb5\xe1\x88\xb0\xe1\x8c\xa5");
}
if (slot == 4) {
return EL_STR("\xe1\x8a\x95\xe1\x88\xb0\xe1\x8c\xa5");
}
return EL_STR("\xe1\x8b\xad\xe1\x88\xb0\xe1\x8c\xa1");
return 0;
}
el_val_t gez_ray_perfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8\xe1\x8a\xa9");
}
if (slot == 1) {
return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8\xe1\x8a\xa8");
}
if (slot == 2) {
return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8");
}
if (slot == 3) {
return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8\xe1\x89\xb5");
}
if (slot == 4) {
return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8\xe1\x8a\x90");
}
return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa9");
return 0;
}
el_val_t gez_ray_imperfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x8a\xa5\xe1\x8b\xab\xe1\x8b\xad");
}
if (slot == 1) {
return EL_STR("\xe1\x89\xb5\xe1\x8b\xab\xe1\x8b\xad");
}
if (slot == 2) {
return EL_STR("\xe1\x8b\xab\xe1\x8b\xad");
}
if (slot == 3) {
return EL_STR("\xe1\x89\xb5\xe1\x8b\xab\xe1\x8b\xad");
}
if (slot == 4) {
return EL_STR("\xe1\x8a\x95\xe1\x8b\xab\xe1\x8b\xad");
}
return EL_STR("\xe1\x8b\xab\xe1\x8b\xa9");
return 0;
}
el_val_t gez_qwl_perfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad\xe1\x8a\xa9");
}
if (slot == 1) {
return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad\xe1\x8a\xa8");
}
if (slot == 2) {
return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa8");
}
if (slot == 3) {
return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa8\xe1\x89\xb5");
}
if (slot == 4) {
return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad\xe1\x8a\x90");
}
return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa9");
return 0;
}
el_val_t gez_qwl_imperfect(el_val_t slot) {
if (slot == 0) {
return EL_STR("\xe1\x8a\xa5\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad");
}
if (slot == 1) {
return EL_STR("\xe1\x89\xb5\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad");
}
if (slot == 2) {
return EL_STR("\xe1\x8b\xad\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad");
}
if (slot == 3) {
return EL_STR("\xe1\x89\xb5\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad");
}
if (slot == 4) {
return EL_STR("\xe1\x8a\x95\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad");
}
return EL_STR("\xe1\x8b\xad\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa9");
return 0;
}
el_val_t gez_generic_perfect(el_val_t base3sg, el_val_t slot) {
if (slot == 0) {
return el_str_concat(base3sg, EL_STR("\xe1\x8a\xa9"));
}
if (slot == 1) {
return el_str_concat(base3sg, EL_STR("\xe1\x8a\xa8"));
}
if (slot == 2) {
return base3sg;
}
if (slot == 3) {
return el_str_concat(base3sg, EL_STR("\xe1\x89\xb5"));
}
if (slot == 4) {
return el_str_concat(base3sg, EL_STR("\xe1\x8a\x90"));
}
return el_str_concat(base3sg, EL_STR("\xe1\x8a\xa1"));
return 0;
}
el_val_t gez_generic_imperfect(el_val_t base3sg, el_val_t slot) {
if (slot == 0) {
return el_str_concat(EL_STR("\xe1\x8a\xa5"), base3sg);
}
if (slot == 1) {
return el_str_concat(EL_STR("\xe1\x89\xb5"), base3sg);
}
if (slot == 2) {
return el_str_concat(EL_STR("\xe1\x8b\xad"), base3sg);
}
if (slot == 3) {
return el_str_concat(EL_STR("\xe1\x89\xb5"), base3sg);
}
if (slot == 4) {
return el_str_concat(EL_STR("\xe1\x8a\x95"), base3sg);
}
return el_str_concat(el_str_concat(EL_STR("\xe1\x8b\xad"), base3sg), EL_STR("\xe1\x8a\xa1"));
return 0;
}
el_val_t gez_known_verb(el_val_t verb, el_val_t tense, el_val_t slot) {
if (str_eq(verb, EL_STR("kwn"))) {
return gez_conjugate_copula(tense, slot);
}
if (str_eq(verb, EL_STR("\xe1\x88\x86\xe1\x8a\x90"))) {
return gez_conjugate_copula(tense, slot);
}
if (str_eq(verb, EL_STR("hona"))) {
return gez_conjugate_copula(tense, slot);
}
if (str_eq(verb, EL_STR("hlw"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_hlw_imperfect(slot);
}
return gez_hlw_perfect(slot);
}
if (str_eq(verb, EL_STR("\xe1\x88\x80\xe1\x88\x8e"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_hlw_imperfect(slot);
}
return gez_hlw_perfect(slot);
}
if (str_eq(verb, EL_STR("hallo"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_hlw_imperfect(slot);
}
return gez_hlw_perfect(slot);
}
if (str_eq(verb, EL_STR("hbl"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_hbl_imperfect(slot);
}
return gez_hbl_perfect(slot);
}
if (str_eq(verb, EL_STR("\xe1\x88\xb0\xe1\x8c\xa0"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_hbl_imperfect(slot);
}
return gez_hbl_perfect(slot);
}
if (str_eq(verb, EL_STR("s\xc3\xa4tta"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_hbl_imperfect(slot);
}
return gez_hbl_perfect(slot);
}
if (str_eq(verb, EL_STR("r\xca\xbey"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_ray_imperfect(slot);
}
return gez_ray_perfect(slot);
}
if (str_eq(verb, EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_ray_imperfect(slot);
}
return gez_ray_perfect(slot);
}
if (str_eq(verb, EL_STR("\xca\xbe""ayya"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_ray_imperfect(slot);
}
return gez_ray_perfect(slot);
}
if (str_eq(verb, EL_STR("qwl"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_qwl_imperfect(slot);
}
return gez_qwl_perfect(slot);
}
if (str_eq(verb, EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa8"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_qwl_imperfect(slot);
}
return gez_qwl_perfect(slot);
}
if (str_eq(verb, EL_STR("t\xc3\xa4nag\xc3\xa4r\xc3\xa4"))) {
if (str_eq(tense, EL_STR("imperfect"))) {
return gez_qwl_imperfect(slot);
}
return gez_qwl_perfect(slot);
}
return EL_STR("");
return 0;
}
el_val_t gez_conjugate(el_val_t verb, el_val_t tense, el_val_t person, el_val_t number) {
el_val_t slot = gez_slot(person, number);
if (gez_is_copula(verb)) {
return gez_conjugate_copula(tense, slot);
}
el_val_t known = gez_known_verb(verb, tense, slot);
if (!str_eq(known, EL_STR(""))) {
return known;
}
return verb;
return 0;
}
el_val_t gez_is_fidel(el_val_t noun) {
el_val_t n = gez_str_len(noun);
if (n == 0) {
return 0;
}
el_val_t first = str_slice(noun, 0, 1);
if (str_eq(first, EL_STR("\xe1\x88\x80"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\x81"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\x82"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\x83"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\x84"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\x85"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\x86"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\x88"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\x98"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\xb0"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x88\xb8"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x89\x80"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x89\xa0"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x89\xb0"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8a\x90"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8a\xa0"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8a\xa5"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8a\xa8"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8b\x88"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8b\x98"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8b\xa8"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8b\xb0"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8c\x88"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8c\xa0"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8d\x80"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8d\x88"))) {
return 1;
}
if (str_eq(first, EL_STR("\xe1\x8d\x90"))) {
return 1;
}
return 0;
return 0;
}
el_val_t gez_decline(el_val_t noun, el_val_t gram_case, el_val_t number) {
if (str_eq(number, EL_STR("plural"))) {
if (gez_is_fidel(noun)) {
return el_str_concat(noun, EL_STR("\xe1\x8b\x8e\xe1\x89\xbd"));
}
return el_str_concat(noun, EL_STR("\xc4\x81t"));
}
if (str_eq(gram_case, EL_STR("acc"))) {
if (gez_is_fidel(noun)) {
return el_str_concat(noun, EL_STR("\xe1\x8a\x95"));
}
return el_str_concat(noun, EL_STR("a"));
}
return noun;
return 0;
}
el_val_t gez_noun_phrase(el_val_t noun, el_val_t gram_case, el_val_t number, el_val_t definite) {
return gez_decline(noun, gram_case, number);
return 0;
}
el_val_t gez_map_canonical(el_val_t verb) {
if (str_eq(verb, EL_STR("be"))) {
return EL_STR("kwn");
}
if (str_eq(verb, EL_STR("exist"))) {
return EL_STR("hlw");
}
if (str_eq(verb, EL_STR("give"))) {
return EL_STR("hbl");
}
if (str_eq(verb, EL_STR("see"))) {
return EL_STR("r\xca\xbey");
}
if (str_eq(verb, EL_STR("speak"))) {
return EL_STR("qwl");
}
if (str_eq(verb, EL_STR("say"))) {
return EL_STR("qwl");
}
return verb;
return 0;
}