#include #include #include "el_runtime.h" el_val_t str_ends(el_val_t s, el_val_t suf); el_val_t str_last_char(el_val_t s); el_val_t str_last2(el_val_t s); el_val_t str_last3(el_val_t s); el_val_t str_drop_last(el_val_t s, el_val_t n); el_val_t is_vowel(el_val_t c); el_val_t morph_apply_suffix(el_val_t base, el_val_t suffix); el_val_t en_irregular_plural(el_val_t word); el_val_t en_irregular_singular(el_val_t word); el_val_t en_irregular_verb(el_val_t base); el_val_t en_verb_3sg(el_val_t base); el_val_t en_should_double_final(el_val_t base); el_val_t en_verb_past(el_val_t base); el_val_t en_verb_gerund(el_val_t base); el_val_t en_pluralize_regular(el_val_t singular); el_val_t en_verb_form(el_val_t base, el_val_t tense, el_val_t person, el_val_t number); el_val_t agree_determiner(el_val_t det, el_val_t noun); el_val_t morph_pluralize(el_val_t noun, el_val_t profile); el_val_t morph_map_canonical(el_val_t verb, el_val_t code); el_val_t morph_conjugate(el_val_t verb, el_val_t tense, el_val_t person, el_val_t number, el_val_t profile); el_val_t morph_inflect(el_val_t word, el_val_t features, el_val_t profile); el_val_t pluralize(el_val_t singular); el_val_t singularize(el_val_t plural); el_val_t verb_form(el_val_t base, el_val_t tense, el_val_t person, el_val_t number); el_val_t irregular_plural(el_val_t word); el_val_t irregular_singular(el_val_t word); el_val_t gez_str_ends(el_val_t s, el_val_t suf); el_val_t gez_str_len(el_val_t s); el_val_t gez_str_drop_last(el_val_t s, el_val_t n); el_val_t gez_slot(el_val_t person, el_val_t number); el_val_t gez_slot_g(el_val_t person, el_val_t gender, el_val_t number); el_val_t gez_kwn_perfect(el_val_t slot); el_val_t gez_kwn_imperfect(el_val_t slot); el_val_t gez_is_copula(el_val_t verb); el_val_t gez_conjugate_copula(el_val_t tense, el_val_t slot); el_val_t gez_hlw_perfect(el_val_t slot); el_val_t gez_hlw_imperfect(el_val_t slot); el_val_t gez_hbl_perfect(el_val_t slot); el_val_t gez_hbl_imperfect(el_val_t slot); el_val_t gez_ray_perfect(el_val_t slot); el_val_t gez_ray_imperfect(el_val_t slot); el_val_t gez_qwl_perfect(el_val_t slot); el_val_t gez_qwl_imperfect(el_val_t slot); el_val_t gez_generic_perfect(el_val_t base3sg, el_val_t slot); el_val_t gez_generic_imperfect(el_val_t base3sg, el_val_t slot); el_val_t gez_known_verb(el_val_t verb, el_val_t tense, el_val_t slot); el_val_t gez_conjugate(el_val_t verb, el_val_t tense, el_val_t person, el_val_t number); el_val_t gez_is_fidel(el_val_t noun); el_val_t gez_decline(el_val_t noun, el_val_t gram_case, el_val_t number); el_val_t gez_noun_phrase(el_val_t noun, el_val_t gram_case, el_val_t number, el_val_t definite); el_val_t gez_map_canonical(el_val_t verb); el_val_t gez_str_ends(el_val_t s, el_val_t suf) { return str_ends_with(s, suf); return 0; } el_val_t gez_str_len(el_val_t s) { return str_len(s); return 0; } el_val_t gez_str_drop_last(el_val_t s, el_val_t n) { el_val_t len = str_len(s); if (n >= len) { return EL_STR(""); } return str_slice(s, 0, (len - n)); return 0; } el_val_t gez_slot(el_val_t person, el_val_t number) { if (str_eq(person, EL_STR("first"))) { if (str_eq(number, EL_STR("plural"))) { return 4; } return 0; } if (str_eq(person, EL_STR("second"))) { return 1; } if (str_eq(number, EL_STR("plural"))) { return 5; } return 2; return 0; } el_val_t gez_slot_g(el_val_t person, el_val_t gender, el_val_t number) { el_val_t base = gez_slot(person, number); if (str_eq(person, EL_STR("third"))) { if (str_eq(number, EL_STR("singular"))) { if (str_eq(gender, EL_STR("f"))) { return 3; } } } return base; return 0; } el_val_t gez_kwn_perfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x88\x86\xe1\x8a\x95\xe1\x8a\xa9"); } if (slot == 1) { return EL_STR("\xe1\x88\x86\xe1\x8a\x95\xe1\x8a\xa8"); } if (slot == 2) { return EL_STR("\xe1\x88\x86\xe1\x8a\x90"); } if (slot == 3) { return EL_STR("\xe1\x88\x86\xe1\x8a\x90\xe1\x89\xb5"); } if (slot == 4) { return EL_STR("\xe1\x88\x86\xe1\x8a\x95\xe1\x8a\x90"); } return EL_STR("\xe1\x88\x86\xe1\x8a\x91"); return 0; } el_val_t gez_kwn_imperfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x8a\xa5\xe1\x88\x86\xe1\x8a\x95"); } if (slot == 1) { return EL_STR("\xe1\x89\xb5\xe1\x88\x86\xe1\x8a\x95"); } if (slot == 2) { return EL_STR("\xe1\x8b\xad\xe1\x88\x86\xe1\x8a\x95"); } if (slot == 3) { return EL_STR("\xe1\x89\xb5\xe1\x88\x86\xe1\x8a\x95"); } if (slot == 4) { return EL_STR("\xe1\x8a\x95\xe1\x88\x86\xe1\x8a\x95"); } return EL_STR("\xe1\x8b\xad\xe1\x88\x86\xe1\x8a\x91"); return 0; } el_val_t gez_is_copula(el_val_t verb) { if (str_eq(verb, EL_STR("kwn"))) { return 1; } if (str_eq(verb, EL_STR("\xe1\x88\x86\xe1\x8a\x90"))) { return 1; } if (str_eq(verb, EL_STR("hona"))) { return 1; } if (str_eq(verb, EL_STR("be"))) { return 1; } return 0; return 0; } el_val_t gez_conjugate_copula(el_val_t tense, el_val_t slot) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_kwn_imperfect(slot); } return gez_kwn_perfect(slot); return 0; } el_val_t gez_hlw_perfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x88\x80\xe1\x88\x8e\xe1\x8a\xa9"); } if (slot == 1) { return EL_STR("\xe1\x88\x80\xe1\x88\x8e\xe1\x8a\xa8"); } if (slot == 2) { return EL_STR("\xe1\x88\x80\xe1\x88\x8e"); } if (slot == 3) { return EL_STR("\xe1\x88\x80\xe1\x88\x88\xe1\x8b\x88\xe1\x89\xb5"); } if (slot == 4) { return EL_STR("\xe1\x88\x80\xe1\x88\x8e\xe1\x8a\x90"); } return EL_STR("\xe1\x88\x80\xe1\x88\x89"); return 0; } el_val_t gez_hlw_imperfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x8a\xa5\xe1\x88\x80\xe1\x88\x89"); } if (slot == 1) { return EL_STR("\xe1\x89\xb5\xe1\x88\x80\xe1\x88\x89"); } if (slot == 2) { return EL_STR("\xe1\x8b\xad\xe1\x88\x80\xe1\x88\x89"); } if (slot == 3) { return EL_STR("\xe1\x89\xb5\xe1\x88\x80\xe1\x88\x89"); } if (slot == 4) { return EL_STR("\xe1\x8a\x95\xe1\x88\x80\xe1\x88\x89"); } return EL_STR("\xe1\x8b\xad\xe1\x88\x80\xe1\x88\x8d\xe1\x8b\x89"); return 0; } el_val_t gez_hbl_perfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0\xe1\x8a\xa9"); } if (slot == 1) { return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0\xe1\x8a\xa8"); } if (slot == 2) { return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0"); } if (slot == 3) { return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0\xe1\x89\xb5"); } if (slot == 4) { return EL_STR("\xe1\x88\xb0\xe1\x8c\xa0\xe1\x8a\x90"); } return EL_STR("\xe1\x88\xb0\xe1\x8c\xa1"); return 0; } el_val_t gez_hbl_imperfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x8a\xa5\xe1\x88\xb0\xe1\x8c\xa5"); } if (slot == 1) { return EL_STR("\xe1\x89\xb5\xe1\x88\xb0\xe1\x8c\xa5"); } if (slot == 2) { return EL_STR("\xe1\x8b\xad\xe1\x88\xb0\xe1\x8c\xa5"); } if (slot == 3) { return EL_STR("\xe1\x89\xb5\xe1\x88\xb0\xe1\x8c\xa5"); } if (slot == 4) { return EL_STR("\xe1\x8a\x95\xe1\x88\xb0\xe1\x8c\xa5"); } return EL_STR("\xe1\x8b\xad\xe1\x88\xb0\xe1\x8c\xa1"); return 0; } el_val_t gez_ray_perfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8\xe1\x8a\xa9"); } if (slot == 1) { return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8\xe1\x8a\xa8"); } if (slot == 2) { return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8"); } if (slot == 3) { return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8\xe1\x89\xb5"); } if (slot == 4) { return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8\xe1\x8a\x90"); } return EL_STR("\xe1\x8a\xa0\xe1\x8b\xa9"); return 0; } el_val_t gez_ray_imperfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x8a\xa5\xe1\x8b\xab\xe1\x8b\xad"); } if (slot == 1) { return EL_STR("\xe1\x89\xb5\xe1\x8b\xab\xe1\x8b\xad"); } if (slot == 2) { return EL_STR("\xe1\x8b\xab\xe1\x8b\xad"); } if (slot == 3) { return EL_STR("\xe1\x89\xb5\xe1\x8b\xab\xe1\x8b\xad"); } if (slot == 4) { return EL_STR("\xe1\x8a\x95\xe1\x8b\xab\xe1\x8b\xad"); } return EL_STR("\xe1\x8b\xab\xe1\x8b\xa9"); return 0; } el_val_t gez_qwl_perfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad\xe1\x8a\xa9"); } if (slot == 1) { return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad\xe1\x8a\xa8"); } if (slot == 2) { return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa8"); } if (slot == 3) { return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa8\xe1\x89\xb5"); } if (slot == 4) { return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad\xe1\x8a\x90"); } return EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa9"); return 0; } el_val_t gez_qwl_imperfect(el_val_t slot) { if (slot == 0) { return EL_STR("\xe1\x8a\xa5\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad"); } if (slot == 1) { return EL_STR("\xe1\x89\xb5\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad"); } if (slot == 2) { return EL_STR("\xe1\x8b\xad\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad"); } if (slot == 3) { return EL_STR("\xe1\x89\xb5\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad"); } if (slot == 4) { return EL_STR("\xe1\x8a\x95\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xad"); } return EL_STR("\xe1\x8b\xad\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa9"); return 0; } el_val_t gez_generic_perfect(el_val_t base3sg, el_val_t slot) { if (slot == 0) { return el_str_concat(base3sg, EL_STR("\xe1\x8a\xa9")); } if (slot == 1) { return el_str_concat(base3sg, EL_STR("\xe1\x8a\xa8")); } if (slot == 2) { return base3sg; } if (slot == 3) { return el_str_concat(base3sg, EL_STR("\xe1\x89\xb5")); } if (slot == 4) { return el_str_concat(base3sg, EL_STR("\xe1\x8a\x90")); } return el_str_concat(base3sg, EL_STR("\xe1\x8a\xa1")); return 0; } el_val_t gez_generic_imperfect(el_val_t base3sg, el_val_t slot) { if (slot == 0) { return el_str_concat(EL_STR("\xe1\x8a\xa5"), base3sg); } if (slot == 1) { return el_str_concat(EL_STR("\xe1\x89\xb5"), base3sg); } if (slot == 2) { return el_str_concat(EL_STR("\xe1\x8b\xad"), base3sg); } if (slot == 3) { return el_str_concat(EL_STR("\xe1\x89\xb5"), base3sg); } if (slot == 4) { return el_str_concat(EL_STR("\xe1\x8a\x95"), base3sg); } return el_str_concat(el_str_concat(EL_STR("\xe1\x8b\xad"), base3sg), EL_STR("\xe1\x8a\xa1")); return 0; } el_val_t gez_known_verb(el_val_t verb, el_val_t tense, el_val_t slot) { if (str_eq(verb, EL_STR("kwn"))) { return gez_conjugate_copula(tense, slot); } if (str_eq(verb, EL_STR("\xe1\x88\x86\xe1\x8a\x90"))) { return gez_conjugate_copula(tense, slot); } if (str_eq(verb, EL_STR("hona"))) { return gez_conjugate_copula(tense, slot); } if (str_eq(verb, EL_STR("hlw"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_hlw_imperfect(slot); } return gez_hlw_perfect(slot); } if (str_eq(verb, EL_STR("\xe1\x88\x80\xe1\x88\x8e"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_hlw_imperfect(slot); } return gez_hlw_perfect(slot); } if (str_eq(verb, EL_STR("hallo"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_hlw_imperfect(slot); } return gez_hlw_perfect(slot); } if (str_eq(verb, EL_STR("hbl"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_hbl_imperfect(slot); } return gez_hbl_perfect(slot); } if (str_eq(verb, EL_STR("\xe1\x88\xb0\xe1\x8c\xa0"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_hbl_imperfect(slot); } return gez_hbl_perfect(slot); } if (str_eq(verb, EL_STR("s\xc3\xa4tta"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_hbl_imperfect(slot); } return gez_hbl_perfect(slot); } if (str_eq(verb, EL_STR("r\xca\xbey"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_ray_imperfect(slot); } return gez_ray_perfect(slot); } if (str_eq(verb, EL_STR("\xe1\x8a\xa0\xe1\x8b\xa8"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_ray_imperfect(slot); } return gez_ray_perfect(slot); } if (str_eq(verb, EL_STR("\xca\xbe""ayya"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_ray_imperfect(slot); } return gez_ray_perfect(slot); } if (str_eq(verb, EL_STR("qwl"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_qwl_imperfect(slot); } return gez_qwl_perfect(slot); } if (str_eq(verb, EL_STR("\xe1\x89\xb0\xe1\x8a\x93\xe1\x8c\x88\xe1\x88\xa8"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_qwl_imperfect(slot); } return gez_qwl_perfect(slot); } if (str_eq(verb, EL_STR("t\xc3\xa4nag\xc3\xa4r\xc3\xa4"))) { if (str_eq(tense, EL_STR("imperfect"))) { return gez_qwl_imperfect(slot); } return gez_qwl_perfect(slot); } return EL_STR(""); return 0; } el_val_t gez_conjugate(el_val_t verb, el_val_t tense, el_val_t person, el_val_t number) { el_val_t slot = gez_slot(person, number); if (gez_is_copula(verb)) { return gez_conjugate_copula(tense, slot); } el_val_t known = gez_known_verb(verb, tense, slot); if (!str_eq(known, EL_STR(""))) { return known; } return verb; return 0; } el_val_t gez_is_fidel(el_val_t noun) { el_val_t n = gez_str_len(noun); if (n == 0) { return 0; } el_val_t first = str_slice(noun, 0, 1); if (str_eq(first, EL_STR("\xe1\x88\x80"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\x81"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\x82"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\x83"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\x84"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\x85"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\x86"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\x88"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\x98"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\xb0"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x88\xb8"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x89\x80"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x89\xa0"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x89\xb0"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8a\x90"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8a\xa0"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8a\xa5"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8a\xa8"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8b\x88"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8b\x98"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8b\xa8"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8b\xb0"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8c\x88"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8c\xa0"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8d\x80"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8d\x88"))) { return 1; } if (str_eq(first, EL_STR("\xe1\x8d\x90"))) { return 1; } return 0; return 0; } el_val_t gez_decline(el_val_t noun, el_val_t gram_case, el_val_t number) { if (str_eq(number, EL_STR("plural"))) { if (gez_is_fidel(noun)) { return el_str_concat(noun, EL_STR("\xe1\x8b\x8e\xe1\x89\xbd")); } return el_str_concat(noun, EL_STR("\xc4\x81t")); } if (str_eq(gram_case, EL_STR("acc"))) { if (gez_is_fidel(noun)) { return el_str_concat(noun, EL_STR("\xe1\x8a\x95")); } return el_str_concat(noun, EL_STR("a")); } return noun; return 0; } el_val_t gez_noun_phrase(el_val_t noun, el_val_t gram_case, el_val_t number, el_val_t definite) { return gez_decline(noun, gram_case, number); return 0; } el_val_t gez_map_canonical(el_val_t verb) { if (str_eq(verb, EL_STR("be"))) { return EL_STR("kwn"); } if (str_eq(verb, EL_STR("exist"))) { return EL_STR("hlw"); } if (str_eq(verb, EL_STR("give"))) { return EL_STR("hbl"); } if (str_eq(verb, EL_STR("see"))) { return EL_STR("r\xca\xbey"); } if (str_eq(verb, EL_STR("speak"))) { return EL_STR("qwl"); } if (str_eq(verb, EL_STR("say"))) { return EL_STR("qwl"); } return verb; return 0; }