Решить проблему безударного вокализма в английском языке можно простым способом: на этапе логической обработки текста необходимо ввести стадию морфемного анализа.
Для каждого морфологического разбора можно выделить несколько правил:
- Анализ букв или группы букв по степени их родства;
- Создание сложных логических проверок на грамматическую форму слова, либо создание проанализированного корпуса текстов для статистической проверки грамматической формы слова;
- Фильтрация по образцу;
Недостатком этого метода является то, что МА будет генерировать проекции с низкой степенью достоверности. Частично проблема решается с помощью механизма откатов анализа: генерируются проекции с достоверностью не ниже, допустим, 90%, запускается синтаксический анализ, если он не приводит к успеху — нижняя граница достоверности снижается до 60%, и анализ повторяется.
Логическая проверка грамматики в словосочетании проверяется при помощи составления специальных словарей, в которые заносятся данные о различных формах слова (см. приложение C).
Во время проведения морфологического анализа неизбежно будет возникать множество неточностей. В работе МА можно выделить 2 алгоритма для исправления этих неточностей:
- Создание отдельного потока информации для каждой возможной альтернативы и последующего ее синтаксического анализа.
- Использования «версионных» словоформ, если слово дает неоднозначность его грамматических признаков, при условии, что его лексическое значение останется неизменным.
Однако стоит заметить, что оба способа имеют свои недостатки, так в первом алгоритме обработки существует склонность к взрывному росту числа альтернативных потоков в длинных предложениях. Во втором же алгоритме необходимо делать дополнительные проверки контекста, также для этого метода необходимо проверять все версии словоформ, не взирая на провал отдельных проверок.