Машинный перевод языков в искусственном интеллекте

Искусственный интеллект в здравоохранении Изучение

Автоматический перевод текста с одного естественного языка (исходного) на другой известен как машинный перевод (целевой). Это было одно из первых придуманных приложений для компьютеров (Weaver, 1949).

В прошлом было три основных применения машинного перевода:

  1. Грубый перевод, например, предоставляемый бесплатными интернет-сервисами, передает «суть» иностранного заявления или документа, но изобилует неточностями. Компании используют предварительно отредактированный перевод для публикации документации и коммерческих материалов на нескольких языках.
  2. Исходный исходный контент написан на ограниченном языке, что упрощает машинный перевод, а результаты часто редактируются человеком для исправления любых недостатков.
  3. Перевод ограниченного источника полностью автоматизирован, но только для очень стереотипного языка, такого как сводка погоды.

Перевод сложен, так как требует глубокого понимания текста в самом общем сценарии. Это верно даже для очень простых сообщений, таких как «тексты», состоящие из одного слова. Рассмотрим слово «Открыть» на входной двери магазина. Это передает ощущение того, что магазин в настоящее время приветствует клиентов. Рассмотрим ту же фразу «Открыть», которая красуется на гигантском баннере возле недавно построенного магазина. Это указывает на то, что бизнес теперь открыт ежедневно, но зрители этой вывески не были бы введены в заблуждение, если бы магазин закрывался на ночь, а баннер не был удален. Эти два знака имеют один и тот же термин, но имеют разные значения. «Offen» будет надписью на входе на немецком языке, а «Neu Eroffnet» — флагом.

Проблема в том, что разные языки классифицируют мир по-разному. Например, французское слово «дукс» имеет широкий спектр коннотаций, которые примерно эквивалентны английским терминам «мягкий», «сладкий» и «нежный». Точно так же английский термин «жесткий» охватывает почти все значения немецкого слова «харт» (физически стойкий, суровый), а также некоторые значения слова «швириг» (физически непокорный, жестокий) (трудный). В результате перевод значения высказывания сложнее, чем его понимание на одном языке. Такие предикаты, как Open(x), могут использоваться в системе синтаксического анализа английского языка, но язык представления должен будет делать дополнительные различия для перевода, возможно, с Open1(x), выражающим смысл «Offen», и Open2(x), отражающим «Neu Ero». смысл ffnet.

Переводчик, будь то человек или компьютер, часто должен понимать весь сценарий, описанный в источнике, а не просто отдельные слова. Чтобы перевести английское слово «он» на корейский, например, нужно выбрать между скромной и почетной формами, что определяется социальной связью говорящего с референтом «его». Поскольку почетные знаки в японском языке относительны, решение основывается на социальных связях говорящего, референта и слушателя. Переводчикам (как машинам, так и людям) может быть сложно принять это решение. «Бейсбольный мяч ударил в окно», например, можно перевести как «Бейсбольный мяч ударил в окно». Чтобы перевести на французский язык «он сломался», мы должны выбирать между женским «elle» и мужским «il», указывая, относится ли «it» к бейсбольному мячу или к окну. Чтобы перевод был правильным,

Бывают ситуации, когда нет другого варианта, который приведет к действительно удовлетворительному переводу. Например, итальянская любовная поэзия, в которой мужское «il sole» (солнце) и женское «la luna» (луна) обозначают две любви, должна быть скорректирована при переводе на немецкий язык, где роды меняются местами, и еще больше изменяется, когда переведены на язык того же пола.

Читайте также:  Разница между двоичным деревом поиска и деревом AVL

Хотя все системы перевода должны моделировать исходный и конечный языки, модели, используемые каждой системой, различаются. Некоторые системы пытаются преобразовать текст на исходном языке в интерлингва-представление знаний, которое впоследствии используется для построения предложений на целевом языке. Это сложно, потому что влечет за собой три нерешенных вопроса: построение комплексного представления знаний обо всем, анализ в этом представлении и создание слов из этого представления.

Трансферная модель используется в других системах. Они хранят базу данных правил перевода (или экземпляров) и переводят напрямую, когда правило (или пример) совпадает. На лексическом, синтаксическом или семантическом уровнях может происходить перенос. Строгие синтаксические правила, например, переводят английское [прилагательное существительное] во французское [существительное прилагательное]. Французский [S1 “et puis” S2] переводится на английский язык [S1 “и затем” S2] с использованием гибридного синтаксического и лексического правила.

Оцените статью
bestprogrammer.ru
Добавить комментарий