ЗАДАТЬ ВОПРОС ЗАКАЗАТЬ ПЕРЕВОД

Информатика vs грамматика

24 Фев 2015

Вниманию любознательного читателя предлагается статья с провокационным заголовком «Английский можно не учить» о том, что смартфоны научились мгновенно переводить считанную информацию:

http://www.gazeta.ru/tech/2015/01/19_a_6380753.shtml 

Однако, действительно ли английский уже можно не учить? Встроенные в гаджеты программы обработки текста основаны на алгоритмах машинного перевода, т.е. четких правилах преобразования текста на одном языке в эквивалентный по смыслу текст на другом языке. Но естественные языки плохо поддаются формализации: к примеру, английское слово lead как существительное помимо прочего может означать лидерство, инициативу, а также поводок, цепь (для собаки), и кроме того, подводящий электропровод. В той же орфографии, но ином звучании lead означает свинец. Если в языке перевода для каждого из подобных значений имеется отдельное слово, то каким образом машина будет их различать? И как вообще обучить ее различать смысловые нюансы в значениях слов?

Решение этой фундаментальной задачи стоит в одном ряду с созданием искусственного интеллекта. Развивая собственные лингвистические технологии, компания «Яндекс», например, сделала ставку на статистический алгоритм машинного перевода (http://company.yandex.ru/technologies/translation/), при котором компьютер, сопоставляя миллионы фраз на разных языках, устанавливает закономерности в употреблении слов и словосочетаний и вырабатывает множество вариантов перевода по степени их вероятности. Такой подход напоминает работу компьютерных шахматных программ: машина, руководствуясь формализованными инструкциями (правилами движения фигур по 64 клеткам доски), за доли секунды оценивает расстановку фигур и перебирает тысячи и тысячи возможных вариантов ходов в поисках наилучшего для победы сочетания. И здесь, увы, человеческий мозг уже уступает в масштабе и скорости шахматных вычислений.

Из текста статьи следует, что программы перевода в смартфонах удовлетворительно справляются с несложными бытовыми ситуациями. Хотя кажущийся простым заголовок самой статьи [«Английский можно не учить»] оказался не по зубам сервису Google Translate, который перевел первый абзац так:

English can not teach

Smartphones learned momentary reading and translation

Known online translator Google Translate can now instantly translate text from a sheet when you hover over a smartphone camera  In addition to Google over the likes of online translators and OCR systems are successfully operating and other companies, including Russian.

Безусловно, смысл ухватить можно. А как машинные переводчики справляются с научно-техническим текстами? Ведь термины, изначально лишенные эмоциональной окраски, отличающиеся конкретностью значений и лаконичностью, должны легко поддаваться формализации и преобразованию в инструкции для машин. В реальности все обстоит не так просто. Возьмем, к примеру, научный текст:

[ОРИГИНАЛ] The volumetric approach for finding bulk volume uses a small amount of mercury in a porosimeter. First, the empty sample chamber of the porosimeter is filled with mercury to determine its volume. The mercury is then drained from the chamber and the core plug is inserted. The chamber is again filled with mercury. The volume of mercury that filled the empty chamber minus the volume needed to fill the chamber while it held the sample equals the sample’s bulk volume.

[Google Translate] Объемный подход к объему Fi дача объемной использует небольшое количество ртути в порозиметра . Во-первых,пустой Камера для образцов порозиметра является заполняются ртутью, с целью определения его объема. Затем ртуть удаляют из камеры и основной штекер вставлен. Камера снова заполняются ртутью. Объем ртути , что заполняли пустые камеры минус объем , необходимый для фи LL камеры в то время как он провел образец равен объем насыпной образца.

Из приведенного фрагмента очевидно нынешнее несовершенство алгоритмов Google Translate, отвечающих за обработку грамматики русского языка. Ради справедливости отметим, что в рамках этого сервиса предлагается откорректировать перевод – для дальнейшего совершенствования машинных инструкций и накопления образцов переводов.   

Годится ли машинный перевод для перевода поэтических строчек, когда вам захочется блеснуть перед иноязычным адресатом сочными метафорами и эпитетами? Судите сами:

[В. Маяковский, «Адище города»]

В дырах небоскребов, где горела руда

и железо поездов громоздило лаз —

крикнул аэроплан и упал туда,

где у раненого солнца вытекал глаз.

[Google Translate]

In holes of skyscrapers, where burned ore

and iron manhole piled trains

 - shouted an airplane and fell there,

where the sun emerged wounded eyes.

Строгая машинная логика здесь неукоснительно следует русскому порядку слов, но даже в получившемся нагромождении фраз поблескивают искорки экспрессивности оригинала. Вот только англоязычный читатель вряд ли оценит в переводе смысл и без того нелегкого для понимания четверостишия.

Обратимся к художественной литературе, предложив «переводчику Google» абзац из рассказа Джона Апдайка «Вольная птица» (John Updyke «Free»):

[ОРИГИНАЛ]: His mother had never warmed to his wife: Irene was too citified, too proper, too stoical. For Henry, she had been a step up, into a family of comfortably well-off lawyers, bankers, and professors, but in a small incessant society of their home her dispensations of intimacy were measured, and became more so than less. Henry tried to restrict his appetites to match, and rather enjoyed his increasing dryness, his ever more effortless impersonation of a well-bred stick. His mother, whose ambitions for him took something florid from her unfulfilled hopes for herself, saw his construction and resented it; her resentment fortified him then. With Lila more intensely than with several others, he strayed from fidelity and inhaled the wild, damp outdoor air.

[Google Translate]: Его мать никогда не нагревается жене: Irene была слишком citified тоже собственно, тоже стоически. Для Генри, она была шагом вперед, в семье комфортно зажиточных юристов, банкиров и профессоров, но маленький непрерывный общество их дома ее устроения интимности были измерены, и стать больше, чем меньше. Генри попытался ограничить свои аппетиты, чтобы соответствовать, и скорее наслаждался свою растущую сухость, его все более и более легкое олицетворение хорошо воспитанный палкой. Его мать, чьи амбиции для него что-то взял витиеватый из ее несбывшихся надежд для себя увидел, что его строительство и возмущало; ее обида укрепленный его тогда. С Lila более интенсивно, чем с несколькими другими, он отклонился от верности и вдохнул дикий влажной открытый воздух.

[Перевод Б. Аронштейна]: Отношения его матери и его жены так никогда и не стали теплыми: Ирэн была слишком воспитанна, слишком правильна и слишком бесстрастна. Для Генри она была ступенькой вверх, пропуском в круг достаточно состоятельных адвокатов, финансистов и университетских профессоров, однако в тесном, размеренном укладе все проявления были строго отмерены и с годами становились все реже. Генри старался подавлять свое влечение, он даже наслаждался всевозрастающей сухостью их отношений и без напряжения играл роль породистого истукана. Его мать, бурно проявлявшая свои ожидания в отношении Генри, что было продолжением ее собственных несбывшихся надежд, с недовольством наблюдала за натянутостью их отношений. Ее недовольство еще больше укрепило Генри, когда с другими женщинами, и прежде всего с Лайлой, он забыл о супружеской верности и по-настоящему вдохнул влажный и терпкий воздух свободы.

В отличие от бесстрастного анализа двоичного кода, которым мыслит машина, литературный перевод здесь видится результатом одушевленного сотрудничества переводчика с автором текста: жизненный опыт, переживания, наблюдения, которые Апдайк вложил в строчки, столь метко характеризующие его героев, неизбежно преобразуются сквозь призму субъективного восприятия переводчика, обладающего своим собственным, уникальным жизненным опытом и представлением о людских отношениях. Поэтому, например, неслучайна чисто человеческая трактовка слова «construction» His mother… saw his construction and resented it»] как воплощения неестественности, искусственности, даже вымученности в семейном укладе героя рассказа и его жены [«Его мать…  с недовольством наблюдала за натянутостью их отношений»].

Пока фундаментальные проблемы искусственных систем остаются неразрешенными, машинный перевод не заменит кропотливый и одухотворенный труд переводчиков-людей, лишь отчасти облегчит его.  Огромная вычислительная мощь современных компьютеров еще не в состоянии соревноваться с нейронными сетями человеческого мозга, таящими в себе способность творчески мыслить, хранить память, испытывать эмоции, переживать интуитивные озарения и искренние заблуждения.

Вместе с тем, знание других языков оттачивает мыслительные способности, расширяет границы восприятия и открывает доступ к несметным социокультурным сокровищницам человечества, минуя посредников-переводчиков. И пусть гаджеты – будь то электронные словари или иные справочники - станут нам посохом в самостоятельном и увлекательном путешествии к этим сокровищницам.