ЗАДАТЬ ВОПРОС ЗАКАЗАТЬ ПЕРЕВОД

ЧЕЛОВЕК ПРОТИВ МАШИНЫ (или трудности перевода по версии Google Translate)

22 Авг 2014

Можно поздравить создателей программного обеспечения Google Translate с тем, что они действительно предоставили возможность многомиллионной аудитории интернета получить предсталение об иноизычных материалах даже без базовых навыков иностранных языков. Создатели этого ПО с успехом применили «брендовый» алгоритм скрининга аналогичных слов для поиска информацими в целом для такого сравнительного скрининга аналогичных лексических форм в разных языках С профессиональным техническим переводом все гораздо сложнее,подбор слов, обозначающих на разных языках одни и те же понятия, но скорее, социокультурное переложение текстов.

Обратимся к конкретным примерам. В первом из них, несмотря на определенную «синонимичность» темы, Google Translate вполне прилично справился с «общеполитическим» текстом. В этом случае программа стала объектом упреков в предвзятости  в связи с событиями на Украине. В приводимой статье Газеты Ру речь идет о политических нюансах английского слова rebel в переводах  Google Translate. Причем редакторской правки такой перевод практически не требует. Для полной объективности перевод этой статьи для нашего англоязычного сайта (а также и этого вступления) также сделан с помощью Google Translate (http://www.techinput.com/news/man-against-the-machine). 

Во втором случае - довольно сложная в семантическом смысле научно-популярная статья о «понятийной емкости» и «цивильности» языка в эпоху Facebook и Twitter (http://www.nytimes.com/2014/04/06/opinion/sunday/like-degrading-the-language-no-way.html?_r=0). Здесь алгоритмической «продвинутости»  Google Translate в сфере сравнительно-аналитического скрининга разноязычных понятий оказывается явно недостаточно. В результате – текст, который, как говорят переводчики, «редактированию не подлежит».

Ну, и совсем «плохо дело» у машинного переводчика в переводах поэзии. Впрочем, об этом судите сами (http://www.techinput.com/news/man-against-the-machine).

Повстанцы по-русски 

(Источник: Газета Ру - http://www.gazeta.ru/social/2014/08/08/6167481.shtml). 

Почему Google переводит английское слово 'rebels' в контексте пророссийских ополченцев как «боевики».

Корпорация Google исправляет ошибку, из-за которой интернет-переводчик компании называет пророссийских повстанцев боевиками. При этом английское слово 'rebels' в контексте других стран Google переводит как «повстанцы». После того как первоначальная ошибка была исправлена, пророссийские повстанцы превратились в мятежников.

Впервые любопытный алгоритм перевода выражения 'pro-Russia/pro-Russian rebels' (пророссийские повстанцы. — «Газета.Ru») заметили пользователи сети. Бесплатный онлайн-сервис Google Translate по-разному переводил эту фразу в зависимости от страны, которую поддерживают повстанцы.

Так, например, выражения 'pro-America rebels' (проамериканские повстанцы), 'pro-Ukrain/pro-Ukrainian rebels' (проукраинские повстанцы) или же 'pro-Germany rebels' (пронемецкие повстанцы) переводились сервисом именно как «повстанцы», в то время как 'pro-Russia rebels' — как «пророссийские боевики».

Необходимо отметить, что 'rebel' с английского может переводиться по-разному в зависимости от контекста и носить негативную или нейтральную коннотацию. «Повстанец», «мятежник», «боевик», «бунтарь», «бунтовщик» — все это допустимые варианты перевода на русский язык.

Однако в свете нынешней политической ситуации интернет-пользователи иронично отметили это как предвзятость электронного переводчика.

«Газета.Ru» обратилась за разъяснениями в российское представительство Google. В пресс-службе компании сообщили, что это так называемый баг — ошибка в программе, приводящая к сбою алгоритмов, — над которым уже работают сотрудники компании.

«Когда нам становится известно о баге, мы тут же начинаем работать над его исправлением», — пояснили в пресс-службе. В компании не уточнили, сколько времени может занять такая работа.

В Google также напомнили, что это не первый случай, когда онлайн-сервис обвиняют в предвзятости и якобы политизированном переводе. Так, например, в 2010 году Google Translate по-разному «обвинял» Россию и США. Фразу 'to be to blame' — «быть виновным» — программа переводила в зависимости от субъекта обвинения: 'USA is to blame' — «США не виноваты»; 'Russia is to blame' — «Россия виновата»; 'Google is to blame' — «Google не виноват».

В связи с этим компания даже опубликовала разъяснение за авторством менеджера технических программ Google Михаила Дайчика.

«Обычные переводчики, как правило, преобразуют грамматические конструкции из одного языка в другой, исходя из жестко прописанных правил, — рассказал Дайчик. — У этого подхода есть свои преимущества и недостатки, к которым, в частности, можно отнести нечеловеческую сложность работы, требующейся для того, чтобы покрыть такими правилами все разнообразие языка».

Однако, говорит менеджер, Google использует иную систему перевода.

«Переводчик Google устроен принципиально иначе. У нас есть набор статистических эвристик, например «эта последовательность слов обычно переводится так», который дополнен рядом вспомогательных правил, обобщающих группы слов, — рассказывают в Google. — Изначально для обучения Google Translate мы взяли набор текстов, переведенных максимально близко к оригиналу. В дальнейшем для усовершенствования правил мы дали пользователям возможность присылать нам переводы тех фраз, которые переводчик перевел некорректно».

Таким образом, в компании указывают на то, что те или иные алгоритмы перевода могут появиться в том случае, если сами пользователи «подсказывают» переводчику, как правильно переводить ту или иную фразу.

Не исключено, что эта же система сработала и в случае с повстанцами.

На момент публикации баг был исправлен. Однако и теперь пророссийские 'rebels' стоят особняком — переводчик называет их «мятежниками», в то время как 'rebels' других стран по-прежнему переводятся как «повстанцы.»

 

Типа, деградируя язык? Ни за что

Джон МакХортер

Доцент английской и сравнительной литературы

Колумбийскогог университета

Нью-Йорк Таймс, 5 апреля 2014 года

Если и существует какая-либа тема, в отношении которой все, без исключения, американцы, независимо от их взглядов, едины в своем мнении, то это движение страны назад в языковой сфере, независимо от прогресса в остальных областях. Для этого достаточно просто пробежаться по разнузданному дискурсу комментариев в социальных сетях и бездумной обрывистости текстовых сообщений и песенных хитов.

Однако, посреди этого кажущегося чудовищным вырождения некогда могучего языка, можно заметить признаки и другой тенденции – а именно, усиливающейся языковой усложненности.

Эта усложненность, правда, присуща в основном людям до определенного возраста и включет в себя такие слова, как, например «типа». Мы считаем эту тенденцию следствием укоренившейся  языковой нерешительности, страха вербализации определенных заявлений. В то же время подобный языковый феномен можно также рассматривать скорее как выражение уверенности в себе, нежели «размышлений вслух».

Слово «типа» часто выполняет роль признаваемого несогласия при вербализации чьей-либо точки зрения. Выражение «это, типа, единственная возможность добиться результата» является косвенным признанием того, что эта новость может быть неприятна собеседнику и желанием смягчить удар предложением, осмотрительно приведенным в гипотетический формат.

Выражение «типа, единственная возможность это сделать» базируется на том же принципе, как и, например, просьба «Не могли бы вы открыть дверь…» - гипотетическая по форме и конкретная по содержанию. Слово «типа» в некотором роде более небрежное, однако лишь потому, что молодые люди и любители лексической новизны хотят казаться небрежными. 

На самом деле неформальная американская разговорная лексика в своих словах «типа» стала даже более «фетишизированной» и вежливой, чем ранее. Чем раньше мы это поймем, тем скорее люди, применяющие в своей речи слово «типа», перейдут в обычную лексическую группу, и в мире все опять устаканится.

Применение словесной конструкции «чисто конкретно» имеет под собой ту же лексическую основу. Выражение «Он чисто конкретно собирается тебе звонить» не означает, что «он совершенно точно тебе позвонит», а имеет другой, конкретный смысл, привязываемый шлалрящим к его вербальной форме подсознательно, что собственно, во многих случаях и является лексической функцией подсознания. Это выражение подразумевает, что кто-то усомнился в возможности этого события или то, что шансы на его реализацию, кажущиеся на первый взгляд незначительными, на самом деле значительно выше. Так же, как и слово «типа», выражение «чисто конкретно» вербализует мнение других и в этом смысле является совершенно цивилизованным.

Лексически, под внешней нецивилизованностью кроется тенденция в духе классического труда Дейла Карнеги «Как приобрести друзей и завоевать собеседника». Эта тенденция  - осознанное желание людей, которое обычно называется «лексическим лекарством от языковых прыщей юности».

Например, знаменитое сокращение «lol» в текстовых сообщениях, которое буквально означает «надорвать живот от смеха - НДЖ», однако в настоящее время выполняет ту же функцию, что и тихое похохатыввание или хихиканье. В совместном с моей студенткой Лаурой Милмед исследовании мы установили, что эта аббревиатура создает «зону комфорта» привлекая наше внимание к ничем иначе не примечательным заявлениям. 

«Я занимаюсь уже три часа НДЖ» - никто такое заявление грубым хохотом не сопроводит, а визуализированное таким образом хихиканье канализирует совершенно определенное чувство тянущего лямку мытаря, которым отправитель хочет поделиться с получателем, также вовлеченным в процесс обучения. Это делает текстовое сообщение более вербализованным и превращает его в визуализированный тип словесного общения. 

В этом смысле выражение «Because X - потому что потому», ставшее «выражением 2013 года» по версии Американского диалектического общества, принадлежит к тому же смысловому ряду. Как недавно выразился один блоггер «Правило пяти секунд» может действительно существовать, потому что наука». Данное выражение имеет особое значение, подразумевающее осторожность в отношении научного обоснования фактов, которые (как предполагается) понимают все. В данном сдучае это сводится к тому, безопасно ли есть поднятую с полу еду. Мы оцениваем взгляды других и при этом выходим за пределы своего собственного «я». И поэтому «потому что потому» - еще один способ обозначить «прописную истину»..

Широкое распространение ненормативной лексики, казалось, также свидетельствует против лучезарных переспектив языка. Однако, что такое на самом деле «ненормативная лексика»? В современном американском английском слова «из четырех букв» (которое обычно связывают с ненормативной лексикой), является не более чем лексической «приправой». Еще в двадцатых годах прошлого столетия  более вызывающее слово обозначающее экскременты, редко появлялось в печати, а теперь его использование возросло стократно. Частота использования выражений «Damn - бляха муха» и «Hell - пошел к черту» в печати высока как никогда. Однако, ни один из антропологов, изучающих современное общество, не назовет эти широко циркулирующие выражения «ненормативной лексикой». 

В то же время слова, которые мы считаем в настоящее время действительно «табуированными» и которые мы наделяем почти мистической греховностью, являются в подавляющем большинстве случаев эпитетатми, направленными против определенных групп людей.

Давно ушли в прошлое дни, когда наши основные лексические табу относились исключительно к религиозным темам – например, абревиатура «Egad» (сокращенное от “Ye Gods”- Боже правый) или обозначение половых признаков и частей тела, когда американцы стали говорить «темное» и «белое» мясо для того чтобы избежать слов «грудь» и «конечности».

И наоборот, в современном языке применение в грубом смысле слова «негр» или слова, начинающегося с буквы «П», что обозначает гомосексуальных мужчин, а также пятибуквенное слово, обозначающее половой орган женщины, считаются выходящими далеко за пределы нормативной лексики даже во время неформального общения, что поразит путешественника по времени, отправившегося к нам из пятидесятилетнего далека.

Краеугольным камнем образования является содействие повышению уровня информированности и, в частности, в отношении всего спектра различных взглядов. Языковые изменения свидетельствуют о том, что общество в целом стало более толерантно к такого роду социальной диверсификации. Расширяющиееся и все более диверсифицированная осведомленность американцев, вероятно, привлечет больше внимания к определенным вопросам языковой цивилизованности. Культура текстовых сообщений буквально требует введения в письменный язык графических замещений для письменных обозначений эмоционального интонационного фона, являющихся декорациями и нюансами устной речи. Революция в области гражданских прав вряд ли создала рай на земле, однако ее влияние на то, что мы называем нормативной лексикой, оказалось действительно революционной.

Мы, может быть, не общаемся друг с другом на языке учтивостей героев британского сериала «Даунтонское аббатство», однако по сути наш язык во многих отношениях стал более цивилизованным, чем ранее.

Нас учат принципу, на основании которого языки инуитов устанавливают уникальную связь между образом и словом «снег», а русский язык имеет отдельные обозначения для бледносинего (голубой) и темносинего (фиолетовый) цветов, в силу чего носители русского языка гораздо более графически, чем большинство из нас, представляют себе цветовую разницу между ягодами голубики и яйцами малиновки. И разве не здорово, когда старомодный американский английский выдает иногда какую-нибудь лексическую «крутизну»?       

Перевод с английского Бориса Аронштейна

Джеймс Кейтс

ССЫЛКА

Давно, задолго до его конца, его прошенье снова отклонили.

Да, впрочем, он на это и не обратил вниманья.

Он растерял все корни слова "дом": - "Что должно называть им?

Не землю ль, принявшую прах моих отцов? - она меня

отвергла. Другая ж, давшая приют, взяла меня, как приз -

подобье рыб летучих, пускающих своим уменьем

пыль в глаза, - в терпимости, в дешевом плюрализме...

Пожалуйста, молчи о доме том - мне это веки жжет".

И с обожженным взором уронил он голову в колени.

Он жил везде, на дюжине заморских языков

он пел, едва ли не глотая желчь свою. Еще сейчас

кишки его, и легкие, и сердце - все вниз до Лангернганса островков

оборвалось и плавает бесцельно в океане острой боли.

Все нити порваны. Навек. И кони,

оборвавшие узду, несутся вскачь. И дрожью кожи

тело ввинчивает в пытку ностальгии...

Он был повенчан снова. С молодой женой

из дома, неподсудного словам, с душой загадочной,

его боготворившей, как Отелло, за его рассказы

и льнувшей к волосам его. Но демон

ложа разбросал его безжалостно по миру.

Он задирал учеников своих и презирал коллег,

хоть все еще имел друзей. Его настольной книгой стали каталоги,

и с той поры его любое мненье дважды поверялось...

В отеле умер он, в том городе, что ненавистью был его отмечен,

в стране, что так и не сдалась его произношенью...

Вздымают памятники там, где мог бы, вероятно, он на свет явиться -

трибун великий всех однажды побежденных.

Перевод Бориса Аронштейна 

 

Джеймс Кейтс

ССЫЛКА

Ну, прежде чем он умер, указ был отменен.

Но в конце концов, это не имело никакого значения для него.

"Домой!" он рычал, "Где я должен позвонить домой?

Земля мои родители погребены в - что исключили

мне? Земля, который приземлился мне как приз

хлопая рыбу, чтобы показать свои знания

в политической толерантности и гуманитарных наук?

Не говорить о доме, пожалуйста, это больно глазам ".

Его глаза больно. Он зарылся головой в руках

и полетел везде и пел в десятках языках

чтобы не глотать желчь. Тем не менее, его легкие,

сердце, кишки - до островов Лангерганса

отдельно и поплыл бесплатно в бесконечной боли.

Ничего связано ни с чем. Лошади

набросился на его конечностях поскакал в разных направлениях. Его торс

лежала в его озноб кожу на стойке ностальгическим в.

Он снова женился. На этот раз, более молодой женщиной

из безупречной семьи и личной тайны

кто поклонялся ему, как Отелло для его рассказов

и любил его за редкими волосами. Его демон

разбросала на подушках по всему миру.

Он hectored* своих учеников. Scorned* свои естественные коллег.

Хранится в контакте со своими друзьями. Читать только каталоги.

Его мнения становились все более двуствольное.

Он умер в гостиничном номере в городе он ненавидел

в состоянии, чье имя он никогда не научился произносить.

Где он родился, они подняли ему памятники

отличный представитель некогда победил.

Перевод Google Translate