Машинного перекладу не існує

наш блог

19.11.2019

Технології машинного перекладу розвиваються семимильними кроками. Вони все далі проникають у життя людей, ніяк не пов’язаних із перекладацьким бізнесом, що тут казати про професійних перекладачів.

Завдяки цим технологіям звичайний турист може легко порозумітися з жителями дивовижних країн, на вивчення мови яких йому б довелося витратити половину життя. Щоб прочитати об’яву, написану, наприклад, кхмерською мовою, достатньо навести на неї камеру смартфона — і через секунду отримати її переклад. Skype уміє розпізнавати ваш голос і автоматично перекладати ваші слова іншою мовою в режимі реального часу. Майбутнє вже настало, воно навіть не за вікном — воно прямо у ваших руках.

Дивлячись на весь цей технотріумф, дивуєшся: чим узагалі займаються перекладачі й за що їм платять, якщо машина вже навчилася миттєво перекладати й текст, і голос, і написи майже з будь-якої мови на будь-яку іншу?

Жорстокий силогізм

Зробимо два сильних твердження.

Перше: переклад — це передавання змісту.

Друге: машини не вміють оперувати змістом.

З першим твердженням зазвичай ніхто не сперечається; друге, навпаки, породжує бурхливі дискусії. Детальне його обговорення здатне завести нас у нетрі навколофілософських роздумів про те, що таке зміст, що значить мислити тощо. Однак важко сперечатися з тим, що сучасні комп’ютери, принаймні на теперішньому етапі їх розвитку, не видобувають із тексту зміст у людському розумінні цього слова.

З цих двох тверджень неминуче випливає неочікуваний висновок: те, що створює машина, апріорі не є перекладом.

Не тільки «звичайного» туриста, а й багатьох лінгвістів цей висновок часто приголомшує. Чому це машина не може виконувати переклад? Адже мій смартфон уже читав мені об’яви, написані іншою мовою, а мені вже доводилося перекладати тексти з абсолютно незнайомої мови за допомогою Google Translate. Це дійсно працює!

Розберемось у визначеннях.

Невдалі терміни

У науці, техніці й інших сферах людської діяльності є багато невдалих термінів, які, на жаль, прижилися. Їх «терплять» і далі застосовують не тому, що вони відображають суть, а тому, що всі до них звикли, так історично склалося.

Наприклад, «наднова зірка» — невдалий термін. Спалах наднової — це не народження нової зірки, як більшість вважає, а навпаки — передсмертна агонія старої зірки, що помирає. Нам, людям, з відстані в тисячі світлових років здається, що на небі запалилася нова зірка, проте насправді десь безмежно далеко загинула зірка, яка світила мільйони років. До речі, і «світловий рік» — теж невдалий термін. Чуючи слово «рік», необізнані люди сприймають його як одиницю виміру часу, тоді як у світлових роках вимірюються величезні астрономічні відстані.

«Машинний переклад» — ще один приклад вкрай невдалого терміна. Машинний переклад — це оксиморон. Переклад машинним бути не може. Якщо його виконала машина — це не переклад, а якщо його виконала людина — він не машинний.

Зараз важко встановити, хто саме ввів у мову термін «машинний переклад». Судячи з усього, ця людина була далека від лінгвістики або просто не потурбувалася про те, щоб придумати точніший термін. І цим вона породила страшну термінологічну плутанину: перекладом (тим, який є передаванням змісту) почали називати бездумне підставляння слів однієї мови замість слів іншої — лише через те, що зовні результати цих двох процесів схожі.

Так машинний переклад почали сприймати як один із різновидів перекладу. Різниця велика, проте в очах обивателів присутність слова «переклад» в обох термінах її нівелює.

Переклад — це французьке вино, а машинний переклад — спроба відтворити його формулу в хімічній лабораторії. Це сурогат. Виглядає так само, має схожий смак, проте все одно не те. Ви ж не називатимете цей синтетичний продукт французьким вином. Проте синтетичний продукт, створений машиною як наслідування перекладу, ми чомусь називаємо перекладом.

Якби процес заміни одних слів іншими називали інакше, не вживаючи слова «переклад», термінологічної плутанини й багатьох пов’язаних із нею непорозумінь не виникло б. Можна було б назвати його, наприклад, транспідставляння, автоконвертація — будь-як, головне, щоб у ньому не було слова «переклад».

Проте невдалий термін «машинний переклад», на жаль, прижився.

Машини й тест Тюрінга

Тут можуть заперечити: як же так? Адже машинний переклад майже не відрізняється від «людського». Звісно, є недоліки, але ж він зрозумілий, а недоліки є й у людей!

Так, це правильно — схожість вражаюча. Проаналізувавши мільйони речень, перекладених людиною (це важливо), машина сама виводить дуже складні й не завжди зрозумілі залежності між реченнями в різних мовах. Згодом, застосовуючи їх, вона породжує тексти, за якими вже важко зрозуміти, хто їх створив, людина чи машина. Тобто вона успішно складає тест Тюрінга.

Однак суті це не змінює: машинний переклад беззмістовний — у тому розумінні, що машина, яка його створює, не вдумується в те, що вона створює. Вона здатна знайти слова, які часто зустрічаються, установити, як вони синтаксично пов’язані, визначити структуру речень. Проте на відміну від людини, вона не здатна видобувати з усього цього зміст.

Машини вміють оперувати даними й виявляти зв’язки між ними. Вони роблять це набагато краще й швидше людини — їх для того й створювали. Кількість даних може бути величезною, і тоді їх називають великими. Закономірності зв’язків між ними іноді виявляються неочікуваними й цікавими. Причому що більше даних, то складніші залежності, які виявляються між ними, і то більше машинний переклад схожий на «людський». У таких випадках кажуть: «модуль машинного перекладу натренований». Однак натренувати не означає надати змісту.

Для машини текст, який у неї вводять, — це просто послідовність знаків і нічого більше. Для неї однаково беззмістовні й «Гамлет» Шекспіра, і маячня хворого на шизофазію, і lorem ipsum, і навіть випадковий набір букв, які набрав ваш кіт, походивши по клавіатурі.

Машина з однаковою ретельністю «перекладе» й «Гамлета», і будь-яку абракадабру. Оскільки вона ні з того, ні з іншого не видобуває змісту, для неї це однаково цінні (точніше, навпаки — однаково беззмістовні) послідовності знаків. І в їх «переклад» вона вкладе рівну кількість змісту — нуль. Для неї беззмістовні не лише вихідні тексти, а й тексти, створені нею самою, якими б осмисленими вони не здавалися людині.

Машини й качиний тест

Існує так званий «качиний тест», який дає змогу визначити сутність явищ за їх зовнішніми проявами. Формулюється він так:

Якщо щось виглядає, як качка, плаває, яка качка, і крякає, як качка, то, імовірно, це і є качка.

На перший погляд, слідом за тестом Тюрінга машинний переклад з успіхом складає й качиний тест. Адже він виглядає, як переклад, читається, як переклад, чується, як переклад — здавалося б, є всі підстави вважати, що це і є переклад.

Проте диявол у деталях. Добре проходити качиний тест в ідеальних умовах — коли розглядаєш об’єкт при денному освітленні, з невеликої відстані й у спокійних умовах. А якщо ця «качка» пливе далеко, на іншій стороні річки? А якщо у вас міопія? А якщо вже сутінки або йде дощ? А якщо ви керуєте автомобілем і встигли лише мигцем поглянути на неї?

Придивишся уважніше — і виявляється, що це не качка, а гуска, чи видра, чи відображення у воді хмари дивної форми. І все — качиний тест завалено. Не дарма його автор завбачливо залишив собі лазівку та включив у його формулювання слово «імовірно».

Те саме й із машинним перекладом. На перший погляд, усе добре, слова синтаксично пов’язані, текст читабельний. Проте варто вчитатись уважніше — і картковий будиночок руйнується: той самий термін у різних місцях перекладено по-різному, тут машина не змогла розшифрувати абревіатуру, тут не зрозуміла жарт, тут «забула», якої статі дійова особа, тут узагалі з удаваною наївністю написала безладний набір слів тощо.

У кожній мові є характерні ознаки машинного перекладу. Їх іноді складно сформулювати, проте досвідчені перекладачі відразу визначають, який текст створений людиною, а який машиною. Їх не обдуриш.

Віддамо належне машинам: вони навчилися досить точно імітувати «людський» переклад, так що іноді дуже важко розрізнити їх. Це надихає туристів і засмучує перекладачів. Проте це не переклад, а його імітація. Вам здалося.

Машини в пошуках змісту

Як бачимо, розмежувальною лінією між людиною й машиною є зміст. Виникає питання: чого потребує машина для того, щоб оволодіти змістом? Чого їй не вистачає, щоб вивести машинний переклад на рівень людського?

Розглянемо як приклад того ж «Гамлета». Це нетиповий текст, проте він дає змогу найточніше показати різницю між людьми й машинами.

Навіть люди часом насилу сприймають цей твір. Він вважається класичним, діти вивчають його в школах. Проте він погано сприймається в підлітковому віці.

Зрозуміти, який зміст вкладав у свій витвір Шекспір, може тільки підготовлений читач. Він уже заздалегідь має знати, що таке кохання, дружба, зрада, іронія, помста. Аби зрозуміти мотиви поведінки героїв, потрібно самому хоч раз пережити ті почуття, які їх огортають. Потрібно, як кажуть, «пожити на світі». Тому «Гамлета» зазвичай починають цінувати в зрілому віці, уже маючи за плечима деякий життєвий досвід.

І без того непросте завдання перекласти такий багатогранний твір іншою мовою додатково ускладнюється тим, що події розгортаються в далекі від нас Середні віки, а текст викладено віршованою формою. Недивно, що кількість його різних перекладів величезна. Одних тільки українських перекладів «Гамлета» існує більше 10.

Висновок: щоб зрозуміти, який зміст вкладав у свій твір автор, потрібно розбиратися в людській природі. Узагалі, для цього потрібно мати у своїй голові (у випадку комп’ютера — у процесорі) модель усього світу. Ось за що платять перекладачам — за зміст. Це недешева річ.

Щоб оволодіти змістом, машині не вистачає здатності бути людиною. Образливий факт для машини. Проте вона не ображається — їй невідомий зміст слова «образа».

Неправильні висновки

У заключній частині кожної статті ми зазвичай формулюємо «правильні» висновки, до яких дійшли. Ця стаття незвичайна: у ній будуть «неправильні» висновки. Ми перерахуємо те, що не випливає з написаного вище.

Справжній перекладач ніколи не користуватиметься машинним перекладом. Це занадто категоричне твердження. Застосовувати машинний переклад у перекладі не означає покрити себе ганьбою. Використовувати його цілком можливо. Наприклад, «натренований» машинний переклад значно прискорює роботу під час перекладу однотипних технічних текстів. Проте застосовуючи його, важливо чітко усвідомлювати: автор тексту, над яким ви працюєте, у його зміст не вдумувався.
Машинний переклад не приносить користі. Це не зовсім так. Він не приносить користі, якщо застосовувати його для рішення завдань, на які він не розрахований. Він не впорається з «Гамлетом», занадто висока в ньому концентрація змісту. Настільки висока, що навіть люди перекладають його знову й знову, проте досі не існує перекладу, який би влаштовував усіх. Однак є завдання, які машинний переклад вирішує успішно (ми їх уже обговорювали), і для їх рішення він дуже корисний.
Машини ніколи не навчаться оперувати змістом. Ми цього не знаємо. У будь-якому випадку, це з вищеописаного не випливає. Цілком можливо, що в один прекрасний день ваш розумний холодильник почне писати вірші або забажає обговорити з вами сенс свого існування. Можливо також, що розвиток машин піде іншим шляхом і в майбутньому нас із вами чекає техноапокаліпсис у стилі «Матриці».

Одне можна сказати напевно: коли машини навчаться оперувати змістом, перекладачі дійсно перестануть бути потрібними. Проте коли це станеться та чи станеться взагалі — передбачити неможливо.

Етичні обмеження українських бюро перекладів

З початком повномасштабної війни Росії проти України перекладацька галузь України зіткнулася з новими етичними обмеженнями й дилемами, з якими доводиться мати справу ледь не щодня. Категоричне «ні» замовленням від російського уряду та бізнесу Причина такого підходу очевидна. Аморально виконувати роботу для тих, хто бере участь у спробі нас знищити. Крім того, згідно з українським законодавством, […]

Стаття

Найбільші бюро перекладу України

Принаймні половина більш-менш відомих українських перекладацьких агенцій зазначає на своїх сайтах і сторінках у соцмережах, що вони «лідери», «найбільші» або «найперші». Найчастіше це лише маркетинговий хід, а реальність написаному не відповідає. Спробуймо знайти об’єктивну інформацію. Міжнародні рейтинги Найавторитетніші організації, які займаються дослідженням ринку перекладів на міжнародному рівні, — Slator, Nimdzi та CSA Research. Пошукаймо в їхніх […]

Стаття

Що бісить перекладача

Пересічним людям здається, що в професії перекладача немає нічого особливого, але водночас мало хто з них знає, як насправді працює перекладач, якими навичками він має володіти, які професійні інструменти він використовує і якими нормами він керується у своїй роботі. Ми постійно потрапляємо в ситуації, які в сторонніх людей викликають нерозуміння, а в нас, перекладачів, — утомлену посмішку. Нижче опишемо деякі з них. «Моя донька […]

Стаття

Поради кандидатам на вакансію «Технічний перекладач»

У цій статті ви дізнаєтеся про загальні принципи відбору кандидатів на вакансію технічного перекладача. Ми розглянемо поширені хибні думки багатьох кандидатів і типові недоліки більшості тестових перекладів. Ця стаття призначена для тих, хто робить перші професійні кроки, а також тих, хто хоче знайти відповідь на запитання, чому потенційний роботодавець відхилив їх кандидатуру. Можливо, для багатьох […]

Стаття

Недомовки й еківоки у сфері перекладу

Перекладач — складна професія, хоча «цивільні» її такою не вважають. Але крім технічних труднощів, у перекладацьких проєктах часто виникають проблеми суто людські — невиправдані очікування, непорозуміння, недомовки. У кожному бюро відбувається безліч історій — і смішних, і сумних. Зазвичай їх розповідають під час неформального спілкування, не називаючи конкретних імен; чимало з них стають легендами. Трапляються вони й у нас. Деякі історії, серед дієвих осіб яких ми опинилися, — готовий […]

Стаття