наш блог

Машинного перекладу не існує 

Машинного перекладу не існує  - 1

Технології машинного перекладу розвиваються семимильними кроками. Вони все далі проникають у життя людей, ніяк не пов’язаних із перекладацьким бізнесом, що тут казати про професійних перекладачів.

Завдяки цим технологіям звичайний турист може легко порозумітися з жителями дивовижних країн, на вивчення мови яких йому б довелося витратити половину життя. Щоб прочитати об’яву, написану, наприклад, кхмерською мовою, достатньо навести на неї камеру смартфона — і через секунду отримати її переклад. Skype уміє розпізнавати ваш голос і автоматично перекладати ваші слова іншою мовою в режимі реального часу. Майбутнє вже настало, воно навіть не за вікном — воно прямо у ваших руках.

Дивлячись на весь цей технотріумф, дивуєшся: чим узагалі займаються перекладачі й за що їм платять, якщо машина вже навчилася миттєво перекладати й текст, і голос, і написи майже з будь-якої мови на будь-яку іншу?

Жорстокий силогізм

Зробимо два сильних твердження.

Перше: переклад — це передавання змісту.

Друге: машини не вміють оперувати змістом.

З першим твердженням зазвичай ніхто не сперечається; друге, навпаки, породжує бурхливі дискусії. Детальне його обговорення здатне завести нас у нетрі навколофілософських роздумів про те, що таке зміст, що значить мислити тощо. Однак важко сперечатися з тим, що сучасні комп’ютери, принаймні на теперішньому етапі їх розвитку, не видобувають із тексту зміст у людському розумінні цього слова.

З цих двох тверджень неминуче випливає неочікуваний висновок: те, що створює машина, апріорі не є перекладом.

Не тільки «звичайного» туриста, а й багатьох лінгвістів цей висновок часто приголомшує. Чому це машина не може виконувати переклад? Адже мій смартфон уже читав мені об’яви, написані іншою мовою, а мені вже доводилося перекладати тексти з абсолютно незнайомої мови за допомогою Google Translate. Це дійсно працює!

Розберемось у визначеннях.

Невдалі терміни

У науці, техніці й інших сферах людської діяльності є багато невдалих термінів, які, на жаль, прижилися. Їх «терплять» і далі застосовують не тому, що вони відображають суть, а тому, що всі до них звикли, так історично склалося.

Наприклад, «наднова зірка» — невдалий термін. Спалах наднової — це не народження нової зірки, як більшість вважає, а навпаки — передсмертна агонія старої зірки, що помирає. Нам, людям, з відстані в тисячі світлових років здається, що на небі запалилася нова зірка, проте насправді десь безмежно далеко загинула зірка, яка світила мільйони років. До речі, і «світловий рік» — теж невдалий термін. Чуючи слово «рік», необізнані люди сприймають його як одиницю виміру часу, тоді як у світлових роках вимірюються величезні астрономічні відстані.

«Машинний переклад» — ще один приклад вкрай невдалого терміна. Машинний переклад — це оксиморон. Переклад машинним бути не може. Якщо його виконала машина — це не переклад, а якщо його виконала людина — він не машинний.

Зараз важко встановити, хто саме ввів у мову термін «машинний переклад». Судячи з усього, ця людина була далека від лінгвістики або просто не потурбувалася про те, щоб придумати точніший термін. І цим вона породила страшну термінологічну плутанину: перекладом (тим, який є передаванням змісту) почали називати бездумне підставляння слів однієї мови замість слів іншої — лише через те, що зовні результати цих двох процесів схожі.

Так машинний переклад почали сприймати як один із різновидів перекладу. Різниця велика, проте в очах обивателів присутність слова «переклад» в обох термінах її нівелює.

Переклад — це французьке вино, а машинний переклад — спроба відтворити його формулу в хімічній лабораторії. Це сурогат. Виглядає так само, має схожий смак, проте все одно не те. Ви ж не називатимете цей синтетичний продукт французьким вином. Проте синтетичний продукт, створений машиною як наслідування перекладу, ми чомусь називаємо перекладом.

Якби процес заміни одних слів іншими називали інакше, не вживаючи слова «переклад», термінологічної плутанини й багатьох пов’язаних із нею непорозумінь не виникло б. Можна було б назвати його, наприклад, транспідставляння, автоконвертація — будь-як, головне, щоб у ньому не було слова «переклад».

Проте невдалий термін «машинний переклад», на жаль, прижився.

Машини й тест Тюрінга

Тут можуть заперечити: як же так? Адже машинний переклад майже не відрізняється від «людського». Звісно, є недоліки, але ж він зрозумілий, а недоліки є й у людей!

Так, це правильно — схожість вражаюча. Проаналізувавши мільйони речень, перекладених людиною (це важливо), машина сама виводить дуже складні й не завжди зрозумілі залежності між реченнями в різних мовах. Згодом, застосовуючи їх, вона породжує тексти, за якими вже важко зрозуміти, хто їх створив, людина чи машина. Тобто вона успішно складає тест Тюрінга.

Однак суті це не змінює: машинний переклад беззмістовний — у тому розумінні, що машина, яка його створює, не вдумується в те, що вона створює. Вона здатна знайти слова, які часто зустрічаються, установити, як вони синтаксично пов’язані, визначити структуру речень. Проте на відміну від людини, вона не здатна видобувати з усього цього зміст.

Машини вміють оперувати даними й виявляти зв’язки між ними. Вони роблять це набагато краще й швидше людини — їх для того й створювали. Кількість даних може бути величезною, і тоді їх називають великими. Закономірності зв’язків між ними іноді виявляються неочікуваними й цікавими. Причому що більше даних, то складніші залежності, які виявляються між ними, і то більше машинний переклад схожий на «людський». У таких випадках кажуть: «модуль машинного перекладу натренований». Однак натренувати не означає надати змісту.

Для машини текст, який у неї вводять, — це просто послідовність знаків і нічого більше. Для неї однаково беззмістовні й «Гамлет» Шекспіра, і маячня хворого на шизофазію, і lorem ipsum, і навіть випадковий набір букв, які набрав ваш кіт, походивши по клавіатурі.

Машина з однаковою ретельністю «перекладе» й «Гамлета», і будь-яку абракадабру. Оскільки вона ні з того, ні з іншого не видобуває змісту, для неї це однаково цінні (точніше, навпаки — однаково беззмістовні) послідовності знаків. І в їх «переклад» вона вкладе рівну кількість змісту — нуль. Для неї беззмістовні не лише вихідні тексти, а й тексти, створені нею самою, якими б осмисленими вони не здавалися людині.

Машини й качиний тест

Існує так званий «качиний тест», який дає змогу визначити сутність явищ за їх зовнішніми проявами. Формулюється він так:

Якщо щось виглядає, як качка, плаває, яка качка, і крякає, як качка, то, імовірно, це і є качка.

На перший погляд, слідом за тестом Тюрінга машинний переклад з успіхом складає й качиний тест. Адже він виглядає, як переклад, читається, як переклад, чується, як переклад — здавалося б, є всі підстави вважати, що це і є переклад.

Проте диявол у деталях. Добре проходити качиний тест в ідеальних умовах — коли розглядаєш об’єкт при денному освітленні, з невеликої відстані й у спокійних умовах. А якщо ця «качка» пливе далеко, на іншій стороні річки? А якщо у вас міопія? А якщо вже сутінки або йде дощ? А якщо ви керуєте автомобілем і встигли лише мигцем поглянути на неї?

Придивишся уважніше — і виявляється, що це не качка, а гуска, чи видра, чи відображення у воді хмари дивної форми. І все — качиний тест завалено. Не дарма його автор завбачливо залишив собі лазівку та включив у його формулювання слово «імовірно».

Те саме й із машинним перекладом. На перший погляд, усе добре, слова синтаксично пов’язані, текст читабельний. Проте варто вчитатись уважніше — і картковий будиночок руйнується: той самий термін у різних місцях перекладено по-різному, тут машина не змогла розшифрувати абревіатуру, тут не зрозуміла жарт, тут «забула», якої статі дійова особа, тут узагалі з удаваною наївністю написала безладний набір слів тощо.

У кожній мові є характерні ознаки машинного перекладу. Їх іноді складно сформулювати, проте досвідчені перекладачі відразу визначають, який текст створений людиною, а який машиною. Їх не обдуриш.

Віддамо належне машинам: вони навчилися досить точно імітувати «людський» переклад, так що іноді дуже важко розрізнити їх. Це надихає туристів і засмучує перекладачів. Проте це не переклад, а його імітація. Вам здалося.

Машини в пошуках змісту

Як бачимо, розмежувальною лінією між людиною й машиною є зміст. Виникає питання: чого потребує машина для того, щоб оволодіти змістом? Чого їй не вистачає, щоб вивести машинний переклад на рівень людського?

Розглянемо як приклад того ж «Гамлета». Це нетиповий текст, проте він дає змогу найточніше показати різницю між людьми й машинами.

Навіть люди часом насилу сприймають цей твір. Він вважається класичним, діти вивчають його в школах. Проте він погано сприймається в підлітковому віці.

Зрозуміти, який зміст вкладав у свій витвір Шекспір, може тільки підготовлений читач. Він уже заздалегідь має знати, що таке кохання, дружба, зрада, іронія, помста. Аби зрозуміти мотиви поведінки героїв, потрібно самому хоч раз пережити ті почуття, які їх огортають. Потрібно, як кажуть, «пожити на світі». Тому «Гамлета» зазвичай починають цінувати в зрілому віці, уже маючи за плечима деякий життєвий досвід.

І без того непросте завдання перекласти такий багатогранний твір іншою мовою додатково ускладнюється тим, що події розгортаються в далекі від нас Середні віки, а текст викладено віршованою формою. Недивно, що кількість його різних перекладів величезна. Одних тільки українських перекладів «Гамлета» існує більше 10.

Висновок: щоб зрозуміти, який зміст вкладав у свій твір автор, потрібно розбиратися в людській природі. Узагалі, для цього потрібно мати у своїй голові (у випадку комп’ютера — у процесорі) модель усього світу. Ось за що платять перекладачам — за зміст. Це недешева річ.

Щоб оволодіти змістом, машині не вистачає здатності бути людиною. Образливий факт для машини. Проте вона не ображається — їй невідомий зміст слова «образа».

Неправильні висновки

У заключній частині кожної статті ми зазвичай формулюємо «правильні» висновки, до яких дійшли. Ця стаття незвичайна: у ній будуть «неправильні» висновки. Ми перерахуємо те, що не випливає з написаного вище.

  • Справжній перекладач ніколи не користуватиметься машинним перекладом. Це занадто категоричне твердження. Застосовувати машинний переклад у перекладі не означає покрити себе ганьбою. Використовувати його цілком можливо. Наприклад, «натренований» машинний переклад значно прискорює роботу під час перекладу однотипних технічних текстів. Проте застосовуючи його, важливо чітко усвідомлювати: автор тексту, над яким ви працюєте, у його зміст не вдумувався.
  • Машинний переклад не приносить користі. Це не зовсім так. Він не приносить користі, якщо застосовувати його для рішення завдань, на які він не розрахований. Він не впорається з «Гамлетом», занадто висока в ньому концентрація змісту. Настільки висока, що навіть люди перекладають його знову й знову, проте досі не існує перекладу, який би влаштовував усіх. Однак є завдання, які машинний переклад вирішує успішно (ми їх уже обговорювали), і для їх рішення він дуже корисний.
  • Машини ніколи не навчаться оперувати змістом. Ми цього не знаємо. У будь-якому випадку, це з вищеописаного не випливає. Цілком можливо, що в один прекрасний день ваш розумний холодильник почне писати вірші або забажає обговорити з вами сенс свого існування. Можливо також, що розвиток машин піде іншим шляхом і в майбутньому нас із вами чекає техноапокаліпсис у стилі «Матриці».

Одне можна сказати напевно: коли машини навчаться оперувати змістом, перекладачі дійсно перестануть бути потрібними. Проте коли це станеться та чи станеться взагалі — передбачити неможливо.

Рекомендований контент

Машинного перекладу не існує  - 2

12 типів перекладу

Переклад — це значно більше, ніж просто заміна слів однієї мови на іншу. Його суть полягає в передачі змісту: збереженні наміру, культурного резонансу та комунікативної мети через лінгвістичні бар’єри. Незалежно від того, чи ви — бізнес, що виходить на новий ринок, юридична фірма, що працює з міжнародними контрактами, чи медична організація, яка обслуговує багатомовних пацієнтів, розуміння доступних […]
Машинного перекладу не існує  - 3

Стратегія локалізації: що це таке та як її розробити

Що насправді означає стратегія локалізації Що таке стратегія локалізації? Стратегію локалізації насамперед варто розглядати як бізнес-підхід, орієнтований на стратегічну адаптацію продукту, послуги чи контенту до культурних, мовних, нормативних і ринкових вимог конкретної цільової аудиторії або географічного регіону. Мета локалізації полягає в тому, щоб користувачі сприймали продукт або контент так, ніби вони були створені для цільового […]
Машинного перекладу не існує  - 4

Головні «червоні прапорці» під час вибору постачальника послуг перекладу українською мовою

На перший погляд, вибір партнера з перекладу рідко здається ризикованим рішенням. Чимало організацій вважають: якщо виконавець знає мову, усе інше додасться саме собою. Однак переклад — це набагато більше, ніж просто відтворення слів. Це мистецтво ефективної комунікації, відповідність галузевим стандартам, бездоганна репутація бренду та довіра клієнтів. Помилки стають помітними миттєво, і часто в людей виникає відчуття, […]
Машинного перекладу не існує  - 5

Переклад політик і правових умов і положень: на що слід звернути особливу увагу

Чому правову документацію слід перекладати особливо ретельно Одна помилка в перекладі корпоративної політики може призвести до непорозумінь і потенційних судових спорів. Неточність у перекладі «Умов і положень» може стати причиною невідповідності законодавству й нарахування фінансових штрафів. Помилки в юридичних документах не просто створюють незручності або додаткові витрати на виправлення — вони породжують відповідальність і збитки, що […]
Машинного перекладу не існує  - 6

Робота з множиною, датами та одиницями вимірювання в локалізації UI українською мовою

UI, або інтерфейс користувача, — це ваша перша і найважливіша точка контакту з клієнтами. Його роль у кожній цифровій дії, яку ми виконуємо, справді вирішальна, проте якісний інтерфейс є настільки ж корисним, наскільки він безшовний та непомітний. Локалізуючи інтерфейс свого продукту, важливо зменшити будь-яке «тертя» — моменти, які змушують користувачів дратуватися, плутатися і, як наслідок, йти. Саме […]