наш блог

На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом

На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 1
  • Пропуски та вигадки (omissions & additions). Деякі частини вихідного тексту МП може просто викинути, а може нафантазувати такого, чого в оригіналі й не було. Цієї хиби припускаються й люди, але з інших причин. Технічні перекладачі, які працюють у «кішках» (CAT tools), найчастіше роблять такі помилки, коли поспішають і бездумно підтверджують неточні збіги (fuzzy matches), сприймаючи їх за 100%-ві (100% matches).
  • Термінологія. Той самий термін МП може перекласти по-різному навіть у межах одного речення. Screw у вас в одному місці буде гвинт, у другому шуруп, у третьому болт. Для технічного перекладача це катастрофа. Її намагаються позбутися шляхом «тренування» МП-модулів — створення так званого trained МП engine. Але для цього потрібні великі за обсягом напрацювання в конкретній термінологічній галузі — щонайменше 500 тисяч сегментів, перекладених людиною. Далеко не завжди вони взагалі існують.
  • Рід і стать. Це та сфера, де МП-служби надзвичайно неполіткоректні. Звертатиметься МП то на ти, то на ви. Про жінку з попереднього речення він у наступному запросто може казати пан, сер, пішов, приїхав. Якщо ви користуєтеся машинним перекладом, слідкуйте за тим, щоб ваша дійова особа, зокрема й нежива, тишком-нишком не змінила свою стать («Олег підняв годинник. Вона була прекрасна.»). Особливої уваги потребують особові займенники (він, вона, його, її тощо) та інші частини мови, які мають морфологічні ознаки роду.
  • Короткі речення. У них багато хиб, оскільки МП бракує контексту. Переклад в умовах відсутності контексту — це й для людей проблема.
  • Регістр букв і знаки пунктуації. Іноді результат машинного перекладу змінюється, лише якщо змінити регістр першої літери речення, додати або забрати крапку тощо. Більшість МП-служб цю ваду успішно подолали, але вона не щезла.
  • Погіршення якості, якщо ні вихідна, ні цільова мова не є англійською. Англійська — мова міжнародного спілкування і, найчастіше, рідна мова розробників МП-служб. Англійські датасети, на яких вони тренують нейронні МП-мережі (NMT), найбільші за обсягом. Для рідкісної мовної пари, як-от угорська — суахілі, просто не знайдеться датасету достатнього обсягу, на якому можна було б натренувати нейронну МП-мережу. Тому машинний переклад у таких мовних парах часто відбувається через посередництво англійської: угорська → англійська, потім англійська → суахілі. Тобто здійснюється подвійний машинний переклад, і кількість усіх описаних вище вад подвоюється. З цим недоліком теж намагаються боротися.
  • Гумор, гра слів, алюзії, натяки, алегорії. Для машинного перекладу це поки що terra іncognіta: він їх просто не бачить і перекладає в лоб. З почуттям гумору та кмітливістю в МП погано.
  • Теги (variables і placeholders). МТ сприймає теги як якісь дивні елементи посеред тексту і найчастіше просто викидає їх. Він не розуміє, яке слово підставлятиметься замість тега, тому не враховує відмінки, однину/множину тощо.

 

Цей допис у нашому телеграм-каналі.

Рекомендований контент

На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 2

Як налаштувати поведінку Passolo після натискання клавіші Enter

Програмне забезпечення Passolo (його ще називають SDL Passolo) — це один із найзручніших інструментів для локалізації програмного забезпечення. Проте навіть досвідчені перекладачі не завжди знають, що поведінку клавіші Enter у цьому інструменті можна змінювати. Ця невелика настройка допоможе уникнути автоматичного підтвердження сегментів, зберегти гнучкість під час роботи та оптимізувати процес перекладу у Passolo. Поведінка клавіші Enter […]
На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 3

Клавіатурні команди, які запускають програми у Windows

Багато користувачів Windows навіть не здогадуються, що за допомогою простих клавіатурних команд можна відкривати потрібні програми швидше, ніж мишкою чи через меню Пуск. Якщо ви постійно працюєте з кількома офісними програмами, як-от Word, Excel або Outlook, ці гарячі сполучення клавіш Windows допоможуть заощадити десятки хвилин щодня. Основні клавіатурні команди для запуску програм У Windows 10 і […]
На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 4

Як ввести символ табулятора в таблиці Word

Більшість користувачів Microsoft Word знають, що клавіша Tab створює відступ у тексті. Якщо поставити курсор посеред звичайного абзацу й натиснути Tab, програма вставляє символ табуляції — прихований форматувальний знак, який дає змогу красиво вирівнювати текст. Це одна з базових, але дуже потужних функцій Word, адже вона допомагає робити структуровані списки, оформлювати колонки, надавати тексту табличний вигляд, […]
На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 5

Як перекладати українською англійські скорочення A.D., B.C., BCE і CE

Англійські скорочення A.D. і B.C. A.D. — скорочення від латинського Anno Domini («у літо Господнє»), яке, своєю чергою, є частиною фрази Anno Domini Nostri Iesu Christi («у рік Господа нашого Ісуса Христа»). З’явилося воно в Європі в ранньому середньовіччі. Сама система літочислення «від Різдва Христового» з’явилась у VI столітті; її розробив римський монах Діонісій Малий. B.C. — скорочення від Before Christ (букв. «до [народження] Христа»). […]
На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 6

Як перекладати TXLF-файли Wordfast у Trados Studio

TXLF-файли Wordfast можна перекладати в Trados Studio Якщо у вас немає Wordfast, ви в ньому не працюєте або він просто вам не подобається, ви можете перекладати файли Wordfast у Trados Studio. Trados Studio добре знає, як працювати з файлами різних типів (Word, Excel, HTML і багатьма іншими). Аби навчити Trados Studio працювати з TXLF-файлами Wordfast, потрібно «пояснити» їй, що вони собою являють. TXLF-файл — це насправді звичайний файл стандарту XLIFF зі зміненим розширенням. Тому […]