наш блог

На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом

На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 1

    Наводимо основні аспекти під час роботи з машинним перекладом, які корисно врахувати, щоб його використання принесло задовільний результат.

    • Пропуски та вигадки (omissions & additions). Деякі частини вихідного тексту МП може просто викинути, а може нафантазувати такого, чого в оригіналі й не було. Цієї хиби припускаються й люди, але з інших причин. Технічні перекладачі, які працюють у «кішках» (CAT tools), найчастіше роблять такі помилки, коли поспішають і бездумно підтверджують неточні збіги (fuzzy matches), сприймаючи їх за 100%-ві (100% matches).
    • Термінологія. Той самий термін МП може перекласти по-різному навіть у межах одного речення. Screw у вас в одному місці буде гвинт, у другому шуруп, у третьому болт. Для технічного перекладача це катастрофа. Її намагаються позбутися шляхом «тренування» МП-модулів — створення так званого trained МП engine. Але для цього потрібні великі за обсягом напрацювання в конкретній термінологічній галузі — щонайменше 500 тисяч сегментів, перекладених людиною. Далеко не завжди вони взагалі існують.
    • Рід і стать. Це та сфера, де МП-служби надзвичайно неполіткоректні. Звертатиметься МП то на ти, то на ви. Про жінку з попереднього речення він у наступному запросто може казати пан, сер, пішов, приїхав. Якщо ви користуєтеся машинним перекладом, слідкуйте за тим, щоб ваша дійова особа, зокрема й нежива, тишком-нишком не змінила свою стать («Олег підняв годинник. Вона була прекрасна.»). Особливої уваги потребують особові займенники (він, вона, його, її тощо) та інші частини мови, які мають морфологічні ознаки роду.
    • Короткі речення. У них багато хиб, оскільки МП бракує контексту. Переклад в умовах відсутності контексту — це й для людей проблема.
    • Регістр букв і знаки пунктуації. Іноді результат машинного перекладу змінюється, лише якщо змінити регістр першої літери речення, додати або забрати крапку тощо. Більшість МП-служб цю ваду успішно подолали, але вона не щезла.
    • Погіршення якості, якщо ні вихідна, ні цільова мова не є англійською. Англійська — мова міжнародного спілкування і, найчастіше, рідна мова розробників МП-служб. Англійські датасети, на яких вони тренують нейронні МП-мережі (NMT), найбільші за обсягом. Для рідкісної мовної пари, як-от угорська — суахілі, просто не знайдеться датасету достатнього обсягу, на якому можна було б натренувати нейронну МП-мережу. Тому машинний переклад у таких мовних парах часто відбувається через посередництво англійської: угорська → англійська, потім англійська → суахілі. Тобто здійснюється подвійний машинний переклад, і кількість усіх описаних вище вад подвоюється. З цим недоліком теж намагаються боротися.
    • Гумор, гра слів, алюзії, натяки, алегорії. Для машинного перекладу це поки що terra іncognіta: він їх просто не бачить і перекладає в лоб. З почуттям гумору та кмітливістю в МП погано.
    • Теги (variables і placeholders). МТ сприймає теги як якісь дивні елементи посеред тексту і найчастіше просто викидає їх. Він не розуміє, яке слово підставлятиметься замість тега, тому не враховує відмінки, однину/множину тощо.

     

    Цей допис у нашому телеграм-каналі.

    Рекомендований контент

    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 2

    Правопис складених підрядних сполучників

    Поради щодо граматики й стилістики Перелічені нижче словопотяги офіційно називаються складені підрядні сполучники. Якщо у вашому тексті отаке страховисько опинилося на початку речення або звороту — після тире, дужки тощо, — то, найімовірніше, але не завжди, кома в ньому не пишеться (кому цікаво чому: див. Український правопис, § 158, ч. II, п. 3, прим. 8, це на стор. 225). Але якщо ви небайдужі […]
    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 3

    Звідки з’являтимуться досвідчені перекладачі, якщо недосвідчених на ринку меншає

    Абстрактні напівфілософські міркування Машинний переклад потроху витискає з ринку тих перекладачів, які не можуть наздогнати його за якістю, — тобто не дуже досвідчених. Унаслідок цього співвідношення досвідчених і недосвідчених теоретично має поступово змінюватися на користь перших. Здавалося б, це привід для радощів. Але досвідчений перекладач — це, власне кажучи, недосвідчений, який набрався досвіду. Постає питання: з кого […]
    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 4

    Як писати про об’єкти, названі на честь когось

    Коротко про те, як писати про об’єкти, названі на честь когось Короткий спойлер для тих, кому ліньки читати все: * * * Тепер докладніше з прикладами. Власне ім’я пишемо в родовому відмінку (кого? чого?): Власне ім’я може містити дефіс: Якщо об’єкт названо на честь кількох людей, перераховуємо їх усіх через тире з пробілами (а не через дефіс і не через кому!):  Це […]
    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 5

    Знаки питання й оклику в іспанській мові

    Про знаки пунктуації в іспанській мові Знаки питання й оклику в іспанській мові використовуються не так, як в українській. Ми ставимо ? або ! тільки в кінці речення. Якщо речення довге, буває, читаєш-читаєш його з розповідною інтонацією, і раптом у самому кінці з’ясовується, що воно питальне. В іспанській такого немає: у ній спеціальним знаком — перевернутим […]
    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 6

    Як усунути помилку «Failed to save target content Cannot find central directory» в Trados Studio

    Про способи усунення помилки в Trados Studio Під час спроби згенерувати перекладений документ у Trados Studio (тобто зробити «клін») іноді виникає така помилка: Failed to save target content: Cannot find central directory. Виникає вона через те, що дані вихідного файлу, з якого було створено перекладений вами SDLXLIFF-файлу і який зберігається в ньому, якимось чином було пошкоджено, і через це Trados Studio […]