наш блог

На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом

На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 1

    Наводимо основні аспекти під час роботи з машинним перекладом, які корисно врахувати, щоб його використання принесло задовільний результат.

    • Пропуски та вигадки (omissions & additions). Деякі частини вихідного тексту МП може просто викинути, а може нафантазувати такого, чого в оригіналі й не було. Цієї хиби припускаються й люди, але з інших причин. Технічні перекладачі, які працюють у «кішках» (CAT tools), найчастіше роблять такі помилки, коли поспішають і бездумно підтверджують неточні збіги (fuzzy matches), сприймаючи їх за 100%-ві (100% matches).
    • Термінологія. Той самий термін МП може перекласти по-різному навіть у межах одного речення. Screw у вас в одному місці буде гвинт, у другому шуруп, у третьому болт. Для технічного перекладача це катастрофа. Її намагаються позбутися шляхом «тренування» МП-модулів — створення так званого trained МП engine. Але для цього потрібні великі за обсягом напрацювання в конкретній термінологічній галузі — щонайменше 500 тисяч сегментів, перекладених людиною. Далеко не завжди вони взагалі існують.
    • Рід і стать. Це та сфера, де МП-служби надзвичайно неполіткоректні. Звертатиметься МП то на ти, то на ви. Про жінку з попереднього речення він у наступному запросто може казати пан, сер, пішов, приїхав. Якщо ви користуєтеся машинним перекладом, слідкуйте за тим, щоб ваша дійова особа, зокрема й нежива, тишком-нишком не змінила свою стать («Олег підняв годинник. Вона була прекрасна.»). Особливої уваги потребують особові займенники (він, вона, його, її тощо) та інші частини мови, які мають морфологічні ознаки роду.
    • Короткі речення. У них багато хиб, оскільки МП бракує контексту. Переклад в умовах відсутності контексту — це й для людей проблема.
    • Регістр букв і знаки пунктуації. Іноді результат машинного перекладу змінюється, лише якщо змінити регістр першої літери речення, додати або забрати крапку тощо. Більшість МП-служб цю ваду успішно подолали, але вона не щезла.
    • Погіршення якості, якщо ні вихідна, ні цільова мова не є англійською. Англійська — мова міжнародного спілкування і, найчастіше, рідна мова розробників МП-служб. Англійські датасети, на яких вони тренують нейронні МП-мережі (NMT), найбільші за обсягом. Для рідкісної мовної пари, як-от угорська — суахілі, просто не знайдеться датасету достатнього обсягу, на якому можна було б натренувати нейронну МП-мережу. Тому машинний переклад у таких мовних парах часто відбувається через посередництво англійської: угорська → англійська, потім англійська → суахілі. Тобто здійснюється подвійний машинний переклад, і кількість усіх описаних вище вад подвоюється. З цим недоліком теж намагаються боротися.
    • Гумор, гра слів, алюзії, натяки, алегорії. Для машинного перекладу це поки що terra іncognіta: він їх просто не бачить і перекладає в лоб. З почуттям гумору та кмітливістю в МП погано.
    • Теги (variables і placeholders). МТ сприймає теги як якісь дивні елементи посеред тексту і найчастіше просто викидає їх. Він не розуміє, яке слово підставлятиметься замість тега, тому не враховує відмінки, однину/множину тощо.

     

    Цей допис у нашому телеграм-каналі.

    Рекомендований контент

    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 2

    Як усунути помилку «Failed to open return package» в Trados Studio

    Про ще одну помилку в Trados Studio Якщо під час імпорту пакета Trados Studio пише, що вона Failed to open return package, because it contains a project that does not exist in your setup. це означає, що помилка не в неї, а у вас: ви намагаєтеся імпортувати зворотний пакет для проєкту, якого немає в програмі. […]
    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 3

    Lorem ipsum

    Про умовний беззмістовний текст Lorem ipsum — беззмістовний латинський текст, так звана «риба», за допомогою якого оцінюють, який вигляд матиме макет із текстом, поданим тим чи іншим шрифтом. Зазвичай це роблять дизайнери, але він потрібен також для псевдолокалізації. Широкої популярності цей текст набув завдяки попереднику Adobe InDesign — програмі PageMaker, у якій він використовувався як текст-заповнювач за замовчуванням. Lorem ipsum є […]
    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 4

    Ви продаєте не тільки переклад, а й свої знання

    Трохи роздумів і спогадів Сучасний технічний перекладач (і не тільки технічний, і не тільки перекладач) має бути допитливим. Навіть не має — мусить. Інструменти, у яких він працює сьогодні, через кілька років буде не впізнати. З’являються нові програми та методи, наявні знання застарівають, і перекладача, який нічим, крім тексту, не цікавиться, починають обганяти допитливіші конкуренти. * * * Напівмістична історія сивої давнини від автора. […]
    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 5

    Знак мінуса

    Про ще одну важливу рисочку — знак мінуса Окрім дефіса та двох тире, короткого й довгого, існує ще одна важлива рисочка — знак мінуса. Його постійно ображають і набирають замість нього щось інше. В усіх мовах програмування замість мінуса пишуть дефіс. Його ж вводить клавіша «мінус» на цифровій клавіатурі. У тексті початківці зазвичай замість мінуса пишуть дефіс, люди з певним досвідом — коротке тире, і тільки круті […]
    На що потрібно звертати увагу, якщо ви користуєтеся машинним перекладом - 6

    Експоненційний запис числа

    Корисні відомості про запис чисел Щоб не малювати багато нулів, коли записуєш дуже велике або дуже маленьке число, іноді зручніше написати, скільки в ньому цих нулів. Наприклад, замість 25 000 000 (запитів на день) можна написати 2,5•10⁷ або 25•10⁶. Це називається експоненційним записом числа. Звучить нуднувато, але насправді нічого складного тут немає, ми всі вчили це в […]