Огляд Smartcat
Розвиток технологій дає нам дедалі більшу свободу
Інтернет, що був каналом зв’язку, тепер став середовищем для зберігання й обробки інформації, а збільшення пропускної здатності мереж, удосконалення обладнання та технології віртуалізації забезпечили широкий доступ до хмарних обчислень.
«Хмара» дає змогу не тільки отримувати доступ до даних із будь-якої точки світу, а й опрацьовувати їх. Одна з найпоширеніших хмарних послуг — це SaaS (software as a service — програмне забезпечення як послуга) — рішення, що дає змогу відкривати програму в браузері, не встановлюючи її на власний комп’ютер і не перевантажуючи ресурси.
Ідучи в ногу з часом, розробники програм автоматизації перекладу (CAT-інструментів) не залишили поза увагою такі нові можливості, адже вони дуже цікаві для всіх сторін в індустрії перекладів. І для замовників послуг і перекладацьких компаній (це чудовий інструмент для організації та синхронізації сумісної роботи багатьох перекладачів), і для перекладачів, зокрема фрилансерів (для роботи потрібен лише пристрій із дисплеєм необхідного розміру та клавіатура, підключення до мережі Інтернет і власні знання).
Спочатку з’явилися сервісні рішення, які зробили можливою одночасну сумісну роботу, забезпечуючи доступ до пам’яті перекладів і глосаріїв, що зберігаються в хмарі, і синхронізацію проєктів, а потім і повністю хмарні системи, які взагалі не потребують встановлення програми. Найвідоміші серед них — Google Translator Toolkit (GTT), Wordfast Anywhere (SaaS-варіант Wordfast), MateCat, Phrase (раніше — Memsource) і Smartcat.
Як приклад розглянемо порівняно молоду, але потужну систему — Smartcat.
«Розумна “кішка”»
Платформа Smartcat — це не лише CAT-інструмент, а й біржа перекладачів, яка дає змогу фрилансерам знайти замовлення, а компаніям — перекладачів. Також це система керування проєктами та низка можливостей для організації платежів.
Розробники програми — це фанати своєї справи, які активно впроваджують нові функції. Нові релізи виходять досить часто. Основні зміни останніх версій: прискорення завантаження сторінок, підтримка нових мов (до мов, що підтримуються, належать і досить рідкісні), додавання нових API-методів для керування проєктами. В одному з недавніх релізів додана можливість завантажувати файли у форматі XLIFF.
Вивчимо детальніше саму CAT-частину платформи.
Інтерфейс системи інтуїтивно зрозумілий кожному, хто будь-коли працював із CAT-інструментами: звична «таблиця» оригінального тексту й перекладу, вікно збігу з пам’яттю перекладів (TM) і глосарієм. Окреме вікно виділено для пошуку в пам’яті, глосаріях і словниках, а ще одне вікно в нижній частині екрана (а втім, не обов’язково в нижній, оскільки доступні три варіанти компонування екрана на вибір) призначене для результатів перевірки якості, історії змін сегмента й коментарів.
Smartcat — це повнофункціональна програма, що підтримує різноманітні формати документів, роботу з пам’яттю перекладів і глосаріями (як тими, що створюються під час роботи в системі, так і імпортованими). Вона також без проблем опрацьовує теги й плейсхолдери (заповнювачі). Крім того, до системи підключені словники Lingvo та є можливість використовувати різні програмні засоби машинного перекладу. Як і в інших «кішках», у Smartcat передбачена перевірка якості, яку можна налаштувати відповідно до власних потреб.
Із системи можна експортувати оригінал завантаженого документа, переклад у тому ж форматі (крім графічних і PDF-файлів, які експортуються у форматі docx), а також двомовні файли DOCX із таблицею зіставлення оригіналу та перекладу, файли TMX і XLIFF. Крім того, під час завантаження пакетів Trados Studio можна завантажити пакет для повернення.
Коли вже мова зайшла про експорт із системи, розглянемо детальніше, що ж можна туди завантажити для роботи. Для цього ми провели низку невеликих експериментів.
Робота з файлами різних типів
Спробуємо імпортувати в Smartcat файли різних типів і поглянемо, як система з ними справляється в «бойових» умовах.
Спочатку класична перевірка — файли програм Microsoft Office.
Microsoft Office
- Word: DOCX, DOC, RTF — так
- Excel: XLSX, XLS — так
- PowerPoint: PPTX, PPT — так
Усі файли Microsoft Office — і старого (DOC, XLS, PPT), і нового (DOCX, XLSX, PPTX) форматів — пройшли перевірку «на ура».
Тепер перевіряємо, як Smartcat ставиться до інших популярних програм автоматизації перекладу — зокрема, memoQ, Wordfast і Trados — і чи вміє працювати з їхніми файлами.
Інші CAT-інструменти
- memoQ: MQXLIFF — так, MQXLZ — ні
- Wordfast: TXML, TXLF — ні
- Trados: TTX, SDLXLIFF, SDLPPX — так
- SDLX: ITD — ні
- Passolo: TBULIC — ні
- Transit: TPF, PPF — ні
Таким чином, Smartcat дружить не з усіма «кішками» (сподіватимемося, що це тимчасово) і вміє імпортувати тільки файли Trados і memoQ. Застарілий формат SDLX ITD програма не розпізнає, не працює з файлами SDL Passolo, проте вміє безпосередньо імпортувати пакети Trados Studio, відразу з усією «начинкою» — пам’яттю перекладів і термбазами. Зауважимо, що в один проєкт Smartcat неможливо одночасно додати і пакет Trados Studio, і SDLXLIFF-файли — потрібно створювати два різних проєкти.
Невміння працювати із занесеним у Червону книгу форматом ITD та вкрай специфічним TBULIC можна пробачити. Однак підтримку формату Wordfast усе ж варто впровадити.
Графічні файли
Тепер перевіримо, як Smartcat діє у випадках, коли текст представлений у вигляді графіки. Перш ніж почати перекладати, текст потрібно видобути з графічного файлу. Якщо завантажити в Smartcat графічний файл, зокрема у форматі JPG, система його приймає, однак повідомляє, що попередньо потрібно виконати розпізнавання (OCR — optical character recognition), а це окрема платна послуга, тому пропонується поповнити баланс.
Кількість форматів графічних файлів, з якими працює Smartcat, вражає: PDF, JPG, JPEG, TIF, TIFF, BMP, PNG, GIF, CX, PCX, JP2, JPC, JFIF і JB2. Графічними також вважаються DJVU й DJV.
Локалізація PDF-файлів — це традиційний головний біль для перекладацьких бюро.
З точки зору обробки тексту PDF-файли бувають двох типів: які містять власне текст і які містять графічні елементи, на яких є текст. Методи обробки останніх несуттєво відрізняються від тих, які використовуються для звичайних графічних файлів JPG або PNG, і Smartcat вчиняє з ними так само — пропонує виконати платне розпізнавання.
Інші формати
До переваг Smartcat слід віднести вміння працювати ще з двома форматами Adobe (крім PDF) — IDML і INX (обидва InDesign).
Крім того, підтримуються файли локалізації у форматах PO, JSON, PHP та XML.
З цього ми робимо висновок: з файлами основних форматів у Smartcat проблеми відсутні.
Лінгвістичні ресурси
Як і будь-яка CAT-програма, Smartcat підтримує роботу з пам’яттю перекладів і термінологічними базами (глосаріями). Однак на цьому список допоміжних ресурсів не закінчується.
Пам’ять перекладів
Створюючи проєкт (якщо не йдеться про завантаження пакета Trados Studio з уже включеною пам’яттю), система автоматично створює для нього пам’ять перекладів, однак її також можна імпортувати. Smartcat підтримує ТМ двох форматів — «загальнонародний» TMX і SDL’івський SDLTM.
Результати тестового імпорту TM загалом позитивні. Безліч «пам’ятей» в обох форматах, зокрема досить велику SDLTM-пам’ять, система Smartcat впевнено «проковтнула», однак спіткнулася на порівняно невеликому TMX-файлі.
Заради справедливості варто сказати, що цей файл TMX був навмисно створеною «збірною солянкою» із кількох різних проєктів, що виконувалися в різних CAT-інструментах, і, відповідно, містив сегменти й теги всіляких типів і форматів. Програма memoQ цей TMX-файл «взяла», а Trados Studio — не подужала.
Глосарії
Глосарії (термбази) можна створювати в рамках проєкту й легко поповнювати під час роботи. Крім того, можна імпортувати терміни з наявних глосаріїв і експортувати термбази у форматі XLSX.
Створені глосарії потім можна використовувати в інших своїх проєктах.
Машинний переклад
Smartcat надає можливість використовувати машинний переклад (МТ). Безкоштовно можна підключити Microsoft Translator та Яндекс.Перекладач, а за додаткову плату — машинний переклад від Google і адаптивний переклад Lilt.
Словники
До системи підключений базовий пакет словників ABBYY Lingvo, пошук у яких можна здійснювати безпосередньо з екрана перекладу.
Однак слід врахувати, що якщо мова в проєкті визначена, зокрема як «Англійська (США)» або «Англійська (Сполучене Королівство)», то словник не розпізнає її як англійську. Скористатися нею вдасться, тільки клацнувши посилання «Відкрити в новій вкладці» та вибравши на сторінці, що відкриється, мову «Англійська» без будь-яких географічних доповнень.
Інші можливості
У Smartcat передбачена перевірка якості, яку можна налаштувати відповідно до своїх уподобань. Крім того, перевірка термінології враховує словозміни. Це суттєво скорочує кількість дратівливих псевдопозитивних результатів і дає змогу приділити більше уваги тому, що дійсно може виявитися помилкою.
У разі локалізації програмного забезпечення буде досить корисною можливість додавати до сегментів знімки екрана.
У системі Smartcat реалізована функція чата. Перекладачі, редактори й менеджери, які працюють над проєктом, можуть оперативно обговорювати поточні питання. Повідомлення відображаються у вікні коментарів.
Дуже цікава функція Smartcat — це чат-бот Telegram. За його допомогою менеджер може отримувати відомості про те, на якому етапі перебуває робота над проєктом, і оперативно зв’язуватися з перекладачами (повідомлення, які відправлені з Telegram, миттєво відображаються в чаті Smartcat). Для менеджера проєктів ця функція — просто знахідка.
Хмарна система
Хмарні технології мають як переваги, так і недоліки.
До переваг належить доступність і незалежність від обладнання й операційної системи, можливості сумісної роботи, а також надійність (дані зазвичай зберігаються на кількох серверах, фізично розташованих у різних країнах, і постійно виконується їхнє резервне копіювання).
Занепокоєння зазвичай породжують питання безпеки й конфіденційності.
Хоча хмара сама собою є досить надійною та захищеною системою, якщо в неї проникає зловмисник, він отримує доступ відразу до величезної кількості даних.
Щодо конфіденційності, то, на жаль, на сьогодні не існує технології, яка б забезпечувала стовідсоткову гарантію конфіденційності даних, що зберігаються в хмарі. Розробники Smartcat докладають максимум зусиль, щоб захистити дані від несанкціонованого доступу.
- Усі облікові записи в системі ізольовані один від одного, а передавання даних між ними можливе, тільки якщо надано явний дозвіл на це.
- Дані, що передаються, зашифровані, і навіть співробітники Smartcat не мають до них доступу.
- Гнучке розмежування прав доступу дає змогу контролювати рівні доступу співробітників до даних — аж до окремого документа або перекладацького ресурсу.
Якщо характер вашої роботи або вимоги замовника такі, що виключають можливість використання загальнодоступної хмарної системи, Smartcat може запропонувати встановити систему на локальному сервері або в приватній хмарі, яку контролюватимете лише ви. Звісно ж це послуга, що додатково оплачується.
Підсумуємо
Усе викладене нижче — це суб’єктивна думка. По-іншому не може бути, оскільки в різних бюро та перекладачів вимоги до системи для перекладу різні. Оскільки система неперервно розвивається, ця інформація актуальна тільки на цей момент. З появою нових версій переваги й недоліки зникають, додаються, переходять один в одного тощо.
Переваги Smartcat
- Використання системи безкоштовне, якщо не йдеться про приватну хмару або встановлення на локальному сервері. Крім того, платними є додаткові послуги: деякі варіанти машинного перекладу й розпізнавання тексту.
- Завдяки хмарності можливість використання не залежить від операційної системи, якою користується перекладач. Ні в memoQ, ні в Trados Studio, ні у Wordfast — у грандів світу локалізації — немає версій для Linux і MacOS (у Wordfast, щоправда, є Wordfast Anywhere — також хмарна система, конкурент Smartcat). Технічно можливо використовувати навіть на смартфоні або планшеті (його ОС також не важлива — це може бути як iOS, так і Android). Щоправда, це буде не дуже зручно через невеликий розмір екрана.
- Smartcat — повнофункціональний CAT-інструмент, зіставний за можливостями з популярними CAT-програмами для комп’ютера. Зазвичай онлайнові інструменти цим похвалитися не можуть.
- Працювати над проєктом може необмежена кількість перекладачів і редакторів.
- Можна виконувати переклади, що надаються в пакетах Trados Studio, не маючи Trados Studio та не платячи за покупку цієї програми.
- У системі реалізоване зручне керування проєктами. Менеджер бачить, який перекладач на якому етапі перебуває. Оперативні питання обговорюються в чаті безпосередньо в системі. Розрахунок платежів перекладачам виконується автоматично.
- Система Smartcat інтегрована з системою обліку перекладацьких проєктів Protemos. Керування максимально просте: якщо ви створили проєкт у Protemos, то відповідний проєкт у Smartcat створюється фактично одним натисканням кнопки. Детальніше про це див. тут.
- Можливий імпорт і експорт пам’яті перекладів. Ця функція стане в пригоді тим, хто хотів би використовувати свої напрацювання. Багато замовників просять разом із перекладами надсилати також і пам’ять перекладів.
- У менеджерів є можливість швидко знайти перекладача-виконавця, навіть для рідкісних мовних пар. Крім того, знижено навантаження на менеджерів проєктів: їм не доводиться займатися розрахунком виплат.
- Список мов, що підтримуються, величезний і постійно зростає.
- Система має чутливу та доброзичливу підтримку.
Недоліки Smartcat
- «Хмарність» системи — це як перевага, так і недолік. Як уже згадувалося вище, безпека/ризикованість хмарних систем (будь-яких) обумовлена специфікою технології.
- Зворотний бік функціональності — ускладнення інтерфейсу. Щоб максимально ефективно використовувати всі можливості системи, доведеться «понишпорити» в довідці та в програмі.
- Немає можливості відкрити кілька файлів одночасно, щоб скористатися функцією автоматичного поширення перекладу, коли є багато повторюваних сегментів у різних файлах.
- Немає можливості відобразити текст тегів і пробіли.
- Не реалізовані масові заміни. Якщо в проєкті багато файлів, і в усіх них потрібно замінити одне слово на інше (зокрема, усюди замінити «Bluetooth» на «USB»), зробити це однією заміною не вдасться — доведеться по черзі відкривати кожен файл і виконувати заміну всередині нього. Скільки файлів, стільки буде замін.
- В операціях заміни відсутня підтримка регулярних виразів (RegEx).
- Не реалізовані операції з кількома сегментами відразу. Зокрема, не можна відразу в 10 сегментах скопіювати початковий текст у переклад або підтвердити відразу 10 сегментів.
Smartcat — це дійсно зручний і функціональний безкоштовний CAT-інструмент, який має низку додаткових можливостей, що спрощують керування проєктами перекладу та спільну роботу. Сподіваємося, у міру розвитку системи недоліків ставатиме менше, а переваг — більше.