Обзор Smartcat

© Все права защищены.

Развитие технологий дарит нам все большую степень свободы.

Из канала связи Интернет стал средой для хранения и обработки информации, а увеличение пропускной способности сетей, совершенствование оборудования и технологии виртуализации сделали возможным широкий доступ к облачным вычислениям.

«Облако» позволяет не только получать доступ к данным из любой точки мира, но и обрабатывать их. Одна из самых распространенных облачных услуг — это SaaS (software as a service — ПО как услуга), решение, позволяющее открывать программу в браузере, не устанавливая ее на собственный компьютер и не нагружая его ресурсы.

Идущие в ногу со временем разработчики программ автоматизации перевода (CAT-инструментов) не обделили своим вниманием такие новые возможности, ведь они крайне интересны для всех сторон в индустрии переводов. И для заказчиков услуг и переводческих компаний (это отличный инструмент для организации и синхронизации совместной работы многих переводчиков), и для переводчиков, в частности фрилансеров (для работы нужно лишь устройство с дисплеем подходящего размера и клавиатурой, подключение к Интернету и собственные знания).

Сначала появились серверные решения, которые сделали возможной одновременную совместную работу, обеспечивая доступ к памяти переводов и глоссариям, хранящимся в облаке, и синхронизацию проектов, а затем и полностью облачные системы, вообще не требующие установки клиента программы. Самые известные из них — Google Translator Toolkit (GTT), Wordfast Anywhere (SaaS-вариант Wordfast), MateCat, Memsource, Smartcat.

Рассмотрим в качестве примера сравнительно молодую, но мощную систему — Smartcat.

«Умная “кошка”»

Платформа Smartcat —это не только CAT-инструмент, но и биржа переводчиков, позволяющая фрилансерам найти заказы, а компаниям — переводчиков, а также система управления проектами и ряд возможностей для организации платежей.

Разработчики программы — фанаты своего дела и активно внедряют новые функции. Новые релизы выходят довольно часто. Самый свежий билд (помимо номера, они имеют еще и «географические» названия) — № 65 «Сингапур». Основные изменения последних версий — ускорение загрузки страниц, возможность подключать Яндекс.Переводчик, поддержка новых языков (среди поддерживаемых языков есть и очень редкие), добавление новых API-методов для управления проектами. В последнем релизе добавлена возможность скачивать файлы в формате XLIFF.

Изучим внимательнее собственно CAT-часть платформы.

Интерфейс системы интуитивно понятен любому, кто когда-либо работал с CAT-инструментами: привычная «таблица» оригинального текста и перевода, окно совпадений с памятью переводов (TM) и глоссарием. Отдельное окно выделено для поиска в памяти, глоссариях и словарях, а еще одно окно в нижней части экрана (впрочем, не обязательно в нижней, так как есть три варианта компоновки экрана на выбор) предназначено для результатов проверки качества, истории изменений сегмента и комментариев.

Smartcat — полнофункциональная программа, поддерживающая разнообразные форматы документов, работу с памятью переводов и глоссариями (как создаваемыми в процессе работы в системе, так и импортированными), она без проблем обрабатывает теги и плейсхолдеры (заполнители). Кроме того, к системе подключены словари Lingvo и есть возможность использовать различные движки машинного перевода. Как и в других «кошках», в Smartcat предусмотрена проверка качества, которую можно настроить в соответствии со своими потребностями.

Экспортировать из системы можно оригинал загруженного документа, перевод в том же формате (за исключением графических и PDF-файлов, которые экспортируются в формате docx), а также двуязычные файлы DOCX с таблицей сопоставления оригинала и перевода, файлы TMX и XLIFF. Кроме того, при загрузке пакетов Trados Studio можно скачать пакет для возврата.

И раз уж речь зашла об экспорте из системы, рассмотрим подробнее, что же можно туда загрузить для работы. Для этого мы провели ряд небольших экспериментов.

Работа с файлами различных типов

Попробуем импортировать в Smartcat файлы различных типов и посмотрим, как система с ними справляется в «боевых» условиях.

Сначала классическая проверка — файлы программ Microsoft Office.

Microsoft Office

—  Word: DOCX, DOC, RTF — да

—  Excel: XLSX, XLS — да

—  PowerPoint: PPTX, PPT — да

Все файлы Microsoft Office — и старого (DOC, XLS, PPT), и нового (DOCX, XLSX, PPTX) форматов — прошли «на ура».

Теперь проверяем, как Smartcat относится к другим популярным программам автоматизации перевода — в том числе memoQ, Wordfast и Trados — и умеет ли работать с их файлами.

Другие CAT-инструменты

—  memoQ: MQXLIFF — да, MQXLZ — нет

—  Wordfast: TXML, TXLF — нет

—  Trados: TTX, SDLXLIFF, SDLPPX — да

—  SDLX: ITD — нет

—  Passolo: TBULIC — нет

—  Transit: TPF, PPF — нет

Таким образом, Smartcat дружит не со всеми «кошками» (будем надеяться, пока) и умеет импортировать только файлы Trados и memoQ. Устаревший формат SDLX ITD программа не распознает, не работает с файлами SDL Passolo, но зато умеет напрямую импортировать пакеты Trados Studio, сразу со всей «начинкой» — памятью переводов и термбазами. Заметим, что в один проект Smartcat нельзя добавить одновременно и пакет Trados Studio, и SDLXLIFF-файлы — нужно создавать два разных проекта.

Неумение работать с занесенным в Красную книгу форматом ITD и крайне специфическим TBULIC можно простить. Но вот поддержку формата Wordfast хорошо бы реализовать.

Графические файлы

Теперь проверяем, как Smartcat действует в случаях, когда текст представлен в виде графики. Прежде чем приступать к переводу, текст нужно извлечь из графического файла. Если загрузить в Smartcat графический файл, например в формате JPG, он его принимает, но сообщает, что предварительно требуется выполнить распознавание (OCR — optical character recognition), а это отдельная платная услуга, и предлагает пополнить баланс.

Количество форматов графических файлов, с которыми работает Smartcat, впечатляет: PDF, JPG, JPEG, TIF, TIFF, BMP, PNG, GIF, CX, PCX, JP2, JPC, JFIF, JB2. Графическими также считаются DJVU и DJV.

PDF

Локализация PDF-файлов — традиционная головная боль для переводческих бюро.

С точки зрения обработки текста PDF-файлы бывают двух типов: содержащие собственно текст и содержащие графические элементы, на которых есть текст. Методы обработки последних мало чем отличаются от используемых для обычных графических файлов JPG или PNG, и Smartcat поступает с ними так же — предлагает выполнить платное распознавание.

Другие форматы

К плюсам Smartcat следует отнести умение работать еще с двумя форматами Adobe (помимо PDF) — IDML и INX (оба InDesign).

Кроме того, поддерживаются файлы локализации в форматах PO, JSON, PHP и XML.

Из этого мы делаем вывод: с файлами основных форматов у Smartcat проблем нет.

Лингвистические ресурсы

Как и любая CAT-программа, Smartcat поддерживает работу с памятью переводов и терминологическими базами (глоссариями). Но этим список вспомогательных ресурсов не исчерпывается.

Память переводов

При создании проекта (если речь не идет о загрузке пакета Trados Studio с уже включенной памятью) система автоматически создает для него память переводов, но также ее можно импортировать. Smartcat поддерживает ТМ двух форматов — «общенародный» TMX и SDL’евский SDLTM.

Результаты тестового импорта TM в целом положительные. Множество разных «памятей» в обоих форматах, в том числе довольно крупную SDLTM-память, система Smartcat уверенно «заглотила», но споткнулась на сравнительно небольшом TMX-файле.

Справедливости ради нужно сказать, что этот файл TMX был специально созданной «сборной солянкой» из нескольких разных проектов, выполнявшихся в разных CAT-инструментах, и, соответственно, содержал сегменты и теги всевозможных типов и форматов. Программа memoQ этот TMX-файл «взяла», а Trados Studio — не одолела.

Глоссарии

Глоссарии (термбазы) можно создавать в рамках проекта и без труда пополнять в процессе работы. Кроме того, можно импортировать термины из существующих глоссариев и экспортировать термбазы в формате XLSX.

Созданные глоссарии затем можно использовать в других своих проектах.

Машинный перевод

Smartcat предоставляет возможность использовать машинный перевод (МТ). Бесплатно можно подключить Microsoft Translator и Яндекс.Переводчик, а за дополнительную плату — машинный перевод от Google и адаптивный перевод Lilt.

Словари

К системе подключен базовый пакет словарей ABBYY Lingvo, и поиск в них можно выполнять прямо с экрана перевода.

Но следует учесть, что если язык в проекте определен, например, как «Английский (США)» или «Английский (Соединенное Королевство)», то словарь не распознает его как английский и воспользоваться им получится, только щелкнув ссылку «Открыть в новой вкладке» и выбрав на открывшейся странице язык «Английский» без каких-либо географических дополнений.

Другие возможности

В Smartcat предусмотрена проверка качества, которую можно настроить в соответствии со своими предпочтениями. Кроме того, проверка терминологии учитывает словоизменение. Это значительно сокращает количество раздражающих ложноположительных результатов и позволяет уделить больше внимания тому, что действительно может оказаться ошибкой.

В случае локализации программного обеспечения будет очень полезна возможность добавлять к сегментам скриншоты.

В системе Smartcat реализована функция чата. Переводчики, редакторы и менеджеры, работающие над проектом, могут оперативно обсуждать текущие вопросы. Сообщения отображаются в окне комментариев.

Очень интересная функция Smartcat — чат-бот Telegram. С его помощью менеджер может получать информацию о том, на каком этапе находится работа над проектом, и оперативно связываться с переводчиками (сообщения, отправленные из Telegram, мгновенно отображаются в чате Smartcat). Для менеджера проектов такая функция — просто находка.

Облачная система

Облачные технологии имеют как преимущества, так и недостатки.

К достоинствам можно отнести доступность и независимость от оборудования и операционной системы, возможности совместной работы, а также надежность (данные обычно хранятся на нескольких серверах, физически расположенных в разных странах, и постоянно выполняется их резервное копирование).

Обеспокоенность обычно вызывают вопросы безопасности и конфиденциальности.

Хотя облако само по себе является достаточно надежной и защищенной системой, при проникновении в него злоумышленник получит доступ сразу к огромному количеству данных.

Что же касается конфиденциальности, то, к сожалению, на данный момент не существует технологии, которая обеспечивала бы 100%-ную гарантию конфиденциальности хранимых в облаке данных. Разработчики Smartcat прилагают все усилия, чтобы защитить данные от несанкционированного доступа.

—  Все учетные записи в системе изолированы друг от друга, и передача данных между ними возможна, только если дано явное разрешение на это.

—  Передаваемые данные зашифрованы, и даже сотрудники Smartcat не имеют к ним доступа.

—  Гибкое разграничение прав доступа позволяет контролировать уровни доступа сотрудников к данным — вплоть до отдельного документа или переводческого ресурса.

Если характер вашей работы или требования заказчика таковы, что исключают возможность использования общедоступной облачной системы, Smartcat может предложить установить систему на локальном сервере или в частном облаке, которые будете контролировать только вы. Это, естественно, дополнительно оплачиваемая услуга.

Подведем итоги

Все изложенное ниже — субъективное мнение. Оно и не может быть иным, т. к. в разных бюро и у разных переводчиков требования к системе для перевода различны. Поскольку система непрерывно развивается, эта информация актуальна только на данный момент. По мере появления новых версий плюсы и минусы исчезают, добавляются, переходят друг в друга и т. д.

Плюсы Smartcat

—  Использование системы бесплатно, если речь не идет о частном облаке или установке на локальном сервере. Кроме того, платными являются дополнительные услуги: некоторые варианты машинного перевода и распознавание текста.

—  Благодаря облачности возможность использования не зависит от операционной системы, которой пользуется переводчик. Ни у memoQ, ни у Trados Studio, ни у Wordfast — у грандов мира локализации — нет версий для Linux и MacOSWordfast, правда, есть Wordfast Anywhere — тоже облачная система, конкурент Smartcat). Технически возможно даже использование на смартфоне или планшете (его ОС тоже не важна — это может быть как iOS, так и Android). Правда, это будет не очень удобно в силу небольшого размера экрана.

—  Smartcat — полнофункциональный CAT-инструмент, сопоставимый по возможностям с популярными CAT-программами для ПК. Обычно онлайн-инструменты этим похвастаться не могут.

—  Работать над проектом может неограниченное количество переводчиков и редакторов.

—  Можно выполнять переводы, предоставляемые в пакетах Trados Studio, не имея Trados Studio и не платя за покупку этой программы.

—  В системе реализовано удобное управление проектами. Менеджер видит, какой переводчик на каком этапе находится. Оперативные вопросы обсуждаются в чате непосредственно в системе. Расчет платежей переводчикам осуществляется автоматически.

—  Smartcat интегрирован с системой учета переводческих проектов Protemos. Управление предельно простое: если вы создали проект в Protemos, то соответствующий ему проект в Smartcat создается буквально одним нажатием кнопки. Подробнее об этом см. здесь.

—  Возможен импорт и экспорт памяти переводов. Эта функция пригодится тем, кто хотел бы использовать свои наработки. Многие заказчики просят вместе с переводом присылать также и память переводов.

—  У менеджеров есть возможность быстро найти переводчика-исполнителя, даже для редких языковых пар. Кроме того, снижена нагрузка на менеджеров проектов: им не приходится заниматься расчетом выплат.

—  Список поддерживаемых языков огромен и постоянно растет.

—  У системы отзывчивая и доброжелательная поддержка.

Минусы Smartcat

—  «Облачность» системы — это как плюс, так и минус. Как уже упоминалось выше, безопасность/небезопасность облачных систем (любых) обусловлена спецификой технологии.

—  Обратная сторона функциональности — усложнение интерфейса. Чтобы максимально эффективно использовать все возможности системы, придется «покопаться» в справке и самой программе.

—  Нет возможности открыть несколько файлов сразу, чтобы воспользоваться функцией автоматического распространения перевода, когда есть много повторяющихся сегментов в разных файлах.

—  Нет возможности отобразить текст тегов и пробелы.

—  Не реализованы массовые замены. Если в проекте много файлов, и во всех них нужно заменить одно слово на другое (например, везде заменить «Bluetooth» на «USB»), сделать это одной заменой не получится — придется поочередно открывать каждый файл и выполнять замену внутри него. Сколько файлов, столько будет замен.

—  В операциях замены отсутствует поддержка регулярных выражений (RegEx).

—  Не реализованы операции с несколькими сегментами сразу. Например, нельзя сразу в 10 сегментах скопировать исходный текст в перевод или подтвердить сразу 10 сегментов.

Smartcat — это действительно удобный и функциональный бесплатный CAT-инструмент, который обладает рядом дополнительных возможностей, упрощающих управление проектами перевода и совместную работу. Надеемся, по мере развития системы недостатков будет становиться меньше, а плюсов — больше.

 

Другие cтатьи

Как фрилансеру сотрудничать с бюро переводов и как гарантированно испортить отношения с ним

10.07.2018 Переводчиком считаете себя не только вы, некоторые ваши знакомые и брат Саша, но и любой человек, у которого в дипломе есть запись «N-ский язык». Но запись в дипломе — это, так сказать, теория. В столкновении с практикой она порождает множество заблуждений, мифов и конфликтов. Эта статья посвящена тому, как можно было бы их избежать.

Это страшное слово «МТ»

26.11.2015 МТ (machine translation — машинный перевод) в его современном виде — весьма неоднозначное и противоречивое явление. Многочисленные недоразумения и разочарования, связанные с ним, объясняются тем, что у обеих сторон процесса перевода — и у переводчиков, и у тех, кто пользуется плодами их работы, — выработалось неправильное отношение к МТ. Рассмотрим, что такое МТ для людей, которые выполняют перевод, и для обычных пользователей, которые этот перевод читают.

Качество перевода:
как не заблудиться заказчику

14.01.2016 В этой статье мы рассмотрим, как выглядит обеспечение качества переводческих услуг с позиции клиента.

Спасибо!

Мы получили ваше резюме.

Как только мы его изучим, мы свяжемся с вами.

Спасибо!

Мы получили ваше сообщение.

Как только мы его изучим, мы свяжемся с вами.


В рабочее время мы обычно отвечаем
в течение часа.

Спасибо!


Вы успешно подписаны!

Сообщение

+ Прикрепить файл

Мы внимательно изучим ваше резюме
и свяжемся с вами в ближайшее время