Муки розшифровки померли? Сервіси, які друкують замість вас

Муки розшифровки померли? Сервіси, які друкують замість вас

09:04,
31 Січня 2017
20968

Муки розшифровки померли? Сервіси, які друкують замість вас

09:04,
31 Січня 2017
20968
Муки розшифровки померли? Сервіси, які друкують замість вас
Муки розшифровки померли? Сервіси, які друкують замість вас
Challange accepted. MediaSapiens кинули перший виклик: розшифрувати інтерв’ю через сервіси й таким чином їх перевірити. За вікном 2017-й, ми можемо голосом керувати своєю мультиваркою, то чому ж ми досі витрачаємо години на монотонне прослуховування записаних голосів? У нас є відповідь.

Інтерв'ю. Здається, вже все пережили, розмова вдалась, але попереду на вас ще чекають вони — незабутні години розшифровки. Це завжди як гіркий післясмак бесіди: слухаєш те саме, друкуєш, перевіряєш, слухаєш, друкуєш, перевіряєш. Сам. У навушниках. Здається, весь світ рухається далі, десь народжується нове життя, десь спалахують зірки й перетворюються на чорні діри, а ви витрачаєте час на прослуховування вже почутого і пройденого. Мука. Можна на неї, звісно, приректи фрілансерів, які за окрему плату витрачатимуть на це своє життя. Але нині є більш гуманні методи — сервіси розшифровки аудіозаписів. Та й фрілансери поза контекстом, тому часто замінюють слова й доводиться вам, попри витрачені кошти, все ж знову прослуховувати розмову.

1. Voco

Розпізнає російську. Працює без інтернету й «може вчити вашу лексику». Програма достатньо вимоглива в залізі: процесор Core i5 мінімум та 4 GB оперативки. У вашому розпорядженні дві функції: надиктовка й розшифровка аудіозаписів. Із першою функцією ви можете трохи попрактикувати майбутнє й відчути себе, як письменниця Аврора Данн із фільму «Пробудження». Але тільки трохи, тому що в мікрофон нотбука (принаймні мого) програма чує геть кепсько й дуже затягує трансформацію моїх геніальних слів у не менш геніальні тексти. Взагалі розробники просять використовувати гарнітуру. Я використовував провідну й безпровідну, але це не надто допомогло: дуже повільно перетворюється в текст, потрібно чекати секунд 30, поки речення надрукується; дуже багато помилок, власні назви перетворюються на «зомби», «стол» и «порезаны».

Та працювати з Voco просто: відкриваєте Word, двічі натискаєте Ctrl — і вас вже слухають. Але на третьому — четвертому реченні система видавала мені брак оперативної пам’яті, тому зважайте, що 4 GB — це замало.

На диво, запис, зроблений у тихому приміщенні, розшифрувався значно вдаліше. Навіть майже правильно розставлені крапки й коми. Звісно, не без огріхів, але краще, ніж я очікував. Щоби «віддати» запис на розшифровку у Word, натискаєте вкладку «Транскрайбер». У ній відкриваєте запис і обираєте «Розшифрувати». Шифрує, до речі, за прийнятний час. Приблизно стільки, скільки триває запис. До програми є відеоінструкції.

На жаль, програма розуміє тільки справді якісні записи. Підійде для спланованих інтерв'ю. Якщо ви розмовляли на вулиці чи в іншому гамірному місці — готуйте пальці. І, якщо вона вам замінить слова… Не знаю, чи не доведеться знову слухати запис. До речі, це недешеве задоволення — пакет, який розпізнає аудіозаписи, 14 тис. рублів (близько 6300 грн).

2.Trinscriber

Ця дивовижна річ мене вразила. По-перше, тут є українська. По-друге, вона справді гарно чує її й навіть розуміє абревіатури, імена, англійські слова. Мова перетворюється на текст дуже швидко. Також програма розумна, наприклад, почула слова «маршрутка», «Анатолій» та «візуалізація». Тепер про те, як це працює.

Trinscriber не намагається за вас розшифрувати автоматично з запису, але допоможе, якщо у вас втомилися руки. Програма пропонує вам диктувати почуте. Тобто ви завантажуєте запис, який відображається у вас згори вікна, а внизу онлайн-вікно для надиктовки. Слухаєте запис — диктуєте. Зупинити, пришвидшити, сповільнити, перекрутити запис можна відповідними клавішами прямо тут. Зручно.

Взагалі, надиктовувати веселіше, ніж бити по клавіатурі кілька годин, слухаючи монотонний запис. Та й у такий спосіб розшифровки ви контролюєте процес: одразу можете прибирати зайве, розставляти необхідні знаки, перевіряти точність слів.

Сервіс заявляє, що словами «кома» і «крапка» ці елементарні знаки будуть розставлятися, але дзуськи. Я хвилин десять кричав на комп’ютер (сусіди, напевне, подумали, що я навіжений), намагався це робити швидше й повільніше (бо в порадах було сказано «immediately»), але Trinscriber уперто писав просто «кома», «крапка». Я не міг повірити: на україномовному ресурсі знаходив, що він ці знаки розставляє, поки не побачив, що вони розшифровували інтерв’ю російською. І так, російською чи англійською вони справді ставляться. А якщо ви маєте запис українською, то руцями, панове. І все ж, незважаючи на таку прикру неприємність, сервіс украй дієвий порівняно з іншими. Він, щоправда, платний — коштує 20 доларів на рік. Це недорого за доволі якісну річ. Я навіть замислився над таким капіталовкладенням.

Тільки зважайте: після десяти хвилин розшифровки ви почнете говорити, як робот, бо програма саме таку вимову розуміє найкраще. Своє до свого.

3. Cybermova

Здається, цю програму зробили й забули. Форуми щодо неї не оновлюються, а функції, які анонсувалися, не додаються. І взагалі, я розважено диктував у гарнітуру такий абзац: «Джерело, близьке до засновника Facebook, також підтвердило BuzzFeed, що Марк Цукерберг ніколи не говорив про наміри стати президентом США. Анонімне джерело також зазначило, що він може зайняти важливу роль в політичній системі США, але не ставить це за мету». А вийшло: «…також під бар до фіба щит фіз шаурма».

4. Google translator

Так, тут ви можете диктувати, й вас навіть будуть дуже добре і блискавично чути. Але запис вам доведеться вмикати, вимикати на якомусь програвачі в іншому вікні або на телефоні, що не дуже зручно. Також некомфортно працювати з постійним перекладом в іншому вікні, яке буде блимати. Але, звісно, якщо дуже треба й дуже хочеться безкоштовно, то можете використовувати.

5. Youtube

Усім знавцям і порадникам щодо титрів у Youtube присвячується. Так, я пройшов ці кола пекла з конвертацією початкового запису з M4A у MP3, потім створення на його базі відео через сервіс TunesToTube, потім пошуку тих титрів по всьому «Менеджеру відео». Якщо що — то вони в розділі «Субтитри»: обираєте автоматичне створення титрів російською (української немає) і трохи чекаєте, поки вони з’являться, перезавантажуєте сторінку. Після того у вас буде така колонка біля відео.

Завантажити це диво транскрайбу ви можете у специфічних форматах. Тому конвертуєте його в txt тут.

Попри те, що я начитував дуже повільно і як робот, вийшло таке: «источник близкий к основателю фэйсбук 0:00:05.100,0:00:07.990 также подтвердил баскет что марк 0:00:07.990,0:00:11.060 цукенберг никогда не говорил о намерениях 0:00:11.059,0:00:12.969 стать 0:00:12.969,0:00:15.719 анонимный источник также ответил что он 0:00:15.719,0:00:18.060 может занять важную роль в политической 0:00:18.060,0:00:21.150 системе сша они ставят этот столицы».

І це ще я його вручну зводив із однієї колонки у звичайний абзац. Якщо вам ще хтось скаже, що це непоганий метод для розшифровки тексту, стукніть цього негідника в коліно. Я дозволяю.

Ще дехто радить начитувати текст на телефон чи планшет і додавати це в текстовий редактор. Я прямо бачу, як ви це робите. Особливо годинне інтерв’ю начитуєте й пальцями редагуєте слова на сенсорному екрані.

Отже, розшифрувати інтерв’ю не руками мені все ж вдалося. По секрету кажучи, зробив я це у Trinscriber. Тобто не друкувати годинами в навушниках, нервово переслуховуючи текст, — це реально. Так, ви начитуватимете, але це значно приємніше, як на мене. Звісно, це не повна автоматична розшифровка і я трохи розчарований, але й не повне фіаско.

Update 1.02.2017

6.Speech Recognition у Google docs

Після виходу матеріалу нам запропонували спробувати ще цей інструмент.

Так, Google таки зміг. Тобто його безкоштовний додаток до Google docs справді дуже гарно чує українську/російську/англійську, а тестовий абзац тут почутий майже ідеально. Для такого ефекту я диктував через гарнітуру (хоча навіть у мікрофон ноутбука додаток чує непогано). До речі, знову у російській та англійській «кома», «крапка» нормально перетворюються у знаки, а в українській – ні. Невідомо, чому для сервісів це такий нездоланний бар'єр…

Все, що вам треба, – це завантажити додаток. Після цього ви отримуєте бокове вікно у гугл-документі. Згори у меню натискаєте «Доповнення-Speech Recognition-Config». Виставляєте мову і слова, які перетворюватимуться у знаки (якщо ви говоритимете не українською). Потім: «Доповнення-Speech Recognition-Start». У боковому меню натискаєте мікрофон і вас слухають.

Але я б тут інтерв’ю українською не розшифровував. Якщо іншими мовами, коли голосом одразу можна розставляти крапки/коми, переходити на новий рядок, тоді це має сенс. Українською ж – вкрай марудно. Можливості поставити розділові знаки «на ходу», як у Trinscriber, тут немає, а слова у текст додаток перетворює шматками. Тобто ви начитали, зупинили, він додав цей шматок у документ. Після цього ви розставляєте УСІ розділові знаки вручну. Крім того, аудіозапису у цьому вікні у вас також немає. Доведеться відкривати його у сусідньому і постійно перемикатись між вікнами або, що ймовірніше, – прослуховувати його на телефоні/диктофоні.  Проте з безкоштовних альтернатив – це, мабуть, найкраща.

Якщо ви хочете кинути новий виклик MediaSapiens — протестувати онлайн-інструменти, будь ласка, пишіть сюди :) chaccepted.ms@gmail.com

 

ГО «Детектор медіа» понад 20 років бореться за кращу українську журналістику. Ми стежимо за дотриманням стандартів у медіа. Захищаємо права аудиторії на якісну інформацію. І допомагаємо читачам відрізняти правду від брехні.
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.
Фото: davidpj
* Знайшовши помилку, виділіть її та натисніть Ctrl+Enter.
Коментарі
оновити
Код:
Ім'я:
Текст:
2019 — 2024 Dev.
Andrey U. Chulkov
Develop
Використовуючи наш сайт ви даєте нам згоду на використання файлів cookie на вашому пристрої.
Даю згоду