SlideShare a Scribd company logo
© 2020
1
Общий обзор решений – Удобство – Стоимость – Точность - Выводы
ТРАНСКРИПТ, ТИТРЫ,
ПЕРЕВОД
УДОБНЕЕ, ЧЕМ КОГДА-ЛИБО
© 2020
2
Экскурс в историю
1950-
1960
Bell Laboratories разработали систему Audrey, которая распознавала цифры, сказанные одним голосом.
Через 10 лет, в 1962 году, IBM продемонстировала систему "Shoebox", которая понимала 16 слов на
английском.
1970-е МО США и DARPA запускают программу Speech Understanding Research (SUR). Система Harpy
Университета Карнеги Меллона распознает более 1000 слов (словарный запас трехлетнего ребенка)
1980-е Новый статистический метод, больше известный как «скрытая марковская модель». Распознаются
несколько тысяч слов. В 1987 появляется кукла, «понимающая» голос ребенка. Появляется ПО
(например, Kurzweil text-to-speech могла распознавать до 5000 слов), но после каждого слова нужно
было делать паузу.
1990-е Появляются ПК и соответствующее ПО. Dragon Dictate с изначальной ценой в 9000 долларов. Первый
голосовой интерактивный портал VAL от BellSouth в 1996 году. В 1997 выходит Dragon NaturallySpeaking,
который умел распознавать нормальную речь со скоростью 100 слов в минуту, но требовал тренировки
и стоил 695 долларов.
2000-е Достижение порога в 80% точности. Застой до появления голосового поиска Google. Обработка
информации в облаке, сбор огромного массива данных и обучение системы.
2010-е Привет, Сири и окей, Гугл! Бум голосовых помощников (Siri, Google Assistant, Alexa)
2020-е Максимальное увеличение точности распознавания (4,9% ошибок, по заявлению Google). Artificial
Intelligence, Machine Learning, Natural Language Processing.
© 2020
3
Как мы делали это раньше?
Требуемый результат Инструменты
Текст для транскрипта или
перевода
Медиаплеер + текстовый
редактор
Субтитры для видео /
монтажный лист
Subtitle Edit / Aegisub и аналоги
Перевод субтитров • Вручную
• В текстовом редакторе
• Без САТ / МТ
© 2020
4
Как мы можем делать это сегодня?
Загрузить /
распознать
• Загрузить
исходный
материал в
систему STT и
распознать
Внести правки
• Отредактировать
распознанный
текст
• [Разметить
спикеров]
• Ряд облачных
инструментов
поддерживает
совместную работу
Экспортировать
• Экспортировать в
нужном формате
• Текст в Word или
субтитры
Перевести
• Если нужен
перевод,
воспользуйтесь
CAT
• Работу можно
ускорить,
подключив МП
• Некоторые
средства TTS
поддерживают МП
© 2020
5
Зачем, если вручную быстрее и дешевле?
https://sonix.ai/fast-transcription
© 2020
6
Инструменты для STT
 Хороший выбор с краткими оценками на G2
© 2020
7
Как улучшить результат или
Garbage in – garbage out
 Если запись делаете вы, позаботьтесь о ее качестве
заранее.
 Крайне желательно, чтобы дновременно говорил только
один спикер.
 Речь должна быть на одном языке
 Добавьте «сложные» слова в глоссарий
 Удалите фоновый шум
 (например, в бесплатном Audacity для Win/Mac)
 Поделитесь своими рекомендациями!
© 2020
8
Мой выбор - сводка
Название Стоимость($/час) Trial Форматы экспорта Спикеры Прим. Рус. Укр. Словарь Перевод Youtube
Audtext 13 30мин txt/doc + - - - - - -
Descript 10часов / 10в мес 180мин doc/srt + + - - - - -
Go transcribe 12 10мин txt/doc/pdf/srt/etc + + + - + - -
Happyscribe 14 2мин / 1файл txt/doc/pdf/srt/etc + + + + + + +
Simon Says 15 15мин txt/doc/pdf/srt/etc+ + + + + + -
Sonix 10 30мин txt/doc/pdf/srt/etc+ + + + - + +
Otter 4часа / 8,33в мес 600мин, 3ф. 30дн txt, ост. в премиум + - - - + - -
© 2020
9
Go transcribe
© 2020
10
HappyScribe
© 2020
11
Simon Says
© 2020
12
Sonix
© 2020
13
Как будем сравнивать?
 Качество распознавания
 Удобство редактора
 Наличие нормального trial-a
 Поддержка украинского и русского
 Стоимость
© 2020
14
Результаты тестирования
Название $/час Trial Прим. Укр Словарь Перевод Редактор Качество
Go transcribe 12 10мин + - + - 9 93,3
Happyscribe 14 2мин / 1 + + + + 8 95,3
Simon Says 15 15мин + + + 8 92,7
Sonix 10 30мин + - + 10 95,5
© 2020
15
NEVER STOP
EVOLVING OR TRYING!
СПАСИБО ЗА ВНИМАНИЕ!
www.logrusit.com
partnership@logrusit.com

More Related Content

Similar to UTICamp-2020. Transcription, Subtitles, Translation: Easier Than Ever

Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10Сообщество eLearning PRO
 
Приёмы программирования
Приёмы программированияПриёмы программирования
Приёмы программирования
Timur Shaporev
 
Компьютерные самоучители по языкам от компании "РЕПЕТИТОР МультиМедиа"
Компьютерные самоучители по языкам от компании "РЕПЕТИТОР МультиМедиа"Компьютерные самоучители по языкам от компании "РЕПЕТИТОР МультиМедиа"
Компьютерные самоучители по языкам от компании "РЕПЕТИТОР МультиМедиа"
Anatoly Zhislin
 
"Маленькие секреты успешной презентации"
"Маленькие секреты успешной презентации""Маленькие секреты успешной презентации"
"Маленькие секреты успешной презентации"ANSevrukova
 
Go в продакшене Яндекса: отчёт после года использования — Вячеслав Бахмутов
Go в продакшене Яндекса: отчёт после года использования — Вячеслав БахмутовGo в продакшене Яндекса: отчёт после года использования — Вячеслав Бахмутов
Go в продакшене Яндекса: отчёт после года использования — Вячеслав Бахмутов
Yandex
 
Alexandr Serbul "The Rust language for a high-load network service - a quick ...
Alexandr Serbul "The Rust language for a high-load network service - a quick ...Alexandr Serbul "The Rust language for a high-load network service - a quick ...
Alexandr Serbul "The Rust language for a high-load network service - a quick ...
Fwdays
 
Ag Systran 2008 04 26
Ag Systran 2008 04 26Ag Systran 2008 04 26
Ag Systran 2008 04 26
NLPseminar
 

Similar to UTICamp-2020. Transcription, Subtitles, Translation: Easier Than Ever (8)

Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
 
Приёмы программирования
Приёмы программированияПриёмы программирования
Приёмы программирования
 
Компьютерные самоучители по языкам от компании "РЕПЕТИТОР МультиМедиа"
Компьютерные самоучители по языкам от компании "РЕПЕТИТОР МультиМедиа"Компьютерные самоучители по языкам от компании "РЕПЕТИТОР МультиМедиа"
Компьютерные самоучители по языкам от компании "РЕПЕТИТОР МультиМедиа"
 
"Маленькие секреты успешной презентации"
"Маленькие секреты успешной презентации""Маленькие секреты успешной презентации"
"Маленькие секреты успешной презентации"
 
Go в продакшене Яндекса: отчёт после года использования — Вячеслав Бахмутов
Go в продакшене Яндекса: отчёт после года использования — Вячеслав БахмутовGo в продакшене Яндекса: отчёт после года использования — Вячеслав Бахмутов
Go в продакшене Яндекса: отчёт после года использования — Вячеслав Бахмутов
 
текст
тексттекст
текст
 
Alexandr Serbul "The Rust language for a high-load network service - a quick ...
Alexandr Serbul "The Rust language for a high-load network service - a quick ...Alexandr Serbul "The Rust language for a high-load network service - a quick ...
Alexandr Serbul "The Rust language for a high-load network service - a quick ...
 
Ag Systran 2008 04 26
Ag Systran 2008 04 26Ag Systran 2008 04 26
Ag Systran 2008 04 26
 

More from UTICamp

UTICamp-2020. We Translate/Localise into Two Languages: Yes, This Can Be Done...
UTICamp-2020. We Translate/Localise into Two Languages: Yes, This Can Be Done...UTICamp-2020. We Translate/Localise into Two Languages: Yes, This Can Be Done...
UTICamp-2020. We Translate/Localise into Two Languages: Yes, This Can Be Done...
UTICamp
 
UTICamp-2020. Is Translation Safe Road for Beginner?
UTICamp-2020. Is Translation Safe Road for Beginner?UTICamp-2020. Is Translation Safe Road for Beginner?
UTICamp-2020. Is Translation Safe Road for Beginner?
UTICamp
 
UTICamp-2020. Translators’ happiness 101
UTICamp-2020. Translators’ happiness 101UTICamp-2020. Translators’ happiness 101
UTICamp-2020. Translators’ happiness 101
UTICamp
 
UTICamp-2020. Technical Writing and Translation: the Interaction Between Simp...
UTICamp-2020. Technical Writing and Translation: the Interaction Between Simp...UTICamp-2020. Technical Writing and Translation: the Interaction Between Simp...
UTICamp-2020. Technical Writing and Translation: the Interaction Between Simp...
UTICamp
 
UTICamp-2020. The Art of Exhibition: InText & Cartonator Case Study
UTICamp-2020. The Art of Exhibition: InText & Cartonator Case StudyUTICamp-2020. The Art of Exhibition: InText & Cartonator Case Study
UTICamp-2020. The Art of Exhibition: InText & Cartonator Case Study
UTICamp
 
UTICamp-2020. Is translation automation a myth or a reality?
UTICamp-2020. Is translation automation a myth or a reality?UTICamp-2020. Is translation automation a myth or a reality?
UTICamp-2020. Is translation automation a myth or a reality?
UTICamp
 
UTICamp-2020. From Quality Assurance to Operational Excellence
UTICamp-2020. From Quality Assurance to Operational ExcellenceUTICamp-2020. From Quality Assurance to Operational Excellence
UTICamp-2020. From Quality Assurance to Operational Excellence
UTICamp
 
UTICamp-2020. Step Across The Border and Find Your Niche
UTICamp-2020. Step Across The Border and Find Your NicheUTICamp-2020. Step Across The Border and Find Your Niche
UTICamp-2020. Step Across The Border and Find Your Niche
UTICamp
 
UTICamp-2020. Size Does Matter, or Is the translation Industry Restructuring ...
UTICamp-2020. Size Does Matter, or Is the translation Industry Restructuring ...UTICamp-2020. Size Does Matter, or Is the translation Industry Restructuring ...
UTICamp-2020. Size Does Matter, or Is the translation Industry Restructuring ...
UTICamp
 
UTICamp-2020. Fake It Till You Make It: the Update of Translation Industry Br...
UTICamp-2020. Fake It Till You Make It: the Update of Translation Industry Br...UTICamp-2020. Fake It Till You Make It: the Update of Translation Industry Br...
UTICamp-2020. Fake It Till You Make It: the Update of Translation Industry Br...
UTICamp
 
UTICamp-2020. Preparing for Post-Doom – Diversifying business: Content creati...
UTICamp-2020. Preparing for Post-Doom – Diversifying business: Content creati...UTICamp-2020. Preparing for Post-Doom – Diversifying business: Content creati...
UTICamp-2020. Preparing for Post-Doom – Diversifying business: Content creati...
UTICamp
 
UTICamp-2020. Machine Translation: Manual V.S. Automated Assembly
UTICamp-2020. Machine Translation: Manual V.S. Automated AssemblyUTICamp-2020. Machine Translation: Manual V.S. Automated Assembly
UTICamp-2020. Machine Translation: Manual V.S. Automated Assembly
UTICamp
 
UTICamp-2020. Quality Assurance in Translation
UTICamp-2020. Quality Assurance in TranslationUTICamp-2020. Quality Assurance in Translation
UTICamp-2020. Quality Assurance in Translation
UTICamp
 
UTICamp-2020. Translating Slang & Swear words
UTICamp-2020. Translating Slang & Swear wordsUTICamp-2020. Translating Slang & Swear words
UTICamp-2020. Translating Slang & Swear words
UTICamp
 
UTICamp-2020. Live on full tank mode
UTICamp-2020. Live on full tank modeUTICamp-2020. Live on full tank mode
UTICamp-2020. Live on full tank mode
UTICamp
 
UTICamp-2020. Quality Criteria in Interpreting
UTICamp-2020. Quality Criteria in InterpretingUTICamp-2020. Quality Criteria in Interpreting
UTICamp-2020. Quality Criteria in Interpreting
UTICamp
 
UTICamp-2020. Interpreting As Part Of the Official Delegation: Expectations A...
UTICamp-2020. Interpreting As Part Of the Official Delegation: Expectations A...UTICamp-2020. Interpreting As Part Of the Official Delegation: Expectations A...
UTICamp-2020. Interpreting As Part Of the Official Delegation: Expectations A...
UTICamp
 
UTICamp-2020. Interpreting Oncology: A View from Both Sides
UTICamp-2020. Interpreting Oncology: A View from Both SidesUTICamp-2020. Interpreting Oncology: A View from Both Sides
UTICamp-2020. Interpreting Oncology: A View from Both Sides
UTICamp
 
UTICamp-2020. Conference Trends in a Post-Covid-19 World
UTICamp-2020. Conference Trends in a Post-Covid-19 WorldUTICamp-2020. Conference Trends in a Post-Covid-19 World
UTICamp-2020. Conference Trends in a Post-Covid-19 World
UTICamp
 
UTICamp-2020. Translator as a participant in the formation of an inclusive cu...
UTICamp-2020. Translator as a participant in the formation of an inclusive cu...UTICamp-2020. Translator as a participant in the formation of an inclusive cu...
UTICamp-2020. Translator as a participant in the formation of an inclusive cu...
UTICamp
 

More from UTICamp (20)

UTICamp-2020. We Translate/Localise into Two Languages: Yes, This Can Be Done...
UTICamp-2020. We Translate/Localise into Two Languages: Yes, This Can Be Done...UTICamp-2020. We Translate/Localise into Two Languages: Yes, This Can Be Done...
UTICamp-2020. We Translate/Localise into Two Languages: Yes, This Can Be Done...
 
UTICamp-2020. Is Translation Safe Road for Beginner?
UTICamp-2020. Is Translation Safe Road for Beginner?UTICamp-2020. Is Translation Safe Road for Beginner?
UTICamp-2020. Is Translation Safe Road for Beginner?
 
UTICamp-2020. Translators’ happiness 101
UTICamp-2020. Translators’ happiness 101UTICamp-2020. Translators’ happiness 101
UTICamp-2020. Translators’ happiness 101
 
UTICamp-2020. Technical Writing and Translation: the Interaction Between Simp...
UTICamp-2020. Technical Writing and Translation: the Interaction Between Simp...UTICamp-2020. Technical Writing and Translation: the Interaction Between Simp...
UTICamp-2020. Technical Writing and Translation: the Interaction Between Simp...
 
UTICamp-2020. The Art of Exhibition: InText & Cartonator Case Study
UTICamp-2020. The Art of Exhibition: InText & Cartonator Case StudyUTICamp-2020. The Art of Exhibition: InText & Cartonator Case Study
UTICamp-2020. The Art of Exhibition: InText & Cartonator Case Study
 
UTICamp-2020. Is translation automation a myth or a reality?
UTICamp-2020. Is translation automation a myth or a reality?UTICamp-2020. Is translation automation a myth or a reality?
UTICamp-2020. Is translation automation a myth or a reality?
 
UTICamp-2020. From Quality Assurance to Operational Excellence
UTICamp-2020. From Quality Assurance to Operational ExcellenceUTICamp-2020. From Quality Assurance to Operational Excellence
UTICamp-2020. From Quality Assurance to Operational Excellence
 
UTICamp-2020. Step Across The Border and Find Your Niche
UTICamp-2020. Step Across The Border and Find Your NicheUTICamp-2020. Step Across The Border and Find Your Niche
UTICamp-2020. Step Across The Border and Find Your Niche
 
UTICamp-2020. Size Does Matter, or Is the translation Industry Restructuring ...
UTICamp-2020. Size Does Matter, or Is the translation Industry Restructuring ...UTICamp-2020. Size Does Matter, or Is the translation Industry Restructuring ...
UTICamp-2020. Size Does Matter, or Is the translation Industry Restructuring ...
 
UTICamp-2020. Fake It Till You Make It: the Update of Translation Industry Br...
UTICamp-2020. Fake It Till You Make It: the Update of Translation Industry Br...UTICamp-2020. Fake It Till You Make It: the Update of Translation Industry Br...
UTICamp-2020. Fake It Till You Make It: the Update of Translation Industry Br...
 
UTICamp-2020. Preparing for Post-Doom – Diversifying business: Content creati...
UTICamp-2020. Preparing for Post-Doom – Diversifying business: Content creati...UTICamp-2020. Preparing for Post-Doom – Diversifying business: Content creati...
UTICamp-2020. Preparing for Post-Doom – Diversifying business: Content creati...
 
UTICamp-2020. Machine Translation: Manual V.S. Automated Assembly
UTICamp-2020. Machine Translation: Manual V.S. Automated AssemblyUTICamp-2020. Machine Translation: Manual V.S. Automated Assembly
UTICamp-2020. Machine Translation: Manual V.S. Automated Assembly
 
UTICamp-2020. Quality Assurance in Translation
UTICamp-2020. Quality Assurance in TranslationUTICamp-2020. Quality Assurance in Translation
UTICamp-2020. Quality Assurance in Translation
 
UTICamp-2020. Translating Slang & Swear words
UTICamp-2020. Translating Slang & Swear wordsUTICamp-2020. Translating Slang & Swear words
UTICamp-2020. Translating Slang & Swear words
 
UTICamp-2020. Live on full tank mode
UTICamp-2020. Live on full tank modeUTICamp-2020. Live on full tank mode
UTICamp-2020. Live on full tank mode
 
UTICamp-2020. Quality Criteria in Interpreting
UTICamp-2020. Quality Criteria in InterpretingUTICamp-2020. Quality Criteria in Interpreting
UTICamp-2020. Quality Criteria in Interpreting
 
UTICamp-2020. Interpreting As Part Of the Official Delegation: Expectations A...
UTICamp-2020. Interpreting As Part Of the Official Delegation: Expectations A...UTICamp-2020. Interpreting As Part Of the Official Delegation: Expectations A...
UTICamp-2020. Interpreting As Part Of the Official Delegation: Expectations A...
 
UTICamp-2020. Interpreting Oncology: A View from Both Sides
UTICamp-2020. Interpreting Oncology: A View from Both SidesUTICamp-2020. Interpreting Oncology: A View from Both Sides
UTICamp-2020. Interpreting Oncology: A View from Both Sides
 
UTICamp-2020. Conference Trends in a Post-Covid-19 World
UTICamp-2020. Conference Trends in a Post-Covid-19 WorldUTICamp-2020. Conference Trends in a Post-Covid-19 World
UTICamp-2020. Conference Trends in a Post-Covid-19 World
 
UTICamp-2020. Translator as a participant in the formation of an inclusive cu...
UTICamp-2020. Translator as a participant in the formation of an inclusive cu...UTICamp-2020. Translator as a participant in the formation of an inclusive cu...
UTICamp-2020. Translator as a participant in the formation of an inclusive cu...
 

UTICamp-2020. Transcription, Subtitles, Translation: Easier Than Ever

  • 1. © 2020 1 Общий обзор решений – Удобство – Стоимость – Точность - Выводы ТРАНСКРИПТ, ТИТРЫ, ПЕРЕВОД УДОБНЕЕ, ЧЕМ КОГДА-ЛИБО
  • 2. © 2020 2 Экскурс в историю 1950- 1960 Bell Laboratories разработали систему Audrey, которая распознавала цифры, сказанные одним голосом. Через 10 лет, в 1962 году, IBM продемонстировала систему "Shoebox", которая понимала 16 слов на английском. 1970-е МО США и DARPA запускают программу Speech Understanding Research (SUR). Система Harpy Университета Карнеги Меллона распознает более 1000 слов (словарный запас трехлетнего ребенка) 1980-е Новый статистический метод, больше известный как «скрытая марковская модель». Распознаются несколько тысяч слов. В 1987 появляется кукла, «понимающая» голос ребенка. Появляется ПО (например, Kurzweil text-to-speech могла распознавать до 5000 слов), но после каждого слова нужно было делать паузу. 1990-е Появляются ПК и соответствующее ПО. Dragon Dictate с изначальной ценой в 9000 долларов. Первый голосовой интерактивный портал VAL от BellSouth в 1996 году. В 1997 выходит Dragon NaturallySpeaking, который умел распознавать нормальную речь со скоростью 100 слов в минуту, но требовал тренировки и стоил 695 долларов. 2000-е Достижение порога в 80% точности. Застой до появления голосового поиска Google. Обработка информации в облаке, сбор огромного массива данных и обучение системы. 2010-е Привет, Сири и окей, Гугл! Бум голосовых помощников (Siri, Google Assistant, Alexa) 2020-е Максимальное увеличение точности распознавания (4,9% ошибок, по заявлению Google). Artificial Intelligence, Machine Learning, Natural Language Processing.
  • 3. © 2020 3 Как мы делали это раньше? Требуемый результат Инструменты Текст для транскрипта или перевода Медиаплеер + текстовый редактор Субтитры для видео / монтажный лист Subtitle Edit / Aegisub и аналоги Перевод субтитров • Вручную • В текстовом редакторе • Без САТ / МТ
  • 4. © 2020 4 Как мы можем делать это сегодня? Загрузить / распознать • Загрузить исходный материал в систему STT и распознать Внести правки • Отредактировать распознанный текст • [Разметить спикеров] • Ряд облачных инструментов поддерживает совместную работу Экспортировать • Экспортировать в нужном формате • Текст в Word или субтитры Перевести • Если нужен перевод, воспользуйтесь CAT • Работу можно ускорить, подключив МП • Некоторые средства TTS поддерживают МП
  • 5. © 2020 5 Зачем, если вручную быстрее и дешевле? https://sonix.ai/fast-transcription
  • 6. © 2020 6 Инструменты для STT  Хороший выбор с краткими оценками на G2
  • 7. © 2020 7 Как улучшить результат или Garbage in – garbage out  Если запись делаете вы, позаботьтесь о ее качестве заранее.  Крайне желательно, чтобы дновременно говорил только один спикер.  Речь должна быть на одном языке  Добавьте «сложные» слова в глоссарий  Удалите фоновый шум  (например, в бесплатном Audacity для Win/Mac)  Поделитесь своими рекомендациями!
  • 8. © 2020 8 Мой выбор - сводка Название Стоимость($/час) Trial Форматы экспорта Спикеры Прим. Рус. Укр. Словарь Перевод Youtube Audtext 13 30мин txt/doc + - - - - - - Descript 10часов / 10в мес 180мин doc/srt + + - - - - - Go transcribe 12 10мин txt/doc/pdf/srt/etc + + + - + - - Happyscribe 14 2мин / 1файл txt/doc/pdf/srt/etc + + + + + + + Simon Says 15 15мин txt/doc/pdf/srt/etc+ + + + + + - Sonix 10 30мин txt/doc/pdf/srt/etc+ + + + - + + Otter 4часа / 8,33в мес 600мин, 3ф. 30дн txt, ост. в премиум + - - - + - -
  • 13. © 2020 13 Как будем сравнивать?  Качество распознавания  Удобство редактора  Наличие нормального trial-a  Поддержка украинского и русского  Стоимость
  • 14. © 2020 14 Результаты тестирования Название $/час Trial Прим. Укр Словарь Перевод Редактор Качество Go transcribe 12 10мин + - + - 9 93,3 Happyscribe 14 2мин / 1 + + + + 8 95,3 Simon Says 15 15мин + + + 8 92,7 Sonix 10 30мин + - + 10 95,5
  • 15. © 2020 15 NEVER STOP EVOLVING OR TRYING! СПАСИБО ЗА ВНИМАНИЕ! www.logrusit.com partnership@logrusit.com

Editor's Notes

  1. Минута истории https://sonix.ai/history-of-speech-recognition https://habr.com/ru/post/131945/
  2. Средняя скорость – 1 час материала за 10 минут
  3. Не совсем. Если объем материала до 2-3 минут и скорость речи медленная, возможно, использовать STT нецелесообразно. Если нужен перевод, можно перевести и «со слуха». Но, если: объем становится больше вам нужно контролировать качество перевода (что невозможно без исходника), возможно, подключать МП вам нужно создать титры – вам придется сначала создать исходник, и лучше, если он будет изначально в правильном формате, который позволяет экспорт как в Word, так и в титры – как с указанием спикеров, так и без. Потратьте 3 минуты, воспользуйтесь бесплатной пробной версией любого из лучших сервисов. Вы ничего не теряете, но получите готовый подстрочник. Что касается стоимости и средней скорости (данные Sonix), данные говорят сами за себя. В нормальном режиме минута речи – около 200 слов. Даже если у вас очень высокая скорость слепого набора, применение STT более чем оправдано (проверено личной практикой). Средние расценки на биржах фрилансеров в Украине - 10 долларов за час звука (что запредельно ниже плинтуса)
  4. Инструкция здесь https://sonix.ai/remove-metallic-sound-from-audio Соникс, например, поддерживает мультитрек-где разные голоса записаны на разных дорожках
  5. Совместная работа над одним проектом поддерживается большинством, но на бесплатных планах ограничения почти у всех, на дешевых - у части. Otter - для транскрипта интервью, онлайн-встреч и совещаний
  6. Качество распознавания – Editing Distance для эталонного текста и неотредактированного распознанного.
  7. Традиционных баллов не будет. Не всем нужны определенные фичи, такие как поддержка русского или украинского языков, возможность напрямую скачивать видео с Youtube/DropBox/GoogleDrive etc. Поэтому выбирайте систему, исходя из нужных именно вам параметров. CopyLeaks – identical + minor changes 194 слова