Проблемът с разпознаването на реч все още не е решен. Включете и изключете автоматичното разпознаване на реч. Настройте разпознаването на реч в Windows 7

Windows Vista е първата операционна система от Microsoft с вградено разпознаване на реч. Използвайки тази функция, можете да изпълнявате различни задачи с гласа си, като стартиране на програми, затваряне, запазване и изтриване на файлове, диктуване на текст, който да бъде записан дословно, и редактирането му. Деб Шиндер, ИТ консултант, ще ви преведе през подробностите как да използвате тази функция.

Още от излизането на филма Star Trek, много компютърни потребители мечтаят да изхвърлят клавиатури, мишки и да контролират компютъра си с гласа си. Програми, които ви позволяват да изговаряте различни команди, да диктувате текст на компютър - са правени от много години и са били много полезни за тези, които физически не са били в състояние да използват други методи за въвеждане. Но по някаква причина тези програми не бяха популярни.

Windows Vista е първата операционна система на Microsoft, която може да разпознава реч. Преди това функцията за разпознаване на реч присъстваше в Microsoft Office XP и Office 2003 и също беше възможно да се използват програми от други разработчици, като Dragon NaturallySpeaking. Microsoft също добави разпознаване на реч към Windows Mobile.

Не е нужно да купувате нищо допълнително, за да започнете да говорите с компютъра си, Vista вече разполага с всичко. По подразбиране функцията е деактивирана, но можете лесно да я активирате в контролния панел, както е показано на фигура A.

Можете също да стартирате тази функция от менюто, като изберете Всички програми | Стандартен | Достъпност (Всички програми | Аксесоари | Лесен достъп), както е показано на фигура B.

Как работи

Можете да изберете един от два режима за разпознаване на реч:

За да управлявате програми: Стартирайте и затваряйте програми, превключвайте между тях, запазвайте и изтривайте файлове и т.н.
Да диктува текста, който ще бъде записан дословно, както и да го редактира.

Разработчиците на софтуер могат да добавят поддръжка за тази функция към своите програми. Досадно е, че в момента разпознаването на реч поддържа само няколко езика: английски (САЩ и Обединеното кралство), немски, френски, испански, японски и китайски (традиционен и опростен).

Настройване на разпознаване на реч

Преди да можете да използвате разпознаването на реч, ще трябва да изпълните следните стъпки:

Включете разпознаването на реч.
Настройте микрофона.
Прочетете ръководството (по избор).
Практикувайте ясно, говорете (също не е необходимо).

След като щракнете двукратно върху Разпознаване на реч в контролния панел или изберете Разпознаване на реч от менюто, ще ви бъде представен прозорец за настройка, както е показано на фигура C.

Когато щракнете върху Стартиране на разпознаването на реч, в горната част на екрана ще се появи панел за гласово управление, както е показано на фигура D.

Ако вече сте конфигурирали тази функция, тогава сокетът ще бъде регистриран в автоматичното стартиране и ще стартира всеки път, когато Windows стартира. Синя икона за гласово управление също ще се появи в областта.
Можете да извикате контекстното меню за настройки, като щракнете с десния бутон върху иконата в лентата или върху панела за гласово управление, както е показано на фигура E.

В менюто ще видите следните настройки:

Включване на говора:Компютърът ще слуша всичко, което казвате, и ще изпълнява командите, които разпознава.
Режим на готовност (Sleep):Компютърът ще следва речта ви, но няма да отговаря на никакви команди, докато не кажете „Започнете да слушате“.
Изключено:Компютърът не ви слуша, каквото и да му кажете.
Отворете справочна карта за реч:Удобен измамен лист с основни команди и допълнителна информация.
Стартирайте урока за реч:Видео урок, където ще ви бъде разказано и показано всичко.
Помогне:Отваря помощен файл за тази функция.
Настроики:Тук можете да настроите програмата да се зарежда с Windows, автоматична корекция на текст и т.н.
Конфигурация:Тук можете да настроите своя микрофон, да подобрите разпознаването на реч и да отворите контролния панел.
Отворете Речния речник:Можете да добавяте нови думи (много полезно за имена и думи, които са трудни за разпознаване) и можете също да изключите думи, които никога не казвате.
Тема на диктовката:Тук може да се избере само Разказ.
Посетете сайта (Отидете на уеб сайта за разпознаване на реч).
Получете информация за разпознаването на реч:Това е познатият ни диалогов прозорец на Windows, в който са написани версията, номерът на лиценза и името на програмата.
Отворете разпознаването на реч.
Изход:Затваря напълно програмата.

Превод

Откакто дълбокото обучение навлезе на сцената на разпознаването на реч, броят на грешките в разпознаването на думи драстично намаля. Но въпреки всички статии, които може би сте чели, все още нямаме разпознаване на реч на човешко ниво. Разпознавателите на реч имат много режими на отказ. За да ги подобрите допълнително, трябва да ги идентифицирате и да се опитате да ги елиминирате. Това е единственият начин да преминете от разпознаване, което работи за някои хора през повечето време, до разпознаване, което работи за всички хора през цялото време.

Подобрения в броя на грешно идентифицираните думи. Пробно гласово набиране беше сглобено на телефонна централа през 2000 г. от 40 произволни разговора между двама души, чийто роден език е английският.

Да кажем, че сме достигнали нивото на човек в разпознаването на речта в разговори, базирано само на набор от разговори от телефонна централа, е все едно да кажем, че роботизирана кола се движи толкова добре, колкото човек, тестван в един град в слънчев ден без трафик. Неотдавнашните промени в разпознаването на реч са невероятни. Но твърденията за разпознаване на реч на човешко ниво са твърде смели. Ето няколко области, в които все още трябва да се направят подобрения.

Акценти и шум

Един от очевидните недостатъци на разпознаването на реч е обработката акцентии фонов шум. Основната причина за това е, че повечето от данните за обучение се състоят от американски диалекти с високо съотношение сигнал/шум. Например, в набор от разговори от телефонна централа има само разговори на хора, чийто роден език е английски (предимно американци) с малко фонов шум.

Но увеличаването на данните за обучение само по себе си най-вероятно няма да реши този проблем. Има много езици, които съдържат много диалекти и акценти. Нереалистично е да се събират етикетирани данни за всички случаи. Създаването на висококачествен разпознавател на реч за американски английски изисква само до 5000 часа аудио, транскрибирано в текст.

Сравнение на хора с говор към текст с Deep Speech 2 на Baidu за различни типове говор. Хората са по-лоши в разпознаването на неамерикански акцент, може би поради изобилието на американци сред тях. Мисля, че хората, които са израснали в определен регион, биха се справили с разпознаването на акцента на този регион с много по-малко грешки.

При наличие на фонов шум в движеща се кола съотношението сигнал/шум може да достигне до -5 dB. Хората лесно се справят с разпознаването на речта на друг човек в такива условия. Автоматичните разпознаватели се разграждат много по-бързо с увеличаване на шума. Графиката показва колко се увеличава разделянето на хората с увеличаване на шума (при ниско SNR, съотношение сигнал/шум)

Семантични грешки

Често броят на погрешно разпознатите думи не е самоцел за системата за разпознаване на реч. Насочваме се към броя на семантичните грешки. Това е делът на изразите, в които неправилно разпознаваме значението.

Пример за семантична грешка е, когато някой каже „да се срещнем във вторник“ [да се срещнем във вторник] и разпознаващият върне „да се срещнем днес“ [да се срещнем днес]. Има и грешки в думи без семантични грешки. Ако резолверът не разпознае „нагоре“ и върне „да се срещнем във вторник“, семантиката на изречението не се променя.

Трябва внимателно да използваме броя на грешно идентифицираните думи като критерий. За да илюстрирам това, ще ви дам пример за най-лошия случай. 5% от грешките в думата съответстват на една липсваща дума от 20. Ако във всяко изречение има 20 думи (което е доста в рамките на средното за английския), тогава броят на неправилно разпознатите изречения се доближава до 100%. Можем да се надяваме, че погрешно разпознатите думи не променят семантичното значение на изреченията. В противен случай разпознаващият може да тълкува погрешно всяко изречение дори с 5% погрешно разпознати думи.

Когато сравнявате модели с хора, е важно да проверите същността на грешките и да наблюдавате не само броя на неправилно разпознатите думи. Според моя опит хората с говор към текст правят по-малко грешки и не са толкова сериозни, колкото компютрите.

Изследователи от Microsoft наскоро сравниха грешките на човешки и компютърни разпознаватели на подобно ниво. Една от откритите разлики е, че моделът обърква „ъъъъъъъъъъъъъъъъъъъъъъъъъъъАаа много по-често от хората. Двата термина имат много различна семантика: „ъ-ъ“ запълва празнините, докато „ъ-ъъ“ обозначава потвърждение от слушателя. Освен това моделите и хората откриха много грешки при съвпадение на типове.

Много гласове в един канал

Разпознаването на записани телефонни разговори също е по-лесно, защото всеки говорител е записан на отделен микрофон. Няма припокриване на множество гласове в един аудио канал. Хората могат да разбират няколко оратора, понякога говорещи едновременно.

Добрият разпознавател на реч трябва да може да разделя аудио потока на сегменти в зависимост от говорещия (подлага го на диаризация). Той също така трябва да извлече смисъл от аудиозапис с два припокриващи се гласа (разделяне на източниците). Това трябва да се направи без микрофон, разположен директно в устата на всеки от високоговорителите, тоест, така че разпознавателят да работи добре, когато е поставен на произволно място.

Качество на записа

Акцентите и фоновият шум са само два фактора, срещу които устройството за разпознаване на реч трябва да бъде устойчиво. Ето още няколко:

Реверберация при различни акустични условия.
Артефакти, свързани с оборудване.
Артефакти на кодека, използван за записване и компресиране на сигнала.
Честота на вземане на проби.
Възрастта на говорещия.

Повечето хора не могат да направят разлика между mp3 и wav файлове. Разпознаващите трябва да станат устойчиви към тези източници на вариации, преди да претендират за човешка производителност.

Контекст

Вижда се, че броят на грешките, които хората правят на тестове в записите от телефонната централа е доста голям. Ако разговаряте с приятел, който не разбира 1 дума от 20, ще ви бъде много трудно да общувате.

Една от причините за това е разпознаването без контекст. В реалния живот ние използваме много различни допълнителни знаци, които ни помагат да разберем какво казва другият човек. Някои примери за контекст, използван от хората и игнориран от устройствата за разпознаване на реч:

Историята на разговора и обсъжданата тема.
Визуални знаци за говорещия - изражение на лицето, движение на устните.
Съвкупността от знания за човека, с когото говорим.

Устройството за разпознаване на реч на Android вече има списък с вашите контакти, така че да може да разпознава имената на вашите приятели. Гласовото търсене на карти използва геолокация, за да стесни опциите, към които искате да получите упътвания.

Точността на системите за разпознаване се повишава с включването на такива сигнали в данните. Но ние едва започваме да се задълбочаваме в типа контекст, който можем да включим в обработката и как да го използваме.

Разгръщане

Последните постижения в разпознаването на говорим език не могат да бъдат разгърнати. Когато си представяте внедряването на алгоритъм за разпознаване на реч, трябва да имате предвид латентността и мощността на обработка. Тези параметри са свързани, тъй като алгоритмите, които увеличават изискванията за мощност, също увеличават латентността. Но за простота ще ги обсъдим отделно.

Закъснение: Времето от края на речта на потребителя до края на получаване на преписа. Малко забавяне е типично изискване за разпознаване. Това значително влияе на опита на потребителя при работа с продукта. Често има ограничение от десетки милисекунди. Това може да изглежда твърде строго, но не забравяйте, че издаването на препис обикновено е първата стъпка в поредица от сложни изчисления. Например, в случай на гласово търсене в Интернет, след разпознаване на реч, все още трябва да имате време, за да завършите търсенето.

Двупосочните повтарящи се слоеве са типичен пример за подобрение, което влошава ситуацията с латентността. С тяхна помощ се получават всички най-нови висококачествени резултати от преписи. Единственият проблем е, че не можем да преброим нищо след първия двупосочен слой, докато лицето не приключи да говори. Следователно забавянето се увеличава с продължителността на присъдата.

Отляво: Директното повторение позволява дешифрирането да започне незабавно. Вдясно: Двупосочното повтаряне изисква да изчакате до края на речта, преди да започнете да транскрибирате.

Все още се търси добър начин за ефективно включване на бъдеща информация в разпознаването на реч.

Изчислителна мощност: Този параметър се влияе от икономически ограничения. Трябва да имате предвид цената на банкета за всяко подобрение в точността на разпознавателя. Ако дадено подобрение не достигне икономическия праг, то няма да може да го разгърне.

Класически пример за непрекъснато подобрение, което никога не се внедрява, е съвместното дълбоко обучение. Намаляването на броя на грешките с 1-2% рядко оправдава увеличение на изчислителната мощност с 2-8 пъти. Съвременните модели на повтарящи се мрежи също попадат в тази категория, тъй като те са много нерентабилни за използване при търсене на куп траектории, въпреки че мисля, че ситуацията ще се промени в бъдеще.

Искам да поясня - не казвам, че подобряването на точността на разпознаване със сериозно увеличение на изчислителните разходи е безполезно. Вече видяхме как работи принципът „първо бавно, но точно и после бързо“ в миналото. Въпросът е, че докато подобрението не стане достатъчно бързо, не може да се използва.

През следващите пет години

Все още има много нерешени и сложни проблеми в областта на разпознаването на реч. Между тях:

Разширяване на възможностите на новите системи за съхранение на данни, разпознаване на акценти, реч на фона на силен шум.
Включването на контекста в процеса на разпознаване.
Дневник и разделяне на източниците.
Броят на семантичните грешки и иновативните методи за оценка на разпознавателите.
Много малко забавяне.

Очаквам напредъка, който ще бъде постигнат през следващите пет години на тези и други фронтове.

Тагове: Добавете тагове

Управлението чрез сензорен екран вече е стандартно. Най-новите системи като Windows 8 „разбират“ гласовите команди.Разпознаването на реч трябва да направи комуникацията ни с компютъра още по-лесна, по-интуитивна и... по-естествена. Ще ви кажа как изглежда днес.

Малко история - как се развива комуникацията с машината

Начините за комуникация с компютър са се развили през годините. Първият интерфейс, чрез който човек може да издава команди, са перфокарти, които датират от 1832 г. Използвани са в машини за производство на платове. Клавиатурата започва да се използва през 1960 г. Две десетилетия по-късно стандартната мишка се присъедини и все още се използва днес. Въпреки че мишката споделя мощност с тракпада, тя все още е най-популярната форма на контрол. Благодарение на смартфоните и таблетите сензорният интерфейс и жестовете станаха много популярни, които се използват по-специално за управление на Xbox 360 Kinect. След сензорните екрани и жестовете идва гласовият контрол, но това решение досега е толкова недоразработено, че понякога не чувате за него.

Настройка на разпознаване на реч в Windows 8

За съжаление, гласовият контрол все още не е наличен на руски. В момента се поддържат английски, френски, немски, японски, корейски, китайски и испански. Microsoft реши да се съсредоточи върху най-големите и развити страни, но е възможно за известно време да добави тази функция и за нашата страна. Ако се опитате да го стартирате, той ругае така

Ако все пак искате да тествате това решение, трябва да настроите системата (да смените езика) и да научите няколко думи на английски. За да направите това, трябва да отидете в контролния панел и да изберете елемента Език. Ако нямате друг език освен руски, трябва да кликнете върху бутона "Добавяне на език" и след това да изберете един от поддържаните езици. В нашия случай това е "английски (САЩ)". Виждаме, че е налично само оформлението на този език, щракнете двукратно, наличността на езика за интерфейса ще бъде проверена, след като проверите, щракнете върху „Изтеглете и инсталирайте езиковия пакет“ и процесът ще започне, търпеливо изчакайте да натоварване. След като този процес приключи, задайте езика по подразбиране на английски

Сега трябва да отидете на началния екран на Windows 8 (плочки), да въведете „Разпознаване на реч на Windows“ в полето за търсене и да натиснете Enter.

Така можете да стартирате инструмента за гласово разпознаване. Когато стартирате за първи път, ще ви подкани да конфигурирате микрофона, след като изберете, кажете нещо за проверка.

След това предложете да вземете уроци за обучение. Те продължават до 15-20 минути, но са много полезни и дават основна информация за това как да използвате функциите. Но ако не сте силен в английския, мисля, че не трябва да губите време, ще бъде трудно да разберете нещо, отидете направо в битка

Как да работи

За да може компютърът да започне да разпознава вашата реч, трябва да кажете "start listening" (което означава започнете да слушате) или да натиснете бутона на микрофона, за да започнете режим на слушане. Сега можете да отворите приложението или просто да диктувате думи в текстов редактор, браузър или лента за търсене

Какво можем да направим

По принцип възможностите са огромни, в допълнение към стандартните думи можете да създадете свои собствени екипи. Основните характеристики са показани в таблицата

Действие	Какво да кажа
Изберете произволен елемент по името му	Щракнете върху Файл, Старт, Преглед
Изберете произволен елемент или икона	Щракнете върху Кошче, щракнете върху Компютър, щракнете върху (име на файл)
Щракнете два пъти върху всеки елемент	Щракнете двукратно върху Кошче, щракнете двукратно върху Компютър
Превключване между отворени приложения	Превключете към Paint, Превключете към WordPad
превъртане	превъртете нагоре; превърти надолу; превъртане наляво; Превъртете надясно
Включете нов параграф или нов ред в документа	нов параграф; нова линия
Изберете дума в документ
Корекция на думи	правилна дума
Изберете и изтрийте определени думи
Показване на списък с приложими команди
	Опресняване на говорни команди
Включете режима на слушане
Деактивирайте режима на слушане
Свиване на микрофона	Намалете до минимум разпознаването на реч
Вижте помощ и поддръжка на Windows	Как да направя нещо? Например: Как да инсталирам принтер?

Ако не знаете как да произнесете фразата, предлагам ви да използвате Google Translate или http://tutor.ru (той разбра този сайт по-добре)

Имах желание да напиша екипите си, състоящи се от прости буржоазни думи. Което мога да произнасям. Така че той не ми позволи да направя това, той не можа да стартира редактора на команди. В резултат на това той отлично разбра моето произношение на думите One, Two и Open. С този комплект можете да стартирате приложението по номер в началния екран. Първо кажете номера, след това ОТВОРИ. Не много, разбира се, но смятам експеримента за успешен. Няма да е лошо, ако Microsoft въведе руски език, добър заместител на дистанционното управление.

Операционната система Windows 7 е оборудвана с много опции, които дават все повече и повече възможности на потребителите на тази система. Те успяха да въведат много интересна функция в него, която се нарича "разпознаване на реч". Но каква е тази система? Това ще бъде обсъдено.

Въпросната опция позволява на приложенията в цялата система да използват напълно нов начин за взаимодействие на потребителя с компютъра. Това е системата за разпознаване на реч на Windows 7, която ви позволява да контролирате компютъра си, без да използвате клавиатура, мишка или други средства.

Бих искал да отбележа, че тази иновация ще бъде налична и в други продукти на Microsoft. Тази функция беше забелязана малко по-рано, тоест те се опитаха да я внедрят в Windows Vista, но в седмата версия на операционната система Microsoft гласовият контрол се извършва на по-високо ниво от предшественика му. Казано по-просто, такава опция като разпознаване на реч в Windows 7 стана още по-функционална.

В допълнение към всичко казано, бих искал да отбележа, че има доста широк спектър от приложения. Потребителите на Windows 7 с разпознаване на реч имат възможността да стартират програми и да конвертират всички звукови фрагменти в текст, да изпълняват всички видове команди на компютъра, като използват само гласа си и необходимите устройства. Но какво е необходимо, за да стане разпознаването на реч в Windows 7 реалност?

На първо място, ще ви трябва микрофон, който трябва да бъде свързан към вашия компютър. Освен това трябва да закупите специално приложение или програма, публикувана от самия производител, тоест от Microsoft. След като всички необходими компоненти са инсталирани и микрофонът е свързан към компютъра, трябва да се приложи определен работен план:

Трябва да изпълните тестови гласови команди и да ги конвертирате в текст.
След като обучите програмата за разпознаване, ще трябва да създадете шаблони за различни команди с вашия глас. Именно на базата на тази работа компютърът ще може да приема и изпълнява всички зададени от вас команди.

Функцията за разпознаване на реч на Windows 7 се използва в текстовия редактор на WordPad на Microsoft. Функционира безупречно при попълване на различни форми, а също така се представя добре в Internet Explorer и когато

В допълнение, тази опция лесно ще редактира предварително записания текст, като дефинира специални гласови команди. Разбира се, в процеса на разпознаване на конкретна задача възникват типични грешки (когато възникне погрешно разпознаване на определени звуци). В този случай програмата предоставя списък със съответствия на определени думи.

Функцията, разбира се, е феноменална, но все пак има едно „но“. Работата е там, че разпознаването на руската реч сега по принцип не е достъпно. Има отлични версии на програмата за английски, френски, немски и японски език. Има и версии за китайска, испанска и италианска реч.

Но тази новост не е съвсем адаптирана за руска реч. Вашият компютър няма да може да възприема задачите, които са му възложени, което означава, че ще ви бъде по-лесно да пишете нещо с помощта на клавиатурата или да изпълнявате определени задачи с мишката.

Разбира се, можете да опитате да работите с подобни рускоезични програми или да дадете предпочитание на английски, но все пак остава да се надяваме, че скоро разпознаването на реч на руски ще бъде достъпно и в режим с високо качество. И точно тогава ще можете да изпробвате такава уникална функция на практика. В крайна сметка, без съмнение, очевидно опростява работата на персонален компютър и е огромен пробив в областта на програмирането. Така че остава само да чакаме.

Никоя програма не може напълно да замени ръчната работа по транскрибиране на записана реч. Има обаче решения, които могат значително да ускорят и улеснят превода на реч в текст, тоест да опростят транскрипцията.

Транскрипцията е запис на аудио или видео файл в текстова форма. В интернет има платени платени задачи, когато се плаща определена сума пари на изпълнителя за транскрибиране на текст.

Преводът на реч към текст е полезен

студентите да превеждат записани аудио или видео лекции в текст,
блогъри, водещи уебсайтове и блогове,
писатели, журналисти да пишат книги и текстове,
информационни бизнесмени, които се нуждаят от текст след своя уебинар, реч и т.н.,
хора, на които им е трудно да пишат - те могат да продиктуват писмо и да го изпратят на роднини или приятели,
други възможности.

Ще опишем най-ефективните инструменти, налични на компютър, мобилни приложения и онлайн услуги.

1 Сайт speakpad.ru

Това е онлайн услуга, която ви позволява да превеждате реч в текст чрез браузъра Google Chrome. Услугата работи с микрофон и с готови файлове. Разбира се, качеството ще бъде много по-високо, ако използвате външен микрофон и диктувате сами. Услугата обаче върши добра работа дори с видеоклипове в YouTube.

Кликнете върху „Активиране на запис“, отговорете на въпроса за „Използване на микрофон“ - за това щракнете върху „Разрешаване“.

Дългата инструкция за използване на услугата може да се свие, като щракнете върху бутон 1 на фиг. 3. Можете да се отървете от рекламата, като преминете през проста регистрация.

Ориз. 3. Сервизна клавиатура

Готовият резултат е лесен за редактиране. За да направите това, трябва или ръчно да коригирате маркираната дума, или да я продиктувате отново. Резултатите от работата се запазват във вашия личен акаунт, те също могат да бъдат изтеглени на вашия компютър.

Списък с видео уроци за работа с речта:

Можете да транскрибирате видеоклипове от Youtube или от вашия компютър, но ще ви трябва миксер, повече подробности:

Видео "аудио транскрипция"

Услугата работи на седем езика. Има малък минус. Това се крие във факта, че ако трябва да транскрибирате готов аудио файл, тогава неговият звук се разпределя към високоговорителите, което създава допълнителни смущения под формата на ехо.

2 Услуга dictation.io

Прекрасна онлайн услуга, която ще ви позволи да превеждате реч в текст безплатно и лесно.

Ориз. 4. Услуга dictation.io

1 на фиг. 4 - руски език може да бъде избран в края на страницата. В браузъра Google Chrome езикът е избран, но в Mozilla по някаква причина няма такава възможност.

Трябва да се отбележи, че е въведена възможност за автоматично запазване на крайния резултат. Това ще предотврати случайно изтриване в резултат на затваряне на раздел или браузър. Тази услуга не разпознава готови файлове. Работи с микрофон. Когато диктувате, трябва да назовавате препинателни знаци.

Текстът се разпознава съвсем коректно, няма правописни грешки. Можете сами да вмъквате препинателни знаци от клавиатурата. Готовият резултат може да бъде запазен на вашия компютър.

3 RealSpeaker

Тази програма ви позволява лесно да превеждате човешка реч в текст. Предназначен е да работи на различни системи: Windows, Android, Linux, Mac. С негова помощ можете да конвертирате реч, която звучи в микрофон (например може да бъде вградена в лаптоп), както и да се записва в аудио файлове.

Може да възприема 13 езика на света. Има бета версия на програмата, която работи като онлайн услуга:

Трябва да следвате връзката по-горе, да изберете руски език, да качите своя аудио или видео файл в онлайн услугата и да платите за неговата транскрипция. След транскрипцията можете да копирате получения текст. Колкото по-голям е файлът за транскрипция, толкова повече време ще отнеме обработката му, повече подробности:

През 2017 г. имаше опция за безплатна транскрипция с помощта на RealSpeaker, през 2018 г. няма такава възможност. Много е неудобно, че транскрибираният файл е достъпен за изтегляне от всички потребители, може би това ще бъде финализирано.

Контактите на разработчика (VKontakte, Facebook, Youtube, Twitter, имейл, телефон) на програмата могат да бъдат намерени на страницата на неговия уебсайт (по-точно в долния колонтитул на сайта):

4 Speechlogger

Алтернатива на предишното приложение за мобилни устройства, работещи на Android. Предлага се безплатно в магазина за приложения:

Текстът се редактира автоматично, в него се поставят препинателни знаци. Чудесно за диктуване на бележки или съставяне на списъци. В резултат на това текстът ще се окаже с много прилично качество.

5 Драконови диктовки

Това е приложение, което се разпространява безплатно за мобилни устройства от Apple.

Програмата може да работи с 15 езика. Тя ви позволява да редактирате резултата, да изберете желаните думи от списъка. Необходимо е ясно да произнасяте всички звуци, да не правите ненужни паузи и да избягвате интонацията. Понякога има грешки в окончанията на думите.

Приложението Dragon Dictation се използва от собствениците, например, за да диктуват списъка за пазаруване в магазина, докато се движат из апартамента. Ще дойда там, ще можете да разгледате текста в бележката и няма нужда да слушате.

Каквато и програма да използвате в практиката си, бъдете готови да проверите отново резултата и да направите определени корекции. Това е единственият начин да получите безупречен текст без грешки.

Също полезни услуги:

Получавайте актуални статии за компютърна грамотност директно във входящата си поща.
Вече повече 3 000 абонати