• Сөйлеуді тану мәселесі әлі шешілген жоқ. Дауысты автоматты тануды қосу және өшіру Сөйлеуді тануды орнату Windows 7

    Windows Vista — Microsoft корпорациясының кірістірілген сөйлеуді тану мүмкіндігі бар бірінші операциялық жүйесі. Бұл функцияны пайдалана отырып, бағдарламаларды іске қосу, файлдарды жабу, сақтау және жою, сөзбе-сөз жазылатын мәтінді жазу және оны өңдеу сияқты әртүрлі тапсырмаларды дауыспен орындауға болады. Деб Шиндер, АТ-кеңесші сізге осы мүмкіндікті пайдаланудың егжей-тегжейлерімен таныстырады.

    «Star Trek» фильмі шыққаннан бері көптеген компьютер пайдаланушылары пернетақталарды, тышқандарды лақтырып, компьютерді дауыспен басқаруды армандады. Әртүрлі командаларды айтуға, компьютерге мәтінді жазуға мүмкіндік беретін бағдарламалар көп жылдар бойы жасалған және басқа енгізу әдістерін физикалық түрде пайдалана алмайтындар үшін өте пайдалы болды. Бірақ қандай да бір себептермен бұл бағдарламалар танымал болмады.

    Windows Vista — Microsoft корпорациясының сөйлеуді тани алатын алғашқы операциялық жүйесі. Бұрын сөзді тану мүмкіндігі Microsoft Office XP және Office 2003 нұсқаларында болған, сонымен қатар Dragon NaturallySpeaking сияқты басқа әзірлеушілердің бағдарламаларын пайдалануға болатын. Microsoft сонымен қатар Windows Mobile жүйесіне сөйлеуді тану мүмкіндігін қосты.

    Компьютермен сөйлесуді бастау үшін қосымша ештеңе сатып алудың қажеті жоқ, Vista-да бәрі бар. Әдепкі бойынша, функция өшірілген, бірақ оны А суретінде көрсетілгендей Басқару тақтасында оңай қосуға болады.

    Сондай-ақ, бұл мүмкіндікті мәзірден Барлық бағдарламалар | опциясын таңдау арқылы іске қосуға болады Стандартты | Қол жетімділік (Барлық бағдарламалар | Керек-жарақтар | Қол жеткізу оңайлығы), В суретінде көрсетілгендей.

    Бұл қалай жұмыс істейді

    Сөйлеуді тану екі режимінің бірін таңдауға болады:

    • Бағдарламаларды басқару үшін: Бағдарламаларды іске қосу және жабу, олардың арасында ауысу, файлдарды сақтау және жою, т.б.
    • Сөзбе-сөз жазылатын мәтінді диктанттау, сонымен қатар оны өңдеу.

    Бағдарламалық жасақтаманы әзірлеушілер өз бағдарламаларына бұл мүмкіндікті қолдауды қоса алады. Бір қызығы, сөйлеуді тану қазіргі уақытта тек бірнеше тілге қолдау көрсетеді: ағылшын (АҚШ және Ұлыбритания), неміс, француз, испан, жапон және қытай (дәстүрлі және жеңілдетілген).

    Сөйлеуді тануды орнату

    Сөйлеуді тануды қолданар алдында келесі қадамдарды орындау керек:

    • Сөйлеуді тану мүмкіндігін қосыңыз.
    • Микрофонды реттеңіз.
    • Нұсқаулықты оқыңыз (міндетті емес).
    • Жаттығуды анық орындаңыз, сөйлеңіз (сонымен қатар қажет емес).

    Басқару тақтасындағы Сөйлеуді тану параметрін екі рет басқаннан кейін немесе мәзірден Сөйлеуді тану опциясын таңдағаннан кейін C суретінде көрсетілгендей орнату терезесі көрсетіледі.


    Сөйлеуді тануды бастау түймесін басқан кезде, D суретінде көрсетілгендей, экранның жоғарғы жағында дауысты басқару тақтасы пайда болады.


    Егер сізде бұл функция конфигурацияланған болса, розетка автоматты іске қосуда тіркеледі және Windows жүктелген сайын іске қосылады. Науада көк дауыспен басқару белгішесі де пайда болады.
    Е суретінде көрсетілгендей науа белгішесін немесе дауыстық басқару тақтасын тінтуірдің оң жақ түймешігімен басу арқылы параметрлердің контекстік мәзіріне қоңырау шалуға болады.


    Мәзірде сіз келесі параметрлерді көресіз:

    • Сөйлеуді қосу:Компьютер сіз айтқан барлық нәрсені тыңдайды және өзі танитын пәрмендерді орындайды.
    • Күту режимі (Ұйқы):Компьютер сіздің сөзіңізді бақылайды, бірақ сіз «Тыңдауды бастау» демейінше ешбір пәрменге жауап бермейді.
    • Өшірулі:Не айтсаң да, компьютер сені тыңдамайды.
    • Сөйлеу анықтамалық картасын ашу:Негізгі пәрмендер мен қосымша ақпараты бар ыңғайлы парағы.
    • Сөйлеу сабағын бастау:Сізге барлығын айтып, көрсететін бейне оқулық.
    • Көмектесіңдер:Осы функция туралы анықтама файлын ашады.
    • Опциялар:Мұнда сіз бағдарламаны Windows жүйесіне жүктеуге, мәтінді автоматты түрде түзетуге және т.б. орнатуға болады.
    • Конфигурация:Мұнда микрофонды орнатуға, сөйлеуді тануды жақсартуға және басқару тақтасын ашуға болады.
    • Сөйлеу сөздігін ашыңыз:Жаңа сөздерді қосуға болады (аттар мен тану қиын сөздер үшін өте пайдалы), сондай-ақ ешқашан айтпайтын сөздерді алып тастауға болады.
    • Диктант тақырыбы:Мұнда тек Баяндаманы таңдауға болады.
    • Сайтқа кіріңіз (Сөйлеуді тану веб-сайтына өтіңіз).
    • Сөйлеуді тану туралы ақпарат алу:Бұл бізге таныс Windows диалогтық терезесі, онда бағдарламаның нұсқасы, лицензия нөмірі және аты жазылған.
    • Сөйлеуді тану мүмкіндігін ашыңыз.
    • Шығу:Бағдарламаны толығымен жабады.
    • Аударма

    Терең оқыту сөйлеуді тану сахнасына енгеннен бері сөзді танудағы қателер саны күрт азайды. Бірақ сіз оқыған барлық мақалаларға қарамастан, бізде әлі де адам деңгейінде сөйлеуді тану мүмкіндігі жоқ. Сөйлеу тану құрылғыларында көптеген сәтсіздік режимдері бар. Оларды одан әрі жақсарту үшін оларды анықтау және жоюға тырысу керек. Бұл көбінесе кейбір адамдар үшін жұмыс істейтін танудан барлық уақытта барлық адамдар үшін жұмыс істейтін тануға өтудің жалғыз жолы.

    Қате анықталған сөздер санының жақсаруы. 2000 жылы телефон коммутаторында ана тілі ағылшын тілі болып табылатын екі адамның кездейсоқ 40 сөйлесуінен сынақ дауыстық теру құрастырылды.

    Сөйлесудегі сөйлеуді тануда адам деңгейіне жеттік деу, тек телефон коммутаторындағы сөйлесулер жиынтығына сүйене отырып, робот машинаны бір қалада сынап көрген адам сияқты жақсы жүргізеді дегенмен бірдей. ешқандай қозғалыссыз шуақты күнде. Сөйлеуді танудағы соңғы өзгерістер таңқаларлық. Бірақ адам деңгейінде сөйлеуді тану туралы мәлімдемелер тым батыл. Мұнда әлі де жақсартуды қажет ететін бірнеше аймақтар бар.

    Акцент және шу

    Сөйлеуді танудың айқын кемшіліктерінің бірі өңдеу болып табылады екпінжәне фондық шу. Мұның басты себебі - оқу деректерінің көпшілігі сигнал-шуыл қатынасы жоғары американдық диалектілерден тұрады. Мысалы, телефон коммутаторынан сөйлесулер жинағында тек ана тілі ағылшын (негізінен американдықтар) болып табылатын адамдардың фондық шуы аз сөйлесулері бар.

    Бірақ жаттығу деректерін өздігінен көбейту бұл мәселені шешпейді. Көптеген диалектілер мен акценттерді қамтитын көптеген тілдер бар. Барлық жағдайлар үшін белгіленген деректерді жинау мүмкін емес. Американдық ағылшын тілі үшін жоғары сапалы сөйлеу тану құралын жасау тек мәтінге транскрипцияланған 5000 сағатқа дейін аудионы қажет етеді.


    Сөйлеудің әртүрлі түрлері бойынша Baidu's Deep Speech 2-мен сөйлеген-мәтіндік адамдарды салыстыру. Адамдар американдық емес акценттерді тануға нашар, мүмкін олардың арасында американдықтардың көптігіне байланысты. Менің ойымша, белгілі бір аймақта өскен адамдар сол аймақтың акцентін танумен әлдеқайда аз қателіктермен күресетін еді.

    Қозғалыстағы автомобильде фондық шу болған жағдайда сигнал-шу қатынасы -5 дБ дейін төмен болуы мүмкін. Мұндай жағдайларда адамдар басқа адамның сөйлеуін танумен оңай күреседі. Автоматты тану құрылғылары шу жоғарылаған сайын тезірек нашарлайды. График шудың жоғарылауымен адамдардың бөлінуі қаншалықты артқанын көрсетеді (төмен SNR кезінде, сигнал-шуыл қатынасы)

    Семантикалық қателер

    Көбінесе қате танылған сөздердің саны сөйлеуді тану жүйесі үшін өздігінен аяқталмайды. Біз семантикалық қателердің санын мақсат етіп отырмыз. Бұл біз мағынасын қате таныған өрнектердің үлесі.

    Семантикалық қатенің мысалы ретінде біреу «сейсенбіде кездесейік» [сейсенбіде кездесейік] десе, танушының «бүгін кездесейік» [бүгін кездесейік] деп қайтаруы. Семантикалық қатесі жоқ сөздерде де қателер бар. Шешуші «жоғары» дегенді танымай, «сейсенбіде кездесейік» деп қайтарса, сөйлемнің семантикасы өзгерген жоқ.

    Біз қате анықталған сөздердің санын өлшем ретінде мұқият пайдалануымыз керек. Мұны көрсету үшін мен сізге ең нашар мысал келтіремін. Сөз қателерінің 5%-ы 20 сөздің бір жетіспейтін сөзіне сәйкес келеді. Егер әрбір сөйлемде 20 сөз болса (бұл ағылшын тіліндегі орташа көрсеткішке сәйкес), онда қате танылған сөйлемдердің саны 100%-ға жақындайды. Қате танылған сөздер сөйлемдердің семантикалық мағынасын өзгертпейді деп үміттенуге болады. Әйтпесе, танушы әрбір сөйлемді 5% қате танылған сөздермен де қате түсіндіруі мүмкін.

    Модельдерді адамдармен салыстыру кезінде қателердің мәнін тексеру және қате танылған сөздердің санын ғана емес бақылау маңызды. Менің тәжірибемде сөзден мәтінге ауысатын адамдар аз қателіктер жібереді және олар компьютерлер сияқты маңызды емес.

    Майкрософт зерттеушілері жақында ұқсас деңгейдегі адам мен компьютерді танушылардың қателерін салыстырды. Табылған айырмашылықтардың бірі - модель адамдарға қарағанда «ух» [uh…] және «uh huh» [иә] жиі шатастырады. Екі терминнің семантикасы өте әртүрлі: «ух» бос орындарды толтырады, ал «ух» тыңдаушының растауын білдіреді. Сондай-ақ, модельдер мен адамдар сәйкес түрлердің көптеген қателерін тапты.

    Бір арнада көп дауыс

    Жазылған телефон сөйлесулерін тану оңайырақ, себебі әрбір динамик жеке микрофонға жазылған. Бір аудио арнада бірнеше дауыстың қабаттасуы жоқ. Адамдар бірнеше сөйлеушіні түсінеді, кейде бір уақытта сөйлейді.

    Жақсы сөйлеу танушысы дыбыс ағынын динамикке байланысты сегменттерге бөлуі керек (оны диагностикалауға бағынады). Ол сондай-ақ екі қабаттасатын дауыстары бар аудио жазбадан мағынаны шығаруы керек (көздерді бөлу). Мұны динамиктердің әрқайсысының аузында орналасқан микрофонсыз жасау керек, яғни танушы ерікті жерге қойылғанда жақсы жұмыс істейді.

    Жазу сапасы

    Екпіндер мен фондық шу - бұл сөйлеуді танушы сенімді болуы керек екі фактор ғана. Міне, тағы бірнеше:

    Әртүрлі акустикалық жағдайларда реверберация.
    Жабдықпен байланысты артефактілер.
    Сигналды жазу және қысу үшін қолданылатын кодек артефактілері.
    Сынама алу жиілігі.
    Сөйлеушінің жасы.

    Көптеген адамдар mp3 және wav файлдарын ажырата алмайды. Адамға ұқсас өнімділікті талап етпес бұрын, танушылар осы өзгеру көздеріне сенімді болуы керек.

    Контекст

    Адамдардың телефон станциясынан жазбалардағы сынақтарда жіберетін қателерінің саны айтарлықтай көп екенін байқауға болады. Егер сіз 20 сөздің 1 сөзін түсінбейтін досыңызбен сөйлесіп жатсаңыз, сізге тіл табысу өте қиын болар еді.

    Мұның себептерінің бірі - контекстсіз тану. Нақты өмірде біз басқа адамның не айтып жатқанын түсінуге көмектесетін көптеген әртүрлі қосымша белгілерді қолданамыз. Адамдар қолданатын және сөйлеу танушылары еленбейтін контексттің кейбір мысалдары:

    Әңгімелесу тарихы және талқыланатын тақырып.
    Сөйлеуші ​​туралы көрнекі белгілер – мимика, ерін қимылы.
    Біз әңгімелесіп отырған адам туралы білім жиынтығы.

    Android сөйлеу тану құралында енді контактілер тізімі бар, сондықтан ол достарыңыздың атын тани алады. Карталарда дауыспен іздеу бағыттарды алғыңыз келетін опцияларды тарылту үшін геолокацияны пайдаланады.

    Тану жүйелерінің дәлдігі деректерге осындай сигналдарды қосқанда артады. Бірақ біз өңдеуге қосуға болатын контекст түрін және оны қалай пайдалану керектігін енді ғана зерттей бастадық.

    Орналастыру

    Сөйлеу тілін танудағы соңғы жетістіктерді қолдану мүмкін емес. Сөйлеуді тану алгоритмін қолдануды елестеткен кезде кідіріс пен өңдеу қуатын есте сақтау керек. Бұл параметрлер байланысты, себебі қуат талаптарын арттыратын алгоритмдер де кідірісті арттырады. Бірақ қарапайымдылық үшін біз оларды бөлек талқылаймыз.

    Кідіріс: Пайдаланушының сөзі аяқталғаннан бастап транскриптті алғанға дейінгі уақыт. Кішкентай кідіріс тану үшін әдеттегі талап болып табылады. Бұл пайдаланушының өніммен жұмыс істеу тәжірибесіне қатты әсер етеді. Көбінесе ондаған миллисекунд шегі бар. Бұл тым қатал болып көрінуі мүмкін, бірақ транскрипт беру әдетте күрделі есептеулер сериясының алғашқы қадамы екенін есте сақтаңыз. Мысалы, дауысты Интернетте іздеу жағдайында, сөйлеуді танудан кейін іздеуді аяқтауға әлі де уақыт керек.

    Екі бағытты қайталанатын қабаттар кідіріс жағдайын нашарлататын жақсартудың әдеттегі мысалы болып табылады. Барлық соңғы жоғары сапалы транскрипт нәтижелері олардың көмегімен алынады. Жалғыз мәселе - адам сөйлесіп болғанша, біз бірінші екі жақты қабаттан өткен ештеңені санай алмаймыз. Сондықтан кідіріс сөйлемнің ұзақтығына қарай артады.


    Сол жақта: Тікелей қайталау шифрды шешуді бірден бастауға мүмкіндік береді. Оң жақ: екі жақты қайталану транскрипциялауды бастамас бұрын сөздің соңына дейін күтуді талап етеді.

    Болашақ ақпаратты сөйлеуді тануға тиімді енгізудің жақсы жолы әлі де іздестірілуде.

    Есептеу қуаты: Бұл параметрге экономикалық шектеулер әсер етеді. Сіз танушының дәлдігін әрбір жақсарту үшін банкет құнын ескеруіңіз керек. Егер жақсарту экономикалық шекке жетпесе, ол оны қолдана алмайды.

    Ешқашан қолданылмайтын үздіксіз жетілдірудің классикалық мысалы - бірлескен терең оқыту. Қателер санын 1-2% қысқарту есептеу қуатының 2-8 есе артуын сирек ақтайды. Қайталанатын желілердің заманауи үлгілері де осы санатқа жатады, өйткені оларды траекториялар шоғырын іздеуде пайдалану өте тиімсіз, дегенмен болашақта жағдай өзгереді деп ойлаймын.

    Мен түсіндіргім келеді - есептеу шығындарының айтарлықтай өсуімен тану дәлдігін жақсарту пайдасыз деп айтпаймын. «Алдымен баяу, бірақ дәл, содан кейін тез» принципінің қалай жұмыс істейтінін бұрын көрдік. Мәселе мынада, жақсарту жеткілікті жылдам болғанша оны пайдалану мүмкін емес.

    Алдағы бес жылда

    Сөйлеуді тану саласында әлі де көптеген шешілмеген және күрделі мәселелер бар. Олардың ішінде:

    Деректерді сақтаудың жаңа жүйелерінің мүмкіндіктерін кеңейту, екпінді тану, қатты шу фонында сөйлеу.
    Контекстті тану процесіне қосу.
    Дереккөздерді күнделендіру және бөлу.
    Семантикалық қателер саны және танушыларды бағалаудың инновациялық әдістері.
    Өте аз кідіріс.

    Мен осы және басқа да бағыттар бойынша алдағы бес жылда қол жеткізілетін жетістіктерді асыға күтемін.

    Тегтер: тегтерді қосыңыз

    Сенсорлық экранды басқару стандартты болып табылады. Windows 8 сияқты соңғы жүйелер дауыстық пәрмендерді «түсінеді».Сөйлеуді тану біздің компьютермен байланысымызды одан да жеңіл, интуитивті және... табиғи ету керек. Мен бүгін оның қандай екенін айтамын.

    Біраз тарих - машинамен байланыс қалай дамыды

    Компьютермен байланысу тәсілдері жылдар бойы дамып келеді. Адамның командалар бере алатын бірінші интерфейсі 1832 жылдан бастау алатын перфокарталар болды. Олар мата өндіруге арналған машиналарда пайдаланылды. Пернетақта 1960 жылы қолданыла бастады. Екі онжылдық өткеннен кейін стандартты тінтуір қосылды және бүгінгі күнге дейін қолданылуда. Тінтуір сенсорлық тақтамен қуатты бөліссе де, ол әлі де басқарудың ең танымал түрі болып табылады. Смартфондар мен планшеттердің арқасында сенсорлық интерфейс пен қимылдар өте танымал болды, олар, атап айтқанда, Xbox 360 Kinect басқару үшін қолданылады. Сенсорлық экрандар мен қимылдардан кейін дауыстық басқару пайда болады, бірақ бұл шешім әлі де дамымағаны сонша, кейде бұл туралы естімейсіз.

    Windows 8 жүйесінде сөйлеуді тануды орнату

    Өкінішке орай, дауыспен басқару орыс тілінде әлі қол жетімді емес. Қазіргі уақытта ағылшын, француз, неміс, жапон, корей, қытай және испан тілдеріне қолдау көрсетіледі. Майкрософт ең үлкен және ең дамыған елдерге назар аударуды шешті, бірақ біраз уақыт бұл мүмкіндікті біздің еліміз үшін де қосуы мүмкін. Егер сіз оны іске қоссаңыз, ол осылай ант береді

    Егер сіз әлі де осы шешімді сынағыңыз келсе, жүйені орнату (тілді өзгерту) және ағылшын тілінде бірнеше сөз үйренуіңіз керек. Ол үшін басқару тақтасына өтіп, Тіл тармағын таңдау керек. Егер сізде орыс тілінен басқа тіл болмаса, «Тіл қосу» түймесін басып, қолдау көрсетілетін тілдердің бірін таңдауыңыз керек. Біздің жағдайда бұл «ағылшын тілі (Америка Құрама Штаттары)». Біз тек осы тілдегі макет қолжетімді екенін көреміз, екі рет басыңыз, интерфейс үшін тілдің қолжетімділігі тексеріледі, тексергеннен кейін «Тіл бумасын жүктеп алу және орнату» түймесін басыңыз және процесс басталады, шыдамдылықпен күтіңіз. жүктеу үшін. Бұл процесс аяқталғаннан кейін әдепкі тілді ағылшын тіліне орнатыңыз

    Енді сізге Windows 8 бастау экранына (плиткамен қапталған) өту керек, іздеу жолағына «Windows Speech Recognition» деп теріп, Enter пернесін басыңыз.

    Осылайша, сіз дауысты тану құралын іске қоса аласыз. Алдымен іске қосқан кезде ол микрофонды конфигурациялауды ұсынады, таңдағаннан кейін тексеру үшін бірдеңе айтыңыз.

    Содан кейін жаттығу сабақтарын алуды ұсыныңыз. Олар 15-20 минутқа дейін созылады, бірақ өте пайдалы және мүмкіндіктерді пайдалану туралы негізгі ақпаратты береді. Бірақ егер сіз ағылшын тілінде мықты болмасаңыз, менің ойымша, сіз уақытты босқа өткізбеуіңіз керек, ештеңені анықтау қиын болады, тікелей шайқасқа барыңыз

    Қалай жұмыс істеу керек

    Компьютер сіздің сөзіңізді тани бастауы үшін «тыңдауды бастау» (бұл тыңдауды бастау дегенді білдіреді) деп айту керек немесе тыңдау режимін бастау үшін микрофон түймесін басыңыз. Енді сіз қосымшаны аша аласыз немесе мәтіндік редакторда, шолғышта немесе іздеу жолағында жай сөздерді айта аласыз

    Біз не істей аламыз

    Негізінде, мүмкіндіктер өте үлкен, стандартты сөздерден басқа, сіз өзіңіздің командаларыңызды құра аласыз. Негізгі мүмкіндіктер кестеде көрсетілген

    Әрекет Не айтайын
    Кез келген элементті аты бойынша таңдаңыз Файл, Бастау, Көру түймешігін басыңыз
    Кез келген элементті немесе белгішені таңдаңыз Себет түймешігін басыңыз, Компьютерді басыңыз, басыңыз (файл атауы)
    Кез келген элементті екі рет басыңыз немесе екі рет басыңыз Себетті екі рет басыңыз, Компьютерді екі рет басыңыз
    Ашық қолданбалар арасында ауысу Paint-қа ауысу, WordPad-қа ауысу

    айналдыру

    жоғары айналдыру; төмен айналдыру;
    солға айналдыру; Оңға айналдырыңыз

    Құжатқа жаңа абзацты немесе жаңа жолды қосыңыз

    жаңа абзац; жаңа жол

    Құжаттағы сөзді таңдаңыз

    Сөзді түзету

    дұрыс сөз

    Белгілі бір сөздерді таңдаңыз және жойыңыз

    Қолданылатын пәрмендер тізімін көрсетіңіз

    Сөйлеу пәрмендерін жаңарту

    Тыңдау режимін қосыңыз

    Тыңдау режимін өшіріңіз

    Микрофонды жию

    Сөйлеуді тануды азайтыңыз

    Windows анықтамасын және қолдауын қараңыз

    Мен бірдеңені қалай істей аламын?
    Мысалы: Принтерді қалай орнатуға болады?

    Егер сіз фразаны қалай айту керектігін білмесеңіз, мен сізге Google Translate немесе http://tutor.ru сайтын пайдалануды ұсынамын (ол бұл сайтты жақсы түсінді)

    Қарапайым буржуазиялық сөздерден тұратын командаларымды жазып алғым келді. Мен айта аламын. Сондықтан ол маған мұны істеуге рұқсат бермеді, ол командалық редакторды іске қоса алмады. Нәтижесінде ол менің Бір, Екі және Ашық сөздерді айтуды жақсы түсінді. Бұл жинақпен қолданбаны негізгі экрандағы нөмір бойынша іске қосуға болады. Алдымен санды айт, сосын АШЫҚ деп айт. Әрине, көп емес, бірақ мен экспериментті сәтті деп санаймын. Майкрософт қашықтан басқару құралын жақсы алмастыратын орыс тілін енгізсе, жаман болмас еді.

    Windows 7 операциялық жүйесі осы жүйені пайдаланушыларға көбірек мүмкіндіктер беретін көптеген опциялармен жабдықталған. Олар оған «сөйлеу тану» деп аталатын өте қызықты функцияны енгізе алды. Бірақ бұл жүйе қандай? Бұл талқыланады.

    Қарастырылып отырған опция бүкіл жүйедегі қолданбаларға пайдаланушының компьютермен әрекеттесуінің мүлдем жаңа әдісін пайдалануға мүмкіндік береді. Бұл компьютерді пернетақтаны, тінтуірді немесе басқа құралдарды пайдаланбай басқаруға мүмкіндік беретін Windows 7 Speech Recognition жүйесі.

    Бұл жаңашылдық басқа Microsoft өнімдерінде қолжетімді болатынын атап өткім келеді. Бұл мүмкіндік сәл ертерек байқалды, яғни олар оны Windows Vista жүйесінде жүзеге асыруға тырысты, бірақ Microsoft операциялық жүйесінің жетінші нұсқасында дауыспен басқару оның алдындағыдан жоғары деңгейде орындалады. Қарапайым тілмен айтқанда, Windows 7-де сөйлеуді тану сияқты опция одан да функционалды болды.

    Айтылғандардың барлығына қоса, оның қолдану аясы өте кең екенін атап өткім келеді. Сөйлеуді тану мүмкіндігі бар Windows 7 пайдаланушылары бағдарламаларды іске қосу және барлық дыбыстық фрагменттерді мәтінге түрлендіру, компьютерде тек дауысты және қажетті құрылғыларды пайдалана отырып, барлық командаларды орындау мүмкіндігіне ие. Бірақ Windows 7-де сөйлеуді тануды шындыққа айналдыру үшін не қажет?

    Ең алдымен, сізге микрофон қажет, ол компьютерге қосылуы керек. Бұған қоса, өндірушінің өзі, яғни Microsoft шығарған арнайы қолданбаны немесе бағдарламаны сатып алу керек. Барлық қажетті компоненттер орнатылып, микрофон компьютерге қосылғаннан кейін белгілі бір жұмыс жоспарын орындау керек:

    • Сынақ дауыстық пәрмендерін орындап, оларды мәтінге түрлендіру керек.
    • Тану бағдарламасын үйреткеннен кейін дауысыңызбен әртүрлі пәрмендер үшін үлгілер жасауыңыз қажет. Дәл осы жұмыстың негізінде компьютер сіз көрсеткен барлық командаларды қабылдап, орындай алады.

    Windows 7 жүйесіндегі сөзді тану мүмкіндігі Microsoft корпорациясының WordPad мәтіндік редакторында қолданылады. Ол әртүрлі пішіндерді толтыру кезінде мінсіз жұмыс істейді, сонымен қатар Internet Explorer-де және қашан жақсы жұмыс істейді

    Бұған қоса, бұл опция арнайы дауыстық пәрмендерді анықтау арқылы бұрын жазылған мәтінді оңай өңдейді. Әрине, белгілі бір тапсырманы тану процесінде типтік қателер пайда болады (белгілі бір дыбыстарды қате тану кезінде). Бұл жағдайда бағдарлама белгілі бір сөздердің сәйкестіктерінің тізімін береді.

    Функция, әрине, керемет, бірақ әлі де бір «бірақ» бар. Мәселе мынада, орысша сөйлеуді тану қазір, негізінен, қол жетімді емес. Бағдарламаның ағылшын, француз, неміс және жапон тілдеріне арналған тамаша нұсқалары бар. Сондай-ақ қытай, испан және итальян тілінде сөйлеуге арналған нұсқалар бар.

    Бірақ бұл жаңалық орысша сөйлеуге мүлдем бейімделмеген. Сіздің компьютеріңіз оған жүктелген тапсырмаларды қабылдай алмайды, бұл сізге пернетақта арқылы бірдеңе жазу немесе тінтуірдің көмегімен белгілі бір тапсырмаларды орындау оңайырақ болады.

    Әрине, сіз ұқсас орыс тілді бағдарламалармен жұмыс істеуге немесе ағылшын тіліне артықшылық беруге болады, бірақ жақын арада орыс тілінде сөйлеуді тану жоғары сапалы режимде де қол жетімді болады деп үміттену керек. Дәл осы кезде сіз осындай бірегей функцияны іс жүзінде сынап көре аласыз. Өйткені, бұл, сөзсіз, дербес компьютердегі жұмысты жеңілдетеді және бағдарламалау саласындағы үлкен серпіліс болып табылады. Сондықтан күту ғана қалды.

    Жазылған сөзді транскрипциялаудың қол жұмысын ешбір бағдарлама толығымен алмастыра алмайды. Дегенмен, сөйлеуді мәтінге аударуды айтарлықтай тездететін және жеңілдететін, яғни транскрипцияны жеңілдететін шешімдер бар.

    Транскрипция - аудио немесе бейне файлды мәтін түрінде жазу. Интернетте мәтінді транскрипциялау үшін орындаушыға белгілі бір ақша сомасы төленетін ақылы тапсырмалар бар.

    Сөйлеуді мәтінге аудару пайдалы

    • студенттерге жазылған аудио немесе бейне лекцияларды мәтінге аудару,
    • веб-сайттар мен блогтарды жетекші блогерлер,
    • жазушылар, журналистер кітаптар мен мәтіндер жазу үшін,
    • вебинардан, сөйлеуден және т.б. кейін мәтінді қажет ететін ақпараттық бизнесмендер,
    • теру қиынға соғатын адамдар - олар хат жазып, оны туыстарына немесе достарына жібере алады,
    • басқа опциялар.

    Біз компьютерде, мобильді қосымшаларда және онлайн қызметтерде қолжетімді ең тиімді құралдарды сипаттайтын боламыз.

    1 speakpad.ru сайты

    Бұл Google Chrome браузері арқылы сөйлеуді мәтінге аударуға мүмкіндік беретін онлайн қызмет. Қызмет микрофонмен және дайын файлдармен жұмыс істейді. Әрине, егер сіз сыртқы микрофонды қолданып, өзіңіз айтып берсеңіз, сапасы әлдеқайда жоғары болады. Дегенмен, қызмет YouTube бейнелерімен де жақсы жұмыс істейді.

    «Жазуды қосу» түймесін басыңыз, «Микрофонды пайдалану» туралы сұраққа жауап беріңіз - бұл үшін «Рұқсат ету» түймесін басыңыз.

    Қызметті пайдалану туралы ұзақ нұсқаулықты суреттегі 1 түймені басу арқылы қысқартуға болады. 3. Қарапайым тіркеуден өту арқылы жарнамадан құтылуға болады.

    Күріш. 3. Қызметтік сөйлеу тақтасы

    Дайын нәтижені өңдеу оңай. Мұны істеу үшін бөлектелген сөзді қолмен түзету керек немесе қайта жазу керек. Жұмыстың нәтижелері сіздің жеке кабинетіңізде сақталады, оларды компьютеріңізге де жүктеп алуға болады.

    Дауыс тақтасымен жұмыс істеу бойынша бейне оқулықтардың тізімі:

    Бейнелерді Youtube сайтынан немесе компьютерден транскрипциялауға болады, бірақ сізге араластырғыш қажет, толығырақ:

    Бейне «аудио транскрипция»

    Қызмет жеті тілде жұмыс істейді. Кішкентай минус бар. Бұл дайын аудио файлды транскрипциялау қажет болса, оның дыбысы динамиктерге таратылады, бұл жаңғырық түрінде қосымша кедергі жасайды.

    2 Dictation.io қызметі

    Сөйлеуді мәтінге тегін және оңай аударуға мүмкіндік беретін тамаша онлайн қызметі.

    Күріш. 4. Dictation.io қызметі

    1 суретте. 4 - Беттің соңында орыс тілін таңдауға болады. Google Chrome браузерінде тіл таңдалған, бірақ Mozilla-да қандай да бір себептермен мұндай мүмкіндік жоқ.

    Бір қызығы, дайын нәтижені автосақтау мүмкіндігі жүзеге асырылады. Бұл қойындыны немесе шолғышты жабу нәтижесінде кездейсоқ жоюды болдырмайды. Бұл қызмет дайын файлдарды танымайды. Микрофонмен жұмыс істейді. Диктант кезінде тыныс белгілерін атау керек.

    Мәтін өте дұрыс танылған, орфографиялық қателер жоқ. Тыныс белгілерін пернетақтадан өзіңіз қоюға болады. Дайын нәтижені компьютерде сақтауға болады.

    3 RealSpeaker

    Бұл бағдарлама адамның сөзін мәтінге оңай аударуға мүмкіндік береді. Ол әртүрлі жүйелерде жұмыс істеуге арналған: Windows, Android, Linux, Mac. Оның көмегімен дыбыстарды микрофонға түрлендіруге болады (мысалы, оны ноутбукке салуға болады), сондай-ақ аудио файлдарға жазылған.

    Әлемнің 13 тілін қабылдай алады. Бағдарламаның онлайн қызмет ретінде жұмыс істейтін бета нұсқасы бар:

    Жоғарыдағы сілтеме бойынша өтіп, орыс тілін таңдап, аудио немесе бейне файлыңызды онлайн қызметке жүктеп, оның транскрипциясын төлеуіңіз керек. Транскрипциядан кейін алынған мәтінді көшіруге болады. Транскрипцияға арналған файл неғұрлым үлкен болса, оны өңдеуге соғұрлым көп уақыт кетеді, толығырақ мәліметтер:

    2017 жылы RealSpeaker көмегімен тегін транскрипция опциясы болды, 2018 жылы мұндай мүмкіндік жоқ. Транскрипцияланған файл барлық пайдаланушыларға жүктеп алу үшін қол жетімді болуы өте ұят, мүмкін бұл аяқталады.

    Бағдарламаның әзірлеушісінің байланыстары (VKontakte, Facebook, Youtube, Twitter, электрондық пошта, телефон) оның веб-сайтының парағында (дәлірек, сайттың төменгі колонтитулында):

    4 Спичлоггер

    Android жүйесінде жұмыс істейтін мобильді құрылғыларға арналған алдыңғы қолданбаға балама. Қолданбалар дүкенінде тегін қол жетімді:

    Мәтін автоматты түрде өңделеді, оған тыныс белгілері қойылады. Жазбаларды жазу немесе тізімдер жасау үшін тамаша. Нәтижесінде мәтін өте лайықты сапалы болып шығады.

    5 Айдаһар диктанты

    Бұл Apple компаниясынан мобильді құрылғылар үшін тегін таратылатын қолданба.

    Бағдарлама 15 тілде жұмыс істей алады. Ол нәтижені өңдеуге, тізімнен қажетті сөздерді таңдауға мүмкіндік береді. Барлық дыбыстарды анық айту керек, қажетсіз үзілістерді жасамау және интонациядан аулақ болу керек. Кейде сөздердің соңында қателер болады.

    Dragon Dictation қолданбасын иелері, мысалы, пәтерде қозғалу кезінде дүкендегі сатып алулар тізімін жазу үшін пайдаланады. Мен сонда келемін, жазбадағы мәтінді қарауға болады, тыңдаудың қажеті жоқ.

    Тәжірибеде қандай бағдарламаны пайдалансаңыз да, нәтижені екі рет тексеруге және белгілі бір түзетулер енгізуге дайын болыңыз. Бұл қатесіз мінсіз мәтін алудың жалғыз жолы.

    Сондай-ақ пайдалы қызметтер:

    Компьютерлік сауаттылық туралы соңғы мақалаларды тікелей кіріс жәшігіңізге алыңыз.
    Қазірдің өзінде көбірек 3000 жазылушы

    .