• Runas atpazīšanas problēma vēl nav atrisināta. Automātiskās runas atpazīšanas ieslēgšana un izslēgšana Runas atpazīšanas iestatīšana operētājsistēmā Windows 7

    Windows Vista ir pirmā Microsoft operētājsistēma, kas ietver runas atpazīšanas iespējas. Izmantojot šo funkciju, ar balsi varat veikt dažādus uzdevumus, piemēram, palaist programmas, aizvērt, saglabāt un dzēst failus, diktēt tekstu, kas tiks ierakstīts burtiski, un rediģēt to. Deb Shinder, IT konsultants, izskaidro, kā izmantot šo funkciju.

    Jau kopš filmas Star Trek iznākšanas daudzi datoru lietotāji ir sapņojuši izmest tastatūras un peles un vadīt datoru ar balsi. Programmas, kas ļāva izrunāt komandas un diktēt tekstu datoram, tika izmantotas daudzus gadus un bija ļoti noderīgas tiem, kuri fiziski nevarēja izmantot citas ievades metodes. Bet kaut kādu iemeslu dēļ šīs programmas nebija populāras.

    Windows Vista ir pirmā Microsoft operētājsistēma, kas spēj atpazīt runu. Iepriekš runas atpazīšanas funkcija bija Microsoft Office XP un Office 2003, un jūs varēja izmantot arī citu izstrādātāju programmas, piemēram, Dragon NaturallySpeaking. Microsoft arī ir pievienojusi runas atpazīšanas līdzekli sistēmai Windows Mobile.

    Lai sāktu runāt ar datoru, jums nekas nav jāiegādājas papildus; Vista jau ir viss šim nolūkam. Funkcija pēc noklusējuma ir atspējota, taču to var viegli palaist no vadības paneļa, kā parādīts A attēlā.

    Varat arī palaist šo funkciju no izvēlnes, atlasot Visas programmas | Standarta | Pieejamība (visas programmas | Piederumi | Vienkārša piekļuve), kā parādīts B attēlā.

    Kā tas strādā

    Varat izvēlēties vienu no diviem runas atpazīšanas darbības režīmiem:

    • Lai pārvaldītu programmas: palaidiet un aizveriet programmas, pārslēdzieties starp tām, saglabājiet un dzēsiet failus un tā tālāk.
    • Diktēt tekstu, kas tiks pierakstīts burtiski, kā arī rediģēt.

    Programmatūras izstrādātāji savām programmām var pievienot šīs funkcijas atbalstu. Žēl, ka runas atpazīšana pašlaik atbalsta tikai dažas valodas: angļu (ASV un Apvienotajā Karalistē), vācu, franču, spāņu, japāņu un ķīniešu (tradicionālo un vienkāršoto).

    Runas atpazīšanas iestatīšana

    Lai varētu izmantot runas atpazīšanu, jums jāveic šādas darbības:

    • Ieslēdziet runas atpazīšanu.
    • Iestatiet mikrofonu.
    • Izlasiet rokasgrāmatu (pēc izvēles).
    • Trenējies runāt skaidri (arī nav nepieciešams).

    Pēc dubultklikšķa uz runas atpazīšanas vadības panelī vai izvēlnē atlasot runas atpazīšanu, tiks parādīts iestatījumu logs, kas parādīts C attēlā.


    Noklikšķinot uz Sākt runas atpazīšanu, ekrāna augšdaļā parādīsies balss vadības panelis, kā parādīts D attēlā.


    Ja esat jau konfigurējis šo funkciju, ligzda tiks reģistrēta automātiskajā palaišanā un tiks startēta katru reizi, kad Windows sāks darboties. Paplātē parādīsies arī zila balss vadības ikona.
    Varat izsaukt iestatījumu konteksta izvēlni, ar peles labo pogu noklikšķinot uz teknes ikonas vai balss vadības panelī, kā parādīts E attēlā.


    Izvēlnē redzēsit šādus iestatījumus:

    • Ieslēgt runu: Dators klausīsies visu, ko sakāt, un izpildīs atpazītās komandas.
    • Miega režīms: Dators pārraudzīs jūsu runu, bet nereaģēs uz komandām, kamēr jūs nepateiksiet “Sākt klausīties”.
    • Izslēgts: Dators tevi neklausa, lai ko tu tam teiktu.
    • Atvērt runas atpazīšanas apkrāptu lapu (Open Speech Reference Card):Ērts apkrāptu lapa ar pamata komandām un papildu informāciju.
    • Sākt runas apmācību: Video pamācība, kurā viņi pastāstīs un parādīs visu.
    • Palīdzība: Atver palīdzību, palīdzības failu par šo funkciju.
    • Iespējas:Šeit jūs varat konfigurēt programmu ielādei ar Windows, automātiski labot tekstu utt.
    • Konfigurācija:Šeit varat pielāgot mikrofonu, uzlabot runas atpazīšanu un atvērt vadības paneli.
    • Atveriet runas vārdnīcu: Varat pievienot jaunus vārdus (ļoti noderīgi nosaukumiem un vārdiem, kurus ir grūti atpazīt), kā arī izslēgt vārdus, kurus nekad neizsakāt.
    • Diktāta tēma:Šeit varat atlasīt tikai stāstījumu.
    • Apmeklējiet vietni Doties uz runas atpazīšanas vietni.
    • Iegūstiet informāciju par runas atpazīšanu:Šis ir pazīstamais Windows dialoglodziņš, kurā ir ierakstīta programmas versija, licences numurs un nosaukums.
    • Atvērta runas atpazīšana (Open Speech Recognition).
    • Izeja: Pilnībā aizver programmu.
    • Tulkošana

    Kopš dziļās mācīšanās ienākšanas runas atpazīšanas jomā, vārdu atpazīšanas kļūdu skaits ir dramatiski samazinājies. Bet, neskatoties uz visiem rakstiem, kurus, iespējams, esat lasījis, mums joprojām nav cilvēka līmeņa runas atpazīšanas. Runas atpazīšanas ierīcēm ir daudz atteices režīmu. Turpmākai uzlabošanai tie ir jāidentificē un jāmēģina novērst. Tas ir vienīgais veids, kā pāriet no atpazīšanas, kas lielākoties darbojas dažiem cilvēkiem, uz atzīšanu, kas visu laiku darbojas visiem cilvēkiem.

    Nepareizi atpazīto vārdu skaita uzlabojumi. Testa balss komplekts tika savākts uz tālruņa slēdža 2000. gadā no 40 nejaušām sarunām starp diviem cilvēkiem, kuru dzimtā valoda bija angļu valoda.

    Teikt, ka esam sasnieguši cilvēka līmeņa runas atpazīšanu sarunās, kuru pamatā ir tikai sarunu kopums no telefona sadales pults, ir tas pats, kas teikt, ka robota automašīna brauc tikpat labi kā cilvēks, to izmēģinājis vienā pilsētā uz saulaina laika. diena bez satiksmes.. Jaunākie notikumi runas atpazīšanas jomā ir pārsteidzoši. Taču apgalvojumi par cilvēka līmeņa runas atpazīšanu ir pārāk drosmīgi. Šeit ir dažas jomas, kurās vēl ir jāveic uzlabojumi.

    Akcenti un troksnis

    Viens no acīmredzamajiem runas atpazīšanas trūkumiem ir apstrāde akcentiem un fona troksnis. Galvenais iemesls tam ir tas, ka lielāko daļu apmācības datu veido amerikāņu runa ar augstu signāla un trokšņa attiecību. Piemēram, sarunu kopa no telefona slēdža satur tikai to cilvēku sarunas, kuru dzimtā valoda ir angļu (galvenokārt amerikāņi), ar nelielu fona troksni.

    Bet tikai apmācības datu palielināšana, visticamāk, neatrisinās šo problēmu. Ir daudzas valodas, kurās ir daudz dialektu un akcentu. Ir nereāli vākt marķētos datus par visiem gadījumiem. Lai izveidotu augstas kvalitātes runas atpazīšanas ierīci tikai amerikāņu angļu valodai, ir nepieciešami līdz 5 tūkstošiem stundu audio ierakstu, kas tulkoti tekstā.


    Cilvēka runas-teksta pārveidotāju salīdzinājums ar Baidu Deep Speech 2 dažādiem runas veidiem. Cilvēki sliktāk atpazīst ne-amerikāņu akcentus, iespējams, tāpēc, ka viņu vidū ir daudz amerikāņu. Es domāju, ka cilvēkiem, kuri uzauguši noteiktā reģionā, būtu daudz mazāk kļūdu, atpazīstot šī reģiona akcentu.

    Fona trokšņa klātbūtnē braucošā automašīnā signāla un trokšņa attiecība var sasniegt -5 dB. Cilvēki šādos apstākļos viegli tiek galā ar citas personas runas atpazīšanu. Automātiskie atpazinēji pasliktinās daudz ātrāk, palielinoties troksnim. Diagrammā parādīts, cik lielā mērā starpība starp cilvēkiem palielinās, palielinoties trokšņa vērtībām (pie zema SNR, signāla un trokšņa attiecība).

    Semantiskās kļūdas

    Bieži vien nepareizi atpazītu vārdu skaits pats par sevi nav runas atpazīšanas sistēmas mērķis. Mēs mērķējam uz semantisko kļūdu skaitu. Tas ir izteicienu īpatsvars, kuru nozīmi mēs nepareizi atpazīstam.

    Semantiskas kļūdas piemērs ir, ja kāds ierosina “tiekamies otrdien” un atrisinātājs atgriež “tiekamies šodien”. Kļūdas ir arī vārdos bez semantiskām kļūdām. Ja atpazītājs neatpazina “uz augšu” un atgrieza “tiekamies otrdien”, teikuma semantika nemainījās.

    Kā kritērijs mums rūpīgi jāizmanto nepareizi atpazīto vārdu skaits. Lai to ilustrētu, es sniegšu jums sliktākā iespējamā gadījuma piemēru. 5% kļūdu vārdos atbilst vienam trūkstošajam vārdam no 20. Ja katrā teikumā ir 20 vārdi (kas ir diezgan vidēji angļu valodā), tad nepareizi atpazīto teikumu skaits tuvojas 100%. Var cerēt, ka nepareizi atpazīti vārdi nemaina teikumu semantisko nozīmi. Pretējā gadījumā atpazinējs var nepareizi atšifrēt katru teikumu pat ar 5% nepareizi atpazītu vārdu skaitu.

    Salīdzinot modeļus ar cilvēkiem, ir svarīgi pārbaudīt kļūdu būtību un uzraudzīt ne tikai nepareizi atpazīto vārdu skaitu. Mana pieredze liecina, ka cilvēki, kas tulko runu tekstā, pieļauj mazāk kļūdu, un tās nav tik nopietnas kā datori.

    Microsoft pētnieki nesen salīdzināja līdzīga līmeņa cilvēku un datoru atpazinēju kļūdas. Viena no konstatētajām atšķirībām ir tāda, ka modelis “uh” [uh-uh...] jauc ar “uh huh” [uh-huh] daudz biežāk nekā cilvēki. Abiem terminiem ir ļoti atšķirīga semantika: “uh” aizpilda pauzes, bet “uh huh” apzīmē klausītāja apstiprinājumu. Arī modeļos un cilvēkos tika konstatētas daudzas tāda paša veida kļūdas.

    Daudzas balsis vienā kanālā

    Ierakstītās telefona sarunas bija arī vieglāk atpazīt, jo katrs runātājs tika ierakstīts atsevišķā mikrofonā. Vienā audio kanālā nepārklājas vairākas balsis. Cilvēki var saprast vairākus runātājus, dažreiz runājot vienlaikus.

    Labam runas atpazītājam jāspēj sadalīt audio straumi segmentos atkarībā no skaļruņa (atbilstoši tam, lai veiktu diarizāciju). Viņam arī jāizvelk nozīme no audio ieraksta ar divām balsīm, kas pārklājas (avota atdalīšana). Tas jādara bez mikrofona, kas atrodas tieši pie katra skaļruņa mutes, tas ir, lai atpazītājs darbotos labi, ja tas ir novietots patvaļīgā vietā.

    Ieraksta kvalitāte

    Akcenti un fona troksnis ir tikai divi faktori, pret kuriem runas atpazīšanai jābūt izturīgam. Šeit ir vēl daži:

    Reverberācija dažādos akustiskajos apstākļos.
    Ar aprīkojumu saistīti artefakti.
    Signāla ierakstīšanai un saspiešanai izmantotā kodeka artefakti.
    Paraugu ņemšanas biežums.
    Runātāja vecums.

    Lielākā daļa cilvēku nevar atšķirt mp3 un wav ierakstus. Lai atpazītājiem varētu pretendēt uz veiktspēju, kas ir salīdzināma ar cilvēku veiktspēju, tiem jākļūst izturīgiem pret šiem izmaiņu avotiem.

    Konteksts

    Jūs varat pamanīt, ka kļūdu skaits, ko cilvēki pieļauj testu laikā ierakstos no telefona centrāles, ir diezgan liels. Ja jūs runātu ar draugu, kurš nesaprata 1 vārdu no 20, jums būtu ļoti grūti sazināties.

    Viens no iemesliem ir atzīšana, neņemot vērā kontekstu. Reālajā dzīvē mēs izmantojam daudz dažādu papildu norādes, lai palīdzētu mums saprast, ko saka cita persona. Daži cilvēku lietotā konteksta piemēri, kurus runas atpazinēji ignorē:

    Sarunas vēsture un apspriežamā tēma.
    Vizuālas norādes par runātāju - sejas izteiksmes, lūpu kustības.
    Zināšanu kopums par personu, ar kuru mēs runājam.

    Mūsdienās Android runas atpazītājam ir jūsu kontaktpersonu saraksts, lai tas varētu atpazīt jūsu draugu vārdus. Balss meklēšana kartē izmanto ģeogrāfisko atrašanās vietu, lai sašaurinātu opcijas, uz kurām vēlaties saņemt norādes.

    Atpazīšanas sistēmu precizitāte palielinās līdz ar šādu signālu iekļaušanu datos. Bet mēs tikai sākam iedziļināties kontekstā, ko mēs varētu iekļaut apstrādē un kā mēs varam to izmantot.

    Izvietošana

    Jaunākos sasniegumus runātās valodas atpazīšanas jomā nevar atklāt. Iztēlojoties runas atpazīšanas algoritma izvietošanu, jums jāpatur prātā latentums un apstrādes jauda. Šie parametri ir saistīti, jo algoritmi, kas palielina jaudas prasības, arī palielina latentumu. Bet vienkāršības labad mēs tos apspriedīsim atsevišķi.

    Latentums: laiks no lietotāja runas beigām līdz transkripcijas saņemšanas beigām. Neliela kavēšanās ir tipiska atzīšanas prasība. Tas lielā mērā ietekmē lietotāja pieredzi darbā ar produktu. Desmitiem milisekundes ierobežojumi ir izplatīti. Tas var šķist pārāk ierobežojoši, taču atcerieties, ka stenogrammas sagatavošana parasti ir pirmais solis sarežģītu aprēķinu sērijā. Piemēram, balss interneta meklēšanas gadījumā pēc runas atpazīšanas jums joprojām ir nepieciešams laiks, lai veiktu meklēšanu.

    Divvirzienu atkārtoti slāņi ir tipisks uzlabojuma piemērs, kas pasliktina latentumu. Ar viņu palīdzību tiek iegūti visi jaunākie augstas kvalitātes transkripcijas rezultāti. Vienīgā problēma ir tā, ka mēs nevaram neko saskaitīt pēc pirmā divvirzienu slāņa, kamēr cilvēks nav beidzis runāt. Tāpēc kavēšanās palielinās līdz ar teikuma garumu.


    Pa kreisi: tieša atkārtošanās ļauj nekavējoties sākt atšifrēšanu. Pa labi: divvirzienu atkārtošanās gadījumā pirms atšifrēšanas ir jānogaida līdz runas beigām.

    Joprojām tiek meklēts labs veids, kā efektīvi iekļaut nākotnes informāciju runas atpazīšanā.

    Skaitļošanas jauda: šo parametru ietekmē ekonomiskie ierobežojumi. Katram atpazīšanas precizitātes uzlabojumam ir jāņem vērā banketa izmaksas. Ja uzlabojums nesasniegs ekonomisko slieksni, tas netiks izvērsts.

    Klasisks nepārtrauktas uzlabošanas piemērs, kas nekad netiek izmantots, ir padziļināta mācīšanās sadarbībā. Kļūdu skaita samazināšana par 1–2% reti attaisno skaitļošanas jaudas palielināšanu 2–8 reizes. Šajā kategorijā ietilpst arī mūsdienu atkārtoto tīklu modeļi, jo tos ir ļoti neizdevīgi izmantot, meklējot virkni trajektoriju, lai gan es domāju, ka situācija nākotnē mainīsies.

    Es vēlos precizēt, ka es nesaku, ka atpazīšanas precizitātes uzlabošana ar nopietnu skaitļošanas izmaksu pieaugumu ir bezjēdzīga. Mēs jau esam redzējuši, kā darbojas princips “vispirms lēnām, bet noteikti, tad ātri”. Lieta tāda, ka kamēr uzlabojums nav pietiekami ātrs, to nevar izmantot.

    Nākamajos piecos gados

    Runas atpazīšanas jomā joprojām ir daudz neatrisinātu un sarežģītu problēmu. Starp viņiem:

    Jaunu datu uzglabāšanas sistēmu iespēju paplašināšana, akcentu atpazīšana, runas uz spēcīga trokšņa fona.
    Konteksta iekļaušana atpazīšanas procesā.
    Diarizācija un avotu atdalīšana.
    Semantisko kļūdu skaits un inovatīvās metodes atpazinēju novērtēšanai.
    Ļoti zems latentums.

    Ar nepacietību gaidu progresu, kas tiks panākts nākamo piecu gadu laikā šajās un citās jomās.

    Tagi: pievienojiet atzīmes

    Skārienekrāna vadība jau ir standarta. Jaunākās sistēmas, piemēram, Windows 8, “saprot” balss komandas.Runas atpazīšanai vajadzētu novest pie tā, ka mūsu komunikācija ar datoru būs vēl vienkāršāka, intuitīvāka un... dabiskāka. Es jums pastāstīšu, kā tas izskatās šodien.

    Nedaudz vēstures - kā attīstījās komunikācija ar mašīnu

    Veids, kā mēs sazināmies ar datoru, gadu gaitā ir attīstījies. Pirmā saskarne, ar kuras palīdzību cilvēki varēja izdot komandas, bija perfokartes, kas datētas ar 1832. gadu. Tos izmantoja audumu izgatavošanas mašīnās. Tastatūru sāka lietot 1960. gadā. Divas desmitgades vēlāk pievienojās standarta pele, un tā tiek izmantota joprojām. Lai gan peles spējas ir dalījušās ar skārienpaliktni, tā joprojām ir vispopulārākais vadības veids. Pateicoties viedtālruņiem un planšetdatoriem, ļoti populāri ir kļuvuši skārienjutīgie interfeisi un žesti, kurus jo īpaši izmanto, lai kontrolētu Xbox 360 Kinect. Pēc skārienekrāniem un žestiem nāk balss vadība, taču šis risinājums līdz šim ir bijis tik maz attīstīts, ka dažkārt par to pat nedzirdēsit.

    Runas atpazīšanas iestatīšana operētājsistēmā Windows 8

    Diemžēl balss vadība vēl nav pieejama krievu valodā. Pašlaik tiek atbalstītas angļu, franču, vācu, japāņu, korejiešu, ķīniešu un spāņu valodas. Microsoft nolēmis koncentrēties uz lielākajām un attīstītākajām valstīm, taču, iespējams, ar laiku tas šo funkciju pievienos arī mūsu valstij. Ja jūs mēģināt to sākt, tas zvēr šādi

    Ja tomēr vēlaties pārbaudīt šo risinājumu, jums ir jākonfigurē sistēma (jāmaina valoda) un jāiemācās daži vārdi angļu valodā. Lai to izdarītu, jums jāiet uz vadības paneli un jāizvēlas valoda. Ja jums nav citas valodas kā krievu, jums jānoklikšķina uz pogas “Pievienot valodu” un pēc tam jāizvēlas viena no atbalstītajām valodām. Mūsu gadījumā tas ir “angļu (ASV)”. Mēs redzam, ka ir pieejams tikai izkārtojums šajā valodā, veiciet dubultklikšķi, tas pārbaudīs saskarnes valodas pieejamību, pēc pārbaudes noklikšķiniet uz “Lejupielādēt un instalēt valodas pakotni”, un process sāksies, pacietīgi gaidiet lai to ielādētu. Kad šis process ir pabeigts, iestatiet noklusējuma valodu uz angļu valodu

    Tagad jums jādodas uz Windows 8 sākuma ekrānu (flīžu), meklēšanā ievadiet “Windows Speech Recognition” un nospiediet taustiņu Enter.

    Tātad jūs varat palaist balss atpazīšanas rīku. Pirmo reizi startējot, tas piedāvās konfigurēt mikrofonu, pēc izvēles sakiet kaut ko, lai pārbaudītu.

    Tālāk piedāvājiet apmeklēt apmācības nodarbības. Tie ilgst līdz 15-20 minūtēm, taču ir ļoti noderīgi un sniedz pamatinformāciju par funkciju lietošanu. Bet, ja neesi spēcīgs angļu valodā, es domāju, ka nav vērts tērēt laiku, būs grūti kaut ko saprast, dodieties kaujā

    Kā strādāt

    Lai dators sāktu atpazīt jūsu runu, jums ir jāpasaka “sāciet klausīties” (tas nozīmē, sāciet klausīties) vai nospiediet mikrofona pogu, lai sāktu klausīšanās režīmu. Tagad varat atvērt lietojumprogrammu vai vienkārši diktēt vārdus teksta redaktorā, pārlūkprogrammā vai meklēšanas joslā

    Ko mēs varam darīt

    Principā iespējas ir milzīgas, papildus standarta vārdiem varat izveidot arī savas komandas. Galvenās funkcijas ir parādītas tabulā

    Darbība Ko teikt
    Atlasiet jebkuru elementu pēc tā nosaukuma Noklikšķiniet uz Fails, Sākt, Skatīt
    Atlasiet jebkuru elementu vai ikonu Noklikšķiniet uz Atkritne, Noklikšķiniet uz Dators, Noklikšķiniet uz (faila nosaukums)
    Veiciet dubultklikšķi vai veiciet dubultklikšķi uz jebkura elementa Veiciet dubultklikšķi uz Atkritne, veiciet dubultklikšķi uz Dators
    Pārslēdzieties starp atvērtajām programmām Pārslēdzieties uz Paint, pārslēdzieties uz WordPad

    Ritiniet

    Ritināt uz augšu; Ritināt uz leju;
    Ritiniet pa kreisi; Ritiniet pa labi

    Iekļaujiet dokumentā jaunu rindkopu vai jaunu rindiņu

    Jauna rindkopa; Jauna līnija

    Dokumentā atlasiet vārdu

    Vārdu labojums

    Pareizs vārds

    Atlasiet un noņemiet konkrētus vārdus

    Rādīt piemērojamo komandu sarakstu

    Atsvaidziniet runas komandas

    Ieslēdziet klausīšanās režīmu

    Izslēdziet klausīšanās režīmu

    Sakļaut mikrofonu

    Samaziniet runas atpazīšanu

    Skatiet Windows palīdzību un atbalstu

    Kā man kaut ko darīt?
    Piemēram: Kā instalēt printeri?

    Ja nezināt, kā izrunāt šo frāzi, iesaku izmantot Google tulkotāju vai http://uchilochka.rf (viņš šo vietni saprata labāk)

    Man radās vēlme pierakstīt savas komandas, kas sastāvēja no vienkāršiem buržuāziskiem vārdiem. Ko es varu izrunāt. Tāpēc viņš neļāva man to darīt, viņš nevarēja palaist komandu redaktoru. Rezultātā viņš lieliski saprata manu vārdu Viens, divi un Atvērt izrunu. Izmantojot šo ciparripu, varat palaist programmu pēc numura sākuma ekrānā. Vispirms pasakiet numuru, pēc tam sakiet OPEN. Protams, nav daudz, bet es uzskatu, ka eksperiments ir veiksmīgs. Nebūtu slikti, ja Microsoft ieviestu krievu valodu, kas ir labs tālvadības pults aizstājējs.

    Operētājsistēma Windows 7 ir aprīkota ar daudzām opcijām, kas sniedz arvien lielākas iespējas šīs sistēmas lietotājiem. Viņi tajā varēja ieviest ļoti interesantu funkciju, ko sauc par “runas atpazīšanu”. Bet kas ir šī sistēma? Par to arī būs saruna.

    Attiecīgā opcija ļauj lietojumprogrammām visā sistēmā izmantot pilnīgi jaunu lietotāja mijiedarbības veidu ar datoru. Tā ir Windows 7 runas atpazīšanas sistēma, kas ļauj vadīt datoru, neizmantojot tastatūru, peli vai citus līdzekļus.

    Vēlos atzīmēt, ka šis jauninājums būs pieejams citos Microsoft produktos. Šī funkcija tika pamanīta nedaudz agrāk, proti, mēģināja to ieviest operētājsistēmā Windows Vista, bet septītajā Microsoft operētājsistēmas versijā balss vadība tiek veikta augstākā līmenī, salīdzinot ar tās priekšgājēju. Vienkārši sakot, tāda opcija kā runas atpazīšana operētājsistēmā Windows 7 ir kļuvusi vēl funkcionālāka.

    Papildus visam, kas tika teikts, es vēlos atzīmēt, ka tam ir diezgan plašs pielietojumu klāsts. Windows 7 lietotājiem ar runas atpazīšanu ir iespēja palaist programmas un pārvērst visus skaņas fragmentus tekstā, izpildīt visa veida komandas datorā, izmantojot tikai savu balsi un nepieciešamās ierīces. Bet kas ir nepieciešams, lai Windows 7 runas atpazīšana kļūtu par realitāti?

    Pirmkārt, jums būs nepieciešams mikrofons, kas jāpievieno datoram. Turklāt jums ir jāiegādājas īpaša lietojumprogramma vai programma, ko publicējis pats ražotājs, tas ir, Microsoft. Pēc visu nepieciešamo komponentu uzstādīšanas un mikrofona pievienošanas datoram ir jāīsteno konkrēts darba plāns:

    • Jums ir jāpalaiž testa balss komandas un jāpārvērš tās par tekstu.
    • Pēc atpazīšanas programmas apmācības jums būs jāizveido veidnes dažādām balss komandām. Tieši uz šī darba pamata dators varēs pieņemt un izpildīt visas jūsu norādītās komandas.

    Windows 7 runas atpazīšanas funkcija tiek izmantota Microsoft teksta redaktorā - WordPad. Tas darbojas nevainojami, aizpildot dažādas veidlapas, kā arī labi darbojas, strādājot pārlūkprogrammā Internet Explorer un kad

    Turklāt šī opcija var viegli rediģēt iepriekš ierakstītu tekstu, definējot īpašas balss komandas. Protams, konkrēta uzdevuma atpazīšanas procesā rodas tipiskas kļūdas (kad kļūdaini tiek atpazītas dažas skaņas). Šajā gadījumā programma nodrošina noteiktu vārdu atbilstības sarakstu.

    Funkcija, protams, ir fenomenāla, taču šeit joprojām ir viens “bet”. Lieta tāda, ka krievu runas atpazīšana tagad principā nav pieejama. Ir lieliskas programmas versijas angļu, franču, vācu un japāņu valodā. Ir arī versijas ķīniešu, spāņu un itāļu runai.

    Bet šis jaunais produkts nav pilnībā pielāgots krievu valodai. Jūsu dators nespēs uztvert tam uzticētos uzdevumus, kas nozīmē, ka jums būs vieglāk kaut ko uzrakstīt, izmantojot tastatūru vai veikt noteiktus uzdevumus, izmantojot peli.

    Protams, jūs varat mēģināt strādāt ar līdzīgām krievu valodas programmām vai dot priekšroku angļu valodai, taču joprojām varat cerēt, ka drīzumā runas atpazīšana krievu valodā būs pieejama arī augstas kvalitātes režīmā. Un tad jūs varēsiet izmēģināt šādu unikālu funkciju praksē. Galu galā tas, bez šaubām, nepārprotami vienkāršo darbu ar personālo datoru un ir milzīgs sasniegums programmēšanas jomā. Tāpēc atliek tikai gaidīt.

    Neviena programma nevar pilnībā aizstāt manuālo darbu, pārrakstot ierakstīto runu. Tomēr ir risinājumi, kas var ievērojami paātrināt un atvieglot runas tulkošanu tekstā, tas ir, vienkāršot transkripciju.

    Transkripcija ir audio vai video faila ierakstīšana teksta formā. Internetā ir maksas uzdevumi, kad izpildītājam tiek samaksāta noteikta naudas summa par teksta pārrakstīšanu.

    Runas tulkošana tekstā ir noderīga

    • studentiem ierakstītās audio vai video lekcijas tulkot tekstā,
    • emuāru autori, kas vada vietnes un emuārus,
    • rakstnieki, žurnālisti grāmatu un tekstu rakstīšanai,
    • informācijas biznesmeņi, kuriem nepieciešams teksts pēc vebināra, runas utt.,
    • cilvēki, kuriem ir grūtības rakstīt - viņi var diktēt vēstuli un nosūtīt to ģimenei vai draugiem,
    • citas iespējas.

    Mēs aprakstīsim visefektīvākos rīkus, kas pieejami personālajos datoros, mobilajās lietojumprogrammās un tiešsaistes pakalpojumos.

    1 Vietne speakpad.ru

    Šis ir tiešsaistes pakalpojums, kas ļauj tulkot runu tekstā, izmantojot pārlūkprogrammu Google Chrome. Serviss darbojas ar mikrofonu un gataviem failiem. Protams, kvalitāte būs daudz augstāka, ja izmantosi ārējo mikrofonu un diktēsi pats. Tomēr pakalpojums labi darbojas pat ar YouTube videoklipiem.

    Noklikšķiniet uz "Iespējot ierakstīšanu", atbildiet uz jautājumu par "Mikrofona izmantošanu" - lai to izdarītu, noklikšķiniet uz "Atļaut".

    Garās instrukcijas par pakalpojuma lietošanu var sakļaut, noklikšķinot uz pogas 1 attēlā. 3. Jūs varat atbrīvoties no reklāmas, aizpildot vienkāršu reģistrāciju.

    Rīsi. 3. Runas bloka pakalpojums

    Gatavo rezultātu ir viegli rediģēt. Lai to izdarītu, jums ir manuāli jālabo iezīmētais vārds vai jādiktē tas vēlreiz. Darba rezultāti tiek saglabāti jūsu personīgajā kontā, tos var arī lejupielādēt savā datorā.

    Video nodarbību saraksts darbam ar runas bloku:

    Jūs varat pārrakstīt video no Youtube vai no sava datora, taču jums būs nepieciešams mikseris, sīkāka informācija:

    Video "audio transkripcija"

    Pakalpojums darbojas septiņās valodās. Ir neliels mīnuss. Tas slēpjas faktā, ka, ja jums ir nepieciešams pārrakstīt gatavu audio failu, tā skaņa tiek dzirdama caur skaļruņiem, kas rada papildu traucējumus atbalss veidā.

    2 Pakalpojuma diktēšana.io

    Lielisks tiešsaistes pakalpojums, kas ļauj bez maksas un vienkārši tulkot runu tekstā.

    Rīsi. 4. Pakalpojuma diktēšana.io

    1 attēlā. 4 – lapas beigās var izvēlēties krievu valodu. Google Chrome pārlūkprogrammā valoda ir atlasīta, taču Mozilla kaut kādu iemeslu dēļ šādas iespējas nav.

    Jāatzīmē, ka ir ieviesta iespēja automātiski saglabāt gatavo rezultātu. Tas novērsīs nejaušu dzēšanu cilnes vai pārlūkprogrammas aizvēršanas rezultātā. Šis pakalpojums neatpazīst gatavos failus. Darbojas ar mikrofonu. Diktējot ir jānosauc pieturzīmes.

    Teksts tiek atpazīts diezgan pareizi, pareizrakstības kļūdu nav. Pieturzīmes varat ievietot pats, izmantojot tastatūru. Gatavo rezultātu var saglabāt savā datorā.

    3 RealSpeaker

    Šī programma ļauj viegli pārtulkot cilvēka runu tekstā. Tas ir paredzēts darbam dažādās sistēmās: Windows, Android, Linux, Mac. Ar tās palīdzību var pārvērst dzirdēto runu mikrofonā (piemēram, to var iebūvēt portatīvajā datorā), kā arī ierakstīt audio failos.

    Var saprast 13 pasaules valodas. Ir programmas beta versija, kas darbojas kā tiešsaistes pakalpojums:

    Jums ir jāievēro iepriekš norādītā saite, jāizvēlas krievu valoda, jāaugšupielādē audio vai video fails tiešsaistes pakalpojumā un jāmaksā par tā transkripciju. Pēc transkripcijas varat kopēt iegūto tekstu. Jo lielāks ir transkripcijai paredzētais fails, jo vairāk laika būs nepieciešams tā apstrāde, sīkāka informācija:

    2017. gadā bija bezmaksas transkripcijas iespēja, izmantojot RealSpeaker, bet 2018. gadā šādas iespējas nav. Tas ir ļoti mulsinoši, ka pārrakstītais fails ir pieejams visiem lietotājiem lejupielādei; iespējams, tas tiks uzlabots.

    Programmas izstrādātāja kontakti (VKontakte, Facebook, Youtube, Twitter, e-pasts, tālrunis) ir atrodami viņa vietnes lapā (precīzāk, vietnes kājenē):

    4 Runogrāfs

    Alternatīva iepriekšējai lietojumprogrammai mobilajām ierīcēm, kas darbojas operētājsistēmā Android. Pieejams bez maksas lietotņu veikalā:

    Teksts tiek rediģēts automātiski un tiek pievienotas pieturzīmes. Ļoti ērti, lai diktētu sev piezīmes vai veidotu sarakstus. Tā rezultātā teksts būs ļoti pienācīgas kvalitātes.

    5 Pūķa diktāts

    Šī ir Apple lietojumprogramma, kas mobilajām ierīcēm tiek izplatīta bez maksas.

    Programma var darboties 15 valodās. Tas ļauj rediģēt rezultātu un atlasīt vajadzīgos vārdus no saraksta. Jums ir skaidri jāizrunā visas skaņas, nevajadzētu veikt nevajadzīgas pauzes un izvairīties no intonācijas. Dažreiz vārdu galos ir kļūdas.

    Aplikāciju Dragon Dictation īpašnieki izmanto, piemēram, lai diktētu iepirkumu sarakstu veikalā, pārvietojoties pa dzīvokli. Kad es tur nokļuvu, es varu apskatīt tekstu piezīmē, un man nav jāklausās.

    Neatkarīgi no programmas, kuru izmantojat savā praksē, esiet gatavs vēlreiz pārbaudīt rezultātus un veikt noteiktas korekcijas. Tas ir vienīgais veids, kā iegūt nevainojamu tekstu bez kļūdām.

    Arī noderīgi pakalpojumi:

    Saņemiet jaunākos datorprasmes rakstus tieši savā iesūtnē.
    Jau vairāk 3000 abonentu

    .