• Խոսքի ճանաչման խնդիրը դեռ լուծված չէ։ Միացնել և անջատել խոսքի ավտոմատ ճանաչումը Windows 7-ում խոսքի ճանաչման կարգավորում

    Windows Vista-ն Microsoft-ի առաջին ՕՀ-ն է, որը ներառում է խոսքի ճանաչման հնարավորություններ: Օգտագործելով այս գործառույթը, դուք կարող եք կատարել տարբեր առաջադրանքներ ձեր ձայնով, ինչպիսիք են ծրագրերի գործարկումը, ֆայլերը փակելը, պահպանելը և ջնջելը, բառացիորեն ձայնագրվող տեքստը թելադրելը և այն խմբագրելը: Դեբ Շայնդերը՝ ՏՏ խորհրդատու, ձեզ ցույց է տալիս, թե ինչպես օգտագործել այս հնարավորությունը:

    «Աստղային ճանապարհ» ֆիլմի թողարկումից ի վեր համակարգչային շատ օգտատերեր երազել են դուրս նետել ստեղնաշարերն ու մկները և կառավարել իրենց համակարգիչը ձայնով: Ծրագրերը, որոնք թույլ էին տալիս ձեզ հրամաններ արտասանել և տեքստ թելադրել համակարգչին, արվել էին երկար տարիներ և շատ օգտակար էին նրանց համար, ովքեր ֆիզիկապես ի վիճակի չէին օգտագործել մուտքագրման այլ մեթոդներ: Բայց ինչ-ինչ պատճառներով այս ծրագրերը հայտնի չէին։

    Windows Vista-ն Microsoft-ի առաջին օպերացիոն համակարգն է, որը կարող է ճանաչել խոսքը: Նախկինում խոսքի ճանաչման գործառույթն առկա էր Microsoft Office XP-ում և Office 2003-ում, և դուք կարող եք նաև օգտագործել այլ մշակողների ծրագրեր, ինչպիսիք են Dragon NaturallySpeaking-ը: Microsoft-ը Windows Mobile-ում ավելացրել է նաև խոսքի ճանաչման գործառույթ:

    Համակարգչի հետ խոսելու համար հարկավոր չէ լրացուցիչ ոչինչ գնել, Vista-ն արդեն ունի ամեն ինչ դրա համար: Գործառույթն անջատված է լռելյայնորեն, բայց դուք կարող եք հեշտությամբ գործարկել այն Control Panel-ից, ինչպես ցույց է տրված Նկար Ա-ում:

    Կարող եք նաև գործարկել այս գործառույթը ընտրացանկից՝ ընտրելով Բոլոր ծրագրերը | Ստանդարտ | Մատչելիություն (Բոլոր ծրագրերը | Աքսեսուարներ | Մատչելիության հեշտություն), ինչպես ցույց է տրված Նկար Բ-ում:

    Ինչպես է դա աշխատում

    Դուք կարող եք ընտրել խոսքի ճանաչման երկու գործառնական ռեժիմներից մեկը.

    • Ծրագրերը կառավարելու համար՝ գործարկեք և փակեք ծրագրերը, անցեք դրանց միջև, պահեք և ջնջեք ֆայլերը և այլն:
    • Թելադրել տեքստ, որը կգրվի բառացիորեն, ինչպես նաև խմբագրել այն:

    Ծրագրային ապահովման մշակողները կարող են իրենց ծրագրերին ավելացնել այս գործառույթի աջակցությունը: Ցավալի է, որ խոսքի ճանաչումը ներկայումս աջակցում է միայն մի քանի լեզուների՝ անգլերեն (ԱՄՆ և Մեծ Բրիտանիա), գերմաներեն, ֆրանսերեն, իսպաներեն, ճապոներեն և չինարեն (ավանդական և պարզեցված):

    Խոսքի ճանաչման կարգավորում

    Նախքան խոսքի ճանաչումն օգտագործելը, դուք պետք է կատարեք հետևյալ քայլերը.

    • Միացնել խոսքի ճանաչումը:
    • Կարգավորեք խոսափողը:
    • Կարդացեք ձեռնարկը (ըստ ցանկության):
    • Սովորեք պարզ խոսել (նաև անհրաժեշտ չէ):

    Կառավարման վահանակում Speech Recognition-ի վրա կրկնակի սեղմելուց հետո կամ ընտրացանկից Speech Recognition ընտրելուց հետո ձեզ կներկայացվի կարգավորումների պատուհան, որը ներկայացված է Նկար Գ-ում:


    Երբ սեղմում եք «Սկսել խոսքի ճանաչումը», ձեր էկրանի վերևում կհայտնվի ձայնային կառավարման վահանակ, որը ցույց է տրված Նկար Դ-ում:


    Եթե ​​դուք արդեն կարգավորել եք այս գործառույթը, ապա վարդակը կգրանցվի autostart-ում և կսկսվի ամեն անգամ Windows-ի բեռնման ժամանակ: Ձայնային կառավարման կապույտ պատկերակը նույնպես կհայտնվի սկուտեղում:
    Կարգավորումների համար կարող եք կանչել համատեքստի ընտրացանկը՝ աջ սեղմելով սկուտեղի պատկերակի կամ ձայնային կառավարման վահանակի վրա, ինչպես ցույց է տրված Նկար E-ում:


    Մենյուում կտեսնեք հետևյալ կարգավորումները.

    • Միացնել ելույթը.Համակարգիչը կլսի այն ամենը, ինչ ասում եք և կհետևի իր կողմից ճանաչված հրամաններին:
    • Քնելու ռեժիմ:Համակարգիչը կվերահսկի ձեր խոսքը, բայց չի արձագանքի որևէ հրամանի, մինչև չասեք «Սկսեք լսել»:
    • Անջատված՝Համակարգիչը ձեզ չի լսում, անկախ նրանից, թե ինչ եք ասում:
    • Բաց խոսքի ճանաչման խաբեության թերթիկ (Բաց խոսքի տեղեկատու քարտ).Հարմար խաբեության թերթիկ՝ հիմնական հրամաններով և լրացուցիչ տեղեկություններով:
    • Սկսել խոսքի ձեռնարկը.Տեսանյութ, որտեղ նրանք կպատմեն և ցույց կտան ձեզ ամեն ինչ:
    • Օգնություն:Բացում է օգնությունը, այս ֆունկցիայի մասին օգնության ֆայլը:
    • Ընտրանքներ:Այստեղ դուք կարող եք կարգավորել ծրագիրը, որպեսզի բեռնվի Windows-ով, ավտոմատ կերպով ուղղի տեքստը և այլն:
    • Կոնֆիգուրացիա:Այստեղ դուք կարող եք կարգավորել ձեր խոսափողը, բարելավել խոսքի ճանաչումը և բացել կառավարման վահանակը:
    • Բացեք Խոսքի բառարանը.Դուք կարող եք ավելացնել նոր բառեր (շատ օգտակար անունների և բառերի համար, որոնք դժվար է ճանաչել), ինչպես նաև կարող եք բացառել այն բառերը, որոնք երբեք չեք ասի:
    • Թելադրություն Թեմա:Այստեղ դուք կարող եք ընտրել միայն Պատմություն:
    • Այցելեք Go To The Speech Recognition կայքը:
    • Ստացեք տեղեկատվություն խոսքի ճանաչման մասին.Սա Windows-ի ծանոթ երկխոսության տուփն է, որտեղ գրված են ծրագրի տարբերակը, լիցենզիայի համարը և անվանումը:
    • Բաց խոսքի ճանաչում (Open Speech Recognition):
    • Ելք.Ամբողջովին փակում է ծրագիրը։
    • Թարգմանություն

    Քանի որ խորը ուսուցումը մտավ խոսքի ճանաչման տեսարան, բառերի ճանաչման սխալների թիվը կտրուկ նվազել է: Բայց չնայած բոլոր հոդվածներին, որոնք դուք կարող եք կարդացել, մենք դեռ չունենք մարդու մակարդակի խոսքի ճանաչում: Խոսքի ճանաչողներն ունեն բազմաթիվ ձախողման ռեժիմներ: Հետագա բարելավման համար դրանք պետք է բացահայտել և փորձել վերացնել: Սա միակ ճանապարհն է՝ անցնելու այն ճանաչումից, որն աշխատում է որոշ մարդկանց մեծ մասի համար դեպի այն ճանաչումը, որը միշտ աշխատում է բոլոր մարդկանց համար:

    Սխալ ճանաչված բառերի քանակի բարելավումներ: 2000 թվականին հեռախոսային անջատիչի վրա հավաքվել է թեստային ձայնային հավաքածու՝ երկու մարդկանց միջև 40 պատահական խոսակցություններից, որոնց մայրենի լեզուն անգլերենն էր:

    Ասել, որ խոսակցություններում մենք հասել ենք մարդու մակարդակի խոսքի ճանաչման, որը հիմնված է միայն հեռախոսային տախտակի խոսակցությունների մի շարքի վրա, նույնն է, ինչ ասենք, որ ռոբոտ մեքենան վարում է նույնքան լավ, ինչպես մարդը՝ այն փորձարկելով մեկ քաղաքում՝ արևոտ արևի վրա։ օր առանց երթևեկության.. Խոսքի ճանաչման վերջին զարգացումները զարմանալի են: Բայց մարդու մակարդակով խոսքի ճանաչման պնդումները չափազանց համարձակ են: Ահա մի քանի ոլորտներ, որտեղ դեռ պետք է բարելավումներ կատարվեն:

    Շեշտադրումներ և աղմուկ

    Խոսքի ճանաչման ակնհայտ թերություններից մեկը մշակումն է շեշտադրումներև ֆոնային աղմուկը: Դրա հիմնական պատճառն այն է, որ վերապատրաստման տվյալների մեծ մասը բաղկացած է ամերիկյան խոսքից՝ ազդանշան-աղմուկ բարձր հարաբերակցությամբ։ Օրինակ, հեռախոսային անջատիչից խոսակցությունների հավաքածուն պարունակում է միայն այն մարդկանց խոսակցությունները, ում մայրենի լեզուն անգլերենն է (հիմնականում ամերիկացիների) քիչ աղմուկով:

    Բայց միայն վերապատրաստման տվյալների ավելացումը, հավանաբար, չի լուծի այս խնդիրը: Կան բազմաթիվ լեզուներ, որոնք պարունակում են բազմաթիվ բարբառներ և շեշտադրումներ: Բոլոր դեպքերի համար պիտակավորված տվյալներ հավաքելը իրատեսական չէ: Միայն ամերիկյան անգլերենի համար բարձրորակ խոսքի ճանաչիչ ստեղծելու համար պահանջվում է մինչև 5 հազար ժամ ձայնագրություններ՝ թարգմանված տեքստի:


    Մարդկային խոսքի տեքստ փոխարկիչների համեմատություն Baidu-ի Deep Speech 2-ի հետ տարբեր խոսքի տեսակների վրա: Մարդիկ ավելի վատ են ճանաչում ոչ ամերիկյան առոգանները, գուցե նրանց մեջ ամերիկացիների առատության պատճառով: Կարծում եմ, որ մարդիկ, ովքեր մեծացել են որոշակի տարածաշրջանում, շատ ավելի քիչ սխալներ կունենան այդ շրջանի առոգանությունը ճանաչելու հարցում:

    Շարժվող մեքենայում ֆոնային աղմուկի առկայության դեպքում ազդանշան-աղմուկ հարաբերակցությունը կարող է հասնել -5 դԲ արժեքների: Նման պայմաններում մարդիկ հեշտությամբ են գլուխ հանում ուրիշի խոսքը ճանաչելուց։ Ավտոմատ ճանաչիչները շատ ավելի արագ են փչանում, երբ աղմուկը մեծանում է: Գրաֆիկը ցույց է տալիս, թե որքան է մարդկանց միջև բացը մեծանում աղմուկի (ցածր SNR, ազդանշան-աղմուկ հարաբերակցությամբ) արժեքների դեպքում:

    Իմաստային սխալներ

    Հաճախ սխալ ճանաչված բառերի քանակն ինքնին խոսքի ճանաչման համակարգի նպատակը չէ: Մենք թիրախավորում ենք իմաստային սխալների քանակը: Սա այն արտահայտությունների համամասնությունն է, որոնցում մենք սխալ ենք ճանաչում իմաստը:

    Իմաստային սխալի օրինակն այն է, երբ ինչ-որ մեկն առաջարկում է «եկեք հանդիպենք երեքշաբթի», իսկ լուծիչը վերադարձնում է «եկեք հանդիպենք այսօր»: Առանց իմաստային սխալների բառերում էլ կան սխալներ։ Եթե ​​ճանաչողը չճանաչեց «վերև»-ը և վերադարձավ «եկեք հանդիպենք երեքշաբթի», ապա նախադասության իմաստաբանությունը չի փոխվել:

    Մենք պետք է ուշադիր օգտագործենք սխալ ճանաչված բառերի քանակը որպես չափանիշ։ Սա լուսաբանելու համար ես ձեզ կտամ ամենավատ հնարավոր դեպքի օրինակը: Բառերի սխալների 5%-ը համապատասխանում է 20-ից մեկ բացակայող բառին: Եթե յուրաքանչյուր նախադասություն պարունակում է 20 բառ (ինչը բավականին միջին է անգլերեն լեզվի համար), ապա սխալ ճանաչված նախադասությունների թիվը մոտենում է 100%-ի: Կարելի է հուսալ, որ սխալ ճանաչված բառերը չեն փոխում նախադասությունների իմաստային իմաստը։ Հակառակ դեպքում, ճանաչողը կարող է սխալ վերծանել յուրաքանչյուր նախադասություն նույնիսկ սխալ ճանաչված բառերի 5%-ով:

    Մոդելները մարդկանց հետ համեմատելիս կարևոր է ստուգել սխալների էությունը և վերահսկել ոչ միայն սխալ ճանաչված բառերի քանակը: Իմ փորձով, մարդիկ, ովքեր խոսքը թարգմանում են տեքստի, ավելի քիչ սխալներ են թույլ տալիս, և դրանք այնքան լուրջ չեն, որքան համակարգիչները:

    Microsoft-ի հետազոտողները վերջերս համեմատել են մարդկանց և նմանատիպ մակարդակների համակարգչային ճանաչողների սխալները: Հայտնաբերված տարբերություններից մեկն այն է, որ մոդելը շատ ավելի հաճախ է շփոթում «ուհ»-ը [uh-uh...] «uh huh»-ի հետ [uh-huh], քան մարդիկ: Երկու տերմինները շատ տարբեր իմաստաբանություն ունեն. «ուհ»-ը լրացնում է դադարները, մինչդեռ «ուհը» նշանակում է ունկնդիրի ընդունում: Բացի այդ, նույն տեսակի բազմաթիվ սխալներ են հայտնաբերվել մոդելների և մարդկանց մոտ:

    Շատ ձայներ մեկ ալիքում

    Նաև ավելի հեշտ էր ճանաչել ձայնագրված հեռախոսային խոսակցությունները, քանի որ յուրաքանչյուր բարձրախոս ձայնագրվում էր առանձին խոսափողի վրա: Մեկ աուդիո ալիքում մի քանի ձայների համընկնում չկա: Մարդիկ կարող են հասկանալ մի քանի խոսողներ, երբեմն խոսում են միաժամանակ:

    Լավ խոսքի ճանաչիչը պետք է կարողանա աուդիո հոսքը բաժանել հատվածների՝ կախված խոսնակից (այն ենթակա է դիարիզացիայի): Նա պետք է նաև իմաստ հանի ձայնագրությունից երկու համընկնող ձայներով (աղբյուրի բաժանում): Դա պետք է արվի առանց խոսափողի, որը տեղադրված է անմիջապես յուրաքանչյուր բարձրախոսի բերանին, այսինքն, որպեսզի ճանաչիչը լավ աշխատի, եթե տեղադրվի կամայական վայրում:

    Ձայնագրման որակը

    Շեշտադրումները և ֆոնային աղմուկը ընդամենը երկու գործոն են, որոնց նկատմամբ խոսքի ճանաչողը պետք է ամուր լինի: Ահա ևս մի քանիսը.

    Արձագանք տարբեր ակուստիկ պայմաններում:
    Սարքավորումների հետ կապված արտեֆակտներ:
    Կոդեկի արտեֆակտներ, որոնք օգտագործվում են ազդանշանը ձայնագրելու և սեղմելու համար:
    Նմուշառման հաճախականությունը:
    Խոսողի տարիքը.

    Մարդկանց մեծամասնությունը չի կարողանում տարբերել mp3 և wav ձայնագրությունները: Մինչև նրանք կարող են պահանջել, որ համեմատելի է մարդկանց կատարողականի հետ, ճանաչողները պետք է ամուր դառնան տատանումների այս աղբյուրների նկատմամբ:

    Համատեքստ

    Դուք կարող եք նկատել, որ սխալների թիվը, որ մարդիկ թույլ են տալիս թեստերի ժամանակ հեռախոսային կայանից ձայնագրություններում բավականին մեծ են։ Եթե ​​զրուցեիք ընկերոջ հետ, ով չի հասկանում 20 բառից 1-ը, դուք շատ դժվար կլինեիք շփվել:

    Դրա պատճառներից մեկը ճանաչումն է՝ առանց համատեքստը հաշվի առնելու։ Իրական կյանքում մենք օգտագործում ենք բազմաթիվ տարբեր լրացուցիչ ազդանշաններ, որոնք օգնում են մեզ հասկանալ, թե ինչ է ասում մեկ ուրիշը: Մարդկանց կողմից օգտագործվող համատեքստի որոշ օրինակներ, որոնք անտեսվում են խոսքի ճանաչողների կողմից.

    Զրույցի պատմությունը և քննարկվող թեման.
    Տեսողական հուշումներ խոսողի մասին՝ դեմքի արտահայտություններ, շուրթերի շարժումներ։
    Գիտելիքների ամբողջությունը այն անձի մասին, ում հետ մենք խոսում ենք:

    Այժմ Android-ի խոսքի ճանաչիչն ունի ձեր կոնտակտների ցանկը, որպեսզի կարողանա ճանաչել ձեր ընկերների անունները: Քարտեզների վրա ձայնային որոնումն օգտագործում է աշխարհագրական տեղաբաշխում, որպեսզի նեղացնի ընտրանքները, որոնց ուղղություններն ուզում եք ստանալ:

    Ճանաչման համակարգերի ճշգրտությունը մեծանում է տվյալների մեջ նման ազդանշանների ընդգրկմամբ: Բայց մենք նոր ենք սկսում խորանալ համատեքստի տեսակի մեջ, որը կարող ենք ներառել մշակման մեջ և ինչպես կարող ենք օգտագործել այն:

    Տեղակայում

    Խոսակցական լեզվի ճանաչման վերջին առաջընթացը հնարավոր չէ վերացնել: Խոսքի ճանաչման ալգորիթմի տեղադրումը պատկերացնելիս պետք է նկատի ունենալ հետաձգման և մշակման հզորությունը: Այս պարամետրերը կապված են, քանի որ ալգորիթմները, որոնք մեծացնում են էներգիայի պահանջները, նույնպես մեծացնում են հետաձգումը: Բայց պարզության համար մենք դրանք կքննարկենք առանձին:

    Լատենտություն՝ օգտագործողի խոսքի ավարտից մինչև տառադարձության ստացման ավարտը: Փոքր ուշացումը ճանաչման բնորոշ պահանջ է: Դա մեծապես ազդում է արտադրանքի հետ աշխատելու օգտատերերի փորձի վրա: Տասնյակ միլիվայրկյանների սահմանափակումները սովորական են: Սա կարող է չափազանց սահմանափակ թվալ, բայց հիշեք, որ տեքստի պատրաստումը սովորաբար առաջին քայլն է բարդ հաշվարկների շարքում: Օրինակ, ձայնային ինտերնետ որոնման դեպքում խոսքի ճանաչումից հետո դեռ պետք է ժամանակ ունենալ որոնումն իրականացնելու համար։

    Երկկողմանի կրկնվող շերտերը բարելավման տիպիկ օրինակ են, որը վատթարացնում է հետաձգումը: Բոլոր վերջին բարձրորակ տառադարձման արդյունքները ստացվում են նրանց օգնությամբ: Միակ խնդիրն այն է, որ մենք չենք կարող որևէ բան հաշվել առաջին երկկողմանի շերտի միջով անցնելուց հետո, քանի դեռ մարդը չի ավարտել խոսելը: Հետևաբար, ուշացումը մեծանում է նախադասության երկարությամբ:


    Ձախ. ուղղակի կրկնությունը թույլ է տալիս անմիջապես սկսել ապակոդավորումը: Աջ․ երկկողմանի կրկնությունը պահանջում է սպասել մինչև խոսքի ավարտը՝ նախքան արտագրելը։

    Խոսքի ճանաչման մեջ ապագա տեղեկատվությունը արդյունավետ կերպով ներառելու լավ միջոց դեռևս փնտրվում է:

    Հաշվողական հզորություն. այս պարամետրի վրա ազդում են տնտեսական սահմանափակումները: Ճանաչողի ճշգրտության յուրաքանչյուր բարելավման համար պետք է հաշվի առնել բանկետի արժեքը: Եթե ​​բարելավումը չհասնի տնտեսական շեմին, այն չի գործարկվի։

    Շարունակական բարելավման դասական օրինակ, որը երբեք չի կիրառվում, համատեղ խորը ուսուցումն է: Սխալների թվի 1-2%-ով կրճատումը հազվադեպ է արդարացնում հաշվողական հզորության 2-8 անգամ ավելացումը: Պարբերական ցանցերի ժամանակակից մոդելները նույնպես ընկնում են այս կատեգորիայի մեջ, քանի որ դրանք շատ անշահավետ են օգտագործել մի շարք հետագծեր փնտրելիս, չնայած կարծում եմ, որ ապագայում իրավիճակը կփոխվի:

    Ես ուզում եմ պարզաբանել, որ չեմ ասում, որ ճանաչման ճշգրտության բարելավումը հաշվողական ծախսերի լուրջ աճով անօգուտ է: Մենք արդեն տեսել ենք, թե ինչպես է նախկինում գործում «նախ դանդաղ, բայց հաստատ, հետո արագ» սկզբունքը։ Բանն այն է, որ քանի դեռ բարելավումը բավականաչափ արագ չէ, այն չի կարող օգտագործվել։

    Առաջիկա հինգ տարում

    Խոսքի ճանաչման ոլորտում դեռ շատ չլուծված ու բարդ խնդիրներ կան։ Նրանց մեջ:

    Տվյալների պահպանման նոր համակարգերի հնարավորությունների ընդլայնում, շեշտադրումների ճանաչում, խոսք ուժեղ աղմուկի ֆոնի վրա։
    Ներառելով համատեքստը ճանաչման գործընթացում:
    Դիարիզացիա և աղբյուրի բաժանում:
    Իմաստային սխալների քանակը և ճանաչողների գնահատման նորարարական մեթոդները:
    Շատ ցածր ուշացում:

    Ես անհամբեր սպասում եմ այն ​​առաջընթացին, որը ձեռք կբերվի առաջիկա հինգ տարիների ընթացքում այս և այլ ճակատներում:

    Պիտակներ. Ավելացնել պիտակներ

    Սենսորային էկրանի կառավարումն արդեն ստանդարտ է: Վերջին համակարգերը, ինչպիսին է Windows 8-ը, «հասկանում» են ձայնային հրամանները Խոսքի ճանաչումը պետք է հանգեցնի նրան, որ մեր շփումը համակարգչի հետ կլինի էլ ավելի պարզ, ավելի ինտուիտիվ և... ավելի բնական։ Ես ձեզ կասեմ, թե ինչ տեսք ունի այն այսօր:

    Մի փոքր պատմություն. ինչպես է զարգացել հաղորդակցությունը մեքենայի հետ

    Համակարգչի հետ մենք հաղորդակցվելու ձևը զարգացել է տարիների ընթացքում: Առաջին ինտերֆեյսը, որի միջոցով մարդիկ կարող էին հրամաններ տալ, դակիչ քարտերն էին, որոնք թվագրվում են 1832 թվականին: Դրանք օգտագործվում էին մեքենաների մեջ՝ կտոր պատրաստելու համար։ Ստեղնաշարը սկսել է օգտագործվել 1960 թվականին։ Երկու տասնամյակ անց ստանդարտ մկնիկը միացավ և մինչ օրս օգտագործվում է: Չնայած մկնիկը կիսել է իր ուժերը trackpad-ի հետ, այն դեռ ամենահայտնի կառավարման տեսակն է: Սմարթֆոնների և պլանշետների շնորհիվ մեծ տարածում են գտել սենսորային ինտերֆեյսներն ու ժեստերը, որոնք օգտագործվում են, մասնավորապես, Xbox 360 Kinect-ը կառավարելու համար։ Սենսորային էկրաններից և ժեստերից հետո գալիս է ձայնային կառավարումը, սակայն այս լուծումը մինչ այժմ այնքան թերզարգացած է եղել, որ երբեմն նույնիսկ չեք լսի դրա մասին:

    Windows 8-ում խոսքի ճանաչման կարգավորում

    Ցավոք սրտի, ձայնային կառավարումը դեռ հասանելի չէ ռուսերենով: Ներկայումս աջակցվող լեզուներն են՝ անգլերենը, ֆրանսերենը, գերմաներենը, ճապոներենը, կորեերենը, չինարենը և իսպաներենը: Microsoft-ը որոշել է կենտրոնանալ ամենախոշոր ու զարգացած երկրների վրա, սակայն չի բացառվում, որ ժամանակի ընթացքում այս ֆունկցիան ավելացնի նաև մեր երկրին։ Եթե ​​դուք փորձեք գործարկել այն, դա երդվում է այսպես

    Եթե ​​դուք դեռ ցանկանում եք փորձարկել այս լուծումը, դուք պետք է կարգավորեք համակարգը (փոխեք լեզուն) և սովորեք մի քանի բառ անգլերենով: Դա անելու համար հարկավոր է գնալ կառավարման վահանակ և ընտրել Լեզու: Եթե ​​ռուսերենից բացի այլ լեզու չունեք, ապա պետք է սեղմեք «Ավելացնել լեզու» կոճակը և ընտրեք աջակցվող լեզուներից մեկը: Մեր դեպքում դա «անգլերեն (ԱՄՆ)» է: Մենք տեսնում ենք, որ այս լեզվով միայն դասավորությունը հասանելի է, կրկնակի սեղմեք, այն կստուգի ինտերֆեյսի համար լեզվի առկայությունը, ստուգելուց հետո կտտացրեք «Ներբեռնեք և տեղադրեք լեզվական փաթեթ», և գործընթացը կսկսվի, համբերատար սպասեք: այն բեռնելու համար: Այս գործընթացն ավարտվելուց հետո սահմանեք լռելյայն լեզուն անգլերենին

    Այժմ դուք պետք է գնաք Windows 8-ի մեկնարկային էկրան (սալիկապատ), որոնման մեջ մուտքագրեք «Windows Speech Recognition» և սեղմեք Enter:

    Այսպիսով, դուք կարող եք գործարկել ձայնի ճանաչման գործիքը: Երբ առաջին անգամ սկսեք այն, այն կառաջարկի կարգավորել խոսափողը, ընտրելուց հետո ինչ-որ բան ասեք ստուգելու համար:

    Հաջորդը, առաջարկեք վերապատրաստման դասեր վերցնել: Դրանք տևում են մինչև 15-20 րոպե, բայց շատ օգտակար են և տալիս են հիմնական տեղեկություններ այն մասին, թե ինչպես օգտագործել գործառույթները: Բայց եթե անգլերենում ուժեղ չես, կարծում եմ, չարժե ժամանակ վատնել, դժվար կլինի ինչ-որ բան հասկանալ, գնա ուղիղ մարտի

    Ինչպես աշխատել

    Որպեսզի համակարգիչը սկսի ճանաչել ձեր խոսքը, դուք պետք է ասեք «սկսիր լսել» (որը նշանակում է սկսել լսել) կամ սեղմել խոսափողի կոճակը՝ լսելու ռեժիմը սկսելու համար: Այժմ դուք կարող եք բացել հավելվածը կամ պարզապես բառեր թելադրել տեքստային խմբագրիչի, բրաուզերի կամ որոնման տողի մեջ

    Ինչ կարող ենք անել

    Սկզբունքորեն, հնարավորությունները հսկայական են, բացի ստանդարտ բառերից, դուք կարող եք ստեղծել ձեր սեփական հրամանները: Հիմնական հատկանիշները ներկայացված են աղյուսակում

    Գործողություն Ինչ պետք է ասել
    Ընտրեք ցանկացած տարր իր անունով Սեղմեք Ֆայլ, Սկսել, Դիտել
    Ընտրեք ցանկացած տարր կամ պատկերակ Սեղմեք թափոնարկղ, սեղմեք Համակարգիչ, սեղմեք (ֆայլի անուն)
    Կրկնակի սեղմեք կամ կրկնակի սեղմեք ցանկացած տարրի վրա Կրկնակի սեղմեք Վերամշակման աղբարկղ, Կրկնակի սեղմեք Համակարգիչ
    Անցում բաց հավելվածների միջև Անցեք Paint-ին, անցեք WordPad-ին

    Ոլորել

    Ոլորել վերև; Ոլորել ներքեւ;
    Ոլորել ձախ; Ոլորեք աջ

    Փաստաթղթում ներառեք նոր պարբերություն կամ նոր տող

    Նոր պարբերություն; Նոր գիծ

    Ընտրեք բառ փաստաթղթում

    Բառի ուղղում

    Ճիշտ բառ

    Ընտրեք և հեռացրեք կոնկրետ բառեր

    Ցույց տալ կիրառելի հրամանների ցանկը

    Թարմացնել խոսքի հրամանները

    Միացրեք լսելու ռեժիմը

    Անջատեք լսելու ռեժիմը

    Ծալել խոսափողը

    Նվազագույնի հասցնել խոսքի ճանաչումը

    Դիտեք Windows-ի օգնությունը և աջակցությունը

    Ինչպե՞ս կարող եմ ինչ-որ բան անել:
    Օրինակ՝ Ինչպե՞ս տեղադրել տպիչ:

    Եթե ​​չգիտեք ինչպես արտասանել արտահայտությունը, առաջարկում եմ օգտագործել Google Translate կամ http://uchilochka.rf (նա ավելի լավ է հասկացել այս կայքը)

    Ես ցանկություն ունեի գրի առնել իմ հրամանները՝ բաղկացած պարզ բուրժուական բառերից։ Որը կարող եմ արտասանել։ Այսպիսով, նա ինձ թույլ չտվեց դա անել, նա չկարողացավ գործարկել հրամանի խմբագրիչը: Արդյունքում նա հիանալի հասկանում էր մեկ, երկու և բաց բառերի իմ արտասանությունը։ Այս հավաքիչի միջոցով դուք կարող եք գործարկել հավելված՝ ըստ համարի հիմնական էկրանին: Նախ ասեք համարը, հետո ասեք ԲԱՑ։ Ոչ, իհարկե, շատ, բայց փորձը հաջողված եմ համարում։ Վատ չէր լինի, եթե Microsoft-ը ներմուծեր ռուսերենը, որը լավ փոխարինում է հեռակառավարման վահանակին։

    Windows 7 օպերացիոն համակարգը հագեցած է բազմաթիվ տարբերակներով, որոնք ավելի ու ավելի շատ հնարավորություններ են տալիս այս համակարգի օգտատերերին։ Նրանք կարողացան դրա մեջ մտցնել մի շատ հետաքրքիր գործառույթ, որը կոչվում է «խոսքի ճանաչում»։ Բայց ի՞նչ է այս համակարգը: Ահա թե ինչի մասին է լինելու զրույցը։

    Քննարկվող տարբերակը թույլ է տալիս ամբողջ համակարգի հավելվածներին օգտագործել համակարգչի հետ օգտատերերի փոխգործակցության բոլորովին նոր եղանակ: Դա Windows 7 Speech Recognition համակարգն է, որը թույլ է տալիս կառավարել ձեր համակարգիչը՝ առանց ստեղնաշարի, մկնիկի կամ այլ միջոցների:

    Նշեմ, որ այս նորամուծությունը հասանելի կլինի Microsoft-ի այլ արտադրանքներում։ Այս ֆունկցիան նկատվել է մի փոքր ավելի վաղ, այսինքն՝ փորձել են այն իրականացնել Windows Vista-ում, սակայն Microsoft-ի օպերացիոն համակարգի յոթերորդ տարբերակում ձայնային կառավարումն ավելի բարձր մակարդակով է իրականացվում՝ համեմատած իր նախորդի։ Պարզ ասած, Windows 7-ում խոսքի ճանաչման նման տարբերակն էլ ավելի գործունակ է դարձել:

    Ի լրումն ասվածի, նշեմ, որ այն ունի կիրառությունների բավականին լայն շրջանակ։ Խոսքի ճանաչմամբ Windows 7-ի օգտատերերը հնարավորություն ունեն գործարկել ծրագրեր և բոլոր ձայնային հատվածները վերածել տեքստի, կատարել բոլոր տեսակի հրամանները համակարգչում՝ օգտագործելով միայն իրենց ձայնը և անհրաժեշտ սարքերը: Բայց ի՞նչ է անհրաժեշտ Windows 7-ի խոսքի ճանաչումն իրականություն դարձնելու համար:

    Առաջին հերթին ձեզ հարկավոր է միկրոֆոն, որը պետք է միացված լինի ձեր համակարգչին։ Բացի այդ, դուք պետք է գնեք հատուկ հավելված կամ ծրագիր, որը հրապարակված է հենց արտադրողի կողմից, այսինքն՝ Microsoft-ի: Բոլոր անհրաժեշտ բաղադրիչները տեղադրվելուց և խոսափողը համակարգչին միացնելուց հետո պետք է իրականացվի հատուկ աշխատանքային պլան.

    • Դուք պետք է գործարկեք թեստային ձայնային հրամաններ և դրանք վերածեք տեքստի:
    • Ճանաչման ծրագիրը մարզելուց հետո ձեզ հարկավոր է ձայնային տարբեր հրամանների համար ձևանմուշներ ստեղծել: Այս աշխատանքի հիման վրա է, որ համակարգիչը կկարողանա ընդունել և կատարել ձեր նշած բոլոր հրամանները:

    Windows 7 խոսքի ճանաչման ֆունկցիան օգտագործվում է Microsoft-ի տեքստային խմբագրիչում՝ WordPad-ում: Այն անթերի է գործում տարբեր ձևաթղթեր լրացնելիս, ինչպես նաև լավ է աշխատում Internet Explorer-ում և երբ

    Բացի այդ, այս տարբերակը հեշտությամբ կարող է խմբագրել նախկինում ձայնագրված տեքստը՝ սահմանելով հատուկ ձայնային հրամաններ: Իհարկե, որոշակի առաջադրանքի ճանաչման գործընթացում տեղի են ունենում բնորոշ սխալներ (երբ որոշ հնչյուններ սխալմամբ են ճանաչվում): Այս դեպքում ծրագիրը տրամադրում է որոշակի բառերի համապատասխանությունների ցանկ:

    Ֆունկցիան, իհարկե, ֆենոմենալ է, բայց այստեղ դեռ կա մեկ «բայց»։ Բանն այն է, որ ռուսերեն խոսքի ճանաչումն այժմ, սկզբունքորեն, անհասանելի է։ Ծրագրի հիանալի տարբերակներ կան անգլերենի, ֆրանսերենի, գերմաներենի և ճապոներենի համար: Կան նաև չինարեն, իսպաներեն և իտալերեն խոսքի տարբերակներ։

    Բայց այս նոր արտադրանքը լիովին հարմարեցված չէ ռուսերենի համար: Ձեր համակարգիչը չի կարողանա ընկալել իրեն հանձնարարված առաջադրանքները, ինչը նշանակում է, որ ձեզ համար ավելի հեշտ կլինի ինչ-որ բան գրել ստեղնաշարի միջոցով կամ կատարել որոշակի առաջադրանքներ՝ օգտագործելով մկնիկը:

    Իհարկե, դուք կարող եք փորձել աշխատել նմանատիպ ռուսալեզու ծրագրերի հետ կամ ձեր նախապատվությունը տալ անգլերենին, բայց դեռ կարող եք հուսալ, որ շուտով ռուսերեն խոսքի ճանաչումը նույնպես հասանելի կլինի բարձրորակ ռեժիմով: Եվ դա այն դեպքում, երբ դուք կկարողանաք գործնականում փորձել նման եզակի հատկանիշը: Ի վերջո, դա, անկասկած, հստակորեն հեշտացնում է աշխատանքը անհատական ​​համակարգչի վրա և հսկայական առաջընթաց է ծրագրավորման ոլորտում։ Այսպիսով, մնում է միայն սպասել:

    Ոչ մի ծրագիր չի կարող ամբողջությամբ փոխարինել ձայնագրված խոսքի արտագրման ձեռքով աշխատանքը: Այնուամենայնիվ, կան լուծումներ, որոնք կարող են զգալիորեն արագացնել և հեշտացնել խոսքի թարգմանությունը տեքստի, այսինքն՝ պարզեցնել տառադարձումը։

    Տառադարձումը աուդիո կամ վիդեո ֆայլի տեքստային ձևով ձայնագրումն է: Համացանցում կան վճարովի վճարովի առաջադրանքներ, երբ կատարողին որոշակի գումար են վճարում տեքստի արտագրման համար։

    Խոսքի տեքստի թարգմանությունը օգտակար է

    • ուսանողներին ձայնագրված աուդիո կամ վիդեո դասախոսությունները թարգմանել տեքստի,
    • բլոգերներ, որոնք վարում են կայքեր և բլոգեր,
    • գրողներ, լրագրողներ գրքեր և տեքստեր գրելու համար,
    • տեղեկատվական գործարարներ, ովքեր իրենց վեբինարից, ելույթից և այլնից հետո տեքստի կարիք ունեն,
    • մարդիկ, ովքեր դժվարանում են մուտքագրել. նրանք կարող են նամակ թելադրել և ուղարկել ընտանիքին կամ ընկերներին,
    • այլ տարբերակներ:

    Մենք նկարագրելու ենք ամենաարդյունավետ գործիքները, որոնք հասանելի են ԱՀ-ներում, բջջային հավելվածներում և առցանց ծառայություններում:

    1 Կայքը speakpad.ru

    Սա առցանց ծառայություն է, որը թույլ է տալիս Google Chrome բրաուզերի միջոցով խոսքը թարգմանել տեքստի: Ծառայությունն աշխատում է խոսափողով և պատրաստի ֆայլերով։ Իհարկե որակը շատ ավելի բարձր կլինի, եթե արտաքին խոսափող օգտագործես ու քեզ թելադրես։ Այնուամենայնիվ, ծառայությունը լավ է աշխատում նույնիսկ YouTube-ի տեսանյութերի դեպքում:

    Կտտացրեք «Միացնել ձայնագրությունը», պատասխանեք «Միկրոֆոն օգտագործելու» մասին հարցին. դա անելու համար կտտացրեք «Թույլատրել»:

    Ծառայությունից օգտվելու երկար հրահանգները կարող են փլուզվել՝ սեղմելով Նկ. 3. Դուք կարող եք ազատվել գովազդից՝ կատարելով պարզ գրանցում։

    Բրինձ. 3. Speechpad ծառայություն

    Ավարտված արդյունքը հեշտ է խմբագրել: Դա անելու համար անհրաժեշտ է կամ ձեռքով ուղղել ընդգծված բառը կամ նորից թելադրել այն: Աշխատանքի արդյունքները պահվում են ձեր անձնական հաշվում, դրանք կարող են ներբեռնվել նաև ձեր համակարգչում:

    Խոսքի պահոցի հետ աշխատելու վիդեո դասերի ցանկ.

    Դուք կարող եք արտագրել տեսանյութեր Youtube-ից կամ ձեր համակարգչից, սակայն ձեզ հարկավոր կլինի խառնիչ, ավելի մանրամասն.

    Տեսանյութ «Աուդիո տառադարձում»

    Ծառայությունը գործում է յոթ լեզուներով։ Մի փոքր մինուս կա. Դա կայանում է նրանում, որ եթե անհրաժեշտ է արտագրել պատրաստի աուդիո ֆայլ, ապա դրա ձայնը լսվում է բարձրախոսների միջոցով, ինչը լրացուցիչ միջամտություն է առաջացնում արձագանքի տեսքով:

    2 Ծառայության թելադրանք.io

    Հրաշալի առցանց ծառայություն, որը թույլ է տալիս անվճար և հեշտությամբ խոսքը թարգմանել տեքստի:

    Բրինձ. 4. Ծառայության թելադրանք.io

    1-ում Նկ. 4 – Էջի վերջում կարելի է ընտրել ռուսաց լեզուն: Google Chrome դիտարկիչում լեզուն ընտրված է, բայց Mozilla-ում չգիտես ինչու նման տարբերակ չկա։

    Հատկանշական է, որ իրականացվել է պատրաստի արդյունքի ավտոմատ պահպանման հնարավորությունը։ Սա կկանխի ներդիրի կամ բրաուզերի փակման արդյունքում պատահական ջնջումը: Այս ծառայությունը չի ճանաչում պատրաստի ֆայլերը: Աշխատում է խոսափողով։ Թելադրելիս պետք է անվանել կետադրական նշաններ:

    Տեքստը բավականին ճիշտ է ճանաչված, ուղղագրական սխալներ չկան։ Դուք կարող եք ինքներդ տեղադրել կետադրական նշաններ ստեղնաշարից: Ավարտված արդյունքը կարող է պահպանվել ձեր համակարգչում:

    3 RealSpeaker

    Այս ծրագիրը թույլ է տալիս հեշտությամբ թարգմանել մարդկային խոսքը տեքստի: Այն նախատեսված է տարբեր համակարգերում աշխատելու համար՝ Windows, Android, Linux, Mac: Նրա օգնությամբ դուք կարող եք լսվող խոսքը վերածել խոսափողի (օրինակ՝ այն կարելի է ներկառուցել նոութբուքի մեջ), ինչպես նաև ձայնագրել աուդիո ֆայլերի։

    Կարող է հասկանալ աշխարհի 13 լեզուներ: Կա ծրագրի բետա տարբերակ, որն աշխատում է որպես առցանց ծառայություն.

    Դուք պետք է հետևեք վերը նշված հղմանը, ընտրեք ռուսերեն լեզուն, վերբեռնեք ձեր աուդիո կամ վիդեո ֆայլը առցանց ծառայության մեջ և վճարեք դրա տառադարձման համար: Տառադարձումից հետո կարող եք պատճենել ստացված տեքստը: Որքան մեծ է տառադարձման համար նախատեսված ֆայլը, այնքան ավելի շատ ժամանակ կպահանջվի այն մշակելու համար, ավելի մանրամասն.

    2017-ին կար RealSpeaker-ի միջոցով անվճար տառադարձման տարբերակ, իսկ 2018-ին նման տարբերակ չկա։ Շատ շփոթեցնող է, որ տառադարձված ֆայլը հասանելի է բոլոր օգտատերերին՝ ներբեռնելու համար, միգուցե դա կբարելավվի:

    Ծրագրի մշակողի (VKontakte, Facebook, Youtube, Twitter, էլ.փոստ, հեռախոս) կոնտակտները կարելի է գտնել նրա կայքի էջում (ավելի ճիշտ՝ կայքի էջատակում).

    4 Speechlogger

    Android-ով աշխատող շարժական սարքերի համար նախորդ հավելվածի այլընտրանք: Հասանելի է անվճար հավելվածների խանութում.

    Տեքստը խմբագրվում է ավտոմատ կերպով, և կետադրական նշաններ են ավելացվում: Շատ հարմար է ինքներդ ձեզ գրառումներ թելադրելու կամ ցուցակներ կազմելու համար։ Արդյունքում տեքստը կլինի շատ պատշաճ որակի։

    5 Վիշապի թելադրություն

    Սա հավելված է, որը անվճար բաժանվում է Apple-ի բջջային սարքերի համար:

    Ծրագիրը կարող է աշխատել 15 լեզուներով։ Այն թույլ է տալիս խմբագրել արդյունքը և ցանկից ընտրել ցանկալի բառերը: Պետք է հստակ արտասանել բոլոր հնչյունները, ոչ թե ավելորդ դադարներ անել և խուսափել ինտոնացիայից: Երբեմն բառերի վերջավորություններում սխալներ են լինում։

    Dragon Dictation հավելվածն օգտագործվում է սեփականատերերի կողմից, օրինակ՝ բնակարանում շարժվելիս խանութում գնումների ցուցակ թելադրելու համար: Երբ ես այնտեղ հասնեմ, ես կարող եմ դիտել գրության տեքստը, և ես ստիպված չեմ լսել:

    Ինչ ծրագիր էլ որ օգտագործեք ձեր պրակտիկայում, պատրաստ եղեք կրկնակի ստուգել արդյունքները և որոշակի ճշգրտումներ կատարել: Սա միակ միջոցն է առանց սխալների անթերի տեքստ ստանալու համար:

    Նաև օգտակար ծառայություններ.

    Ստացեք համակարգչային գրագիտության վերջին հոդվածները անմիջապես ձեր մուտքի արկղում.
    Արդեն ավելին 3000 բաժանորդ

    .