- Тіл
- 20 Мамыр, 2021
Қазақша сөйлейтін және түсінетін технология
Цифрлық технологияны қолдану – жағдаяттарды талдауды, жүйелеуді жүзеге асырумен шектеліп қалмайды, сонымен қатар жергілікті биліктің, мемлекеттік ұйымдардың жедел жауаптасу мүмкіндіктерін арттырады, адам капиталының дамуына септігін тигізеді. Ізгілікті қоғамдық-инновациялық бағыттардың өрістеуіне қызмет етеді. Соның ішінде мемлекеттік тіліміз – қазақ тілінің қолданыс аясын кеңейтуде де цифрлық технологияны қолданудың маңызы зор.
Бүгіндері қазақ лингвистикасы мен ақпараттандыру салаларының интеграциялық зерттеулері нәтижесінде сөйлеу корпусы құрылымдалынып, сол негізде электрондық құралдар мен технологиялар арқылы сөйлеуді тану платформасы жасалуда.
Компьютерлік технология прогресі корпустық мәтіндерді, яғни табиғи байланыстырып сөйлеу қалпынан алынған деңгейдегі тілді тану үдерісін арнайы бағдарламалар арқылы автоматты түрде жүйеге келтіріп, мақсатқа сәйкес өңдеп, оны қолдануға жол ашады.
Цифрлық әлемде сөйлеуді тану жаңалық емес, оны дүние ғалымдары ондаған жылдар зерттеп, қолданысқа ұсынып келеді. Алайда ақпарат енгізудің кешенді жүйесі соңғы жылдарда ғана дамуда. Ең жаңа бағдарламалар қазірдің өзінде адам сөйлеуінің 95%-ын тану мүмкіндігіне ие.
Елімізде бүгіндері жүргізіліп жатқан қазақ тіліндегі сөйлеуді тану бойынша зерттеу жұмыстары да нәтижесіз емес. Жасалған корпус қазақ сөзін түсінеді, мәндік байланыстарын, айтылу ерекшеліктерін, сөздердің түрлі мағыналарын анықтайды, ақылды үй және автомобильдегі технологиялар аясында бұйыруларды ұғады. Алайда бұл сөйлеу корпусының ауқымының шағын болуы APP жүйесінің тиімділігін тежейтінін айту керек. Осы бағыттарда, бірақ ауқымы екі мың сағаттық әлдеқайда көлемді қазақша сөйлеу корпусы Ақпараттық және есептеуіш технологиялар институтында дүниеге келді. Аталған институттың Интеллектуалдық жүйелердің компьютерлік инженериясы зертханасында қазақ тілінде байланыстырылып сөйлеуді автоматтық тану бойынша интеллектуалдық жүйе әзірленді. Интеллектуалдық жүйе негізінде қазақ тіліндегі мәтіндерді сөйлеу ақпараты ретінде сапалы бейіндеп тасымалдауға мүмкіндік беретін Kazakh ASR телеграмм боты жасалды.
Бұл аталған жүйені дайындау үшін, жоғарыда айтылғандай, барлығын қосқанда уақыты 2000 сағат болатын көлемде жиналған қазақша сөйлеу корпусы бүгінгі таңда ең үлкен аса ауқымды бірден-бір корпус болып саналады. Бұл корпусқа тек «таза» оқылған сөйлеудің аудиожазбасы ғана емес, сонымен қатар телефон арқылы сөйлеу де енгізілді, бұның өзі ол корпусқа әмбебаптық сипат дарытады. Телефондық сөйлеулерді транскрипциялау үшін арнайы күрделі әдіс жасалды, өйткені мұндай сөйлеу табан астынан пайда болады, өзге тілдердегі ақпараттың қатысуы, аса айқын сезіліп тұратын акценттің орын алуы мүмкін, сондай-ақ әртүрлі сөйлеу және сөйлеу емес шуылдар (дауыстың түрліше тондары, телефондағы белгі беретін дыбыстар мен қоңыраулар, сөйлеушінің келесі ойды айтуға дайындығының үндері, анық айтылмаған сөздер, дикторлардың бірнешеуінің қабаттасып сөйлеуі, т.б.) естілуі әбден ықтимал. Жалпы корпустың аса мол мәтіндерін іздеп табу, сұрыптау, мәтіндегі фонемолардың контекстік қолдануындағы алдын ала белгіленген статистикалық талаптарға сәйкестігін сақтау едәуір күрделі міндеттер жүктейді және өте ұзақ уақыт алады. Сондықтан да АЕТИ дайындаған корпус аса үлкен көлеммен жұмыс істеуге, жүйенің ұсынатын сипаттарын тексеруге, жүйені тану жылдамығын арттыруға арнап құрылған.
Бұл жүйе бастапқы аудиофайлды машиналық оқу форматына айналдырады. Яғни қосымша компоненттер мен транскрипцияларды қажет етпейді. Аталған жүйе – сөйлеуді интрегалдық модельді қолдану арқылы танудың қазіргі технологияларының бір нұсқасы. Ал интегралды жүйелер кең қолданыстағы дәстүрлі коммерциялық жүйелерде, күрделі шулы орталарда әлдеқайда жақсы әрі тиімді жұмыс істей алады.
Бұл зерттеудің нәтижиесінде сөйлеуді тану үшін мобильдік қосымшаны қазақ тіліне үйрету жүйесі іске асырылды. АЕТИ әзірлеген бұл мобильді қосымша KazVoice бағдарламасы бойынша орындалған, ол пайдаланушыға тестілік режимде қолжетімді етіп жасалған. Берілген қосымшамен жұмыс істеу үшін hhtps://t.me/kazakhASRB.t желісіне өту керек. Сөзді жазу үшін микрофон кнопкасы басылады, микрофоннан сөйлеу сигналдары келіп түседі. Одан әрі де сөйлеу сигналдары автоматты оқылып, ізбе-із сол сәтте мәтін түріндегі нәтиже пайдаланушыға көрінеді.
Бұл бағдарлама қазақ тіліндегі электрондық гаджеттер және дыбыстық бұйырулар берілген ақпараттармен алмасуға мүмкіндік береді. Берілген эксперименттік әзірлеме сөйлеуді тану техологиясын қолдана отырып, ауызша бұйыруларды компьютердің түсінуін, сөйлеу кезіндегі бет-әлпеттің қимылдарын, ымдарды оқуды қамтамасыз етеді. Мұндай мобильді құрылғы ақпаратты тек микрофоннан ғана алумен шектелмейді, ол видеокамералардан да сөздерді ерін қимылына қарай ажыратып оқиды. Берілген сөйлеуді тану бағдарламасы PhoneGap фреймворк негізінде әзірленген, сөйтіп I0S және Android жеделдетпе жүйелерінде жұмыс істей алады. Оның осы типтес электрондық қосымшалардан артықшылығы – экстремалдық жағдайларда ақпараттың кедергісіз келіп түсуін және оны өңдеуді басқара алады, табиғи диалогтардың мағынасын бұзбай, дәл ендіру мүмкіндігіне ие.
Бағдарламаның маңыздылығы – берілген әзірлемеде банк саласының колл-операторларында және тағы басқа салаларында интеллектуалдық дауыстық қызмет көрсете алуымен сипатталады. Сондай-ақ автомобиль, ақылды үй, тұрмыстық техникалар, т.б. салалардағы дауыстық қызмет көрсетулерді қазақ тіліндегі дауыспен басқаруды жүзеге асыруға қол жеткізеді.
Бағдарламаны өндірісте, тұрмыста, электрондық әлемде, әлеуметтік қызмет көрсетулерде, білім беруде, т.б. енгізу үдерістері тоқтаусыз жүзеге асып жатқаны мемлекеттік тіліміздің дамуына және қолданыс әлеуетінің артуына өлшеусіз үлкен мүмкіндіктер беретінін айту керек. Төрткүл дүниеде ағылшын, қытай, орыс, француз, түрік, т.б. тілдерде электрондық құралдарды басқару бағдарламалары мен технологиялары арнайы жасалған. Ал қазақ тілінде сөйлеуді тану енді-енді өркен жайып келеді. Осыған байланысты қазақ тілінде сөйлеуді тануды ғылыми жоба деңгейінде қалдырмай, мемлекеттік бағдарлама қабылданса деген ұсыныс айтқымыз келеді.
Өркен Мамырбаев,
Ақпараттық және есептеуіш
технологиялар институты
Бас директорының орынбасары
2986 рет
көрсетілді3
пікір