• Тіл
  • 20 Мамыр, 2021

Қазақша сөйлейтін және түсінетін технология

Цифрлық технологияны қолдану – жағдаяттарды талдауды, жүйелеуді жүзеге асырумен шектеліп қалмайды, сонымен қатар жергілікті биліктің, мемлекеттік ұйымдардың жедел жауаптасу мүмкіндіктерін арттырады, адам капиталының дамуына септігін тигізеді.  Ізгілікті қоғамдық-инновациялық бағыттардың өрістеуіне қызмет етеді. Соның ішінде мемлекеттік тіліміз – қазақ тілінің қолданыс аясын кеңейтуде де цифрлық технологияны қолданудың маңызы зор. 

Бүгіндері қазақ лингвисти­касы мен ақпараттандыру са­ла­ларының интеграциялық зерт­­теулері нәтиже­сінде сөйлеу кор­­пусы құрылым­далынып, сол негізде электрондық құ­рал­дар мен технологиялар арқылы сөй­леуді тану платформасы жасалуда.

Компьютерлік технология прогресі корпустық мәтіндерді, яғни табиғи байланыстырып сөйлеу қалпынан алынған дең­гей­дегі тілді тану үдерісін арнайы бағдарламалар арқылы автоматты түрде жүйеге келтіріп, мақсатқа сәйкес өңдеп, оны қолдануға жол ашады.

Цифрлық әлемде сөйлеуді тану жаңалық емес, оны дүние ғалым­дары ондаған жылдар зерттеп, қолданысқа ұсынып келеді. Алайда ақпарат енгізудің кешенді жүйесі соңғы жылдарда ғана дамуда. Ең жаңа бағдарламалар қазірдің өзінде адам сөйлеуінің 95%-ын тану мүмкіндігіне ие.

Елімізде бүгіндері жүргізіліп жатқан қазақ тіліндегі сөйлеуді тану бойынша зерттеу жұмыс­тары да нәтижесіз емес. Жа­салған корпус қазақ сөзін түсінеді, мәндік байланыстарын, айтылу ерекшеліктерін, сөздердің түрлі мағыналарын анықтайды, ақылды үй және автомобильдегі технологиялар аясында бұйыруларды ұғады. Алайда бұл сөйлеу корпусының ауқымы­ның шағын болуы APP жүйесінің тиімділігін тежейтінін айту керек. Осы бағыттарда, бірақ ауқымы екі мың сағаттық әлдеқайда көлемді қазақша сөйлеу корпусы Ақпа­раттық және есептеуіш технология­лар институтында дүниеге келді. Аталған институттың Ин­тел­­лектуалдық жүйелер­дің компью­терлік инженериясы зертханасында қазақ тілінде бай­ланыстырылып сөйлеуді автоматтық тану бойынша интел­­лектуалдық жүйе әзірленді. Ин­тел­лектуалдық жүйе негізінде қазақ тіліндегі мәтіндерді сөйлеу ақпараты ретінде сапалы бейіндеп тасымалдауға мүм­кіндік беретін Kazakh ASR телеграмм боты жасалды.

Бұл аталған жүйені дайындау үшін, жоғарыда айтылғандай, барлығын қосқанда уақыты 2000 сағат болатын көлемде жи­налған қазақша сөйлеу корпусы бүгінгі таңда ең үлкен аса ауқымды бірден-бір корпус болып саналады. Бұл корпусқа тек «таза» оқылған сөйлеудің аудио­жазбасы ғана емес, ­сонымен қатар телефон арқылы сөйлеу де енгізілді, бұның өзі ол корпусқа әмбебаптық сипат дарытады. Телефондық сөйлеулерді транскрипциялау үшін арнайы күрделі әдіс жасалды, өйткені мұндай сөйлеу табан астынан пайда болады, өзге тілдердегі ақ­параттың қатысуы, аса айқын сезіліп тұратын акценттің орын алуы мүмкін, сондай-ақ әртүрлі сөйлеу және сөйлеу емес шуылдар (дауыстың түрліше тондары, телефондағы белгі беретін дыбыстар мен қоңыраулар, сөйлеушінің келесі ойды айтуға дайындығының үндері, анық айтылмаған сөздер, дикторлардың бірнешеуінің қабаттасып сөйлеуі, т.б.) естілуі әбден ықтимал. Жалпы кор­пустың аса мол мәтіндерін іздеп табу, сұрыптау, мәтіндегі фонемолардың контекстік қол­дануындағы алдын ала бел­гі­ленген статистикалық талап­тарға сәйкестігін сақтау едәуір күрделі міндеттер жүктейді және өте ұзақ уақыт алады. Сондықтан да АЕТИ дайындаған корпус аса үлкен көлеммен жұмыс істеуге, жүйенің ұсынатын сипат­тарын тексеруге, жүйені  тану жыл­дамығын арттыруға арнап құрылған.

Бұл жүйе бастапқы аудиофайлды машиналық оқу форматына айналдырады. Яғни қосымша компоненттер мен транскрипция­ларды қажет етпейді. Аталған жүйе – сөйлеуді интрегалдық модельді қолдану арқылы танудың қазіргі технологияларының бір нұсқасы. Ал интегралды жүйелер кең қолданыстағы дәстүрлі ком­мерциялық жүйелерде, күрделі шулы орталарда әлдеқайда жақсы әрі тиімді жұмыс істей алады.

Бұл зерттеудің нәтижиесінде сөйлеуді тану үшін мобильдік қосымшаны қазақ тіліне үйрету жүйесі іске асырылды. АЕТИ әзірлеген бұл мобильді қосымша KazVoice  бағдарламасы бойынша орындалған, ол пайдаланушыға тестілік режимде қолжетімді етіп жасалған. Берілген қосымшамен жұмыс істеу үшін hhtps://t.me/kazakhASRB.t желісіне өту керек. Сөзді жазу үшін микрофон кнопкасы басылады,  микрофоннан сөйлеу сигналдары келіп түседі. Одан әрі де сөйлеу сигналдары автоматты оқылып, ізбе-із сол сәтте мәтін түріндегі нәтиже пайдаланушыға көрінеді.

Бұл бағдарлама қазақ тілін­дегі электрондық гаджеттер және дыбыстық бұйырулар берілген ақпараттармен алмасуға мүмкіндік береді. Беріл­ген эксперименттік әзірлеме сөй­леуді тану техологиясын қолдана отырып, ауызша бұйыруларды компьютердің түсінуін, сөйлеу кезіндегі бет-әлпеттің қи­мыл­­дарын, ымдарды оқуды қам­тамасыз етеді.  Мұндай мобильді құрылғы ақпаратты тек микрофоннан ғана алумен шектелмейді, ол видео­камера­лардан да сөздерді ерін қимылына қарай ажыратып оқиды. Берілген сөйлеуді тану бағдарламасы PhoneGap фреймворк негізінде әзірленген, сөйтіп I0S және  Android  жеделдетпе жүйелерінде жұмыс істей алады. Оның осы типтес электрондық қосымшалардан артықшылығы – экстремалдық жағдайларда ақпараттың кедергісіз келіп түсуін және оны өңдеуді басқара алады, табиғи диалогтардың ма­ғынасын бұзбай, дәл ендіру мүмкіндігіне ие.

Бағдарламаның маңыздылығы – берілген әзірлемеде банк сала­сының колл-операторларында және тағы басқа салаларында интеллектуалдық дауыстық қызмет көрсете алуымен сипатталады. Сондай-ақ автомобиль, ақылды үй, тұрмыстық техникалар, т.б. салалардағы дауыстық қызмет көрсетулерді қазақ тіліндегі дауыспен басқаруды жүзеге асыруға қол жеткізеді.

Бағдарламаны өндірісте, тұрмыста, электрондық әлемде, әлеуметтік қызмет көрсетулерде, білім беруде, т.б. енгізу үдерістері тоқтаусыз жүзеге асып жатқаны мемлекеттік тіліміздің дамуына және қолданыс әлеуетінің ­артуына өлшеусіз үлкен мүмкіндіктер беретінін айту керек. Төрткүл дүниеде ағылшын, қытай, орыс, француз, түрік, т.б. тілдерде электрондық құралдарды басқару бағдарламалары мен технологиялары арнайы жасалған. Ал қазақ тілінде сөйлеуді тану енді-енді өркен жайып келеді. Осыған байланысты қазақ тілінде сөйлеуді тануды ғылыми жоба деңгейінде қалдырмай, мемлекеттік бағ­дарлама қабылданса деген ұсыныс айтқымыз келеді.

 

Өркен Мамырбаев,

Ақпараттық және есептеуіш

технологиялар институты

Бас директорының ­орынбасары

2986 рет

көрсетілді

3

пікір

Біздің Telegram каналына жазылыңыз

алдымен сізді қызықтыратын барлық жаңалықтарды біліңіз

ANA TILI №16

25 Сәуір, 2024

Жүктеу (PDF)

Редактор блогы

Ерлан Жүніс

«Ана тілі» газетінің Бас редакторы