- Ақпарат
- 18 Қыркүйек, 2025
Қазақ тіл білімінің цифрлық болашағы және ЖИ
Мемлекет басшысы Қасым-Жомарт Тоқаевтың 2025 жылғы қыркүйектегі «Жасанды интеллект дәуіріндегі Қазақстан: өзекті мәселелер және оны түбегейлі цифрлық өзгерістер арқылы шешу» атты Жолдауы ел дамуының жаңа бағытын айқындады. Президент жасанды интеллектінің экономиканың басты қозғаушы күшіне айналғанын атап өтіп, Қазақстан бұл үдерістің шетінде қалмауы керек екенін қадап айтты.
Бұл стратегиялық бағдар еліміздегі ғылыми мекемелердің де миссиясымен үндесіп отыр. Соның жарқын мысалы – Ахмет Байтұрсынұлы атындағы Тіл білімі институтының соңғы жылдары әзірлеген цифрлық өнімдері. Институт өнімдерін цифрландыру Қазақ тілінің ұлттық сөздікқоры саналатын Картотекалық қордан басталды деуге болады. Қазақ сөзінің семантикалық өрісі мен тілдің грамматикалық жүйесін мәтін ішінде тануға мүмкіндік беретін, беделді авторлар мен академиялық басылымдардан, құнды кітаптардан, халықтың тіл қазынасынан жинақталған қазақтілді жазбаша сөз қор саналады. Қор – елдігіміздің бірден-бір нышаны ретіндегі мемлекеттік тілдің лексика-фразелогиялық байлығын, сөзтізбелік құрамын анықтайтын құнды мұра. Картотекалық қор өткен ғасырдың 30-шы жылдарынан бастап толығып, жалпы саны 4 жарым миллионға жетті. Қор уақыт өте келе, шаң басып, қағаздардың сапасы нашарлап, жыртылып, сарғайып, жазулары өшіп, қағаз форматтағы тіл қазынасының өміршеңдігіне қауып төнгенде, оған қоса күнделікті тілтанымдық зерттеулерде кеңінен, толық пайдалануға қолайсыздық тудыра бастауына байланысты тез арада цифрландыру қажеттілігі туды. Бастапқыда бұған күмәнмен қарағанымыз рас. Бірақ 2020 жылдың екінші жартысынан бастап Институт директоры Анар Фазылжанның бастамасымен картотекалық деректер қорын жүйелі түрде цифрландыру жұмыстары қарқынды жүргізілді. Қазір барлық қимақағаз цифрландырылып, сайтқа жүктелді және халыққа қолжетімді болды. Осыдан кейін цифрлық өнімдерді әзірлеу жаңа қарқын алды.
Тіл білімі институтының цифрлық кеңістіктегі ірі жобасы бұл ғана емес. Институт ғалымдары тілтанымды жаңа дәуір талаптарына сай дамытуда бірқатар іргелі цифрлық ресурстар жасады. 5 жылда Институт әзірлеген негізгі ресурстар қатарына мына өнімдерді жатқызуға болады:
TBISOZDIK.KZ – әмбебап электрондық сөздік. Мұнда әрбір сөздің грамматикалық, семантикалық, фразеологиялық сипаттары мен қазақ–орыс–ағылшын тілдеріндегі аудармалары бір терезеде жинақталған. Жүйе автоматты морфологиялық талдау жасап, QAZCORPUS.KZ ұлттық корпусымен интеграцияланған.
QAZCORPUS.KZ (Қазақ тілінің ұлттық корпусы). 70 миллионға жуық сөзқолданыстан тұратын бұл ресурс қазақ тілін ғылыми тұрғыда зерттеу мен қолдану мәдениетін жаңа деңгейге көтерді.
TBIOCR.KZ – қазақ мәтінін автоматты тану жүйесі. Ол сканерленген кітаптарды PDF форматына түсіріп, мәтіндік өңдеуге мүмкіндік береді.
TBIJAZU.KZ – қазақ мәтінін грамматикалық, орфографиялық және стильдік тұрғыдан түзейтін «ақылды» мәтінтүзеткіш.
TBIKITAP.KZ – 7000-нан аса еңбек жинақталған электрондық тілтанымдық кітапхана.
Цифрлық кеңістіктегі AHMETTANU.KZ сайты ұлт ұстазы Ахмет Байтұрсынұлының мұрасын цифрлық форматта жинақтап, ғылыми қауым мен жалпы жұртшылық оңай пайдалана алатындай етті.
Осы өнімдерді жұртшылыққа таныстыру ісі де дұрыс жолға қойылған. Оның аясында көшпелі жиындар да ұйымдастырылып отыр. Сөзімізге дәлел болсын, биыл, 17 наурызда Тіл білімі институты Астана қаласындағы Президенттік орталықта «Креативті индустрияның тілтанымдық негіздері: зерттеулер мен әзірлемелер» атты стенд-конференция өткізді. Президент әкімшілігінен, Ғылым және жоғары білім министрлігінен қолдау тапқан іс-шараның мақсаты еліміздегі ғылымды дамытудың 2022–2026 жылдарға арналған тұжырымдамасы, тіл саясатын дамытудың 2023–2029 жылдарға арналған тұжырымдамасы, Үкіметтің 2021 жылғы 12 қазандағы №727 қаулысымен бекітілген «Цифрландыру, ғылым және инновациялар есебінен технологиялық серпіліс» ұлттық жобасына және Мемлекет басшысы Қ.К.Тоқаевтың «Ана тілі» газетіне берген сұхбатындағы (03.01.2025): «Цифрлық технологияларды қолдануға баса мән берген жөн. Өйткені қазақ тілінің алдағы тағдыры, еліміздің жаһандық бәсекеге қабілеті көбіне осыған байланысты болады» деген тұжырымды сөзіне орай гуманитарлық ғылымдар, оның ішінде қазақ тіл білімінде атқарылған жұмыстарды, Ахмет Байтұрсынұлы атындағы Тіл білімі институтында әзірленген цифрлық өнімдерді, іргелі зерттеу еңбектері мен сөздіктерін жалпы жұртшылыққа таныстыру және заманауи зерттеулер тәжірибесін бөлісу, насихаттау болатын. Ауқымды іс-шараға түрлі министрлік өкілдері, Парламент Сенаты мен Мәжілісінің депутаттары, қоғам және мемлекет қайраткерлері, саясаткерлер, ғалымдар мен оқытушылар, мектеп мұғалімдері, БАҚ және баспа өкілдері, қоғамдық бірлестіктер қатысты. Мемлекеттік ғылыми саясатты іске асыруға, гуманитарлық ғылымның жеке саласы ретінде қазақ тіл білімін дамытуға және барша ғылым салаларында қазақ тілінің қолданылуына қажетті ғылыми базасын жетілдіруге, елімізде және әлемдік ауқымда отандық ғылыми-лингвистикалық ойдың бәсекеге қабілеттілігін арттыруға бағытталған Ахмет Байтұрсынұлы атындағы Тіл білімі институтының ғылыми зерттеулері мен нәтижелерін ресми лауазымды тұлғалар мен қоғам қайраткерлеріне, ғылыми ортаға, ізденушілер мен білімгерлерге, өнер, кәсіп салаларының өкілдеріне, БАҚ-та кеңінен таныстыру және үздік тәжірибелер мен нәтижелерді бөлісу ендігі жерде мемлекеттік тілдің ғылым тілі ретінде дами түсуіне, қазақ тіл білімінде қол жеткізілген соңғы нәтижелердің түрлі салаларда кеңінен таралуына оң ықпал етпек. Тағы бір көшпелі жиынымыз 8 мамыр күні Түркістан қаласында өтті. Қожа Ахмет Ясауи атындағы халықаралық қазақ-түрік университеті ректоры Ж.Темірбекованың арнайы шақыруымен аталған оқу ордасында өткен жиында облыс мектептерінің 350-ге жуық мұғалімі қатысты. Ұстаздар қауымы Институтымыздың электронды өнімдеріне ерекше қызықты.
Жолдаудағы жасанды интеллект бағытына сәйкес, Институт қазақ тілінде үлкен тілдік модель (KazLLM) құру жұыстарына да белсене кірісті. Бұл жоба ұлттық мәдениетке негізделген датасеттерді жинап, қазақ тіліне бейімделген жасанды интеллект үлгілерін әзірлеуді көздейді. Мысалы, мақал-мәтелдер мен дәстүрлі сөз қолданыстарды қамтитын 140 мыңнан аса үлгі базасы дайындалды.
Қазақ тілінің орфоэпиялық нормасына негізделген сөз синтезі жүйесі де жасалып жатыр. Бұл білім беру платформаларында табиғи дыбысталатын қазақ тілін қолдануға жол ашады. Президенттің «Қазақстан жасанды интеллект дәуірінің шетінде қалмауға тиіс» деген сөзі Ахмет Байтұрсынұлы атындағы Тіл білімі институтының стратегиялық бағытымен толық сәйкеседі.
Президенттің «Қазақстан жасанды интеллект дәуірінің шетінде қалмауға тиіс» деген сөзі Ахмет Байтұрсынұлы атындағы Тіл білімі институтыың стратегиялық бағытымен толық сәйкеседі. Институт әзірлеген жобалар тек қазақ тілін дамытуға емес, сонымен бірге еліміздің жаһандық цифрлық бәсекеге қабілеттілігін арттыруға қызмет етіп отыр.
Жолдауда қойылған міндеттерді жүзеге асыру барысында осындай ғылыми бастамалар ерекше рөл атқарады. Себебі жасанды интеллект дәуіріндегі қазақ тілі – тек коммуникация құралы ғана емес, ұлттық код пен мәдениет сақтаушысы.
Мадияр ҚАЗЫБЕК,
Ахмет Байтұрсынұлы атындағы
Тіл білімі институтының
баспасөз хатшысы
1377 рет
көрсетілді0
пікір