• Ақпарат
  • 17 Сәуір, 2025

Жасанды интеллект – адам ақыл-ойының жемісі

Талғат БЕКБОЛАТҰЛЫ, А.Байтұрсынұлы атындағы Тіл білімі институтының ғылыми қызметкері, PhD

Жасанды интеллект қазақша сөйлей ала ма? Ол қазақтың мәдени коды мен дәстүрлі болмысын түсіне ме? Цифрлық технологиялар адам тілін, дағдысын, тіпті ойлау жүйесін көшіріп үлгерді. Енді әлемдік ІТ-компаниялар көптілді үлгілер жасап жатқан тұста, қазақ тіліне негізделген жасанды интеллект үлгісін құру мәселесі де күн тәртібіне шықты. Елімізде бұл бағытта алғашқы қадамдар жасалып жатыр. Солардың бірі – ҚазLLM деп аталатын, қазақша ірі тілдік модель әзірлеуге арналған жоба. Жобаның бас­тау­шысы – Ахмет Байтұрсынұлы атындағы Тіл білімі институтының ғалымдары. Талғат Рамазанов ҚазLLM-нің қалай жасалып жатқанын, қандай деректер базасына сүйенетінін баяндап берді. 


– Қазақша жасанды интеллектіні жасау идеясы қалай пайда болды? 
– ЖИ күні кеше пайда болған жаңалық емес. Оның іргетасы 1950 жылдары қаланып, 1956 жылы ЖИ атауы ресми қолданыла бастады. 1960 жылдардың өзінде АҚШ-тың Қорғаныс министрлігі компьютерлерді адамның ойлау жүйесіндегідей үлгіде пайдалану мүмкіндіктерін зерттеуге ден қойды. Осылайша, адамның зерделік қабілетіне ұқсас кейбір қызметті компьютерлер атқара бастады. 1975 жылы жапон ғалымы Кунихико Фукусима алғашқы нейрондық желіні құрып, оны есептеу жүйесін жетілдіруге қолданды. Уақыт өте келе ЖИ сөзді тану, аудару және медициналық диаг­ностика секілді түрлі міндеттерді атқаруға қауқарлы бола түсті. Деректердің көлемі ұлғайған сайын, алгоритмдер де дамып, жаңа мүмкіндіктер пайда болды. 
Қазақстанда қазақша ЖИ жасау идеясы дүниежүзілік үрдістер мен цифрландырудың жедел даму қарқынына байланысты пайда болды. Технологиялық алпауыттар мен озық мемлекеттердің цифрлық саладағы жетістіктері еліміздің де осы бағытқа назар аударуы қажет екенін көрсетті. Нәтижесінде мемлекеттік органдар мен сарапшылар қауымдастығы қазақ тіліндегі деректерді сараптап, отандық тілге бейімделген жүйелерді әзірлеу идеясын ұсынды. Былтыр Үкімет жасанды интеллектіні дамытудың 2024–2029 жылдарға арналған тұжырымдамасын қабылдады.
Мемлекеттер мен ірі халықаралық корпорациялар ЖИ-ді қарқынды дамытып, әлеуметтік-экономикалық салада кеңінен қолданысқа енгізді. Медицинаның диагнос­тикалық жүйелерінен бастап өнеркәсіптік автоматтандыру мен білім беру саласына дейінгі әрбір секторда жасанды интеллект шешімдері енгізіліп жатыр. Қазақстан да бұл көштен қалмай, жаһандық бәсекеге қабілеттігін арттыру үшін үлес қосуға мүдделі.
– Институт қазақ тілін цифрландыру бағытында қандай жұмыстар атқарып жатыр?
– Орынды сауал. Президент Қасым-Жомарт Тоқаев «Ana tili» газетіне берген сұқбатында «Цифрлық технологияларды қолдануға баса мән берген жөн, өйткені қазақ тілінің алдағы тағдыры, еліміздің жаһандық бәсекеге қабілеті көбіне осыған байланысты болады» деген еді ғой. Қазақ тілінің заманауи, қоғамның қазіргі сұранысына жауап беретін тіл болуы үшін цифрлық кеңістіктегі қолданыс сапасы жоғары және контенті кең болуы керек. Ол үшін алдымен қазақ тілін цифрландыру қажет.
Институт қазақ тілінің жасанды интеллект негізіндегі ғылыми базасын әзірледі. Осы бағытта 30-дан астам АІ-әзірлеме, зерттеу мен цифрлық ресурс ұсынып отыр. Біздің жоба датасеті бойынша бірегей әрі саны үздіксіз артып отыратын, әзірше 17 ішкорпустан, 70 миллион сөзқолданыстан тұратын қазақ мәтіндерінің ақылды электрондық базасы – Қазақ тілінің ұлттық қорпусы (сілтемесі: https://qazcorpus.kz/). Әр ішкорпус ерекше іздеу жүйесі, метабелгіленімі мен тілдік белгіленім желісімен қамтылып, тұтынушының алуан түрлі лингвистикалық мұқтажын өтейді. Корпус бір мезетте сіз іздеген сөз туралы миллиондаған сөздіктен тұратын базадан мыңдаған контексті шығарып беріп, ол сөздің әр кезеңдегі динамикасын, әр автордың еңбегінде кездескен мағынасын, грамматикалық формасы мен дұрыс жазылу нормасын, шығу төркіні мен орфоэпиялық нормасын, өзге тілге аудармасы сынды т.б. ақпаратты ұсынады. Сөйтіп, ол тіл үйренуші, зерттеу­шінің лингводидактикалық, эмпирикалық базасы бола отырып, қазақ тілінің қазіргі және ғасырлар қойнауындағы көрініс­терінің қоры, әрі зерттеушілердің микроскопы қызметін атқарады. Микроскоп шыққалы биологтердің ғылыми жаңалығы көбейді, зерттеу тақырыптарының дәлдігі артты. Дәл сол сияқты, корпус жасалған соң лингвистердің де тілден анықтайтын жаңа құбылыстары артады, әрі олардың дәлдігі күшейеді.
– Қазақ тілінің ұлттық корпусын қандай ішкорпустар құрайды? Олардың ерекшелігіне тоқталсаңыз. 
– 17 ішкорпустың бірнешеуіне ғана тоқталайын. Мәселен, мәдени-репрезентативті ішкорпус қазақ ұлты жасаған материалдық, рухани құндылықтардың тілдегі атауын түсіндіреді: суретін, қажет десеңіз, бейнеролигін ұсынады. Бұл – ұлттық жадымыздың матрицасы, ұлттық құндылық, салт-дәстүрді жаңғырту құралы. Атап өтерлігі, мәдени-репрезентативті ішкорпус әлемдегі ешбір корпуста жоқ, тек бізде бар ноу-хау.
Тарихи мәтіндер ішкорпусы – қолжазбаларды тірілтіп, олардың аудармасын, транскрипциясын беріп, тарих қойнауындағы қазақ тілі әлеміне саяхаттатады. Тарихи ішкорпус әзірлеудегі мақсат – осы күнге дейінгі отандық деректер қорында сақталған қолжазбаларды тірілтіп, олардың қазіргі заманғы тілге аудармасын, транскрипциясын беріп, бір ресурстан қолдануға қолжетімді ету. Бұл қолжазбалардағы деректерді Қазақстандағы ғана емес, шетелдегі қазақ тілін зерттеушілер, түркітанушылар, шығыстанушылар т.б. сала мамандары кеңінен қолданып, зерттеу­лерінде пайдалана алады. Сонымен бірге қарапайым тұтынушы да өзіне қажет қазақ тілі тарихи даму кезеңдерінен, эволюциясынан хабар ала алады. 
Тарихи ішкорпустың бір ерекшелігі – сіз іздеген сөздің контекстегі аудармасы, транскрипциясы және сол контекстің қолжазба нұсқасы көз алдарыңызға беріледі. Сонымен қатар ішкорпус базасына енген әрбір шығарманың дереккөзі, авторы, олардың аңдатпасы, жазылған дәуірі, графикасы, стилі жайында алуан түрлі ақпарат беріледі. Яғни сіздерге үлкен талдаудан өтіп барып, сипатталып барып түскен, дереккөз танымдық талдау жасалған мәтіндер ұсынылады. Бұл қолжазбаларды өңдеуде институт ғалымдары бірнеше тарихи деректермен жұмыс істегенін айта кеткенім жөн. 
Қазіргі кезеңде ішкорпусқа XII ғасырдан басталған қадім, жадид, араб графикасындағы ескерткіштер және XIX ғасырдағы латын графикасындағы шығармалар салынды.
Ескерткіштің құрамындағы әрбір сөзді талдауды Институттың қадім, жадид жазуының мамандары жүргізді. Болашақта біз оны ұлғайтып, Орхон жазулы ескерткіштердің де аудармасы мен транскрипциясын салуға еңбек етіп жатырмыз. 
Тарихи ішкорпус – тіліміздің тамыры терең екенін, оның бүгін ғана басталмағанын  көрсететін және тілімізді осы тұрғыдан зерттеуге мүмкіндік беретін цифрлық ресурс.
Ауызша ішкорпус – қазақ сөзінің дұрыс айтылымы, сөз сазы, көпшілік алдында сөйлеу, шаршысөз мәдениеті, қазақы әңгіме, ұлт тұлғалары, қандастардың аймақтық, ауызекі, жергілікті сөз үлгілерінің аудиосы, орфоэпиясы берілген дәстүрлі сөзсаптамның цифрланған алтын қоры. Қазіргі кезде ауызша ішкорпустың мәтіндік базасында 1 миллион 500 мың сөзқолданыс бар. Қазақтың қоңыр даусын естіп, қазіргі қазақ тілінің тынысын, сөзге ұйытудың, сөзге тоқтатудың, қазақ жастары қалай сөйлейтінін осы ішкорпустан көруге болады. 
Алты тілді параллель ішкорпус қазақ, ағылшын, түрік, өзбек, әзербайжан, ұйғыр тілдерінен бірдей контекстерді СNN, BBC жаңалықтары, Нобель сыйлығы иегерлерінің және көркем классикалық шығарма мәтіндерінен шығарып параллель ұсынады. Бұл тілдер Оксфордта оқытылады. Сол себепті Институтымыз Оксфордтағы түрік тілдерін оқытуға арналған лингводидактикалық базаны да ұсынып отыр. Ондағы мақсат – Институттың Оксфордта оқытып жатқан қазақ тілі курстарына ғылыми қолдау көрсету. Бұл жоба министр Саясат Нұрбектің қодлауымен жүзеге аса бастағанына екі жыл болып қалды.
Қазақ тілінің әмбебап электрондық сөздігі – түсіндірме, орфографиялық, орфоэпиялық, орфограммалық, этимологиялық, қазақша-орысша, қазақша-ағылшынша, синонимдер, фразеологизмдер, тіркесімдер т.б. көптеген сөздіктегі сөз туралы алуан түрлі ақпаратты бір көзден беретін таптырмас ресурс. Болашақта да үздіксіз жетіліп дамиды.
Тұңғыш тілтанымдық электрондық кітапхана да әзірленді, бір жақсысы, тірек сөзбен іздесеңіз, сол тірек сөз қолданылған қордағы барлық әдебиет ұсынылады. Контекстегі қазақ сөздерінің өмірі тіркелген 4 жарым миллион қимақағаздан тұратын картотекалық қор сайты әзірленді. Іздеген сөзіңіз бойынша Институт ғалымдары өткен ғасырдан бері жинаған карточкалар түгел ұсынылатын бірегей ресурс, сізге қазір қолданыста жоқ көптеген дереккөздегі сөз келбетін көрсетеді.
Жаңалығымыз – ақылды мәтінтүзеткіш ресурсы. Жүйе шамамен 1 200 000 сөзқолданыстан тұратын лингвистер сараптамасынан өткен қазақ мәтініне арқа сүйей­ді. Кез келген мәтіннің грамматикалық, стилистикалық, орфографиялық, техникалық және пунктуациялық қатесін жөндеп, түзетіп береді. Ақылды мәтінтүзеткіш қазақ грамматикасына, жиі кездесетін қателерге арнайы бейімделген, сондықтан бүгінгі қолданыстағы ChatGPT моделіне қарағанда әлдеқайда дәлірек жұмыс істейді.
– Қазақ тіліне негізделген LLM-нің негізін жасау үшін қандай деректер базасы қолданылады? Мәліметтер қандай дереккөздерден алынып жатыр?
– ҚaзLLM – қазақ тіліндегі мәтіндерді өңдеуге, талдауға және генерациялауға арналған заманауи жасанды интеллектінің тілдік моделі. Бұл бірегей жоба қазақ тілін цифрлық кеңістікте ілгерілетуге, бизнес­ке, ғылым мен қоғамға қолдау көрсетуге бағытталған. Ол аударма мен құжаттарды өңдеуден бастап қарым-қатынасты автоматтандыруға дейінгі түрлі міндетті орындайды.
Ұлттық модель бизнестің чат-боттар мен клиенттерді қолдау жүйелерін жасау­ға, құжат айналымын автоматтандыруға және деректерді талдауға мүмкіндік туғызады. Мысалы, жергілікті банктер қазақ тіліндегі сұраныстарды жылдам өңдей алады, ал бөлшек сауда саласы осы модельді үдерістеріне енгізу арқылы пайдаланушылардың тәжірибесін жақсартады. Білім беру және ғылыми мекемелер қазақ тілін үйретуге арналған қосымшаларды, сондай-ақ ғылыми мәтіндерді талдау мен студенттерге көмек құралдарын жасай алады. Медиа және контент саласында жаңалықтар генерациялау, аударма сапасын арттыру және мәтін жазу құралдарын жасау мүмкіндігі туады.
Қазіргі кезде Институт әл-Фараби атындағы ҚазҰУ, Ш.Шаяхметов атындағы «Тіл-Қазына» ұлттық-ғылыми практикалық орталығы және Ақпараттық есептеуіш технологиялар зерттеу институтымен бірлесіп, ҚазLLM әзірлеумен айналысып отыр. Ауқымды лингвистикалық модель, яки жасанды интеллект, қарапайым тілмен айт­қанда, қазақша ойлап, қазақша сөйлейтін «чат джипитиінің» «миы». Оның қазақша нейрондарын қазақ тіліндегі видеотіл – фразеологизм, бейнелі қолданыс, мақал-мәтел, этномаркерлі лексика құрайды. Осы ұлттық колоритті ақпарат бойынша тілдік модельді оқытуға арналған промт жүйесін жасау ісі Институт мамандарына жүктеліп отыр. Біз бір жылда 140 мыңнан аса ұлттық үлгідегі сұрақ-жауап базасын әзірледік. Осы істе тапсырма жетекшісі ретінде жұмыс атқару мен үшін үлкен тәжірибе болды.
Жасанды интеллектінің өзегі – ақпарат қорында. Ол шексіз мәліметті қабылдап, саралап, нәтижесін шығарады, ал адам бір мезетте соншама көп дерекпен терең жұмыс істей алмайды. ChatGPT-дің басты ерекшелігі де көлемді дерек қоры. Ондағы мәліметтер ұлғайған сайын алгоритмнің дәлдігі арта түседі. ChatGPT-дің соңғы нұсқасы мәтінмен қатар, суреттерді де өңдеуге қабілетті. Бағдарламашылардың айтуынша, жаңа чат-бот бұрынғыға қарағанда 8 есе көп, яғни шамамен 25 мың сөзге де­йін­гі ақпаратты тауып, жүйелеп бере алады.
ҚазLLM-нің деректер базасына 21 түрлі сала бойынша мәлімет жиналып, сұрақ-жауап датасеті құрастырылды. Әр датасет 13 түрлі категорияға жіктелді. Атап айтқанда, фактіге негізделген сұрақ, ашық сұрақ, болжалды сұрақ, мәдени контекске негізделген сұрақ, мақал-мәтел, жағдаятқа бағытталған сұрақ т.б. Осы категориялар негізінде Институт ұжымы сапалы, нақты, дәлелді сұрақ-жауап датасетін әзірледі. 
– Жасанды интеллект белгілі бір тілде қойған сұраққа сол тілде лезде жауап бере алады. Бірақ ол ұлттың мәдени кодын түсініп, сол шеңберде жауап қата ала ма?
– Иә, жасанды интеллект тілді үйрете алады. Ал ұлттық мәдени кодты түсіну, ұлттық болмысымыз туралы ақпараттар қазіргі жасанды интеллектіде аздау. Себебі оның дерекқорында қазақтың дәстүрлі мәдениеті, салт-дәстүріне қатысты білім жүйесі қамтылмаған. Қолданыстағы жасанды интеллект орыс және ағылшын тілдеріндегі деректерді дәл және жүйелі береді. Осы орайда отандық ҚазLLM-нің артықшылығы көрінеді. 
Институт мамандары қазақ ChatGPT-дің базасына ұлттық мазмұндағы этномәдени ерекшеліктерге ие тілдік деректерді берді. Оның ішінде қазақтың этнографиялық категориялары мен дәстүрлі ұғым-түсініктеріне қатысты, мәдениетіне, тіліне, діліне қатысты білім жүйесі түгел қамтылды. Отандық ChatGPT-дің басты ерекшелігі – ұлттық құндылықтарымызға қатысты ақпараттарды нақты әрі жүйелі бере алуы. Мысалы, қазіргі қолданыстағы OpenAI компаниясы құрастырған ChatGPT-ге «қонаққа тартылған бастың тісін қақпау дұрыс па» деп сұрақ қойсаңыз, ол сізге былай жауап береді: «Бастың тісін қақпай беру – қонаққа деген ерекше құрметтің белгісі. Тістің қақпай берілуі оның дәмін сақтауға, бас табақтағы барлық бөліктің толық сақталуына және дұрыстап ұсынылуына мән берілуін білдіреді». Яғни бұл жауап қате. Біз жасап отырған ChatGPT мұндай сұрауға былай жауап береді: «Бас тарту – құрметті қонаққа, құдаларға немесе қарияларға көрсетілетін ерекше сый. Бірақ оны дастарқанға қояр алдында тиісті дайындық жүргізіледі. Қазақ дәстүрінде бастың тісін қақпай алып келу өкпе не наздың белгісі саналады.
Ең алдымен, бұл тазалыққа байланыс­ты: қой – шөп пен жем жейтін мал, оның тісінің түбінде не жатқанын білмейміз. Екіншіден, мұның терең символдық мәні бар. Қазақ халқы – небір ұсақ реніш пен өкпені сөзбен емес, ыммен жеткізе білетін текті халық. Мәселен, сыйласатын екі адамның бірі әлденеге көңілі толмай жүрсе, бірақ оны ашып айта алмаса, сол адамға бас тартарда тісі қағылмаған басты алға қояды. Бас ұстаған адам мұны бірден түсініп, «мұнда маған деген реніш бар екен» деп ой түйеді. Нәтижесінде мәселені ашық талқылап, реніштің түйінін шешуге қадам жасайды». Міне, бас­тың тісі не үшін қағылу керек деген сұрауға осылай тұшымды жауап береді. 
Тағы бір мысал. Тілімізде екі кештің арасында деген тұрақты тіркес бар. Мұның эталондық мағынасын белгілі ғалым, Инс­титутымыздың ақсақалы Нұргелді Уәли былай түсіндіреді: «Қазақ халқының ба­йырғы салт-дәстүріне, таным-түсінігіне байланыс­ты қолданылатын сан есімдердің бірі – екі. Екі кештің арасында деген фразеологизм түн ішінде беймезгіл жүрген адамға қарата айтылады. Екі кештің арасында ешкім жайдан-жай жүрмейді. Тосын, күтпеген жердегі жүріс субъектінің анық-қанығына жеткенше, «не жағдай», «әлдеқандай қиындық па», «күтпеген қуанышты хабар ма» деп әбігерленіп, әртүрлі имплицитті күйге түсіреді. Тосын жүрген субъект тосын жүрістің себебін айтқан соң ғана екі кештің арасындағы жүрістің мән-жайы экспликацияланады. Ал екі кеш деген сан есімді тіркес нені білдіреді? Мұндағы кеш қараңғы түскенге дейінгі уақыт емес, «түн», «түн баласы» деген мағынаны білдіреді. Қазақы танымда түн немесе түн баласы ел орынға отырған шақ және ел жатқан шақ деп екі шаққа бөлінеді. Ел орынға отырған шақ ел-жұрттың мал-жанын жайғап болып, кешкі ас-суына отырған кезі, ал ел жатқан шақ жұрт аяғы басылып, түнгі ұйқыға жатқан кезі. Ерекше жағдаймен емес, жай жүрген жолаушы ауыл-елге, ел орынға отырғанша жетуге тырысады. Ондай жолаушыны «екіндіде елге сүйкімді қонақ келеді» деп мақалдайды». 
Тілімізде әдет-ғұрыпқа байланысты айтылатын сөздің бірі – күшік күйеу. Неліктен бұлай айтылған? Күйеудің күшікке, күшіктің күйеуге қандай қатысы бар? Байқап отырсақ, бұл сөздің шығу төркіні о баста ел ішіндегі ескі салтқа байланысты екен. Әрине, ерте кезде күйеудің қалыңмал беріп үйленетіні бәрімізге белгілі. Бірақ ол заманда кейбіреудің қалыңмал беруге шама-шарқы келе бермеген. Белгілі этнограф Х.Арғынбаев бұдан жүз жыл бұрынғы жазбалардан мынадай дерек келтіреді. Кедей балалар 20–30 жасқа дейін үйленбей жүрген. Тіпті тақыр кедей балалары бірнеше жыл жалға жүріп қалыңмал жинайды, немесе қалыңдық үшін қыздың әкесіне қызмет ету әдеті де болған. Қыздың әкесінің үйінде жүріп, қалыңмалды қызмет етіп өтеген күйеуді ертеректе күш күйеу деп атаған. Бұл сөз кейбір түрік тілдерінде «күшік күйеу» емес, «куч күйөө» деп аталады. Күш күйеудің «күшік күйеу» болып өзгеруі, бір жағынан, дыбыстардың ұласа айтылуынан екен, екінші жағынан, «күйеу атымен күл тасы» дейтін әзіл-оспаққа да байланысты болса керек. Тілімізде мұндай құпия аз кездеспейді. Мұны бекер тілге тиек етіп отырған жоқпын. Институт ғалымдары дайындаған ҚазLLM-нің деректер қорына осындай мәдени ақпараты мол тілдік деректер берілді. 
– Қазақ тіліне ірі тілдік модель – LLM қандай мүмкіндіктерге жол ашады деп ойлайсыз? Бұл тек технология дамуының бір көрінісі ме, әлде тілге қызмет етудің бір жолы ма?
– Ауқымды тілдік модельдің артықшылығы жетерлік. LLM қазақ тілінің мүмкіндіктерін арттыруға жағдай жасайды. Мұндай модельдер қазақ тіліндегі үлкен дерекқор негізінде оқытылып, мәтінді түсіну, талдау және генерациялау секілді көпқырлы міндеттерді орындай алады. Нәтижесінде, ақпараттарды қазақ тілінде жылдам өңдеу, көпшілікке қолжетімді ету және түрлі қызметтерде қолдану оңайлайды.
LLM, алдымен, технология, бірақ сонымен қатар тілдің дамуына қызмет етудің тиімді тетігі. Қазақтілді орта үшін, әсіресе цифрлық кеңістікте, сөздік қорды байыту, тілді ғылыми және іскерлік жағынан дамытуға қолдау көрсету сияқты көп пайдасы бар. Мысалы, қазақ тілін жаңа форматта түсіндіріп, оқытуға мүмкіндік беретін білім беру қосымшалары құрылып, олар оқушы мен студентке ана тілінде сапалы білім алуға жағдай жасайды.
Қазақ тілінің виртуалды әлемдегі қолданысын кеңейтудің маңызды қадамы – осындай тілдік модельдер құрастыру. Олар арқылы әлеуметтік желі, бизнес, медиа сынды түрлі салада қазақтілді контент сапасы жақсарады, ал қолданушыларға ұсынылатын қызметтер мемлекеттік тілімізде қолжетімді бола түседі. Мысалы, банк жүйесіне енгізілген модель клиенттердің сұрағына қазақ тілінде жауап беруді жеңілдетіп, қызмет көрсету деңгейін көтереді.
Сонымен қатар LLM тек мәтінді өңдеу­мен шектелмей, қазақтың ұлттық болмысын сақтауға да ықпал етеді. Мысалы, модель қазақ тілінің агглютинативті құрылымын меңгеріп, тұрақты тіркес пен мақал-мәтелді дұрыс талдап, аударып бере алады. Бұл ата-бабамыздан қалған мәдени-рухани мұраны жаңа технологиялық деңгейде дамытып, ұлт тілінің өміршеңдігі мен маңызын одан әрі арттыруға жол ашады.
– Тіл тазалығының ғылыми негізін қалай түсіндірер едіңіз? 
– Тіл тазалығы деген ұғымды бір ғана грамматикалық дұрыстыққа теліп қою аздық етеді. Мысалы, ғалым М.Бала­қаевтың еңбектерінде тіл мәдениеті мен сөйлеу мәдениетін дамытуда орфоэпия­лық, орфографиялық, морфологиялық және синтаксистік нормаларды сақтаумен қатар, стилистикалық реңктерді ескеру маңызды екені айтылады. Яғни тіл тазалығы дегеніміз – бүкіл норманың кешенді түрде дұрыс қолданылуы және ұлттық сөз өнерінің ерекшелігін сақтау арқылы бейнелі сөйлеу дағдыларын дамыту. Тіл тазалығы, сөз сапасына қатысты зерттеу­лерде әйгілі академик Р.Сыздықтың еңбектері құнды. Р.Сыздық өз еңбектерінде тіл тазалығын грамматикалық ережелерге сай сөйлеумен қатар, тарихи қалыптасқан сөз қолданыстарды, тұрақты тіркес пен мақал-мәтелді дұрыс пайдалану тұрғысынан қарастырды. 
Қазір тілімізде жасанды интеллект дәуірі жүріп жатыр. Жасанды интеллект енгізілуімен бірге, «нейрондық желі», «чат-бот», «Big Data» сияқты шетелдік терминдер тілдік айналымға ене бастады. Кейбірі калька жолымен аударылса («үлкен деректер»), енді біреуі аударылмай, тікелей қолданылады. Мұндай терминдерді енгізу барысында байырғы сөздік қор мен тілдік норманы ескеріп, ең тиімді аударма нұсқаларын таңдау – тіл тазалығын сақтаудың бір жолы. Алайда терминнің дәл ғылыми мазмұнын жоғалтпай, бір жағынан, ұлттық тілдің ерекшелігін сақтау да маңызды.
Тіл тазалығын ғылыми негізде сақтап қалу үшін тіл мамандары, аудармашылар мен технологиялық сарапшылар бірлесіп жұмыс істеуі керек. Ақпараттық технологиялар саласындағы жаңа ұғымдарды қазақша сапалы аудару немесе сәтті баламасын ұсыну – осының бір көрінісі. Сонымен қатар бұл үдеріске қоғамның да белсенді қатысуы маңызды: БАҚ, әлеуметтік желілер және білім беру мекемелері тіл мәдениетін насихаттап, жаңа терминдерді қалыптастыруға атсалыса алады. Нәтижесінде технологиялық жаңалық пен ұлттық тілдің табиғи болмысы арасындағы тепе-теңдік сақталып, қазақ тілінің даму ауқымы кеңейе түседі.
– Жасанды интеллектінің ана тіліне тигізер жәрдемі мен зардабы туралы кеңінен айтып өтсеңіз. 
– Жасанды интеллект дәуірінде коммуникацияда «айтушы–тыңдаушы–ЖИ» үштігі қалыптасты. Бұл адамның «таза субъект» рөлін әлсіретіп, кей тұста оны «объектіге» айналдыратын үрдістер тудырады. Дегенмен бұл – «құлдырау» емес, «трансформация». 
ЖИ дәуіріндегі коммуникация жылдам, ауқымды, жекеленген сипатқа ие. Бұл үрдіс тілдік өзгерістерге (қарабайырлану, шеттен термин алу, қолданыстағы стильді ықшамдау) әкеледі. Адам тек ЖИ-мен сөйлесе бастаса, адамзаттың әлеуметтік-эмоциялық қарым-қатынасында жаңа мәселелер туындауы ықтимал. Алайда ұлттық тіл мен мәдениетті сақтай отырып, ЖИ мүмкіндіктерін дұрыс қолдану арқылы коммуникацияны байытып, сапасын арттыруға болады.
– Институт атқарып жатқан жобаларда жас ғалымдардың атқаратын рөлі қандай? 
– Институтымызда істейтін маманның 45 пайызы – жастар. Қазақ тілінің креативті индустриясын дамытуда жас ғалымдарымыз өте белсенді. Аға буынның көрсеткен өнегесін, білімі мен білігін сабақтастырып, қазақ тілінің қолданыс аясын кеңейтуге барымызды салуға тырысамыз.
– Адам интеллектісін жасанды интеллект алмастыра ала ма?
– Адам интеллектісінде саналы түсінік бар. Адам әлемді сезініп қана қоймай, әр іс-әрекетіне, сезіміне талдау жасай алады. Адамда ерікті шешім қабылдау, ниет, мақсат сияқты феномендер болады. Жасанды интеллектіде саналы сезім немесе ішкі түйсік жоқ. Ол тек тапсырылған алгоритмдер аясында, белгілі бір ереже немесе статис­тикалық үлгілер негізінде жұмыс істейді. ЖИ-дің «түсінуі» тек деректер арасындағы заңдылықтарды табумен шектеледі, оған адам эмоциясы немесе интуициясы тән емес. Мысалы, ChatGPT сияқты модельдер сұраққа мағыналы жауап бере алады, бірақ бұл жауаптарды ойланып, толғанып, жан дүниесімен сезіне алмайды. Яғни «адамша ойлау» немесе «ниет» деген түсінік жоқ. Адам интеллектісіне креативтілік тән. Адам интеллектісі шектеулі жағдайларда күтпеген шешім тауып, қиял мен ой жүйрігіне сүйенеді. ЖИ түбегейлі «мүлде жаңа» идея емес, бұрынғы үлгілерді түрлендіріп қана ұсынады. Бұдан шығатын қорытынды: адам интеллектісі – Жаратқанның адамға берген сыйы. Ал жасанды интеллект – адам ақыл-ойының жемісі.

Сұқбаттасқан 
Бағдат СҰЛТАНҚЫЗЫ

988 рет

көрсетілді

0

пікір

Біздің Telegram каналына жазылыңыз

алдымен сізді қызықтыратын барлық жаңалықтарды біліңіз

ANA TILI №17

24 Сәуір, 2025

Жүктеу (PDF)

Редактор блогы

Ерлан Жүніс

«Ана тілі» газетінің Бас редакторы