- Ақпарат
- 17 Сәуір, 2025
Терминдерді жүйелеу тілдің ғылыми әлеуетін арттырады

Сәрсенбай ҚУАНТАЙҰЛЫ, филология ғылымының кандидаты, доцент
Қазіргі заманда ғылым мен технологияның қарқынды дамуы тіл білімінде IT-технологиялар негізінде жасалған қолданбалы цифрлық өнімдердің кеңінен қолданысқа енуіне жол ашты.
Қазақ тіл білімінде де бұл бағыттағы алғашқы нәтижелер көріне бастады. Мысалы, автоматтандыру саласында түрлі лингвистикалық құралдар жасалып, тәжірибеге енгізіліп жатыр. Мысалы, ономастикалық атауларды жүйелеуге арналған Atau платформасы, сөздердің орфографиясы мен емлесін тексеруге бағытталған Emle.kz сайты, ресми құжаттарды әзірлеу мен жөнелтуге мүмкіндік беретін Qujat платформасы, сондай-ақ қазақ сөзі мен тіркесінің қорын ұсынатын Sozdikqor.kz онлайн-сөздігі – жас зерттеушілер мен тіл мамандары, студенттер үшін құнды цифрлық ресурс. Сонымен қатар қазақ-орыс тілдеріндегі салалық терминдерді қамтитын Termin.com терминологиялық дерекқоры; қазақ тілін оқытуға бағытталған Til-Qural мен TilMedia платформалары; зерттеушілер мен тілдік мәтіндерді өңдеушілерге арналған «Алматы қазақ тілінің корпусы» және қалың тұтынушыға арналған «Қазақ тілінің ұлттық корпусы» сияқты жобалар тіл саласындағы ілгерілеуді көрсететін ірі бастамалар қатарында.
«Қазақ тілінің ұлттық корпусы» бір негізгі және бірнеше ішкі корпус жиынтығынан тұрады. Оның негізгі корпусы – көркем әдебиет, ғылыми, публицистикалық, ресми ісқағаздар мен сөйлеу тілі стиліне жататын мәтіндерден құралған, ғылыми зерттеулер мен оқытуға арналған IT негіздегі электрондық ресурс.
Негізгі корпустағы мәтін көлемі мынадай: көркем әдебиет – 7 167 348 сөзқолданыс, поэзия – 1 000 000, оқулық мәтіндері – 2 000 000, публицистика – 11 950 995, ғылыми мәтіндер – 7 779 000, ресми-іскери стиль – 2 208 448, сөйлеу тілі – 1 000 000 сөзқолданыстан тұрады. Ахмет Байтұрсынұлына арналған ішкі корпуста ақын әрі ғалымның өлеңдері, әңгімелері, мақалалары мен оқулықтары толық қамтылып, 132 мың сөзқолданыс енгізілген. Сонымен қатар ұлттық корпуста ауызекі сөйлеу тілі, диалектілік ерекшеліктер, лингвомәдени деректер, тарихи, жанама, ономастикалық және параллель ішкі корпустар бар. Электрондық платформада сөзқолданыстарға берілген арнайы түсіндірмелер, аудио-бейнематериалдар мен транскрипциялар жалпы қолданушыға ашық. Бұл жүйе үнемі жаңартылып, толықтырылып отырады.
Қазіргі таңда «Қазақ тілінің ұлттық корпусында» терминологиялық ішкорпус әзірленіп жатыр. Бұл ішкорпусты құрастыру бірнеше кезеңнен тұрады. Алғашқы кезеңде корпусқа енгізілетін мәтіндік материалдар жинақталады. Ғылыми салаларға қатысты еңбектерден алынған қазақ тіліндегі ғылыми мәтіндер сұрыпталып, шамамен 15 миллион сөзқолданыстан тұратын дерекқор жүйеленіп, техникалық өңдеуден өткізілді.
Екінші кезеңде бұл мәтіндерге метамәтіндік белгілер қойылды. Атап айтқанда, әрбір ғылыми мәтінге дереккөз түрі (мысалы, монография, оқулық, оқу құралы, мақала, тезис, реферат, аңдатпа, түйіндеме, баяндама, пікір), мәтіннің тақырыбы, стилі, кілтсөздері және ғылым саласы секілді сипаттамалар тіркелді. Сонымен қатар мәтінді жан-жақты сипаттау мақсатында қосымша мәліметтер – бет саны, қолданылған графика түрі, сөзқолданыс саны, мақсатты аудиторияның жасы, субкорпусқа қатыстылығы, мәтіннің жүйеге енгізілген уақыты және белгілеуші маман туралы деректер де енгізілді.
Үшінші кезеңде терминологиялық ішкі корпусқа енгізілген әртүрлі ғылым салаларына қатысты терминге жан-жақты лингвистикалық сипаттама беріледі. Бұл ретте терминнің қазақ және орыс тілдеріндегі нұсқалары, оның шығу төркіні (этимологиясы), қазақ тіліндегі баламасы мен анықтамасы көрсетіледі. Сонымен қатар терминге қатысты мынадай мәліметтер белгіленеді: анықтама алынған дереккөзі, терминнің қолданылатын саласы не салалары, авторы, құрылымдық құрамы, ресми бекітілген нұсқасы мен бекітілген жылы, салалық терминологиялық сөздіктердегі аудармасы, сондай-ақ заңнамадағы қолданысы мен аударма нұсқалары. Бұл белгілер терминді кешенді түрде сипаттауға мүмкіндік береді.
Мұндай көлемді жобаны жүзеге асыру барысында бірқатар күрделі мәселелердің туындайтыны белгілі. Ең алдымен, қазақ терминологиясы ғылым ретінде, негізінен, жекелеген ғалымдардың гранттық жобаларында немесе диссертациялық зерттеулер аясында ғана қарастырылып жүр. Екіншіден, қазақ тілінде жазылған салалық ғылыми еңбектердің саны жеткіліксіз. Көптеген ғылыми еңбек орыс тілінде жазылған, ал соңғы уақытта заман талабына сай ағылшын тіліндегі зерттеулердің үлесі артып келеді. Үшіншіден, қазақ тілінде жазылған ғылыми-зерттеу жұмысы мен білім беру саласына қатысты еңбектерде, тіпті нормативтік-құқықтық актілерде де терминдерді қолдану барысында бірізділіктің болмауы – қазір өзекті мәселенің бірі.
Терминологияны қалыптастыру мен жетілдіру – үздіксіз назарда ұстап, толықтырып, жаңартып отыруды қажет ететін күрделі әрі маңызды жұмыс. Сол себепті терминдер жүйелілігі мен бірізділік мәселесі үнемі күн тәртібінде тұр.
Әзірлеген
Бағдат СҰЛТАНҚЫЗЫ

810 рет
көрсетілді0
пікір