ІТ-кеңістікке қазақ тілін енгізу ісі жемісін беруде

Бүгін Халықаралық «Қазақ тілі» қоғамының басшысы Рауан Кенжеханұлы Президенттің қабылдауында болып, тілдік ахуал, тілдің дамуына қатысты мәселелерді қозғады. Тіл саясаты комитеті 2023-2026 жылдары біршама жаңа ІТ-өнімдер әзірлеуді көздеп отыр. Тіл саясаты комитетінің ықпалымен 2ГИС қосымшасының интерфейсіне қазақ тілі қосылып, биылғы шілде айында қазақ тілінде дыбыстау функциясы енгізілді. Indriver, Кaspi.kz, Колеса, Крыша сынды қосымшалардың интерфейстерінің қазақшалануы да Комиттеттің мақсатты жұмысының жемісі екенін атап өткен жөн.


1536825668_news_b.jpeg


Биылғы жылы «Grammarly», «Тext.ru» тәрізді сервистер негізінде әзірленген «Qazgramma» көпфункционалды бағдарламалық кешенін жетілдіру жұмыстары жүргізілуде («Qazgramma» қазақ тілінің заңдылығын морфологиялық, синтаксистік және орфографиялық қателіктерге тексеруге арналған көпфункционалды бағдарламалық кешен).


2024-2026 жылдары балаларға арналған мобильдік желілік ойын, қазақ ауызекі сөйлеу синтезінің интелектуалдық жүйесі (соның ішінде мүмкіндігі шектеулі адамдарға арналған), қазақ тіл білімінің ғылыми электрондық кітапханасы, «Қазақ сөзі» мобильді қосымшасы, қазақ тілін үйрететін бірегей инновациялық көрнекіліктер мен әдістемелік өнімдердің базасы және т.б. әзірленетін болады. Инновациялық көрнекіліктер базасына мемлекеттік және жекеменшік тіл орталықтарының оқытушылары мен әдіскерлері өздерінің тіл оқыту бағытындағы әдістемелік еңбектерін, оқулықтарын, өнімдерін орналастырып, жеке кабинеттері арқылы курсқа жазылушылармен тікелей байланыса алатын болады.


Бірнеше жыл қатарынан әзірленіп жатқан маңызды жобалардың бірі –Ұлттық тіл корпусы. Бұл – мəтіндерді электронды түрде жинауға негізделген ақпараттық-анықтамалық жүйе. Корпус цифрлық кеңістіктегі қазақ тілінің аясын кеңейтуге тікелей ықпал ететін болады.


2023 жылдың І жартыжылдығының қорытындысы бойынша Қазақ тілінің ұлттық корпусының жалпы қоры 83 млн. сөзқолданысына жетті, оның ішінде А.Байтұрсынұлы атындағы Тіл білімі институты әзірлеген корпустың көлемі 30 млн. сөзқолданысты, Ш.Шаяхметов атындағы «Тіл-Қазына» ұлттық ғылыми-практикалық орталығы әзірлеген корпус көлемі 23 млн. сөзқолданысты, Әл-Фараби атындағы Қазақ ұлттық университеті әзірлеген корпус көлемі 40 млн. сөзқолданысты құрайды.


Көру қабілеті төмен азаматтарға ақпараттық кеңістіктің қолжетімдігін қамтамасыз ету мақсатында Қазақстан Республикасы Цифрлық даму, инновациялар және аэроғарыш өнеркәсібі министрлігімен және «Speech Lab» компаниясымен бірлесіп дыбыс синтезін әзірлеу жұмыстарын жүргізілуде. Ол үшін «Speech Lab» компаниясына 1 мың сағаттан асатын көлемдегі дыбыстық қор ұсынылды. Жоба жыл соңында ұсынылады деп күтілуде.


Қазақ тіліндегі аудиожазбаны Speech-To-Text технологиясы негізінде қазақ тіліндегі мәтінге айналдыратын https://t.me/kzstt_bot Telegram-боты іске қосылды. Microsoft Azure интеграциясы арқылы әзірленген Telegram-бот 1000 символға дейінгі мәтінді синтездей алады. 13 қазанда Microsoft компаниясының өкілдерімен кездесіп дыбыс синтезін, экран дикторын әзірлеу, қолданыстағы жобаларды осы компанияның өнімдеріне интеграциялау мәселелері талқыланатын болады.


Бұдан өзге, 2026 жылға дейін дыбыстық қор (ядро) әзірлеу жоспарлануда. Бұл келешекте қазақ тіліндегі дауыстық көмекші, виртуалды робот, электронды аудармашы, автоматты субтитрлеу, сихронды аудармашы, мәтінді дыбысқа, дыбысты мәтінге айналдыру қосымшаларына толыққанды ядро ретінде қолданылатын болады.


Жалпы ІТ-кеңістікке қазақ тілін енгізу бағытындағы жұмыстар жалғаса береді.


Әсел Қашқынбек


Ғылым және жоғары білім министрлігі Тіл комитетінің қызметкері


Mezgil.kz


Ұқсас тақырыптар