Ұлттық корпус уикипедияға енді

04.02.2022

Қазақ тілі ұлттық корпусының кіші корпустары жайлы нақты мәлімет укипедияға енді.

 

Ұлттық корпус – бұл қазақ тілінің бір жүйеге кіріктірілген тілдік материалдарының базасы ғана емес, сондай-ақ виртуалды кеңістікте мемлекеттік тілдің қызмет етуін, семантикалық кеңістігін кеңейту, ақпараттық таралу ауқымын кеңейту, тілдік ресурстарға жаппай қол жеткізу тетігі.

Ұлттық корпустың маңызы:

- Корпус тілдегі мәтіндердің мүмкіндігінше барлық типтерін (көркем, публицистикалық, оқу, ғылыми, іскери, ауызекі сөйлеу, диалектілік, т.б.) ұсына алады, сәйкесінше кезең-кезеңімен бұл мәтіндер корпусқа енгізіледі. Корпустың жақсы болуы оның сөзқолданыс санының (жүздеген млн) мейлінше артуымен байланысты.

- Корпус базасында енгізілген мәтіндердің сипаты туралы аннотация немесе белгіленім түріндегі қосымша ақпарат болады. Ол арқылы бір жерге шоғырландырылған мәлімет алынады. Корпус базасы үнемі үздіксіз жетілдіріліп, толықтырылып отырады.

Қазақ тілі ұлттық корпусын Тіл саясаты комитетінің тапсырысымен «Ш.Шаяхметов» атындағы «Тіл-Қазына» ұлттық ғылыми-практикалық орталығы әзірледі.

Бүгінде қазақ тілі ұлттық корпусының публицистикалық мәтіндерінің кіші корпусында талданған сөзқолданыс саны – 2347713 бірлік.

Корпус көлемі: 5 304 құжат, 309 153 сөйлем, 5 141 248 сөзқолданыс.

Тіл(дер)і: қазақ, орыс, ағылшын.

Ашылған уақыты: 2021 жыл.

 

Пікірлер (0)
Пікір қалдыру