Искусственные интеллекты обучат грамотному казахскому языку
Мажилис одобрил инициированные депутатами Парламента изменения и дополнения по вопросам культуры, образования и наставничества. В рамках данного законопроекта предусматривается унификация употребления казахского языка, передает наш сайт.
В ходе заседания Мажилиса депутат Асхат Аймагамбетов сообщил, что законопроектом предусмтривается создание Национального словарного фонда казахского языка и Национального корпуса казахского зяыка. Эти нормы также предусматривают развитие государственного языка при помощи использования искусственного интеллекта.
«Например, есть чат GPT, есть «Алиса». Также и для их грамотной работы на казахском языке необходимо создание унифицированного национального словарного фонда, то есть языковая информационная система. Следовательно, создание цифрового словарного фонда и предоставление открытого доступа к нему будет способствовать повышению качества казахского языка у искусственного интеллекта», — отметил Асхат Аймагамбетов.
Таким образом, Национальный словарный фонд казахского языка будет представлять собой государственую информационную системы, предоставляющей доступ к словарному фонду казахского языка. Национальный корпус казахского языка – информационно-справочная система, содержащая тексты всех стилей и жанров казахского языка. Оба ресурса будут в открытом доступе, что обеспечит доступ для широкой аудитории к нормам и правилам казахского языка.
Кроме того, предполагается формирование большой языковой модели (LLM), основанной на искусственной нейронной сети, для обработки, генерации и анализа текстов на казахском языке.
Депутат Дмитрий Колода поинтересовался, будет ли Национальный словарный фонд казахского языка приоритетным источником для государственных органов при использовании тех или иных терминов, а также будет ли обязательным применение слов и выражений в соотвествии с их определением и толкованием в этом слова.
«На рабочей группе этот вопрос тоже обсуждался. Как приоритетный – да, как обязательный – нет. Потому что этот ресурс, который будет вести уполномоченный орган, поэтому понятно, что все будут обращать внимание и брать его за основу. И здесь важно, чтобы был один источник. Не надо будет искать пятое терминкома, или, например, искать какой-то словарь 2021 года издания. Вся информация будет в одном месте, она доступна. Это будет официальный источник информации, поэтому разночтений не будет», — ответил Асхат Аймагамбетов.