В целях реализации поручения Руководителя Администрации Президента Республики Казахстан № 2100-7 ПАБ от 19 мая 2014 года, ПРИКАЗЫВАЮ:










Отправить по почте

Об утверждении Концепции Национального корпуса казахского языка Приказ Министра образования и науки Республики Казахстан от 17 ноября 2014 года № 469
В целях реализации поручения Руководителя Администрации Президента Республики Казахстан № 2100-7 ПАБ от 19 мая 2014 года, ПРИКАЗЫВАЮ:
2. Контроль за исполнением настоящего приказа оставляю за собой.
3. Настоящий приказ вступает в силу со дня его подписания.
Министр А. Саринжипов
Утверждена приказом Министра образования и науки Республики Казахстан от 17 ноября 2014 года № 469
Концепция Национального корпуса казахского языка
Введение
Казахский язык как один из крупных языков с помощью информационных ресурсов вовлечен во всемирную конкуренцию и битву идентичностей, в том числе национально-государственной идентичности. Однако, казахский язык, обладая высоким статусом государственного языка Республики Казахстан, с некоторым опозданием участвует в гонке информационных возможностей, в то время как изменившиеся условия его функционирования требуют принятия неотложных и адекватных мер.
В своем Послании народу Казахстана «Казахстанский путь - 2050: единая цель, единые интересы, единое будущее» Президент Республики Казахстан Н.А. Назарбаев отметил: «Қазақ тілі бүгінде ғылым мен білімнің, интернеттің тіліне айналды. Қазақ тілінде білім алатындардың саны жыл өткен сайын көбейіп келеді. Енді ешкім өзгерте алмайтын бір ақиқат бар! Ана тіліміз Мәңгілік Елімізбен бірге Мәңгілік тіл болды. Оны даудың тақырыбы емес, ұлттың ұйытқысы ете білгеніміз жөн».
Для формирования и укрепления национальной идеи Мәңгілік Ел, а также разработки его лингвистической составляющей Мәңгілік Ел необходимо оптимальное использование возможностей, которые предоставляет глобализация и новый техногенный мир. Помимо исполнения системных плановых мероприятий в соответствии с Государственной программой функционирования и развития языков на 2011-2020 годы, следует направить целенаправленные усилия на создание Национального корпуса казахского языка.
Национальный корпус казахского языка - один из эффективных современных способов описания и поддержки государственного казахского языка во всем объеме его выразительных средств и возможностей, поэтому своевременное создание Национального корпуса казахского языка будет способствовать развитию национальной культуры, укреплению национально-государственной идентичности и всемерной поддержки государственного языка.
Концепция Национального корпуса казахского языка разработана в соответствии с приоритетами языковой политики Республики Казахстан и «Стратегии развития Республики Казахстан до 2050 года».
В настоящей Концепции представлены цели, пути и механизмы создания и функционирования Национального корпуса казахского языка, а также определены его параметры.
Даная Концепция будет основой для разработки и реализации научно-технической программы «Разработка и создание Национального корпуса казахского языка», законодательных и нормативно-правовых актов, направленных на успешное создание и поддержку функционирования Национального корпуса казахского языка.
Основная цель и задачи Концепции
Главная цель Концепции состоит в формировании концептуальных параметров Национального корпуса казахского языка, а также определении путей и механизмов его создания и функционирования.
Для достижения указанной цели необходимо сконцентрировать усилия на решении двух блоков задач:
Первый блок задач Концепции связан с формированием концептуальных параметров Национального корпуса казахского языка:
1. Осуществить дефинирование Национального корпуса казахского языка как многоцелевого информационно-справочного продукта;
2. Определить объем и границы Национального корпуса казахского языка в миллионах словоупотреблений;
3. Определить состав подкорпусов Национального корпуса казахского языка (обучающий, параллельный двуязычный, мультимедийный);
4. Очертить диахроническую глубину и представительность собрания оцифрованных текстов, независимо от используемых/использовавшихся графических систем казахского языка;
5. Локализовать собрание оцифрованных текстов казахского языка, создаваемые / созданные в трех графических системах казахского языка в Казахстане и странах присутствия казахского языка (Российской Федерации, Китае, Монголии, Кыргызстане, Туркмении, Узбекистане);
6. Обеспечить представительность и репрезентативность Национального корпуса казахского языка по всем жанрам и направлениям.
Второй блок задач Концепции определяется спецификой менеджмента, путей и механизмов реализации Концепции:
1. Определить главный научно-координационный центр и основных разработчиков Научно-технической программы «Разработка и создание Национального корпуса казахского языка»;
2. Сформировать команды разработчиков (корпусных лингвистов и программистов) Национального корпуса казахского языка, определив конкретное поле их деятельности;
3. Сформулировать этапы и сроки работы по созданию Национального корпуса казахского языка и его подкорпусов;
4. Определить круг заинтересованных министерств и ведомств, архивов в Республике Казахстан и за рубежом, государственных и иных организаций для обеспечения поддержки и технического обеспечения деятельности по созданию, функционированию и поддержке Национального корпуса казахского языка.
Нормативно-правовые основы функционирования Национального корпуса казахского языка
Нормативно-правовые основы функционирования Национального корпуса казахского языка регулируются Конституцией Республики Казахстан, Законом «О языках в Республике Казахстан», «Концепцией языковой политики Республики Казахстан» (1996 года), «Концепцией формирования государственной идентичности Республики Казахстан» (1996 года), Законом Республики Казахстан «Об авторском праве и смежных правах» (1996 года), Государственной программой развития и функционирования языков в Республике Казахстан на 2011-2020 годы» (2011 года), Культурным проектом Триединства языков, «Стратегией развития Республики Казахстан до 2050 года», а также Посланием Президента Республики Казахстана народу страны «Казахстанский путь - 2050: единая цель, единые интересы, единое будущее» (2014 года).
Общие положения и дефиниции
При создании Национального корпуса казахского языка и определении его параметров необходимо руководствоваться следующими принципиальными подходами.
Национальный корпус казахского языка - это открытая, постоянно пополняющаяся, расширяющаяся и углубляющаяся система, поддерживающая функционирование государственного языка и обслуживающая потребности в лингвистических знаниях широкого круга пользователей, требующая непрерывной научной и технической поддержки.
Национальный корпус казахского языка - это инновационная информационно-справочная система на базе электронного собрания письменных и звучащих текстов в кириллической, арабской (төте жазу) и латинской графике, сбалансированная и представительная по объему (300 миллионов словоупотреблений), оснащенная всеми возможными видами полной, глубоко аннотированной и удобной разметки.
Национальный корпус казахского языка - это статистическая картина существования и динамики языковых форм, неологических, грамматических и ортологических процессов, неописанных изменений в семантике и сочетаемости языковых единиц, частотности различных конструкций, нефункционального варьирования языковых единиц, предоставляющая возможность системно и стандартизированно изложить их в правилах правописания, грамматике, словарях, учебниках, а значит - стандартизировать и кодифицировать явления, наиболее употребляемые в узусе на разных этапах развития казахского языка во всем многообразии жанров, стилей, территориальных и социальных вариантов и подъязыков.
Национальный корпус казахского языка - это уникальный справочник, превышающий возможности всех вместе взятых словарей и грамматик, созданных трудом многих поколений лингвистов-лексикографов: корпус по запросу в течение секунд предоставляет исчерпывающий массив информации о языке, сопровождая их статистическими данными, расширяет эмпирическую базу и придает особую объяснительную силу лингвистическим исследованиям, позволяя ставить принципиально новые задачи и получать более точную картину языкового существования и доказательства функционирования в казахском языке конкретных явлений.
Национальный корпус казахского языка - это основа научного описания грамматического строя казахского языка. Национальный корпус казахского языка - это способ проследить контексты и историю употребления того или иного слова и его лексических, семантических, графических, орфографических и иных вариантов, грамматической формы и грамматического значения, типов словосочетаний, предложений на протяжении нескольких веков и в текстах отдельных жанров, конкретных авторов. Только с помощью корпуса можно обеспечить адекватные научные исследования лексики и грамматики языка, а также фиксацию непрерывных процессов языковых изменений, происходящих в языке на протяжении длительного времени.
Национальный корпус казахского языка - это база для создания прямых и обратных частотных словарей, единицами которых могут быть лексические единицы, грамматические формы и конструкции, модели словообразования, синтаксические модели, употребляющиеся в текстах разных периодов развития языка, или в современных текстах разных дискурсов и подъязыков.
Национальный корпус казахского языка - это основа для создания учебников, учебных программ, сборников задач и упражнений, которые будут построены на частотных и актуальных языковых явлениях.
Национальный корпус казахского языка - это надежный источник кодификации и стандартизации языка, поскольку в корпусе оказывается зафиксированным письменный и звучащий язык в его максимально репрезентативном виде.
Национальный корпус казахского языка должен учитывать достижения мировой корпусной лингвистики, включать глубоко аннотированные письменные (разных периодов существования казахского языка) и устные тексты, расшифровки записей публичной и частной устной речи, транскрипты кинофильмов и телефильмов; основной и обучающий корпуса; параллельный казахско-английский и казахско-русский корпуса; быть открытым (то есть пополняться новыми размеченными текстами).
Назначение Национального корпуса казахского языка
1. Национальный корпус казахского языка как эффективный и современный способ описания и поддержки государственного казахского языка во всем объеме его выразительных средств и возможностей способен всемерно способствовать развитию национальной культуры и укреплению национально-государственной идентичности, формированию общей культуры и, как следствие, консолидации казахстанского общества.
2. Национальный корпус казахского языка способен собрать воедино все богатство казахского языка в единую электронную базу независимо от графических систем. Это позволит также сделать его доступным как для исследователей, так и для самого широкого пользователя в Казахстане и других странах.
3. Национальный корпус казахского языка как максимально представительное собрание древних и современных текстов способен дать масштабную панораму развития казахского языка в целом и в его фрагментах, обеспечить фиксацию тонких и непрерывных процессов и тенденций языковых изменений, происходящих в языке на протяжении сравнительно небольших периодов - от одного до двух столетий.
4. Национальный корпус казахского языка поможет осуществить статистический мониторинг функционирования лексических, грамматических и стилистических языковых средств и определить характер и степень присутствия в казахском языке диалектных различий.
5. Национальный корпус казахского языка расширит эмпирическую базу казахского языкознания, снабдит его статистическими данными и предоставит исчерпывающий массив информации о казахском языке. Это позволит, с одной стороны, ставить новые теоретические задачи и получать более точную и достоверную картину функционирования казахского языка во всех его частях и конкретных явлениях (например, исследовать профессиональные подъязыки, жаргоны); с другой - решать насущные прикладные задачи создания:
1) Частотных словарей, единицами которых будут лексические единицы, грамматические формы, модели словообразования, синтаксические и фонетические модели, употребляющиеся в текстах разных периодов развития языка, или в современных текстах разных дискурсов и подъязыков, и дающие объективное представление о реальном функционировании казахского языка и языковых единиц;
2) Школьных словарей, в которые войдут слова общеупотребительной частотной лексики, узуальное присутствие которой в современном казахском языке будет подтверждено статистически (это включит учащихся в современный актуальный дискурс);
3) Современных толковых словарей, в которых объясняются значения слов и фразеологизмов, в том числе неологической лексики, в сопровождении с энциклопедическими данными и лингвокультурологическими иллюстрациями;
4) Исторических словарей, в которых будут представлены контексты и история употребления того или иного слова или его лексико-семантического, графического, орфографического и иных вариантов, грамматического значения, типов словосочетаний и предложений на протяжении нескольких веков в текстах отдельных жанров, типов, конкретных авторов, в казахских текстах, созданных в разных графических системах в Казахстане и других странах;
5) Диалектологических атласов и словарей;
6) Ономастических словарей разных типов и назначения (топонимические, антропонимические), которые будут способствовать кодификации важнейшей сферы казахского языка;
7) Грамматических, морфемных, словообразовательных и других словарей;
8) Словарей сочетаемости слов;
9) Антонимических, синонимических, омонимических, паронимических и иных словарей;
10) Словарей подъязыков (делового языка, профессиональных подъязыков, жаргонов, арго);
11) Орфографических и орфоэпических словарей современного казахского языка, нуждающегося в постоянной ортологической нормализации.
Национальный корпус казахского языка (при наличии обучающего корпуса, корпуса со снятой омонимией, разметка которого ориентирована на школьную программу) найдет широкое применение в обучении казахскому языку.
Корпусные данные станут надежной базой для создания учебников, учебных пособий, тренажеров разных типов, поскольку Национальный корпус казахского языка предоставит достоверную информацию о регулярных и частотных формах употребления, их реальных контекстах в разных типах текстов и жанров; осуществления самостоятельного поиска употреблений конкретного слова, словоформы, грамматических значений; создания онлайновых мультимедийных обучающих сервисов.
6. Национальный корпус казахского языка способен служить источником его кодификации и стандартизации, поскольку в корпусе оказывается зафиксированным письменный и звучащий казахский язык в его максимально репрезентативном виде. Стандартность и кодифицированность казахского языка является главным условием его успешного функционирования в качестве государственного языка, способного победить в жесточайшей конкуренции языков и обеспечить нужный уровень национально-государственной идентичности граждан единой страны. К этому можно прийти через изучение казахского языка во всем корпусном многообразии дискурсов, развития и становления его фонетических, лексико-семантических, грамматических, стилистических и других норм.
7. Только Национальный корпус казахского языка, характеризующийся сбалансированным и представительным объемом, оснащенный всеми возможными видами полной и удобной разметки, даст полную картину динамики закрепления языковых норм и возможность системно и стандартизированно представить их в правилах правописания, словарях, грамматике, учебниках, и тем самым зарегистрировать неологические, грамматические и ортологические процессы, увидеть неописанные изменения в семантике и сочетаемости языковых единиц, частотности различных конструкций, нефункциональное варьирование языковых единиц - обнаружить то, что является наиболее употребляемым в узусе.
Целевая аудитория Национального корпуса казахского языка
Национальный корпус казахского языка востребован самыми широкими слоями населения, а также всеми, кто в силу своей профессии или занятий стремится понять и овладеть особенностями функционирования и устройства казахского языка.
Основными потребителями/ пользователями Национального корпуса казахского языка являются:
1) Носители казахского языка, стремящиеся овладеть всем богатством казахского языка, знать и сохранить разнообразие его выразительных форм и средств;
2) Все, кто заинтересован в изучении казахского языка: специалисты по усвоению казахского языка как родного и как неродного (второго, иностранного); разработчики программ, авторы учебников и методисты; учителя и учительские организации; школьники, студенты, слушатели курсов казахского языка;
3) Администрация и сотрудники правительственных и неправительственных организаций, органов местного государственного управления и самоуправления, финансово-экономических организаций, банковские служащие, политики и бизнесмены;
4) Исследователи-лингвисты самого разного профиля, в первую очередь, корпусные и компьютерные лингвисты, теоретики и историки языка, лексикографы - составители словарей разного типа и назначения, диалектологи, социолингвисты и специалисты по контрастивной лингвистике, психолингвисты, специалисты по судебной и иной лингвистической экспертизе;
5) Писатели, редакторы, литературоведы, историки, журналисты, политологи, социологи, этнографы, представители всех областей гуманитарного знания;
6) Переводчики, которые с параллельными казахско-русским, казахско-английским, казахско-турецким и иными корпусами получают прекрасную эмпирическую базу соизмеримых языков;
7) Разработчики программного обеспечения, создающие корпуса или иные электронные собрания текстов, словари нового типа.
Концептуальные параметры Национального корпуса казахского языка
Ориентируясь на достижения мировой корпусной лингвистики и опыт создания и использования лучших национальных корпусов (Российской Федерации, Финляндии, Великобритании, США, Японии), обеспечить представительность / пропорциональность и репрезентативность текстов, оснащенных специально создаваемой метаразметкой и разметкой, включив в Национальный корпус казахского языка тексты языка на данном синхроническом этапе его существования и на всех этапах его развития во всем многообразии жанров, стилей, территориальных и социальных вариантов в письменной и устной формах. Важными для корпуса являются художественные произведения, публицистика, записи устной сценической, публичной подготовленной и спонтанной речи, деловые бумаги, документы, реклама, медиа-ресурсы, интернет-ресурсы - все то, что полезно с точки зрения изучения казахского языка и обучения казахскому языку.
Исходя из сформулированных общих положений о Национальном корпусе казахского языка как многоцелевого открытого информационно-справочного продукта и принятых дефиниций, концептуальные параметры, объем и фундаментальные особенности Национального корпуса казахского языка определены следующим образом.
1. Собрание оцифрованных текстов для создания Национального корпуса казахского языка определить в 300 миллионов словоупотреблений (Оксфордский корпус английского языка насчитывает 2 миллиарда словоупотреблений, Национальный корпус русского языка - более 200 миллионов словоупотреблений). Границы списка включаемых в Корпус текстов в разных графических системах маркировать с помощью предварительной филологической экспертизы оцифрованных текстов.
2. Современный казахский язык разделен тремя графическими системами - кириллической (в Казахстане, Монголии, а также Российской Федерации, Кыргызстане, Туркмении, Узбекистане и других странах бывшего Советского Союза), латинской (в Турции, Германии, США и других западных странах) и арабской / төте жазу (в Китае, Афганистане, Иране, Пакистане и других странах Ближнего Востока). Для того, чтобы собрать воедино все богатство казахского языка в единую электронную базу независимо от графических систем, сделать Национальный корпус казахского языка доступным как для исследователей, так и для самого широкого пользователя в Казахстане и других странах, включить в собрание оцифрованных текстов все доступные тексты, создаваемые в разных графических системах. Исходить в собрании оцифрованных и размеченных текстов в трех графических системах (кириллические тексты; тексты на латинице; тексты на төте жазу) из пропорций, обусловленных их реальным функционированием и объемом.
3. Национальный корпус казахского языка как максимально представительное собрание древних и современных текстов способен дать масштабную панораму развития казахского языка в целом и в его фрагментах, обеспечить фиксацию тонких и непрерывных процессов языковых изменений, происходящих в языке на протяжении длительного времени. Для достижения диахронической представительности Национального корпуса казахского языка включить в собрание оцифрованных текстов все доступные тексты, начиная от старописьменных книжных текстов, вплоть до современных, созданных в разные периоды истории Казахстана и в разных графических системах. Исходить в собрании оцифрованных и размеченных текстов на трех графических системах из диахронически обусловленных хронологических пропорций.
4. Обеспечить пропорциональность, репрезентативность и представительность Национального корпуса казахского языка по всем жанрам и направлениям: художественная проза и поэзия, произведения устного народного творчества, драматургия, мемуарно-биографическая литература, журнальная публицистика и литературная критика, газетная и журнальная публицистика и новости, научные, научно-технические, научно-популярные и учебные тексты, религиозные и религиозно-философские тексты, производственно-технические тексты, официально-деловые и обиходно-деловые тексты, юридические тексты, бытовые тексты, эпистолярная/личная переписка, дневники, а также все виды зафиксированной звучащей речи, тексты медиа-ресурсов и интернет-ресурсов. Исходя из особенностей синхронического и диахронического функционирования казахского языка, определить объемы (в единицах словоупотреблений) каждого жанра, направления, типа письменного и устного текста.
5. Включить в Национальный корпус казахского языка подкорпусы: обучающий корпус казахского языка (корпус со снятой омонимией, ориентированный на обучение русскоязычных/англоязычных); параллельный выровненный (в котором тексту на казахском языке соответствует перевод этого текста, а между его единицами с помощью специальной процедуры устанавливаются соответствия) казахско-русский корпус; параллельный выровненный казахско-английский корпус; газетный корпус (корпус средств массовой информации); корпус поэтических текстов (ограничив его временными рамками); корпус устной подготовленной и спонтанной речи; мультимедийный корпус.
6. Ориентируясь на лучшие образцы корпусов разных языков, исходить из следующих представлений и дефиниций метаразметки и разметки Национального корпуса казахского языка: 1) метаразметка и разметка - это снабжение целых текстов и его фрагментов дополнительной экстралингвистической и лингвистической (фонетической, морфологической, семантической, синтаксической, стилистической), социолингвистической, литературоведческой, библиографической и иной информацией; 2) именно метаразметка и разметка делают корпус принципиально новым и объективным источником информации о функционировании языка и его изменении; 3) чем точнее и разнообразнее разметка корпуса, тем выше его социальная, научная и обучающая ценность; 4) программы метаразметки и разметки должны допускать постоянное совершенствование; 5) разметка текстов может осуществляться в интерактивном режиме в несколько этапов автоматически или полуавтоматически с помощью специально создаваемых программ и с использованием пополняемых рабочих словарей.
7. Учитывая объем и концептуальные параметры Национального корпуса казахского языка, совместными усилиями лингвистов и программистов создать программные продукты для всех этапов создания и функционирования Национального корпуса казахского языка:
1) Программу филологической экспертизы оцифрованных текстов для включения их в Корпус.
2) Программу трансфера графических систем из латинской и төте жазу в существующую казахскую кирилическую.
3) Программу автоматического снятия омонимии для включения текстов в Корпус.
4) Программу метаразметки, которая способна: 1) формировать архитектуру корпуса; 2) контролировать процесс информационного наполнения корпуса; 3) оценивать представительность и сбалансированность корпуса; 4) обеспечивать точный поиск и отбор информации; 5) предоставлять все контексты заданной информации; 6) получать исчерпывающие данные о частотности запрашиваемой информации. Например, в Национальном корпусе русского языка используется 25 параметров метаразметки, 9 параметров текста (1. название, 2. дата создания, 3. размер текста в словах, 4 параметра сфер функционирования текста (производственно-техническая, учебно-научная, официально-деловая, публицистика, реклама, церковно-богословская, бытовая, художественная), 5 параметров темы текста, 6. хронотоп (место и время описываемых событий), 7 параметров типа текста (в публицистике: заметка, интервью, обзор, комментарий; в официально-деловой: закон, постановление, кодекс, автобиография, акт, договор), 8 параметров жанров текста (историческая проза, фантастика, приключения, юмор, сатира, детская, автобиографическая проза), 9 параметров стиля текста, 2 параметра авторов текста (имя, пол, возраст), 3 параметра возможной аудитории, 4 библиографических параметров о тексте, 5 служебных параметров для организации текстов в составе корпуса.
5) Программу автоматической грамматической (морфологической) разметки текстов. Например, Национальный корпус русского языка обладает следующими видами разметки: морфологической (снятие омонимии, приписывание каждой единице морфологических признаков с помощью специально разработанной системы помет - принадлежность к части речи, грамматические признаки словоформы (падеж, число, вид, время, наклонение и проч.); лексико-семантической (приписывание единице семантических признаков, например, «лицо», «вещество», «пространство», «скорость», «движение», «обладание»).
6) Программу лексико-семантической и культурно-семантической (лингвокульутрологической и этнографической) разметки текстов.
7) Программу стилистической разметки.
8) Программу фонетико-просодической разметки (приписывание единице корпуса ударения и иных просодических характеристик).
9) Программу аннотированной синтаксической разметки.
10) Программу поискового механизма и другие.
Менеджмент, пути и механизмы реализации Концепции
Специфика менеджмента, пути и механизмы реализации Концепции зависят от фундаментальных концептуальных особенностей Национального корпуса казахского языка и требуют особых организованных усилий как со стороны правительственных и государственных органов управления, так и со стороны коллектива создателей Национального корпуса казахского языка.
Поскольку Национальный корпус казахского языка представляет собой открытый, многоцелевой информационно-справочный продукт, координированная деятельность по его созданию должна одновременно осуществляться в нескольких взаимосвязанных направлениях.
Первое направление связано с разработкой и утверждением в установленном порядке Концепции Национального корпуса казахского языка, а также созданием научно-технической программы «Разработка и создание Национального корпуса казахского языка». В рамках данного направления согласованно утвердить сроки и этапы работы по созданию, функционированию и поддержке Национального корпуса казахского языка.
Второе направление программно-лингвистическое и кадровое обеспечение создания и функционирования Национального корпуса казахского языка. Создание и функционирование Национального корпуса казахского языка возможно при согласованной работе специалистов в области казахского языкознания, корпусной и компьютерной лингвистики, а также программистов, способных обеспечить качественную автоматическую метаразметку и разметку всего собрания оцифрованных текстов, создать оригинальные программные продукты в соответствии с заданным уровнем открытости, принятого формата представления и пользования Национальным корпусом казахского языка в свободном доступе.
Определить разработчиков Национального корпуса казахского языка в следующем предварительном составе, обозначив конкретное поле их деятельности и создав условия для работы:
1) Команда программистов по трансферу графических систем и команду по оцифровке текстов с помощью специально созданных программ;
2) Команда корпусных лингвистов-разработчиков специальной метаразметки и разметки письменных и устных текстов, снабженной поисковым механизмом, работающая в тесном сотрудничестве с командой разработчиков программного обеспечения глубокого аннотированного морфологического, синтаксического, семантического и пр. анализа, программ снятия омонимии;
3) В соответствии с параметрами Национального корпуса казахского языка определить команду мультимедийного корпуса; команду газетного корпуса, команду параллельного (казахско-русского, казахско-английского, казахско-турецкого) корпуса, команду обучающего корпуса казахского языка (разметка которого ориентирована на школьную программу), в том числе команду по созданию онлайновых мультимедийных обучающих сервисов, команду корпуса устной речи, команду поэтического корпуса.
Создание Национального корпуса казахского языка - одна из важнейших государственных задач, реализация которой может быть осуществлена совместными усилиями научно-лингвистических центров, уполномоченных государственных органов, издательств и редакций, средств массовой информации, корпусных лингвистов, специалистов по теории и истории казахского языка, диалектологов, лексикографов, терминологов, программистов.
Реализатором проекта и менеджером Национального корпуса казахского языка, контролирующим все этапы создания и функционирования будет являться Министерство образования и науки Республики Казахстан.
В качестве основного разработчика инновационного полномасштабного многофункционального Национального корпуса казахского языка определить Институт языкознания имени А. Байтурсынова с привлечением для разработки лингвистических задач специалистов кафедры общего языкознания Казахского национального университета имени аль-Фараби. IT-компания, которая обеспечит создание, функционирование и поддержку информационно-технической основы Национального корпуса казахского языка, определить Институт информационных и вычислительных технологий. Использовать в этой части опыт создания и онлайн поддержки Национального корпуса русского языка поисковой системы Yandex.
Функции научной координации и общественного контроля за созданием Национального корпуса казахского языка возложить на Научно-экспертный совет Ассамблеи народа Казахстана.
Всем заинтересованным министерствам, государственным и негосударственным организациям обеспечить бесплатный доступ к письменным и устным бумажным и электронным ресурсам казахского языка на территории Республики Казахстан и странах присутствия казахского языка в библиотеках, издательствах, редакциях, средствах массовой информации, архивах, депозитариях, фондах и других хранилищах всех структур и организаций.
Заключение
Реализация настоящей Концепции Национального корпуса казахского языка позволит получить инновационный полномасштабный многофункциональный продукт, востребованный обществом и способный дать полноценное представление обо всех аспектах функционирования государственного казахского языка в настоящее время и в разные периоды его существования. Кроме того, Национальный корпус казахского языка дает новые возможности как для изучения казахского языка, так и для обучения казахскому языку разных категорий граждан страны.
Национальный корпус казахского языка способен служить источником его кодификации, стандартизации и модернизации, определить тенденции развития казахского языка, поскольку в корпусе оказывается зафиксированным письменный и звучащий казахский язык в его максимально репрезентативном виде.

Эта возможность доступна только для зарегистрированных пользователей. Пожалуйста, войдите или зарегистрируйтесь. |
|
| Регистрация | |