Электронный словарь пушту: создание базы данных морфологии
https://doi.org/10.24833/2410-2423-2019-2-18-113-118
Аннотация
В статье рассматривается создание электронного словаря на базе «Пушту-русского словаря» М.Г. Асланова, который является в настоящее время наиболее полным словарём пушту. Бумажные словари неизбежно устаревают, в то время как электронные словари обладают целым рядом неоспоримых преимуществ по сравнению с традиционными. Работа над электронным словарём включает три этапа: 1) составление словника (или использование уже готового), 2) создание базы морфологии, 3) работу с синтаксисом, заключающуюся в создании корпуса текстов, что позволит выявить несвободную сочетаемость слов, начиная от словосочетания. Статья посвящена главным образом созданию базы данных морфологии пушту для электронного словаря, что было сделано впервые в мире. Основное внимание в работе уделено именам существительным и прилагательным. На основе грамматических переменных выделены парадигматические классы указанных частей речи, а в их рамках - все возможные формы слова (морфемы). Для имён существительных описано двадцать шесть парадигматических классов, а для имён прилагательных - восемь. Некоторые классы разделяются на подклассы, в каждый из которых входит одна лексема. Это относится к так называемым исключениям из правил. Для каждого класса приведено в качестве образца наиболее характерное слово. Каждая морфема (равно как и каждое значение слова) выступает отдельной словарной единицей, что даёт возможность пользователю легко находить нужное слово, а также осуществлять обратный перевод. Данная статья рассчитана на афганцев, владеющих языком пушту, а также русскоговорящих, работающих с пушту. Особый интерес результаты исследования представляют для тех, кто составляет или собирается составлять электронные словари, особенно для редких языков.
Ключевые слова
Об авторах
Ю. П. ЛалетинРоссия
Лалетин Юрий Павлович - кандидат исторических наук, доцент кафедры индоиранских и африканских языков МГИМО.
119454, Москва, пр. Вернадского, 76
В. О. Сорвёнков
Россия
Сорвёнков Владислав Олегович - студент 4-го курса факультета Международных отношений МГИМО.
119454, Москва, пр. Вернадского, 76
М. А. Тимофеев
Россия
Тимофеев Михаил Алексеевич - студент 4-го курса факультета Международных отношений МГИМО.
119454, Москва, пр. Вернадского, 76
Список литературы
1. Зубов А. В., Зубова И. И. Основы искусственного интеллекта для лингвистов. Москва: РГГУ, 2013. 320 с.
2. База данных по русской и английской морфологии [Электронный ресурс] - Режим доступа: http://www.solarix.ru/sql-dictionary-sdk.shtml (дата обращения 15.05.2018 г.).
3. Селегей В. П. Компьютерная лексикография [Электронный ресурс] - Режим доступа: https://www.abbyy.com/ru-ru/science/technologies/lexicography/ (Дата обращения 15.05.2018 г.).
4. Лингвистический процессор естественного языка [Электронный ресурс] - Режим доступа: https://studfiles.net/preview/972381/page:5/ (Дата обращения 16.05.2018 г.)
Рецензия
Для цитирования:
Лалетин Ю.П., Сорвёнков В.О., Тимофеев М.А. Электронный словарь пушту: создание базы данных морфологии. Филологические науки в МГИМО. 2019;18(2):113-118. https://doi.org/10.24833/2410-2423-2019-2-18-113-118
For citation:
Laletin Yu.P., Sorvyonkov V.O., Timofeev M.A. ELECTRONIC PASHTO DICTIONARY: CREATING A MORPHOLOGY DATABASE. Linguistics & Polyglot Studies. 2019;18(2):113-118. (In Russ.) https://doi.org/10.24833/2410-2423-2019-2-18-113-118