Preview

Филологические науки в МГИМО

Расширенный поиск

Электронный словарь пушту: создание базы данных морфологии

https://doi.org/10.24833/2410-2423-2019-2-18-113-118

Полный текст:

Аннотация

В статье рассматривается создание электронного словаря на базе «Пушту-русского словаря» М.Г. Асланова, который является в настоящее время наиболее полным словарём пушту. Бумажные словари неизбежно устаревают, в то время как электронные словари обладают целым рядом неоспоримых преимуществ по сравнению с традиционными. Работа над электронным словарём включает три этапа: 1) составление словника (или использование уже готового), 2) создание базы морфологии, 3) работу с синтаксисом, заключающуюся в создании корпуса текстов, что позволит выявить несвободную сочетаемость слов, начиная от словосочетания. Статья посвящена главным образом созданию базы данных морфологии пушту для электронного словаря, что было сделано впервые в мире. Основное внимание в работе уделено именам существительным и прилагательным. На основе грамматических переменных выделены парадигматические классы указанных частей речи, а в их рамках - все возможные формы слова (морфемы). Для имён существительных описано двадцать шесть парадигматических классов, а для имён прилагательных - восемь. Некоторые классы разделяются на подклассы, в каждый из которых входит одна лексема. Это относится к так называемым исключениям из правил. Для каждого класса приведено в качестве образца наиболее характерное слово. Каждая морфема (равно как и каждое значение слова) выступает отдельной словарной единицей, что даёт возможность пользователю легко находить нужное слово, а также осуществлять обратный перевод. Данная статья рассчитана на афганцев, владеющих языком пушту, а также русскоговорящих, работающих с пушту. Особый интерес результаты исследования представляют для тех, кто составляет или собирается составлять электронные словари, особенно для редких языков.

Об авторах

Ю. П. Лалетин
Московский государственный институт международных отношений (университет) МИД России
Россия

Лалетин Юрий Павлович - кандидат исторических наук, доцент кафедры индоиранских и африканских языков МГИМО.

119454, Москва, пр. Вернадского, 76



В. О. Сорвёнков
Московский государственный институт международных отношений (университет) МИД России
Россия

Сорвёнков Владислав Олегович - студент 4-го курса факультета Международных отношений МГИМО.

119454, Москва, пр. Вернадского, 76



М. А. Тимофеев
Московский государственный институт международных отношений (университет) МИД России
Россия

Тимофеев Михаил Алексеевич - студент 4-го курса факультета Международных отношений МГИМО.

119454, Москва, пр. Вернадского, 76



Список литературы

1. Зубов А. В., Зубова И. И. Основы искусственного интеллекта для лингвистов. Москва: РГГУ, 2013. 320 с.

2. База данных по русской и английской морфологии [Электронный ресурс] - Режим доступа: http://www.solarix.ru/sql-dictionary-sdk.shtml (дата обращения 15.05.2018 г.).

3. Селегей В. П. Компьютерная лексикография [Электронный ресурс] - Режим доступа: https://www.abbyy.com/ru-ru/science/technologies/lexicography/ (Дата обращения 15.05.2018 г.).

4. Лингвистический процессор естественного языка [Электронный ресурс] - Режим доступа: https://studfiles.net/preview/972381/page:5/ (Дата обращения 16.05.2018 г.)


Для цитирования:


Лалетин Ю.П., Сорвёнков В.О., Тимофеев М.А. Электронный словарь пушту: создание базы данных морфологии. Филологические науки в МГИМО. 2019;18(2):113-118. https://doi.org/10.24833/2410-2423-2019-2-18-113-118

For citation:


Laletin Y.P., Sorvyonkov V.O., Timofeev M.A. ELECTRONIC PASHTO DICTIONARY: CREATING A MORPHOLOGY DATABASE. Philology at MGIMO. 2019;18(2):113-118. (In Russ.) https://doi.org/10.24833/2410-2423-2019-2-18-113-118

Просмотров: 28


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2410-2423 (Print)