Preview

Филологические науки в МГИМО

Расширенный поиск

Частота совместной встречаемости иероглифов как показатель лексичности (при отборе лексики китайского военного дискурса)

https://doi.org/10.24833/2410-2423-2020-4-24-14-24

Аннотация

Преподавание иностранного языка в неязыковом вузе должно быть профессионально ориентированным, что ставит перед преподавателем задачу отбора лексики, репрезентативной для профессионального дискурса изучаемой специальности и актуальной для его текущего состояния. Современные корпусы текстов являются слишком общими по тематике и охватываемому периоду для такой узкой задачи. Поэтому материалом для отбора лексики должна выступать специально составленная коллекция текстов. В случае с китайским языком задача осложняется отсутствием сегментации таких текстов на слова. С учётом того, что большинство слов китайского языка записываются двумя иероглифами, предполагается, что одним из применимых в этой ситуации методов может быть сплошной частотный анализ текстовых последовательностей из двух иероглифов – иероглифических биграмм. В результате такого анализа среди частотных биграмм получено более 70 % репрезентативных для данного дискурса лексических единиц, в том числе 11 % несловарных. Оставшаяся доля биграмм приходится на синтаксические конструкции, в том числе структурно незавершённые, и фрагменты более длинных лексических единиц. Таким образом, высокая частота совместной встречаемости иероглифов может с достаточно большой вероятностью (p > 0,7) рассматриваться как показатель лексичности при выявлении репрезентативной лексики в несегментированной тематической коллекции текстов на китайском языке.

Об авторе

Д. С. Коршунов
Военный университет радиоэлектроники
Россия

Коршунов Дмитрий Сергеевич – кандидат филологических наук, научно-педагогический работник ВУРЭ

162600, Вологодская область, г. Череповец, пр. Советский, 126



Список литературы

1. Алексахин А.Н. Алфавит китайского языка путунхуа. Буква – фонема – звук речи – слог – слово. 4-е изд., испр. и доп. М.: Восточная книга, 2018. 212 с.

2. Алексахин А.Н. Современная политика КНР в отношении иероглифической и буквенной письменности // Вестник МГИМО. 2011. № 3. С. 243–252.

3. Горина О.Г. Использование технологий корпусной лингвистики для развития лексических навыков студентов-регионоведов в профессионально-ориентированном общении на английском языке: дисс. … канд. пед. наук. М.: МГУ, 2014. 321 с.

4. Кленин И.Д. Лексикология китайского языка / И.Д. Кленин, В.Ф. Щичко. М.: Восточная книга, 2013. 272 с.

5. Курдюмов В.А. Динамический подход к научному изучению китайского языка // III Готлибовские чтения: Востоковедение и регионоведение Азиатско-Тихоокеанского региона в фокусе современности : материалы Междунар. науч. конф. Иркутск, 10–16 сент. 2019 г. / ФГБОУ ВО «ИГУ»; [отв. ред. Е.Ф. Серебренникова]. Иркутск: Изд-во ИГУ, 2019. С. 285–291.

6. Муравьёв Н.А. Подходы к составлению лексических минимумов в России и за рубежом: проблемы и перспективы / Н.А. Муравьёв, М.Ю. Ольшевская // Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2019. Т. 17, № 1. С. 78–89.

7. Риехакайнен Е.И. Восприятие русской устной речи: контекст + частотность: монография. СПб.: С.-Петерб. гос. ун-т, 2016. 270 с.

8. Солнцев В.М. Язык как системно-структурное образование. Изд. 2-е, доп. М.: Наука, 1977.

9. Солнцев В.М. Теоретическая грамматика современного китайского языка (проблемы морфологии): курс лекций / В.М. Солнцев, Н.В. Солнцева. М.: Военный институт, 1978.

10. Шейгал Е.И. Семиотика политического дискурса: дисс. ... д-ра филол. наук. Волгоград, 2000. 431 с.

11. Шемет Г.И. Совершенствование обучения иностранному языку курсантов военных вузов на основе оптимизации лексической компоненты: дисс. … канд. пед. наук. М.: Военный университет, 2011. 249 с.

12. Юй Чуцяо. Автоматический синтаксический анализ китайских предложений при ограниченном словаре / Юй Чуцяо, И.А. Бессмертный // Программные продукты и системы. 2017. Т. 30. № 1. С. 138–142.

13. Da Jun. 2004. Chinese text computing. [Electronic resource] – URL: http://lingua.mtsu.edu/chinese-computing (accessed: 23.03.2020)

14. Deng K. On the unsupervised analysis of domain-specific Chinese texts / K. Deng, P.K. Bol, K.J. Li et al. // Proceedings of the National Academy of Sciences of the United States of America, 2016. Vol. 113, No. 22. Pp. 6154–6159.

15. Huang W. Toward Fast and Accurate Neural Chinese Word Segmentation with Multi-Criteria Learning / W. Huang, X. Cheng, K. Chen et al. [Electronic resource] Cornell University > Computer Science > Computation and Language. – URL: https://arxiv.org/abs/1903.04190 (accessed: 22.03.2020)

16. Li Sh. Collocation Analysis Tools for Chinese Collocation Studies / Sh. Li, Sh. Guo // Journal of Technology and Chinese Language Teaching. Vol. 7, No. 1, 2016. Pp. 56–77.

17. Li J. A Comparison and Semi-Quantitative Analysis of Words and Character-Bigrams as Features in Chinese Text Categorization / J. Li, M. Sun, X. Zhang // Proceedings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics, Sydney, July 2006. Pp. 545–552.

18. Ma J. State-of-the-art Chinese Word Segmentation with Bi-LSTMs / J. Ma, K. Ganchev, D. Weiss // In Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing. Brussels, Belgium, October 31 – November 4, 2018. Pp. 4902–4908.


Рецензия

Для цитирования:


Коршунов Д.С. Частота совместной встречаемости иероглифов как показатель лексичности (при отборе лексики китайского военного дискурса). Филологические науки в МГИМО. 2020;6(4):14-24. https://doi.org/10.24833/2410-2423-2020-4-24-14-24

For citation:


Korshunov D.S. Frequency of co-occurrence of chinese characters as an indicator of lexicality (when selecting the vocabulary of chinese military discourse). Linguistics & Polyglot Studies. 2020;6(4):14-24. (In Russ.) https://doi.org/10.24833/2410-2423-2020-4-24-14-24

Просмотров: 681


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2410-2423 (Print)
ISSN 2782-3717 (Online)