Measured Words: Quantifying Vocabulary Exposure in Beginning Russian

William J. Comer


Slavic and East European Journal, vol. 63, no.1 (Spring 2019), pp. 92–114


The current study provides a thick description of the vocabulary included in one beginning Russian textbook (i.e., Mezhdu nami, an open access, electronically accessible text). The study uses concordance software to quantify the words occurring in the beginning-level textbook, calculating the size, distribution and frequency of the text’s vocabulary in terms of total number of words (tokens), word forms (types) and lemmas. The author explores how well the word forms encountered in the textbook cover the paradigms of basic noun, adjective and verb forms. This data is used to consider the representativeness of the textbook’s vocabulary in comparison with the Russian frequency dictionary (Ljaševskaja and Šarov 2009), the required vocabulary lists for the Test of Russian as a Foreign Language (Andrjušina and Kozlova 2006; Andrjušina 2008; Andrjušina 2009), and studies of vocabulary in textbooks for other languages (Tschichold 2012; Catalan and Francisco 2008; Wagner 2015; Davies and Face 2006; Lipinski 2010). The discussion contextualizes the question of size, distribution and frequency of word forms. It explores the issue of incidental vocabulary in a beginning text and it discusses the fit between one beginning text’s vocabulary and the frequency dictionary/vocabulary lists.


Слов в меру: Количественный анализ лексики в учебнике русского языка для начального уровня

Уильям Комер

В исследовании представлен анализ лексики, содержащейся в электронном учебнике русского языка для начального уровня «Между нами». Для анализа лексики использовался конкондансер CasualConc, с помощью которого были обработаны все лексические единицы, встречающиеся в учебнике, а именно: определено количество токенов  (текстоформ или словоупотреблений), словоформ (отдельных форм лексемы как совокупности всех форм и значений одного слова) и лемм. Вопрос о том, насколько полно словоформы, содержащиеся в учебнике, представляют грамматические парадигмы основных имён существительных, прилагательных и глаголов, занимает важное место в исследовании. С целью определить показательность лексического состава учебника составленные словарные списки сравниваются со списками лексем в «Частотном словаре…», «Лексическом минимуме» и в материалах исследований по лексике в учебниках иностранных языков. В ходе сравнения обсуждаются вопросы объёма, разнообразия и частотности лексических единиц, входящих в списки в указанных источниках, а также предлагаются причины сходств и различий между словарными списками. Не остаётся без внимания и вопрос о случайной лексике, встречающейся в учебниках для начального уровня.


William J. Comer is professor of Russian and Director of the Russian Flagship Program at Portland State University. His main research interests include input-focused approaches for teaching Russian grammar and the pedagogy of reading in Russian as a foreign language. His edition of Viktoria Tokareva’s short story A Day without Lying (Slavica, 2008) makes the story accessible to intermediate-level students of Russian. He is co-author of Между нами (http://www.mezhdunami.org), an online, open-access textbook for elementary Russian, which won the AATSEEL prize for Best Book in Language Pedagogy in 2018.