Text relevance based on the language model, taking into account the absolute position. We go through the text with a box of 20 words, build for each box a language model (that is, probability distribution on the words of the Russian language) and calculate the probability of generating a query. For the distance from the beginning of the document penalize the model.
Текстовая релевантность на основе языковой модели, учитывающая абсолютную позицию. Идем по тексту с окошком 20 слов, строим по каждому окошку языковую модель (то есть распределение вероятностей на словах русского языка) и вычисляем вероятность порождения запроса. За удаление от начала документа штрафуем модель.