We count text features, assuming that the page's title is assigned to each of its sentences, i.e. the distance between a word from the title and any other word is 1 sentence. Len - maximum ratio of words from the query found in some sentence of the text (with the assigned title) in relation to the length of the query. Пример [Хармс цирк Вертунов] для ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fwww.wikilivres.info%2Fwiki%2F%25D0%25A6%25D0%25B8%25D1%2580%25D0%25BA_%25D0%25A8%25D0%25B0%25D1%2580%25D0%25B4%25D0%25B0%25D0%25BC_%28%25D0%25A5%25D0%25B0%25D1%2580%25D0%25BC%25D1%2581%29 этого документа))
group
Combined Sequences
tags
doc
doc text
dynamic
deprecated
Details
index
297
cppName
FI_JOKER_LEN
name
JokerLen
ticket
BUKI-705
group
CombinedSequences
tags
TG_DOC,TG_DOC_TEXT,TG_DYNAMIC,TG_DEPRECATED
description
Считаем текстовые фичи, считая что тайтл страницы приписан к каждому ее предложению, т.е. расстояние между словом из тайтла и любым другим словом 1 предложение. Len- максимальное отношение слов из запроса встретившихся в каком-то предложении текста (с приписанным тайтлом) в отношении к длине запроса. Пример [Хармс цирк Вертунов] для ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fwww.wikilivres.info%2Fwiki%2F%25D0%25A6%25D0%25B8%25D1%2580%25D0%25BA_%25D0%25A8%25D0%25B0%25D1%2580%25D0%25B4%25D0%25B0%25D0%25BC_%28%25D0%25A5%25D0%25B0%25D1%2580%25D0%25BC%25D1%2581%29 этого документа))