Главная формула общего рейтинга
Итоговый рейтинг продавца (overall_rating) рассчитывается следующим образом:
$$overall\_rating = \operatorname{round}\left(\sqrt{normalized\_trust\_score \cdot geo\_rating}\right)$$
где:
- normalized_trust_score — рейтинг доверия по ценовому поведению (от 0 до 100);
- geo_rating — гео-рейтинг продавца (от 0 до 100).
На первый взгляд можно было бы просто усреднить оба показателя. Однако такой подход позволяет компенсировать один плохой показатель другим.
Например, продавец с оценками 100 и 40 получил бы средний балл 70, как и продавец с рейтингами 70 и 70. Очевидно, что эти ситуации различаются.
Геометрическое среднее более строго относится к перекосам. Если один из показателей низкий, итоговый рейтинг заметно снижается. Это позволяет выделять действительно надежных продавцов, а не тех, кто хорош только по одному из критериев.
Как считается доверие по ценам
Шаг 1. Оценка риска каждого объявления
Для каждого объявления рассчитывается показатель риска (neighborhood_risk_score) в диапазоне от 0 до 1.
Он объединяет три компонента:
- насколько цена ниже локального рынка;
- насколько сильно цена отклоняется от типичных значений;
- какое место объект занимает в распределении цен.
Итоговый риск определяется формулой:
$$risk = 0.50 \cdot risk_{ratio} + 0.30 \cdot risk_z + 0.20 \cdot risk_{pct}$$
Компонент 1. Сравнение с медианной ценой
Компонент risk_ratio показывает, насколько цена за квадратный метр ниже медианы для аналогичных объектов.
Чем сильнее объект выбивается вниз относительно локального рынка, тем выше риск.
Компонент 2. Отклонение от рынка через modified z-score
Для оценки статистической аномальности используется модифицированный z-score:
$$z = 0.6745 \cdot \frac{price\_per\_m2 - median}{MAD_{std}}$$
Полученное значение преобразуется через сигмоидальную функцию:
$$risk_z = \frac{1}{1 + e^{z/0.4}}$$
Это позволяет плавно переводить статистическое отклонение в шкалу риска от 0 до 1.
Компонент 3. Положение в распределении цен
Дополнительно учитывается процентиль объекта среди похожих предложений:
$$risk_{pct} = 1 - \frac{percentile\_rank}{100}$$
Чем дешевле объект относительно рынка, тем выше этот компонент риска.
Шаг 2. От риска объявлений к рейтингу продавца
После оценки всех объявлений продавца необходимо объединить их в единую оценку.
Учет давности объявлений
Свежие объявления лучше отражают текущее поведение продавца, поэтому им присваивается больший вес:
$$w_i = e^{-age_i / 90}$$
где age_i — возраст объявления в днях.
Параметр 90 дней задает скорость уменьшения влияния старых объявлений.
Средневзвешенный риск продавца
Далее рассчитывается средний риск:
$$\bar{r} = \frac{\sum_i w_i r_i}{\sum_i w_i}$$
Байесовское сглаживание
Если у продавца всего несколько объявлений, оценки могут быть нестабильными. Поэтому используется сглаживание относительно среднего уровня риска по рынку:
$$r_{smooth} = \frac{prior\_risk \cdot prior\_weight + \bar{r} \cdot \sum_i w_i}{prior\_weight + \sum_i w_i}$$
Шаг 3. Перевод риска в рейтинг доверия и нормализация.
Полученный риск преобразуется в базовый рейтинг доверия:
$$raw\_trust\_score = \operatorname{round}\left((1 - r_{smooth}) \cdot 100\right)$$
Чем ниже риск объявлений продавца, тем выше итоговое доверие.
Чтобы оценки были сопоставимы между всеми продавцами платформы, используется перевод в перцентиль:
$$normalized\_trust\_score = \operatorname{round}\left(percentile \in [0,100]\right)$$
Именно этот показатель участвует в расчете общего рейтинга.
Как считается гео-рейтинг
Вторая составляющая общего рейтинга — качество геоданных.
Для каждого объявления проверяется наличие географических нарушений:
- для квартир — слишком большое отклонение координат от адресного центра;
- для загородных объектов — недостаточная точность указания местоположения.
Для каждого объявления формируется бинарный признак:
$$v_i \in \{0,1\}$$
где:
- 0 — нарушение отсутствует;
- 1 — обнаружено нарушение.
Доля географических нарушений
Рассчитывается отношение количества нарушений к общему числу объектов продавца:
$$rate = \frac{\sum_i v_i}{n}$$
Байесовское сглаживание гео-риска
Как и в случае с ценовым поведением, применяется сглаживание:
$$rate_{smooth} = \frac{prior_{geo} \cdot geo\_prior\_weight + rate \cdot n}{geo\_prior\_weight + n}$$
Расчет гео-рейтинга
Окончательная оценка вычисляется следующим образом:
$$geo\_rating = \operatorname{round}\left(100 \cdot (1 - rate_{smooth})^{1.45}\right)$$
Степень 1.45 усиливает штраф за систематические нарушения. Редкие ошибки практически не влияют на результат, тогда как постоянные проблемы с геопривязкой существенно снижают рейтинг.
Почему рейтинг продавца важен для оценки риска объявления?
При анализе недвижимости важно понимать, что риск определяется не только характеристиками самого объекта. Даже если цена выглядит рыночной, а геоданные указаны корректно, история поведения продавца может существенно изменить итоговую оценку.
Практика показывает, что недобросовестные участники рынка редко ограничиваются единичными ошибками. Если продавец систематически публикует объявления с аномально низкими ценами, некорректной геопривязкой или другими подозрительными признаками, вероятность того, что новое объявление также окажется проблемным, заметно возрастает.
Именно поэтому в Frealtor рейтинг продавца рассматривается как один из ключевых факторов при расчете общего риска объявления.
С точки зрения вероятностного подхода логика достаточно проста: объявление от продавца с плохой историей поведения статистически имеет более высокую вероятность оказаться фейковым или содержать недостоверную информацию.
И наоборот, если продавец длительное время публикует объекты с корректными ценами и качественными геоданными, это снижает вероятность того, что новое объявление является попыткой привлечения контактов с помощью искусственно заниженной цены.
Как рейтинг продавца используется в общей оценке риска
Итоговый рейтинг продавца не отображается только как информационный показатель. Он является одним из признаков в модели оценки риска объявления.
При расчете общего антифейк-скоринга система учитывает несколько групп сигналов:
- ценовые признаки объекта — насколько цена соответствует локальному рынку;
- характеристики самого объявления — полнота данных, согласованность площади, географическая точность;
- поведенческие признаки продавца — история публикаций и общий рейтинг надежности.
Таким образом, итоговый риск формируется не по одному критерию, а как результат объединения независимых источников информации.
Например:
- низкая цена + высокий рейтинг продавца могут указывать на действительно выгодное предложение;
- низкая цена + низкий рейтинг продавца существенно увеличивают вероятность того, что объявление требует дополнительной проверки;
- нормальная цена + очень низкий рейтинг продавца также могут служить сигналом для более внимательного анализа.
Практический эффект использования рейтинга продавца
Использование рейтинга продавца позволяет решить важную проблему классических антифейк-моделей. Если анализировать только отдельное объявление, недобросовестный продавец может адаптироваться: немного повысить цену, скорректировать описание или улучшить геопривязку. Однако изменить накопленную историю поведения значительно сложнее. Поэтому рейтинг продавца выполняет роль долгосрочного сигнала доверия, который дополняет краткосрочные признаки конкретного объявления.
Именно сочетание двух уровней анализа — качества объявления и репутации продавца и позволяет RiskEstate более эффективно выявлять потенциально фейковые объекты и снижать количество ложных срабатываний.
Важно отметить, что низкий рейтинг продавца не означает автоматически, что каждое его объявление является фейковым. Рейтинг отражает лишь статистическую вероятность повышенного риска, основанную на историческом поведении. Окончательное решение всегда принимается на основе совокупности факторов.
Пример расчета
Предположим, продавец имеет следующие показатели:
- normalized_trust_score = 81
- geo_rating = 64
Тогда общий рейтинг составит:
$$overall = \operatorname{round}\left(\sqrt{81 \cdot 64}\right) = \operatorname{round}(72) = 72$$
Итоговая оценка продавца — 72 балла из 100.
Что это дает на практике
Такой подход позволяет оценивать продавцов комплексно, а не опираться на единичные сигналы.
При расчете рейтинга учитываются:
- адекватность цен относительно рынка;
- стабильность поведения продавца во времени;
- качество географических данных объектов;
- влияние репутации продавца на итоговый риск каждого объявления.
В результате система лучше отделяет действительно надежных продавцов от случаев, когда привлекательная цена или ошибки в геоданных могут указывать на повышенный риск.
Выводы
Общий рейтинг продавца в RiskEstate — это не субъективная оценка и не простое усреднение нескольких показателей.
Это формализованная модель, объединяющая независимые источники информации о поведении продавца.
Высокий рейтинг получают только те участники рынка, которые одновременно:
- публикуют объекты с рыночно обоснованными ценами;
- демонстрируют стабильное поведение во времени;
- предоставляют качественные и точные геоданные;
- имеют историю публикаций, не указывающую на повышенный риск фейковых объявлений.
Именно такой подход позволяет использовать рейтинг продавца не только как показатель надежности автора объявлений, но и как важный элемент общей системы антифейк-аналитики при выборе недвижимости.
Комментарии
Пока нет комментариев.