ПРАВО.ru
Инхаус
ВИКТОР ДОМШЕНКО, РУКОВОДИТЕЛЬ ОТДЕЛА СУДЕБНОЙ ЗАЩИТЫ «ПОЧТЫ РОССИИ», СОЗДАТЕЛЬ ТЕЛЕГРАМ-КАНАЛА CLASS ACTION LAB
30 января 2024, 9:18

Групповые иски: автоматизация в массы

Групповые иски: автоматизация в массы
Дела с многосубъектным составом считаются сложными. Причем сложность может иметь как юридический характер — выражаться в необходимости выработки особых правил для соблюдения баланса прав и интересов всех участников такого дела, — так и технический, как правило, связанный с методами работы по отдельным задачам сбора, обработки и представления доказательств. Если юрвопросы следует решать за счет развития доктрины, законодательства и правоприменительной практики, то вторые — за счет оптимизации и автоматизации процессов. О возможном векторе решения практических задач с использованием автоматизации рассказывают эксперты «Почты России»: Виктор Домшенко, руководитель отдела судебной защиты, и Артем Сабиров, руководитель направления по методологии и разрешению ключевых споров.

Принципиальное отличие группового производства от индивидуальной формы судебной защиты — многочисленность лиц. Это обстоятельство, с одной стороны, обусловливает необходимость наличия в правопорядке такой специальной формы разрешения правовых конфликтов. С другой — предопределяет трудности при подготовке к подаче группового иска и его сопровождении в суде. Если управление делом, скажем, с десятью членами группы, еще может встроиться в традиционные представления о сопровождении судебных дел, то с пятьюстами или тысячью членов группы и без адекватного инструментария вопрос сопровождения дела становится критическим. Здесь подчеркнем, что подобный инструментарий должен включать как собственно специальное процессуально-правовое регулирование групповых исков, так и техники и технологии для выявления спорных ситуаций и работы с ними при типичном нарушении прав сразу множества лиц.

Последнее включает возможность решения, в частности, таких вопросов:

  • Как найти событие — массовое однородное нарушение прав лиц, которое могло бы лечь в основу группового иска?
  • Как собрать потерпевших, эффективно с ними договориться?
  • Как организовать сбор и проверку доказательств?
  • Как организовать предоставление и раскрытие доказательств?
  • Как координировать членов группы во время разбирательства?
  • Как организовать исполнение судебного акта и распределение присужденной в пользу членов группы компенсации? 

Важно понимать, что даже распечатка документов для предоставления в судебное дело при большой группе приобретает «издательские» масштабы. Что уж говорить об остальных аспектах.

Очевидным ответом на подобный вызов выступает автоматизация. Но как автоматизировать такие задачи? Использование имеющихся решений, в том числе распознавания документов, их конструкторов, чат-ботов, безусловно, необходимо. Тем не менее их недостаточно. Большинство этих задач в какой-то момент пройдет свой путь от режима «невозможно автоматизировать» до «почти автоматизировано» или даже «автоматизировано». Так случилось, например, с задачей по игре в го (AlphaGo Zero от Google). 

Но как нет одной таблетки от всех болезней, так нет и одного решения для всех задач. Под каждый запрос — свое предложение. Начнем с задачи поиска события, которое могло бы лечь в основу группового иска.

В чем сложность поиска информации?

Казалось бы, можно анализировать сайты судов, но в суд групповой иск попадает уже проработанным: собрана группа и доказательства, придумана стратегия и прочее. Поэтому требуется отступить на шаг назад. 

Разумеется, ситуация подобного поиска может решаться довольно просто: собственники помещений в конкретном многоквартирном доме знают о нарушении их прав управляющей компанией или акционеры конкретного общества знают о совершении CEO убыточной для компании и ее акционеров сделки. Так же с владельцами облигаций конкретного выпуска конкретным эмитентом, потерпевшими от случившейся аварии конкретного воздушного судна или на конкретном объекте. Примеры можно продолжать. Однако все они носят частный, ситуативный характер и, как правило, хорошо известны лишь участникам таких отношений. 

Но как об этом узнать широкому кругу лиц — потенциальным потерпевшим при нарушении условным ответчиком прав множества лиц на распределенной территории и в изначально неочевидных границах группы, специализированным инвесторам и междисциплинарным командам, которые могли бы проинвестировать средства и время в сопровождение дела?

Основной источник, из которого можно получить информацию о нужном событии на системной основе, — новости. При этом, как показывают наши регулярные наблюдения, всего три-четыре популярных новостных источника дают порядка 2000 новостей в сутки, а это около 800 000 слов. Анализировать такой новостной поток ежедневно и вручную означает иметь команду аналитиков, сопоставимую с исследовательским институтом. Вряд ли можно оправдать финансирование такой «роскоши» только для поиска подходящих новостей.

Но даже такую команду аналитиков ждет разочарование: несмотря на масштаб, новостной поток в лучшем случае дает пару подходящих новостей в день. После анализа этих новостей команду ждет еще одно неутешительное открытие. Более подробный анализ может показать, что факты, отраженные в условно подходящей новости, не могут стать основой группового иска по разным причинам, например: журналист не полностью осветил ситуацию, не удалось найти потерпевших и подобное.

Это превращает анализ новостей в лотерею с очень дорогими билетами. Для тех, кто видит в сопровождении групповых исков постоянную работу или даже бизнес, лотерея — плохая идея.

В качестве полумеры можно финансировать анализ новостей конкретной отрасли. Но во-первых, нужно научиться в новостном потоке выделять эту отрасль из общего потока информации, а во-вторых, подобная фильтрация уменьшит и без того небольшой «улов».

Перспективы автоматизации поиска

В различных сферах уже давно используется машинное обучение всех возможных видов: новости анализируют алгоритмы, которые торгуют на бирже («торговые роботы»), давно успешно решается задача по анализу тональности текста (sentiment analysis), его разметки (например, извлечение из текста наименований городов, Ф. И. О.). Что уж говорить о задачах по аннотации текста, его генерации по заданным параметрам — только ленивый не экспериментировал с большими языковыми моделями.

Можно уверенно сказать, что реальна доработка имеющихся инструментов для того, чтобы выявлять подходящую новость без участия человека с приемлемой точностью. Такая доработка возможна за счет участия юриста на всех стадиях разработки:

  1. Как и в большинстве задач машинного обучения, необходимо подготовить датасет — тексты новостей с готовым прогнозом перспектив группового иска. Такая методика машинного обучения — датасет с готовым прогнозом — называется «обучение с учителем» (supervised learning). «Учителем» выступает достаточно квалифицированный юрист, обладающий экспертными познаниями в этой области знаний. 
  2. Текстовые данные в датасете необходимо обработать, чтобы модель могла их воспринимать. Обработка текстовых данных ставит массу вопросов на стыке между IT, юриспруденцией и лингвистикой. Формат колонки не дает возможности даже наметить их, поэтому ограничимся указанием на то, что обработке текстов для машинного обучения (в том числе для русского языка) посвящено множество публикаций.
  3. Следующий этап — выбор подходящей модели. В действительности экспериментировать можно с любыми моделями и выбрать ту, прогноз которой точнее других. В настоящее время их довольно много, поэтому на такие «упражнения» нужно много времени. Можно экспериментировать также с большими языковыми моделями. Например, дообучать их на имеющемся датасете (fine-tuning) — самый затратный способ, но, вероятно, дообучение нейросети даст самый точный прогноз из имеющихся. Или cделать ставку на команду разработчиков конкретной нейросети, и в режиме диалога спрашивать у нее прогноз в отношении каждой новости (zero-shot learning, few-shot learning).
  4. Написать код, на основании которого обученная модель будет принимать на вход новость, анализировать ее и давать свой прогноз на выходе.
  5. Решить вопросы продукта, не связанные с моделью, — автоматизированный сбор новостей (эти технологии применяются уже больше десяти лет), серверная инфраструктура и пользовательский интерфейс.

Решение задачи обретает целостность. Новости автоматически собираются, обрабатываются, и в отношении каждой из них делается прогноз: содержит ли новость потенциал для группового иска. Успешные «кандидаты» отправляются юристам для дальнейшего анализа. И все это делается ежедневно и, что более важно, практически мгновенно и без участия человека. 

При ориентации такого продукта на консультантов, которые сопровождают групповые иски на стороне истцов, он дает ценность также для потенциальных ответчиков: они узнают о своем нарушении еще до того, как оно «кристаллизуется» в суде. Это открывает возможность, например, разрешить спор до суда или заблаговременно начать к нему готовиться.

Будем откровенны, сейчас еще далеко до идеальных результатов в решении поставленной задачи. Процесс сопровождения групповых исков имеет множество подводных камней, надлежащее внимание к которым требует титанического ручного труда. Часть задач имеет потенциал перейти из разряда «невозможно автоматизировать», как минимум, в разряд «почти автоматизировано». При этом остается достаточно неопробованных гипотез и инструментов, которые могут улучшить решение и привести к желаемой оптимизации процессов.