Что юристу нужно знать про технологии: гайд
Грамотное использование терминологии — это первый шаг на пути от восприятия ИИ как модной аббревиатуры к его применению для решения конкретных юридических задач.
Искусственный интеллект (ИИ, Artificial Intelligence, AI) — это компьютерные системы, способные выполнять задачи, свойственные человеческому интеллекту, например: анализировать данные, распознавать образы и речь, обрабатывать тексты и принимать решения. ИИ учится на огромных массивах данных и находит в них закономерности, что позволяет ему имитировать человеческое поведение. Значительных успехов ИИ достиг благодаря языковым моделям и большим языковым моделям.
Языковая модель (ЯМ) — это алгоритм, который предсказывает вероятное продолжение фразы. Задача языковой модели — определить, какие слова логично следуют за предыдущими. Работает она на основе анализа текстов: чем чаще встречается определенная последовательность, тем выше вероятность ее появления в ответе.
Простая языковая модель используется, например, при автодополнении в текстовом редакторе или при подсказке поисковых запросов. Это решение хорошо справляется с предсказуемыми задачами, но ограничено контекстом и глубиной анализа.
Большая языковая модель (БЯМ, Large Language Model, или LLM) отличается от обычной масштабом и возможностями. Она обучается на гигантских объемах текстов, может удерживать сложный контекст и генерировать развернутые ответы. Наиболее известные БЯМ — GPT, Gemini, Claude 3, Yi, Yandex GPT, DeepSeek.
Big Data (большие данные) — это огромные объемы информации разной степени структурированности для работы с ними. Большие данные служат учебным материалом, на котором учится ИИ, находя закономерности и совершенствуя свои знания. Чем качественнее и объемнее данные, тем «умнее» и надежнее становится искусственный интеллект.
GPT (Generative Pre-trained Transformer) — это разновидность большой языковой модели, разработанная компанией OpenAI. GPT фокусируется на тексте, но сейчас продукт расширяется и через него уже можно работать с изображениями, аудио и другими файлами. Основное назначение GPT — генерировать связный, логичный текст.
Модель GPT имеет генеративный, то есть направленный на создание нового текста и смысла, уклон. В связи с этим она периодически допускает ошибки, которые называют «галлюцинации», что обязывает пользователей всегда перепроверять ответы. GPT в формате чат-бота (ChatGPT) имитирует диалог с человеком и может применяться юристами для создания документов, анализа норм права, поиска и систематизации информации и многого другого. Важно понимать, что GPT — это не синоним искусственного интеллекта, а лишь одна из его разновидностей.
NLP (Natural Language Processing) — технология обработки естественного языка. С ее помощью компьютер понимает написанные человеком тексты. В отличие от простого поиска по ключевым словам NLP позволяет извлекать отдельные данные из документов (имена, даты, суммы), классифицировать их, преобразовывать речь в текст и обратно.
NLP используется юристами для поиска информации по заданным критериям, анализа контрактных обязательств, подготовки документов и формулировании правовых заключений.
API (Application Programming Interface) — это технология, которая позволяет одной программе взаимодействовать с другой. Пользователь не видит, как именно передаются команды и обрабатываются запросы, но получает результат.
В юридической практике API особенно полезен, когда нужно получить информацию из официальных источников. Например, если специалист вводит в систему название организации, программное решение с помощью API отправляет запрос в ЕГРЮЛ. В ответ получает данные и выводит их на экран. Юрист не взаимодействует напрямую с реестром, а работает через привычный интерфейс.
RAG (Retrieval-Augmented Generation) — технология, которая сочетает поиск по базе знаний и генерацию текста. Она помогает моделям искусственного интеллекта не только «отвечать по памяти», но и использовать актуальные документы и данные. Это особенно важно в юридической сфере, где точность, контекст и ссылки на конкретные нормы имеют решающее значение.
В отличие от обычной языковой модели, которая формулирует ответ на основе обобщенного обучающего материала, RAG сначала находит нужные фрагменты из базы и только потом генерирует текст с опорой на эти источники. Например, если задать вопрос о последствиях нарушения сроков поставки, обычная языковая модель может сослаться на положения Гражданского кодекса. Однако она не учтет индивидуальные условия контракта. RAG-система, в свою очередь, найдет конкретный договор, проанализирует его и сформулирует ответ с учетом специфики документа.
OCR (Optical Character Recognition) — технология, распознающая текст на изображениях. Если у юриста на руках скан документа, то без OCR он не сможет задать поиск по словам, копировать фрагменты и редактировать.
Технология OCR принимает изображение или PDF, определяет контуры символов, сопоставляет их с базой шрифтов и формирует текст с сохранением структуры документа. При этом она учитывает контекст (например, распознает, где указана буква Ш, а где — Щ). В результате скан становится полноценным текстом.
В юридической практике OCR применяется для цифровизации архивов, при автоматической обработке документов, для подготовки текстов к дальнейшему анализу (например, в RAG-системах) и при работе с судебными решениями, которые поступают в виде сканов.
AI-ассистент — это инструмент, который отвечает на вопросы, но не действует самостоятельно. Он активируется только по запросу пользователя, выполняет ограниченный перечень задач и не принимает решений. Таким ассистентом будет чат-бот, когда предоставляет справочную информацию по делу, подсказывает судебную практику или норму закона, помогает найти нужный документ в корпоративной системе.
AI-агент самостоятельно анализирует данные, формулирует выводы и выполняет действия. Такой инструмент подходит для автоматизации процессов, где участие человека ограничивается постановкой задачи. Например, если нужно подготовить иск, AI-агент находит договор в базе, проверяет сроки, формирует текст иска, передает его на проверку юристу и подгружает в судебную систему.
CRM (Customer Relationship Management) — система, которая помогает организовать работу с клиентами, контролировать дела и автоматизировать документооборот. В юридических департаментах CRM становится центральной точкой, через которую проходит информация от первого обращения до финального отчета по делу. Эта система хранит данные клиентов, содержит привязанные к конкретному делу акты, уведомляет о наступлении ключевых дат и позволяет автоматически формировать типовые документы.
Понимание этих понятий открывает возможности для оптимизации практики, разработки новых юридических продуктов и формирования цифровой правовой культуры. Для тех, кто готов сделать следующий шаг, Форум ПравоТех станет отличной площадкой для глубокого погружения в мир юридических инноваций. Он состоится 25 сентября в кластере «Ломоносов» в Москве. Начало — в 12:00. Сквозной темой мероприятия станет искусственный интеллект.
Автор: Анастасия Артюхова, эксперт ИИ-направления ПравоТех