02.12.2025 Новости, Искусственный интеллектИсследователи российской ИИ-компании Smart Engines представили первый в России масштабный датасет с поддельными документами — MIDV-DM. Он включает 8 тыс. изображений с удостоверениями личности РФ, СНГ и других стран. Вошедшие в набор образцы были изготовлены с помощью наиболее распространенных у мошенников методов подделки. Датасет позволит разработчикам со всего мира обучать, тестировать и совершенствовать антифрод-системы на базе ИИ. MIDV-DM стал первым публичным датасетом, который систематизировал все основные способы манипуляций с документами. В основу набора легла 1 тыс. изображений из ранее опубликованной исследователями Smart Engines выборки MIDV-2020: образцы внутреннего паспорта РФ, национальные паспорта и ID-карты Азербайджана, Латвии, Эстонии, Финляндии и других. Разработчики использовали такие манипуляции с документами, как вставка текстовых полей или фото из «донорского» документа, «маскирование» отдельных полей документа, склеивание разных фрагментов в один образ, вставка посторонних объектов — эмблем, голограмм и др. Новый набор данных позволяет разработчикам повышать точность антифрод-решений. Это особенно актуально на фоне участившихся случаев мошенничества с поддельными документами — в России число уголовных дел по фальсификации, изготовлению и обороту подделок (ст. 327 УК РФ) увеличилось на 34% и составило 3,9 тыс. в 2024 году. Такие данные представлены в ежегодном исследовании специалистов Smart Engines и юридической фирмы INTELLECT. «При создании MIDV-DM ...
читать далее.