ИНФОРМАЦИОННО-КОМПЬЮТЕРНАЯ ЭКСПЕРТИЗА: КОГНИТИВНАЯ МОДЕЛЬ, СЕМАНТИЧЕСКИЕ МЕТОДЫ И ПРОБЛЕМЫ УСТАНОВЛЕНИЯ СОДЕРЖАТЕЛЬНЫХ ХАРАКТЕРИСТИК ЦИФРОВЫХ ОБЪЕКТОВ

ИНФОРМАЦИОННО-КОМПЬЮТЕРНАЯ ЭКСПЕРТИЗА:  КОГНИТИВНАЯ МОДЕЛЬ, СЕМАНТИЧЕСКИЕ МЕТОДЫ И ПРОБЛЕМЫ УСТАНОВЛЕНИЯ СОДЕРЖАТЕЛЬНЫХ ХАРАКТЕРИСТИК ЦИФРОВЫХ ОБЪЕКТОВ

Аннотация.  В статье исследуется информационно-компьютерная экспертиза (ИКЭ) как самостоятельное направление в системе судебных экспертиз, отличительной чертой которого является фокус на смысловом (семантическом) содержании, гносеологической природе и информационных свойствах цифровых объектов, а не только на их технико-функциональных аспектах.  Рассматривается место ИКЭ в контексте общей теории информации, её соотношение с компьютерно-технической и программно-компьютерной экспертизами.  Формулируется когнитивная модель экспертного исследования, включающая уровни синтактики, семантики и прагматики.  Детально анализируются методологические подходы к решению задач идентификации, классификации и оценки информационного воздействия, включая контент-анализ, лингвистический анализ, экспертизу гипертекстовых структур и сетевых коммуникаций.  Особое внимание уделяется проблемам установления авторства, плагиата, фактов манипуляции общественным сознанием, а также экспертной оценке информационной продукции в юридически значимых контекстах.  Выявляются специфические методологические и процессуальные сложности ИКЭ, связанные с субъективностью интерпретации, большими данными (Big Data) и необходимостью междисциплинарного синтеза знаний.

Ключевые слова:  информационно-компьютерная экспертиза, семантический анализ, информационный объект, контент-анализ, установление авторства, лингвистическая экспертиза, гипертекст, сетевая коммуникация, информационное воздействие, прагматика, большие данные, когнитивная модель.

Введение

Современное общество характеризуется как общество информационное, где ключевым ресурсом и объектом правового регулирования становится информация в её цифровом воплощении.  Споры и правонарушения всё чаще связаны не с физическими повреждениями компьютерных систем, а с созданием, распространением, модификацией и интерпретацией информационного содержания:  текстов, изображений, аудиовизуальных произведений, баз данных, гипертекстовых структур.  Для разрешения таких споров классической компьютерно-технической экспертизы, ориентированной на аппаратно-программный уровень, оказывается недостаточно.  Требуется экспертная деятельность, способная исследовать информационную сущность цифровых объектов, их смысловое наполнение, коммуникативную функцию и воздействие на реципиента.

Этим задачам отвечает информационно-компьютерная экспертиза (ИКЭ) – род судебной экспертизы, в рамках которого на основе специальных познаний в области информатики, теории информации, лингвистики, семиотики и психологии восприятия проводятся исследования цифровых объектов с целью установления их содержательных характеристик, информационных свойств, авторской принадлежности, признаков манипулятивного воздействия и иных обстоятельств, имеющих значение для дела.  Если компьютерно-техническая экспертиза отвечает на вопрос «как это работает?», а программно-компьютерная – «что делает эта программа?», то ИКЭ стревится ответить на вопросы «что это означает?», «кто это создал?» и «какой эффект это производит?».

Актуальность методологического осмысления ИКЭ обусловлена экспоненциальным ростом объёмов цифрового контента, усложнением форм его представления (мультимодальность, интерактивность) и обострением социально-правовых конфликтов в информационной сфере (диффамация, фейковые новости, кибербуллинг, незаконное использование персональных данных).  Цель данной статьи – построить теоретический каркас ИКЭ, определить её предметную область, разработать когнитивную модель исследования, систематизировать методы и выявить специфические проблемы этого формирующегося экспертного направления.

  1. Теоретические основы и предметная область информационно-компьютерной экспертизы

В основе ИКЭ лежит общая теория информации (К.  Шеннон, У. Р.  Эшби, Н.  Винер), но с акцентом не на статистической мере количества информации, а на её смысловом (семантическом) и прагматическом аспектах.  Объектом ИКЭ является информационный объект – целостная, логически завершенная совокупность данных, зафиксированных на цифровом носителе и обладающая признаками смыслового единства.  К ним относятся:

  1. Текстовые документы (статьи, письма, посты в соцсетях, комментарии).
  2. Гипертекстовые структуры (веб-сайты, блоги, wiki-страницы) с учётом связей между элементами.
  3. Мультимедийный контент (изображения, фотографии с метаданными, аудио- и видеозаписи).
  4. Базы данных и их представления (выборки, отчёты).
  5. Логи коммуникаций (переписка по email, в мессенджерах, чатах, форумах).
  6. Метаданные, отражающие контекст создания и использования информационного объекта.

Предметом ИКЭ являются фактические данные об информационных свойствах и характеристиках объекта, устанавливаемые путём экспертного исследования:

  • Смысловое содержание и тематическая направленность.
  • Структурно-композиционные особенности.
  • Признаки индивидуального стиля автора (идиостиля).
  • Признаки целенаправленного искажения, монтажа, фальсификации.
  • Признаки плагиата или неправомерного заимствования.
  • Потенциал информационно-психологического воздействия на определённую аудиторию.
  • Контекстные связи с другими информационными объектами.

Таким образом, ИКЭ занимает промежуточное положение между судебной компьютерно-технической экспертизой и традиционными гуманитарными экспертизами (лингвистической, искусствоведческой, психологической), выступая их цифровым интегратором.

  1. Когнитивная модель экспертного исследования в ИКЭ: уровни синтактики, семантики и прагматики

Экспертное познание в ИКЭ может быть представлено как движение по трём взаимосвязанным уровням, соответствующим разделам семиотики:

Уровень 1.  Синтактический (формально-структурный) анализ.
Исследование формальных признаков объекта безотносительно к его содержанию.  На этом уровне решаются задачи, сходные с компьютерно-технической экспертизой, но с информационной точки зрения:

  • Определение формата файла, кодировки, объема.
  • Анализация структурной разметки (HTML, XML, Markdown).
  • Исследование метаданных (EXIF у фотографий, заголовки электронных писем).
  • Выявление скрытой или служебной информации (стенография, водяные знаки).
  • Построение графов связей для гипертекстов (анализ ссылочной массы сайта).
    Методы:  хеширование, парсинг, анализ формальных грамматик.

Уровень 2.  Семантический (содержательно-смысловой) анализ.
Центральный уровень ИКЭ, направленный на извлечение и интерпретацию смысла.  Задачи:

  • Определение основной темы, ключевых понятий, тезауруса.
  • Выявление смысловых связей между частями документа или между документами в массиве.
  • Анализ тональности (сентимент-анализ) и оценочных суждений.
  • Выявление имплицитных смыслов, подтекста, иронии.
  • Установление смысловых искажений при редактировании или переводе.
    Методы:  контент-анализ (качественный и количественный), тематическое моделирование (Latent Dirichlet Allocation), лингвистический анализ с применением NLP (Natural Language Processing), сравнительный смысловой анализ.

Уровень 3.  Прагматический (контекстно-воздейственный) анализ.
Исследование отношения информационного объекта к его потребителю (реципиенту) и целям отправителя.  Задачи:

  • Определение целевой аудитории и коммуникативного намерения автора (информировать, убедить, манипулировать, оскорбить).
  • Оценка потенциального информационно-психологического воздействия контента на стандартного представителя целевой группы (вопрос о наличии признаков экстремизма, клеветы, разжигания вражды).
  • Анализ контекста публикации (место, время, сопутствующие события).
  • Исследование эффектов сетевого распространения информации (вирусность, формирование повестки).
    Методы:  дискурс-анализ, риторический анализ, экспертиза в рамках конкретной юридической конструкции (например, анализ на соответствие признакам состава ст.  282 УК РФ), анализ статистики вовлечённости (лайки, репосты, комментарии).
  1. Ключевые классы задач и методологические подходы в ИКЭ
  2. 1. Установление авторства и идентификация источника информации (автороведческая ИКЭ).
    Задача: определить, одним или разными лицами созданы тексты, либо принадлежит ли анонимный текст конкретному лицу.  В отличие от традиционной автороведческой экспертизы, ИКЭ оперирует цифровыми следами:
  • Стилометрический анализ:  статистическое исследование устойчивых параметров стиля (длина предложений, частотность слов, использование служебных частей речи, синтаксические конструкции).  Применяются алгоритмы машинного обучения для классификации.
  • Анализорфографических и пунктуационных «почерков»:  характерных ошибок, особенностей написания.
  • Исследование цифровых привычек:  времени активности, шаблонов именования файлов, использования специфических сокращений или смайликов.
  • Сравнение метаданных (если они не были целенаправленно удалены).
  1. 2. Выявление плагиата и неправомерных заимствований.
    Задача: установить факт и объем заимствования текста, кода, дизайна или иного контента.  Методы:
  • Поиск буквальных совпадений (string matching) с применением алгоритмов типа Rabin-Karp.
  • Анализ перефразирования и парафраза:  выявление смысловых совпадений при изменённой лексике с помощью векторных моделей слова (Word2Vec, GloVe) и анализа смысловой близости предложений.
  • Сравнение структурно-композиционных схем (для научных статей, веб-сайтов).
  • Анализ уникальности кода на основе сравнения абстрактных синтаксических деревьев.
  1. 3. Экспертиза содержания на предмет наличия юридически значимых признаков.
    Задача: выявить в информации признаки, соответствующие тому или иному юридическому составу (клевета, оскорбление, призывы к экстремизму, разглашение тайны).  Это требует междисциплинарного подхода:
  • Лингвистический компонент:  анализ значений слов, речевых актов, оценочности, инвективной лексики.
  • Информационно-психологический компонент:  оценка потенциального воздействия на адресата, способа подачи информации (эмоциональная окраска, использование мемов, визуального ряда).
  • Контекстный анализ:  изучение условий восприятия информации целевой аудиторией.
  1. 4. Анализ сетевых коммуникаций и гипертекстовых структур.
    Задача: исследовать структуру и содержание распределённых информационных образований.
  • Картография социальных сетей и форумов:  выявление ключевых агентов влияния, сообществ, потоков информации.
  • Анализ тональности и динамики обсуждений (opinion mining).
  • Исследование архитектуры веб-сайта для установления его целей (информационный, коммерческий, пропагандистский) и связей с другими ресурсами.
  1. Специфические проблемы и вызовы информационно-компьютерной экспертизы
  1. Проблема субъективности интерпретации.  Семантический и прагматический анализ неизбежно содержит элемент субъективной оценки эксперта.  Для минимизации этого необходима разработка формализованных, измеримых критериев, использование автоматизированных инструментов анализа как вспомогательных и принцип комиссионности при решении наиболее сложных вопросов.
  2. Проблема работы с Big Data.  Объектом исследования может являться огромный массив данных (например, все посты сообщества в социальной сети за год).  Требуется применение методов Data Science, машинного обучения и высокопроизводительных вычислений, что выходит за рамки традиционной экспертной практики.
  3. Проблема мультимодальности.  Современный контент часто представляет собой комплекс текста, изображения, звука и видео.  Их воздействие синергетично.  ИКЭ должна развивать интегративные методики, объединяющие анализ разных модальностей.
  4. Проблема процессуального статуса и валидации методов.  Многие методы машинного обучения (например, для установления авторства) являются «чёрным ящиком», и их выводы трудно объяснить в суде.  Требуется юридическое признание и стандартизация таких методик, а также подготовка экспертов, способных грамотно интерпретировать их результаты.
  5. Этическая проблема.  Эксперт, анализирующий контент, потенциально оказывается под его воздействием.  Особенно это касается материалов деструктивного содержания.  Необходимы протоколы психологической безопасности эксперта.
  1. Принципы и перспективы развития информационно-компьютерной экспертизы

Для успешного развития ИКЭ необходима реализация следующих принципов:

  1. Принцип междисциплинарного синтеза.  Подготовка экспертов должна объединять техническое образование (информатика) с гуманитарным (лингвистика, психология, право).
  2. Принцип формализации и верификации.  Максимально возможная формализация семантических и прагматических критериев, создание открытых эталонных корпусов текстов и валидированных алгоритмов.
  3. Принцип комплементарности автоматического и экспертного анализа.  Использование AI как инструмента для обработки больших объёмов данных и выявления паттернов, но с обязательным смысловым контролем и интерпретацией человеком-экспертом.
  4. Принцип процессуальной прозрачности.  Все этапы анализа, включая работу алгоритмов, должны быть документированы и представлены в заключении в доступной для понимания судом форме.

Перспективы ИКЭ связаны с созданием гибридных экспертных систем, интеграцией в правоприменение технологий семантического веба (Web 3. 0), разработкой стандартов для экспертизы искусственного интеллекта как генератора контента и формированием правовых основ для экспертизы в виртуальных и дополненных реальностях.

Заключение

Информационно-компьютерная экспертиза представляет собой закономерный и необходимый ответ экспертного сообщества на вызовы информационного общества.  Выходя за рамки технического анализа, она вторгается в сложнейшую область человеческой коммуникации – область смыслов, намерений и воздействий.  Её становление как строгой научной дисциплины сопряжено с преодолением фундаментальных методологических трудностей, связанных с природой самого объекта исследования – информации.

Однако именно эта сложность определяет её высокую социальную и правовую значимость.  Грамотно проведённая ИКЭ способна защитить авторские права, установить истину в делах о диффамации, противодействовать информационным манипуляциям и обеспечить справедливое правосудие в цифровую эпоху.  Будущее ИКЭ видится в её развитии как центральной экспертной дисциплины для работы с цифровым контентом, основанной на прочном синтезе компьютерных наук, лингвистики, психологии и юриспруденции, и вооружённой самым современным аналитическим инструментарием.  Это требует консолидированных усилий учёных, практиков и законодателей по формированию её методологического фундамента и правового поля.

Похожие статьи

Бесплатная консультация экспертов

Обжалование решения ВВК о категории годности
Экспертиза - 2 месяца назад

Обжалование решения ВВК о категории годности Алгоритмы действий при обжаловании

Может ли военкомат пересмотреть категорию годности?
Экспертиза - 2 месяца назад

Может ли военкомат пересмотреть категорию годности?

Как изменить категорию годности в военкомате?
Экспертиза - 2 месяца назад

Как изменить категорию годности в военкомате?

Задавайте любые вопросы

2+5=