Вы на странице
Диссертация по досудебным процедурам и криминалистике
Юристы и правоведы!
Читайте диссертации, повышайте свою экспертность!
Основные разделы библиотеки:
Тематические каталоги всей литературы по экономике и праву
Тематические каталоги по видам документов: Учебники ДИССЕРТАЦИИ - уникальная коллекция Дипломы и ВКР
Алфавитный каталог Учебники и монографии
Алфавитный каталог Диссертации кандидатские и докторские
1 ОБЗОР ПРОБЛЕМ И РЕШЕНИЙ В ОБЛАСТИ АНАЛИЗА ТЕКСТОВ ДЛЯ ЗАДАЧ КИБЕРБЕЗОПАСНОСТИ 20 1.1 Идентификация автора текста и защита интеллектуальной собственности 20 1.1.1 Методы статистического анализа . 23 1.1.2 Методы машинного обучения .. 25 1.1.3 Методы глубокого обучения .... 28 1.2 Определение пола и гендера, возраста автора. выявление признаков лгбт и педофилии 32 1.2.1 Определение пола и возраста автора текста 33 1.2.2 Определение признаков ЛГБТ в тексте .. 38 1.2.3 Модели компьютерного зрения для определения возраста автора 40 1.3 Идентификация автора сообщений в сети интернет и продленная аутентификация пользователя социальных сетей ... 41 1.4 Определение автора программного кода.. 47 1.5 Определение настроения и деструктивной направленности в текстах 56 1.5.1 Определение тональности текста . 58 1.5.2 Определение деструктивной и экстремистской направленности в текстах .. 62 1.6 Анонимизация, имитация и генеративные модели как методы атаки на методы идентификации автора ... 69 1.6.1 Обфускация . 71 1.6.2 Имитация 73 1.6.3 Генеративные модели 75 1.6.4 Атаки на методы идентификации автора программного кода .. 77 1.7 Выводы по главе .... 80 2 МЕТОДОЛОГИЯ ИДЕНТИФИКАЦИИ АВТОРА ТЕКСТОВОЙ ИНФОРМАЦИИ ДЛЯ РЕШЕНИЯ ЗАДАЧ КИБЕРБЕЗОПАСНОСТИ .. 83 2.1 Этапы создания методологии .... 83 2.2 Авторская методология идентификации автора для решения задач кибербезопасности .. 85 2.3 Авторская модель создания автором текста в киберсреде с учетом семантики . 88 2.4 Используемые модели представления текста .... 99 2.4.1 Модель «мешка слов» (BOW) .. 99 2.4.2 Модели на основе n-грамм 100 2.4.3 Модель на основе TF-IDF .. 102 2.4.4 Модели на основе Word2Vec . 103 2.4.5 Модели на основе предобученных эмбеддингов . 105 2.5 Используемые алгоритмы разбора текста ... 107 2.6 Используемые методы семантического анализа .. 109 2.6.1 Методы иерархической кластеризации . 110
2.6.2 Методы на основе плотности объектов 110 2.6.3 Методы на основе центроидов .... 111 2.6.4 Методы на основе плотности вероятности 111 2.6.5 Методы на основе графов .. 112 2.6.6 Методы на основе плотности признаков ... 113 2.6.7 Методы на основе статистических моделей ... 114 2.6.8 Семантические нейросетевые методы .. 114 2.7 Используемые методы принятия решений . 116 2.7.1 Методы на основе статистики 117 2.7.2 Методы на основе классических алгоритмов машинного обучения 120 2.7.3 Методы на основе нейронных сетей 124 2.7.4 Методы на основе глубокого обучения 127 2.8 Используемые методы оптимизации гиперпараметров .. 135 2.9 Используемые методы снижения размерности .... 137 2.9.1 Методы на основе фильтрации ... 138 2.9.2 Методы на основе оберточных моделей .... 141 2.10 Используемые методы сглаживания 143 2.11 Различие естественно- и искусственно-языковых текстов .... 144 2.12 Выводы по главе 145 3 МЕТОДИКА ИДЕНТИФИКАЦИИ АВТОРА ЕСТЕСТВЕННО-ЯЗЫКОВОГО ТЕКСТА .... 147 3.1 Закрытая и открытая атрибуция, верификация автора ... 147 3.2 Методика идентификации автора для случая закрытой атрибуции ... 149 3.2.1 Предварительная обработка данных 150 3.2.2 Формирование признакового пространства в задаче идентификации автора текста . 150 3.2.3 Отбор информативных признаков .... 151 3.2.4 Валидация модели .... 152 3.3 Результаты экспериментов по определению авторства в случае закрытого множества кандидатов .... 155 3.3.1 Художественные тексты .... 155 3.3.2 Тексты авторов-любителей .... 164 3.3.3 Короткие тексты пользователей социальных сетей . 167 3.3.4 Случай использования генеративных моделей .... 171 3.4 Методика верификации автора 173 3.5 Методика идентификации автора для случая открытой атрибуции .. 175 3.5.1 Метод на основе комбинации одноклассового SVM и GRU+CNN .. 176 3.5.2 Метод на основе распределения вероятностей Softmax при использовании GRU+CNN .... 176 3.5.3 Метод на основе порогового значения расстояния Евклида ... 177 3.5.4 Метод на основе порогового значения косинусного сходства 177 3.6 Результаты экспериментов по определению авторства в случае открытого множества кандидатов .... 178 3.6.1 Художественные тексты .... 179 3.6.2 Тексты авторов-любителей .... 180
3.6.3 Короткие тексты пользователей социальных сетей . 182 3.7 Оценка разработанных методик в сравнении с аналогами . 182 3.8 Выводы по главе .. 183 4 МЕТОДИКА ИДЕНТИФИКАЦИИ АВТОРА ИСХОДНОГО КОДА ПРОГРАММЫ 186 4.1 Выбор подходов к идентификации автора исходного кода программы 187 4.2 Сложные случаи идентификации автора исходного кода ... 191 4.2.1 Обфускация исходного кода .. 191 4.2.2 Использование стандартов кодирования ... 192 4.2.3 Использование нескольких языков программирования 193 4.2.4 Искусственно-сгенерированные исходные коды . 194 4.2.5 Коммиты исходных кодов программ .... 195 4.3 Предварительная оценка подходов к идентификации автора исходного кода программы .. 196 4.4 Методика идентификации автора исходного кода программы на основе CodeBERT ... 197 4.5 Результаты экспериментов . 198 4.5.1 Результаты экспериментов для простых случаев идентификации автора исходного кода ... 200 4.5.2 Результаты экспериментов для сложных случаев идентификации автора исходного кода ... 201 4.6 Выводы по главе .. 207 5 ПРИМЕРЫ ПРИМЕНЕНИЯ РАЗРАБОТАННОЙ МЕТОДОЛОГИИ К РЕШЕНИЮ ВАЖНЫХ НАРОДНО-ХОЗЯЙСТВЕННЫХ ЗАДАЧ . 209 5.1 Методика определения текстов деструктивной и экстремистской направленности 209 5.1.1 Описание методики .. 210 5.1.2 Семантическая кластеризация .... 212 5.1.3 Трансферное обучение .. 219 5.1.4 Определение автора текста, имеющего деструктивную и экстремистскую направленность .... 220 5.1.5 Результаты исследования методики . 220 5.1.6 Выводы по подразделу.. 230 5.2 Методика определения возраста автора текстовой информации .. 232 5.2.1 Описание методики .. 232 5.2.2 Результаты экспериментов 239 5.2.3 Выводы по подразделу.. 241 5.3 Методика идентификации пола и гендера автора текстовой информации, включая представителей ЛГБТ-сообщества 242 5.3.1 Описание методики .. 243 5.3.2 Формирование признакового пространства ... 244 5.3.3 Ансамбль на основе SVM, CNN и BERT ... 246 5.3.4 Постановка экспериментов и результаты .. 247 5.3.5 Оценка методики в сравнении с аналогами .... 253
5.3.6 Выводы по подразделу.. 254 5.4 Методика проверки однородности текста и поиска заимствований . 255 5.4.1 Описание методики .. 256 5.4.2 Результаты экспериментов по выявлению плагиата 260 5.4.3 Выводы по подразделу.. 264 5.5 Выводы по главе .. 265 6 АЛГОРИТМИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ, НАБОРЫ ДАННЫХ ДЛЯ АНАЛИЗА ЕСТЕСТВЕННО- И ИСКУССТВЕННО-ЯЗЫКОВЫХ ТЕКСТОВ В ЗАДАЧАХ КИБЕРБЕЗОПАСНОСТИ .... 266 6.1 Программный комплекс для получения информативных признаков текста на основе семантического анализа «PyAuthorship» ... 266 6.1.1 Структура программного комплекса ... 266 6.1.2 Подсистема сбора образцов текстов .... 267 6.1.3 Подсистема хранения информации 269 6.1.4 Подсистема анализа естественного языка 274 6.1.5 Подсистема анализа искусственного языка .. 279 6.1.6 Подсистема выделения информативных признаков .... 279 6.2 Программная система для идентификации автора письменной речи «Авторовед» 284 6.3 Чат-бот для определения возраста автора текстового сообщения «Age Detector» . 287 ...
Посмотрите
Вернуться в каталог диссертаций по расследованию преступлений 2025 год
Каталог всех диссертаций по расследованию преступлений (за все годы)
КРОМЕ ТОГО, по криминалистике и расследованию преступлений на нашем сайте есть Учебники и монографии, Дипломы и магистерские диссертации
Основные каталоги библиотеки
Тематические каталоги:
Вся литература по экономике и праву
По видам документов:
* Учебники
* Диссертации - УНИКАЛЬНАЯ КОЛЛЕКЦИЯ
* Дипломы и ВКР
Наша библиотека была разработана в 2008 году по заданию екатеринбургского филиала одного московского института. Через пару лет филиал был ликвидирован. К тому времени на сайте было 1100 электронных книг по экономике и менеджменту.
Нам, нескольким разработчикам, стало жалко накопленный материал, и мы продолжили пополнять сайт на общественных началах. В 2015 году мы зарегистрировали основной домен информ2000.рф (можно проверить на сайте reg.ru).
К настоящему времени на сайте есть книги, дипломы и диссертации. Всего более 9000 документов.