На главную страницу сайта

Алфавитный каталог учебников и монографий

Тематические каталоги по видам документов: Учебники   Диссертации   Дипломы и ВКР

Магистерская диссертация: Разработка систмы кредитного скоринга на основе моделей машинного обучения. 2024

Полный текст бесплатно

Оглавление

ГЛАВА 1... 11 
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ  11 
1.1. Анализ проблематики исследовательской работы . 11 
1.2. Оценка возможных сложностей проведения исследовательской 
работы .... 12 
1.3. Учёт специфики предметной области и исследование методов 
разработки модели машинного обучения . 14 
1.3.1. Формальная постановка задачи .... 14 
1.3.2. Методы разработки моделей машинного обучения .... 16 
1.3.2.1. Логистическая регрессия. .... 16 
1.3.2.2. Случайный лес . 18 
1.3.2.3. Градиентный бустинг. ... 19 
1.3.3. Метрики оценки качества моделей машинного обучения. .... 21 
1.3.3.1. Матрица ошибок (Confusion matrix) . 22 
1.3.3.2. Аккуратность (Accuracy) . 24 
1.3.3.3. Точность (Precision) .. 24 
1.3.3.4. Полнота (Recall) ... 25 
1.3.3.5. F-мера (F-score)  25 
1.3.3.6. Площадь под кривой ошибок (ROC-AUC) . 25 
ГЛАВА 2... 28 
ПРАКТИЧЕСКАЯ ЧАСТЬ .. 28 
2.1. Разведочный анализ данных и предварительная обработка  28 
2.1.1. Исследовательский анализ данных – EDA  28 
2.1.1.1. Основные выводы по результатам разведочного анализа данных 58 
2.1.2. Предварительная обработка данных . 58 
2.1.2.1. Обработка пропущенных значений  58 
2.1.2.2. Обработка категориальных признаков .. 59 
2.1.2.3. Логарифмирование числовых признаков ... 60 
2.1.2.4. Обработка параметров с количеством дней .... 61 
2.1.2.5. Агрегация данных  61 
2.1.3. Разработка дополнительных и оптимизация имеющихся признаков 
параметров модели – Feature Engineering.  63 
2.1.3.1. Application data feature engineering. . 64 
2.1.3.2. Bureau_balance data feature engineering. . 67 
2.1.3.3. Bureau data feature engineering. . 68 
2.1.3.4. Installments_payments data feature engineering.  70 
2.1.3.5. POS_CASH_balance data feature engineering. .. 72 
2.1.3.6. Previous_application data feature engineering. ... 72 
2.1.3.7. Credit_card_balance data feature engineering. .... 74 
2.1.3.8. Cross-table feature engineering. .. 74 
2.1.4. Разработка моделей машинного обучения и оценка их качества. ... 75 
2.1.4.1. Логистическая регрессия. .... 76 
2.1.4.2. Метод случайного леса. . 77 
2.1.4.3. Градиентный бустинг с помощью XGBoost. .. 80 
2.1.4.4. Градиентный бустинг с помощью LightGBM.  83 
2.1.4.5. Повышение качества модели LightGBM с помощью байесовской оптимизации гиперпараметров.  88 
ГЛАВА 3... 95 
ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ .. 95 
3.1. Необходимые условия внедрения проекта .... 95 
3.2. Эксперимент на независимых данных и оценка инструмента по 
результатам эксперимента ... 99 
3.3. Перспективы совершенствования разработанного инструмента . 100 
3.4. Условия прекращения решения задачи автоматизированным способом 101 
3.5. Оценка эффективности реализации проекта .... 102 
ЗАКЛЮЧЕНИЕ . 104 
БИБЛИОГРАФИЧЕСКИЙ СПИСОК ... 106 
ПРИЛОЖЕНИЕ А (ОБЯЗАТЕЛЬНОЕ) ЛИСТИНГ ОСНОВНЫХ 
ЭЛЕМЕНТОВ ПРОГРАММЫ ... 110 
ПРИЛОЖЕНИЕ Б (СПРАВОЧНОЕ) ХРАНИЛИЩЕ ФАЙЛОВ 
РАЗРАБОТАННОГО РЕШЕНИЯ... 131 

Полный текст магистерской диссертации


Вернуться в Каталог дипломов и магистерских диссертаций по банковскому делу

КРОМЕ ТОГО, по проблемам банков на нашем сайте есть Учебники и монографии и Диссертации кандидатские и докторские

Полный каталог литературы по экономике и праву

Литература по смежным проблемам

На главную страницу сайта

Алфавитный каталог учебников и монографий

Тематические каталоги по видам документов: Учебники   Диссертации   Дипломы и ВКР