Главная » 2019»Октябрь»27 » Microsoft SQL Server 2012. Реализация хранилищ данных
11:05
Microsoft SQL Server 2012. Реализация хранилищ данных
Microsoft SQL Server 2012. Реализация хранилищ данных — Официальный учебный курс Microsoft рассматривает технологии реализации и обслуживания хранилищ данных, которые обеспечивает SQL-Server 2012. Описаны проектирование, реализация и усовершенствование потока управления и потока данных, создание надёжного перезапускаемого пакета, динамических пакетов, аудит и ведение журналов, установка служб SSIS и развёртывание пакетов, выполнение и безопасность пакетов, устранение неисправностей и настройка производительности, установка и поддержка Data Quality Services, реализация Master Data Services, управление основными данными, создание проекта качества для очистки данных.
Название: Microsoft SQL Server 2012. Реализация хранилищ данных Автор: Сарка Д., Лах М., Йеркич Г. Издательство: Русская редакция Год: 2014 Страниц: 805 Формат: PDF Размер: 10,2 МБ ISBN: 978-5-7502-0431-1 Качество: отличное Язык: русский
Содержание:
Учебный курс 70-463. Реализация хранилищ данных с помощью Microsoft SQL Server 2012 Введение Системные требования Требования к SQL Server и другому программному обеспечению Требования к оборудованию и операционной системе Требования к данным О прилагаемом компакт-диске Установка заданий пробного экзамена Использование пробного экзамена Удаление ПО пробного экзамена Благодарности Техническая поддержка и обратная связь Ошибки и опечатки Нас интересует ваше мнение Оставайтесь на связи Подготовка к экзамену ЧАСТЬ I. РАЗРАБОТКА И РЕАЛИЗАЦИЯ ХРАНИЛИЩА ДАННЫХ Глава 1. Логическое проектирование хранилища данных ЗАНЯТИЕ 1. Знакомство со схемами "звезда" и "снежинка" Проблемы формирования отчетов в нормализованной модели Схема "звезда" Схема "снежинка" Степень гранулярности Аудит, происхождение и преобразования данных ПРАКТИКУМ. Схема интернет-продаж из базы данных AdventureWorksDW2012 Задание 1. Изучение схемы базы данных AdventureWorksDW2012 Задание 2. Анализ диаграммы Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Проектирование измерений Типы столбцов в измерениях Иерархии Медленно меняющиеся измерения ПРАКТИКУМ. Изучение измерений из базы данных AdventureWorksDW2012 Задание 1. Исследование измерений AdventureWorksDW2012 Задание 2. Дальнейший анализ диаграммы Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Разработка таблиц фактов Типы столбцов в таблицах фактов Аддитивность мер Аддитивность мер в SSAS Отношения "многие-ко-многим" ПРАКТИКУМ. Изучение таблиц фактов из базы данных AdventureWorksDW2012 Задание 1. Создание диаграммы для таблицы фактов из AdventureWorksDW2012 Задание 2. Анализ столбцов таблицы фактов Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Краткосрочный пробный проект Упражнение 2. Расширение краткосрочного пробного проекта Результаты опроса Вопросы Рекомендуемые упражнения Тщательно изучите базу данных AdventureWorksDW2012 Найдите SCD и сведения о жизненном пути данных в базе данных AdventureWorksDW2012 Глава 2. Реализация хранилища данных ЗАНЯТИЕ 1. Реализация измерений и таблиц фактов Создание базы данных хранилища Реализация измерений Реализация таблиц фактов ПРАКТИКУМ. Реализация таблиц измерений и фактов Задание 1. Создание базы данных хранилища данных и последовательности Задание 2. Создание измерений Задание 3. Создание таблицы фактов Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Управление производительностью хранилища данных Индексирование измерений и таблиц фактов Индексированные представления Правильные приемы написания запроса Сжатие данных Индексы columnstore и пакетная обработка ПРАКТИКУМ. Загрузка данных, применение сжатия данных и индексы columnstore Задание 1. Загрузка вашего хранилища данных Задание 2. Применение сжатия данных и создание индекса columnstore Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Загрузка и аудит загрузок Применение секций Жизненный путь данных ПРАКТИКУМ. Секционирование таблицы Задание 1. Подготовка таблицы фактов к секционированию Задание 2. Загрузка данных с минимальным протоколированием в секционированную таблицу Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Медленные отчеты хранилища данных Упражнение 2. Проблемы администрирования хранилища данных Рекомендуемые упражнения Протестируйте разные методы индексирования Протестируйте секционирование таблицы ЧАСТЬ II. РАЗРАБОТКА ПАКЕТОВ SSIS Глава 3. Создание пакетов SSIS ЗАНЯТИЕ 1. Применение SQL Server Import and Export Wizard Планирование простого перемещения данных ПРАКТИКУМ. Простое перемещение данных Задание 1. Извлечение данных из представления и загрузка их в таблицу Задание 2. Просмотр файлов пакета SSIS Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Разработка пакетов SSIS в SSDT Введение в SSDT ПРАКТИКУМ. Начало работы в SSDT Задание 1. Создание нового проекта SSIS Задание 2. Изучение проектирования потока управления SSIS Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Знакомство с потоком управления, потоком данных и диспетчерами соединений Введение в разработку SSIS Знакомство с развертыванием проекта SSIS ПРАКТИКУМ. Изменение имеющегося перемещения данных Задание 1. Вставка имеющегося пакета SSIS в проект SSIS Задание 2. Редактирование пакета SSIS, созданного мастером SQL Server Import and Export Wizard Задание 3. Настройка соединений и запуск пакета SSIS в режиме отладки Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Копирование производственных данных в среду разработки Упражнение 2. Параметризация диспетчеров соединений Рекомендуемые упражнения Применяйте правильные средства Выявление и учет отличий между рабочей средой и средой разработки Глава 4. Проектирование и реализация потока управления ЗАНЯТИЕ 1. Диспетчеры соединений Область видимости диспетчеров соединений 32- и 64-разрядные поставщики данных Параметризация ПРАКТИКУМ. Создание диспетчера соединений Задание 1. Создание и настройка диспетчера соединений Flat File Задание 2. Создание и настройка диспетчера соединений OLE DB Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Задачи потока управления и контейнеры Планирование сложного перемещения данных Задачи Задачи подготовки данных Задачи рабочего процесса Задачи перемещения данных Задачи администрирования SQL Server Задачи обслуживания SQL Server Задачи служб Analysis Services Задача Script Task Пользовательские задачи Контейнеры ПРАКТИКУМ. Определение потока управления Задание 1. Применение пакета SSIS для обработки файлов Задание 2. Динамическое присваивание значений свойствам Задание 3. Подготовка и проверка выполнения пакета SSIS Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Элементы управления очередностью ПРАКТИКУМ. Определение элементов управления очередностью Задание 1. Применение элементов управления очередностью Задание 2. Перенаправление выполнения задач с помощью элементов управления очередностью со значением failure Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Разработка процесса очистки Упражнение 2. Интеграция внешних процессов Рекомендуемые упражнения Полное решение управления данными Глава 5. Проектирование и реализация потока данных ЗАНЯТИЕ 1. Определение источников данных и мест назначения Создание задачи потока данных Определение адаптеров источников потока данных Добавление адаптера источника потока данных с помощью Source Assistant Настройка адаптера источника потока данных Определение адаптеров назначения потока данных Настройка адаптера назначения потока данных Типы данных служб SSIS Использование быстрого синтаксического анализа ПРАКТИКУМ. Создание простых потоков данных Задание 1. Создание потока данных для размещения таблицы Person.Person Задание 2. Применение адаптера источника ODBC для размещения таблицы Sales.Customer Задание 3. Импорт данных из неструктурированных файлов Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Работа с преобразованиями потока данных Выбор преобразований Преобразования уровня строки Преобразования с несколькими входами и выходами Преобразования набора строк Дополнительные преобразования для подготовки данных Применение преобразований Разрешение ссылок на столбцы ПРАКТИКУМ. Применение преобразования потока данных Задание 1. Подготовка таблицы измерений dbo.Customers к загрузке в хранилище данных Задание 2. Загрузка таблицы измерений dbo.Customers в хранилище данных Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Выбор подходящих стратегии ETL и инструментов Стратегия ETL Архитектура ETL Преобразование Lookup Применение преобразования Lookup Применение преобразования Cache Transform с преобразованием Lookup Сортировка данных Обновления на основе наборов ПРАКТИКУМ. Усовершенствование преобразований потока данных Задание 1. Соединение и сортировка таблиц в промежуточной области Задание 2. Создание эффективных уточняющих запросов Задание 3. Обновление таблицы измерений Customer Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Система с новым источником Рекомендуемые упражнения Создайте и загрузите дополнительные таблицы ЧАСТЬ III. УСОВЕРШЕНСТВОВАНИЕ ПАКЕТОВ SSIS Глава 6. Усовершенствование потока управления ЗАНЯТИЕ 1. Переменные SSIS Системные и пользовательские переменные Типы данных переменных Область действия переменных Параметризация свойств ПРАКТИКУМ. Создание пользовательской переменной и параметризация задачи Задание 1. Подготовка среды Задание 2. Создание пользовательских переменных Задание 3. Параметризация задач потока управления с помощью переменных Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Диспетчеры соединений, задачи и выражения элементов управления очередностью Выражения Выражения свойств Выражения в элементах управления очередностью ПРАКТИКУМ. Использование выражений для параметризации объектов служб SSIS Задание 1. Использование выражения для присваивания значения переменной Задание 2. Применение выражений для управления поведением потока данных 254 Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Применение главного пакета в усовершенствованном потоке управления Разделение рабочих нагрузок, целей и задач Согласование рабочей нагрузки и конфигурации Задача Execute Package Task Задача Execute SQL Server Agent Job Task Задача Execute Process Task ПРАКТИКУМ. Создание и настройка главного пакета Задание 1. Подготовка среды Задание 2. Создание главного пакета Задание 3. Настройка главного пакета Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Полные решения Упражнение 2. Выполнение, управляемое данными Рекомендуемые упражнения Проанализируйте варианты применения главного пакета Глава 7. Усовершенствование потока данных ЗАНЯТИЕ 1. Медленно изменяющиеся измерения Определение типов атрибутов Выводимые элементы измерения Применение задачи Slowly Changing Dimension Эффективно обновляющиеся измерения Проверка изменений атрибутов Алгоритм обновления на основе наборов данных ПРАКТИКУМ. Реализация алгоритма обработки медленно изменяющегося измерения Задание 1. Загрузка измерения Customer с помощью преобразования Slowly Changing Dimension Задание 2. Модификация пакета для вставки процесса обновления на основе наборов данных Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Подготовка пакета к добавочной загрузке Применение динамического SQL для чтения данных Использование адаптера источника OLE DB Использование адаптеров источника ODBC или ADO.NET Реализация CDC с помощью служб SSIS Включение CDC в базе данных Компоненты CDC в службах SSIS Стратегия ETL для поэтапной загрузки таблиц фактов ПРАКТИКУМ. Реализация механизма отслеживания измененных данных (CDC) средствами SSIS Задание 1. Создание пакета начальной загрузки Задание 2. Создание пакета добавочной загрузки Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Поток ошибок Применение потоков ошибок ПРАКТИКУМ. Использование потока ошибок Задание. Добавление путей потока ошибок Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Загрузка больших таблиц измерений и фактов Рекомендуемые упражнения Загрузка добавочных измерений Глава 8. Создание надежного перезапускаемого пакета ЗАНЯТИЕ 1. Транзакции пакета Определение параметров транзакции пакета и задачи Уровни изоляции транзакции Транзакции, обрабатываемые вручную ПРАКТИКУМ. Реализация транзакций Задание. Включение поддержки транзакций и наблюдение за откатом транзакции Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Контрольные точки Создание контрольных точек для перезапуска пакета ПРАКТИКУМ. Установка и просмотр контрольных точек в пакете Задание. Просмотр контрольных точек Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Обработчики событий Применение обработчиков событий ПРАКТИКУМ. Создание обработчиков событий Задание. Применение обработчиков событий Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Аудит и уведомления в пакетах служб SSIS Рекомендуемые упражнения Применение транзакций и обработчиков событий Глава 9. Создание динамических пакетов ЗАНЯТИЕ 1. Параметры и диспетчеры соединений уровней пакета и проекта Применение диспетчеров соединений уровня проекта Параметры Использование параметров Определение параметров Конфигурации построения в службах SQL Server 2012 Integration Services Создание конфигураций построения Применение конфигураций построения Выражения свойств ПРАКТИКУМ. Применение параметров Задание 1. Задание параметра для строки соединения Задание 2. Использование параметра в задаче потока данных Задание 3. Использование конфигураций построения Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Конфигурации пакета Работа с конфигурациями пакета Создание конфигурации Создание XML-файла конфигурации Создание конфигурации SQL Server Вставка свойств в вашу конфигурацию Совместное использование, упорядочивание и редактирование конфигураций ПРАКТИКУМ. Использование конфигураций пакета Задание. Создание XML-файла конфигурации Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Превращение пакетов SSIS в динамические Рекомендуемые упражнения Использование параметра в добавочной загрузке таблицы фактов Глава 10. Аудит и ведение журналов ЗАНЯТИЕ 1. Ведение журналов пакетов Регистраторы или поставщики журналов Выбор регистратора Настройка ведения журналов Наследование настроек журнала Шаблоны настроек журналов ПРАКТИКУМ. Настройка ведения журналов SSIS Задание 1. Подготовка среды Задание 2. Настройка контейнера SSIS для ведения журнала событий Задание 3. Создание шаблона настроек журнала Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Выполнение аудита и фиксация жизненного пути данных Методы аудита Компонент преобразований потока данных Row Count Компонент преобразований потока данных Aggregate Компонент преобразований потока данных Audit Корреляция данных аудита и журналов SSIS Сохранение ПРАКТИКУМ. Реализация базового аудита Задание 1. Подготовка среды Задание 2. Реализация аудита уровня строки с помощью преобразования Audit Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Подготовка шаблонов пакета Шаблоны пакетов SSIS Создание шаблона пакета SSIS Применение шаблона пакета SSIS ПРАКТИКУМ. Создание и использование шаблона пакета SSIS Задание 1. Создание шаблона пакета SSIS Задание 2. Создание нового пакета SSIS с помощью шаблона пакета SSIS Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Реализация ведения журналов SSIS на нескольких уровнях иерархии объектов служб SSIS Упражнение 2. Реализация аудита SSIS на разных уровнях иерархии объектов служб SSIS Рекомендуемые упражнения Вставка аудита в операцию обновления имеющейся задачи Execute SQL Task Создание шаблона пакета SSIS в вашей собственной среде ЧАСТЬ IV. УПРАВЛЕНИЕ И ОБСЛУЖИВАНИЕ ПАКЕТОВ SSIS Глава 11. Установка служб SSIS и развертывание пакетов ЗАНЯТИЕ 1. Установка компонентов служб SSIS Подготовка установки SSIS Разработка или эксплуатация Аппаратные и программные требования Рекомендации по безопасности Сравнение 64- и 32-разрядных сред Установка SSIS Обновление служб SSIS Средства служб SSIS ПРАКТИКУМ. Установка служб SSIS Задание 1. Установка служб SSIS на имеющийся экземпляр SQL Server Задание 2. Проверка установки служб SSIS Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Развертывание пакетов SSIS Каталог SSISDB Настройка SSISDB Объекты SSISDB Папки Проекты и пакеты Параметры Серверные среды, серверные переменные и ссылки на серверную среду Операции Развертывание проекта ПРАКТИКУМ. Развертывание проектов SSIS Задание 1. Создание и настройка SSISDB Задание 2. Подготовка среды Задание 3. Развертывание проекта SSIS в среде SSDT с помощью Deployment Wizard Задание 4. Развертывание проекта SSIS с использованием SQL Server Management Studio Задание 5. Просмотр метаданных пакета SSIS в каталоге SSISDB Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Применение строго структурированных развертываний Упражнение 2. Установка сервера SSIS Рекомендуемые упражнения Обновление имеющихся решений SSIS Глава 12. Выполнение и безопасность пакетов ЗАНЯТИЕ 1. Выполнение пакетов SSIS Выполнение SSIS по требованию Среда SQL Server Management Studio DTExecUI Transact-SQL, Windows PowerShell, SSIS Managed API и DTExec Автоматическое выполнение SSIS SQL Server Agent Мониторинг выполнения SSIS Операции Проверки Выполнения Ведение журналов Мониторинг SSIS в SQL Server Management Studio ПРАКТИКУМ. Запуск и мониторинг процессов SSIS Задание 1. Проверка проектов и пакетов SSIS с помощью SSMS Задание 2. Выполнение и мониторинг пакета SSIS в среде SSMS Задание 3. Выполнение пакета SSIS с помощью DTExec Задание 4. Выполнение пакета SSIS с использованием Windows PowerShell Задание 5. Создание, настройка расписания и выполнение пакета SSIS с помощью SQL Server Agent Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Безопасность пакетов SSIS Безопасность SSISDB Участники Защищаемые объекты Разрешения ПРАКТИКУМ. Управление разрешениями SSISDB Задание 1. Создание пользователей SSISDB Задание 2. Создание и защита сред SSISDB Задание 3. Настройка проекта SSISDB Задание 4. Управление разрешениями проекта SSIS и их проверка Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Развертывание пакетов SSIS в нескольких средах Упражнение 2. Удаленные выполнения Рекомендуемые упражнения Расширение возможности многократного использования решения SSIS Глава 13. Устранение неисправностей и настройка производительности ЗАНЯТИЕ 1. Обнаружение и устранение проблем при выполнении пакетов Устранение неполадок времени разработки Отладка потока управления с помощью точек останова Применение средств просмотра данных в потоке данных Применение других методов для отладки Устранение неисправностей в процессе эксплуатации Устранение неисправностей с помощью каталога SSISDB Использование отводов данных ПРАКТИКУМ. Устранение неисправностей пакетов Задание 1. Исправление ошибки усечения Задание 2. Вставка отвода данных Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Настройка производительности Подсистема обработки потока данных SSIS Структура буфера данных Типы преобразований Деревья выполнения Механизм замедленной обратной реакции Варианты настройки потока данных Оптимизация буфера Рекомендации по повышению производительности потока данных Параллельное выполнение в службах SSIS Устранение неисправностей и контрольное тестирование производительности Применение каталога SSISDB для контрольного тестирования производительности пакета Мониторинг производительности SSIS с помощью счетчиков производительности ПРАКТИКУМ. Отслеживание выполнения пакета Задание 1. Отображение дерева выполнения Задание 2. Отслеживание выполнения пакета Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Настройка пакета SSIS Рекомендуемые упражнения Изучите, как следует представления каталога SSISDB ЧАСТЬ V. ПОСТРОЕНИЕ РЕШЕНИЙ DATA QUALITY Глава 14. Установка и поддержка Data Quality Services ЗАНЯТИЕ 1. Проблемы качества данных и роли Показатели качества данных Полнота Корректность Информативность Непротиворечивость Косвенные показатели Показатели качества схемы данных Действия по обеспечению качества данных и роли ПРАКТИКУМ. Поиск проблем качества данных Задание 1. Поиск проблем качества данных в AdventureWorksDW2012 Задание 2. Обзор потенциальных проблем качества данных в рабочей системе Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Установка служб Data Quality Services Структура служб DQS Установка DQS ПРАКТИКУМ. Установка служб Data Quality Services Задание 1. Запуск SQL Server Setup Задание 2. Выполнение послеустановочных задач DQS Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Поддержка и безопасность Data Quality Services Выполнение административных операций с помощью Data Quality Client Выполнение административных операций с помощью других средств ПРАКТИКУМ. Мониторинг операций DQS Задание 1. Создание вашего первого проекта DQS Задание 2. Мониторинг операций DQS Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Неиспользуемое хранилище данных Упражнения для самостоятельной работы Анализ базы данных AdventureWorksDW2012 Знакомство со средствами профилирования данных Глава 15. Реализация Master Data Services ЗАНЯТИЕ 1. Определение основных данных Что такое основные данные? Управление основными данными Трудности MDM ПРАКТИКУМ. Определение основных данных Задание 1. Определение основных данных в базе данных AdventureWorksDW2012 Задание 2. Определение основных данных в пользовательской рабочей системе Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Установка Master Data Services Структура служб Master Data Services Установка MDS ПРАКТИКУМ. Установка служб Data Quality Services Задание 1. Выполнение предустановочных задач Задание 2. Выполнение операций установки MDS Задание 3. Выполнение послеустановочных задач MDS Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Создание модели Master Data Services Модели MDS и объекты в моделях Объекты MDS ПРАКТИКУМ. Создание модели MDS Задание 1. Создание модели и базовых объектов Задание 2. Заполнение сущностей Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение 1. Ввод в действие решения MDM Упражнение 2. Расширение пилотного проекта Результаты опроса Вопросы Рекомендуемые упражнения Анализ базы данных AdventureWorksDW2012 Расширение модели MDS Глава 16. Управление основными данными ЗАНЯТИЕ 1. Импорт и экспорт основных данных Создание и развертывание пакетов MDS Импорт пакетов данных Экспорт данных ПРАКТИКУМ. Импорт и экспорт основных данных Задание 1. Создание пакета развертывания модели и развертывание пакета Задание 2. Импорт данных и создание представлений подписки Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Установка системы безопасности основных данных Пользователи и разрешения Перекрывающиеся разрешения ПРАКТИКУМ. Установка системы безопасности MDS Задание 1. Назначение разрешений Задание 2. Тестирование разрешений Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Использование надстройки Master Data Services для Excel Редактирование данных MDS в Excel Создание объектов MDS в Excel ПРАКТИКУМ. Применение надстройки MDS для Excel Задание 1. Загрузка данных MDS в программу Excel Задание 2. Изменение данных MDS в программе Excel Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Редактирование пакетов данных MDS Рекомендуемые упражнения Анализ промежуточных таблиц Проверка безопасности Глава 17. Создание проекта качества данных для очистки данных ЗАНЯТИЕ 1. Создание и обслуживание базы знаний Построение базы знаний DQS Управление доменом ПРАКТИКУМ. Создание базы знаний Задание 1. Применение обнаружения знаний Задание 2. Редактирование доменов Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Создание проекта качества данных Проекты DQS Очистка данных ПРАКТИКУМ. Создание проекта DQS Задание 1. Создание представления для очистки Задание 2. Очистка данных с помощью проекта DQS Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Профилирование данных и повышение качества данных Применение запросов для профилирования данных Задача SSIS Data Profiling Task ПРАКТИКУМ. Применение задачи SSIS Data Profiling Task Задание 1. Анализ представления TK463CustomersDirty Задание 2. Просмотр результатов профилирования Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Повышение качества данных Рекомендуемые упражнения Создание дополнительных базы знаний и проекта ЧАСТЬ VI. ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ О SSIS И DATA QUALITY Глава 18. Службы SSIS и интеллектуальный анализ данных ЗАНЯТИЕ 1. Задача и преобразование интеллектуального анализа данных Что такое интеллектуальный анализ данных? Алгоритмы интеллектуального анализа в службах SSAS Применение прогнозов интеллектуального анализа данных в службах SSIS ПРАКТИКУМ. Применение прогнозов интеллектуального анализа данных в службах SSIS Задание 1. Создание модели на основе дерева принятия решений Задание 2. Применение модели интеллектуального анализа в потоке данных SSIS Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Интеллектуальный анализ текста Извлечение терминов Уточняющий запрос термина ПРАКТИКУМ. Выполнение интеллектуального анализа текста Задание 1. Применение преобразования Term Extraction Задание 2. Использование преобразования Term Lookup Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Подготовка данных для интеллектуального анализа Подготовка данных Выборки SSIS ПРАКТИКУМ. Формирование случайной выборки Задание 1. Создание обучающего и проверочного наборов Задание 2. Тестирование разделения Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Подготовка данных для интеллектуального анализа Рекомендуемые упражнения Протестируйте преобразования Row Sampling и Conditional Split Глава 19. Применение пользовательского кода в пакетах SSIS ЗАНЯТИЕ 1. Задача Script Task Настройка задачи Script Task Написание кода для задачи Script Task ПРАКТИКУМ. Применение Script Task для чтения результатов задачи профилирования данных Задание 1. Использование задачи Data Profiling Задание 2. Применение задачи Script Task для обработки результатов профилирования данных Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Компонент Script Component Настройка компонента Script Component Кодирование компонента Script Component ПРАКТИКУМ. Использование результатов профилирования данных для обработки строк потока данных Задание 1. Подготовка среды Задание 2. Использование компонента Script Component Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Реализация пользовательских компонентов Планирование пользовательского компонента Разработка пользовательского компонента Время разработки и время выполнения Методы времени разработки Методы времени выполнения ПРАКТИКУМ. Разработка, развертывание и применение пользовательского компонента потока данных Задание 1. Подготовка среды Задание 2. Разработка пользовательского преобразования потока данных Задание 3. Развертывание пользовательского компонента потока данных Задание 4. Настройка и применение пользовательского компонента потока данных Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Очистка данных Рекомендуемые упражнения Создайте источник Web-службы Глава 20. Сопоставление и устранение дублирования ЗАНЯТИЕ 1. Представление о проблеме Проблемы сопоставления и дедупликации Решение проблем ПРАКТИКУМ. Подготовка данных Задание 1. Подготовка чистых данных Задание 2. Подготовка грязных данных Резюме занятия Закрепление материала ЗАНЯТИЕ 2. Применение служб DQS и преобразования DQS Cleansing Преобразование DQS Cleansing Сопоставление DQS ПРАКТИКУМ. Использование преобразования DQS Cleansing и сопоставления DQS Задание 1. Использование преобразования DQS Cleansing Задание 2. Использование сопоставления DQS Резюме занятия Закрепление материала ЗАНЯТИЕ 3. Использование нечетких преобразований SSIS Алгоритм нечетких преобразований Версии нечетких преобразований ПРАКТИКУМ. Использование SSIS-преобразования Fuzzy Lookup и надстройки MDS для Excel вместе с базой знаний DQS для сопоставления Задание 1. Применение Fuzzy Lookup Задание 2. Использование надстройки MDS для Excel и сопоставления DQS Резюме занятия Закрепление материала УПРАЖНЕНИЯ Упражнение. Повышение качества данных Рекомендуемые упражнения Дополнительно исследуйте сопоставление ОТВЕТЫ Упражнение. Повышение качества данных Предметный указатель Об авторах