Мы в Твиттере
Мы в Контакте
Поиск

Экзамен Microsoft 70-773

Analyzing Big Data with Microsoft R

Продолжительность экзамена: - минут*
Язык: Английский

Варианты оплаты и стоимость экзамена

  1. Оплата по нашему счету. Стоимость экзамена Microsoft 70-773 по выставленному нами счету уточняйте у менеджера. По окончании тестирования выдаются закрывающие документы (акт и договор), а также результат экзамена в распечатанном виде.
  2. Прямая оплата банковской картой. Вы можете самостоятельно зарегистрироваться на экзамен 70-773 по стоимости вендора, оплатив его своей банковской картой. В этом случае наш центр тестирования не требует от вас дополнительной оплаты каких либо услуг, после сдачи экзамена выдается только распечатка результата.

Правила отмены и переноса экзаменов Microsoft

Изменения от 01.05.2017

Certify with Confidence

Предлагаем воспользоваться предложением Certify with Confidence. Приобретите Certify with Confidence вместе с экзаменационным ваучером Microsoft и получите еще две попытки! Стоимость пакета (экзамен + ваучер) уточняйте у менеджера.

Чтобы воспользоваться предложением добавьте в корзину экзамен и Certify with Confidence voucher.

Описание экзамена

Дата выхода: 3 января 2017.

Описание экзамена

Аудитория:

Кандидатами на экзамен 70-773 Analyzing Big Data with Microsoft R являются исследователи данных (data scientists) или аналитики данных, которые обрабатывают и анализируют наборы данных, превышающие объем памяти, с использованием языка R. Кандидаты должны иметь опыт работы с R, знакомство со структурами данных, знакомство с основными концепциями программирования и с написанием и отладкой R-функций.

Кандидаты должны быть знакомы с общими статистическими методами и лучшими практиками анализа данных. Кандидаты также должны иметь общее представление о платформах данных, таких как экосистема Hadoop, SQL Server и основные возможности T-SQL.

Tехнология:

Microsoft R Server, SQL R Services

Зачет в сертификацию: при успешной сдаче экзамена 70-773 Analyzing Big Data with Microsoft R, Вы выполняете одно из требований сертификации

MCSA: Machine Learning

Этот экзамен проводит оценку ваших способностей для выполнения технических задач, перечисленных ниже.

  • Чтение и исследование больших данных
  • Чтение данных с R Server

Чтение поддерживаемых форматов файлов данных, таких как текстовые файлы, SAS и SPSS; преобразование данных в формат XDF; определение изменений между XDF и текстовыми файлами; чтение данных через Open Database Connectivity (ODBC); чтение файлов из других файловых систем; использование внутреннего фрейма данных в качестве источника данных; обработка данных из источников, которые не могут быть прочитаны R Server

  • Обобщение данных

Расчёт кросс-таблиц и одномерной статистики; понимание, когда использовать rxCrossTabs или rxCube; интеграция с технологиями с открытым исходным кодом с помощью таких пакетов, как dplyrXdf; использование функционала group by; создание сложных формул для выполнения нескольких задач за один проход данных; извлечение квантилей с помощью rxQuantile

  • Визуализация данных

Визуализация данных в памяти с помощью базовых функций построения графиков и ggplot2; создание пользовательской визуализации с помощью rxSummary и rxCube; визуализация данных с помощью rxHistogram и rxLinePlot, включая фасеточные графики

  • Обработка больших данных
  • Обработка данных с помощью rxDataStep

Подмножество строк данных, изменение и создание столбцов с помощью аргумента Transforms, выбор между использованием преобразований «на лету» и преобразованными данными, обработка пропущенных значений посредством фильтрации или замены, генерация фрейма данных или файла XDF, обработка дат (POSIXct, POSIXlt)

  • Выполнение сложных преобразований, которые используют функции преобразования

Определение функции преобразования; изменение данных с помощью функции преобразования; использование пакетов с открытым исходным кодом, таких как lubridate; передача значений с помощью transformVars и transformEnvir; использование внутренних переменных .rx и функций для задач, включая взаимодействие cross-chunk

  • Управление наборами данных

Сортировка данных в различных порядках, таких как возрастание и убывание; использование дедупликации rxSort для удаления повторяющихся значений; объединение источников данных, используя rxMerge(); объединение опций и типов; определение, когда следует использовать альтернативы rxSort и rxMerge

  • Обработка текста с использованием пакетов RML

Создание объектов с использованием функций RML, таких как featurizeText(); создание переменных и массивов индикатора с использованием функций RML, таких как categoryorical() и categoryoricalHash(); выбор опций с помощью функций RML

  • Создание прогностических моделей с помощью ScaleR
  • Оценка линейных моделей

Использование rxLinMod, rxGlm и rxLogit для оценки линейных моделей; установка семейства для обобщенной линейной модели, используя такие функции, как rxTweedie; обработка данных «на лету», используя соответствующие аргументы и функции, такие как функция F и аргумент Transforms; измерение наблюдений по частоте или вероятности весов; выбор между различными типами автоматического подбора переменных, такими как жадный алгоритм поиска, повторный подсчет и побочный продукт обучения; определение влияния пропущенных значений при автоматическом выборе переменных

  • Создание и использование моделей разбиения

Использование rxDTree, rxDForest и rxBTrees для построения моделей разбиения; настройка веса ложных срабатываний и промахов, используя потери; выбор параметров, которые влияют на смещение и дисперсию, такие как отсечение, скорость обучения и глубина дерева; использование as.rpart для взаимодействия с экосистемами с открытым исходным кодом

  • Генерация прогнозов и остатков

Использование rxPredict для генерации прогнозов; выполнение параллельной оценки с использованием rxExec; генерация различных типов прогнозов, таких как оценки связей и ответов для GLM, отклика, вероятности и голосов за rxDForest; генерация различных типов остатков - Обычный, Пирсон и DBM

  • Оценка моделей и параметров настройки

Обобщение оценочных моделей; запуск произвольного кода вне процесса, например, параллельную настройку параметров с помощью rxExec; оценка древовидных моделей с помощью RevoTreeView и rxVarImpPlot; расчёт показателей оценки модели с помощью встроенных функций; расчёт показателей оценки модели и визуализации с помощью пользовательского кода, такого как средняя абсолютная процентная ошибка и кривые прецизионного возврата

  • Создание дополнительных моделей с использованием пакетов RML

Построение и использование одноклассового метода опорных векторов, построение и использование линейных и логистических регрессий, которые используют регуляризацию L1 и L2, построение и использование дерева решений с помощью FastTree, использование FastTree в качестве рекомендации с потерей ранжирования (NDCG), построение и использование простой трехуровневой нейронной сети с прямой связью

  • Использование R Server в различных средах
  • Использование различных контекстов вычислений для эффективной работы R Server

Изменение контекста вычисления (rxHadoopMR, rxSpark, rxLocalseq и rxLocalParallel); определение, какой вычислительный контекст использовать для различных задач; использование разных объектов источника данных в зависимости от контекста (RxOdbcData и RxTextData); определение и использование соответствующих источников данных для разных источников данных и вычисление контекстов (HDFS и SQL Server); отладка процессов в различных вычислительных контекстах; определение вариантов использования RevoPemaR

  • Оптимизация задач с использованием локальных вычислительных контекстов

Выявление и выполнение задач, которые могут быть запущены только в локальном контексте вычислений, определение задач, которые более эффективны для выполнения в локальном контексте вычислений, выбор между rxLocalseq и rxLocalParallel, профилирование в разных контекстах вычислений

  • Выполнение аналитики в базе данных с помощью SQL Server

Выбор между выполнением вычислений в базе данных и вычислениями вне базы данных, определение ограничений вычислений в базе данных, правильное использование контекстов вычислений в базе данных и вне базы данных, использование хранимых процедур для обработки данных, сериализация объектов и выполнение обратной записи для двоичных полей в таблице, запись таблиц, настройка R для оптимизации SQL Server (chunksize, numtasks и computecontext), эффективная передача свойств производительности администраторам и архитекторам SQL (SQL Server Profiler)

  • Реализация аналитических рабочих процессов в экосистеме Hadoop и Spark.

Использование соответствующих функций R Server в Spark; интеграция с Hive, Pig и Hadoop MapReduce; интеграция с экосистемой инструментов Spark, таких как SparklyR и SparkR; профилирование и настройка в разных вычислительных контекстах; использование doRSR для распараллеливания кода, написанного с использованием открытого кода foreach

  • Развертывание прогностических моделей в SQL Server и машинном обучении Azure

Развертывание прогностических моделей на SQL Server как хранимых процедур, развертывание произвольной функции в машинном обучении Azure с помощью пакета AzureML R, определение, когда следует использовать DeployR

Для подготовки к этому экзамену, Microsoft Learning рекомендует иметь практический опыт работы с технологией, использовать учебные ресурсы. Учебные ресурсы не обязательно охватывают все области в теме экзамена.

  • Обучение в классах: 20773A: Analyzing Big Data with Microsoft R (3 дня)
  • Интернет-ресурсы Microsoft:
    • Microsoft Learning Community: чтение новостей и посещение форумов, для общения с другими людьми и обмена опытом;
    • TechNet: Разработан для ИТ-специалистов, этот сайт содержит инструкции, как решать конкретные, практические задачи, материалы для скачивания, технические ресурсы, группы новостей и чаты.

* Указанная продолжительность может незначительно отличаться от времени, которое сообщается системой тестирования перед началом экзамена, в связи с регулярно вносимыми изменениями в сложность и количество вопросов
авторизованный центр тестирования Pearson VUE в СПб
Экзамен необходим для программ сертификации
› MCSE Data Management and Analytics
› MCSA Machine Learning
Рекомендуемые курсы для подготовки
№ 20773 Анализ Больших Данных с помощью Microsoft R

# По всем вопросам подготовки специалистов обращайтесь к менеджерам учебного центра
Калининой Лиле, Карповой Елене, Смирновой Светлане, Богдановой Ирине, Литвиновой Елене тел.  8 (812) 718-6184 (многоканальный).

# По вопросам заказа тестов в центре тестирования Pearson VUE просьба обращаться к администратору центра тестирования
Марии Смирновой тел. 8 (812) 326-78-30.