1 Укажите все правильные ответы.
К логическим методам относятся:
2 Укажите все правильные ответы.
Подход Web Usage Mining технологии Data Mining для решения Web-задач включает следующие основные направления:
3 Укажите правильный ответ.
Пример: «место, которое команда заняла на соревнованиях» является:
4 Укажите все правильные ответы.
Назовите факторы, обусловившие возникновение и развитие Data Mining:
5 Укажите правильный ответ.
Подготовка данных в процессе Data Mining является:
6 Укажите правильный ответ.
Данные представляют собой:
7 Укажите все правильные ответы.
Назовите факторы, обусловившие возникновение и развитие Data Mining:
8 Укажите все правильные ответы.
Правильными являются следующие утверждения:
9 Укажите все правильные ответы.
По критерию постоянства данные подразделяются на:
10 Укажите правильный ответ.
Какая из перечисленных ниже групп методов достаточно часто использует для выявления взаимосвязей в данных концепцию усреднения по выборке?
ProM Tools Process Mining: знакомство, функционал, демонстрация работы
11 Укажите правильный ответ.
Пример: «пол (мужской и женский)» является:
12 Укажите все правильные ответы.
Стадиями Data Mining являются:
13 Укажите правильный ответ.
Пример: «температура воздуха днем — 19 градусов, вечером – 14» является:
14 Укажите все правильные ответы.
Подход Web Content Mining технологии Data Mining для решения Web-задач включает следующие основные направления:
15 Укажите все правильные ответы.
Data Mining – это процесс обнаружения сырых данных
16 Укажите правильный ответ.
В процессе работы Data Mining программы пользователь может получить такие результаты:
17 Укажите все правильные ответы.
На получение описательных результатов направлены методы:
18 Укажите все правильные ответы.
К стадиям Data Mining относят:
19 Укажите правильный ответ.
Оцените правильность утверждения: «Data Mining может заменить аналитика»
20 Укажите все правильные ответы.
Особенностями областей успешного применения технологии Data Mining являются:
Источник: studizba.com
Ответы на тест 1. Интеллектуальный анализ данных
- Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для:
принятия решений в различных сферах человеческой деятельности - Атрибут – это:
свойство, характеризующее объект - В процессе работы Data Mining программы пользователь может получить такие результаты:
большой процент ложной информации из комментария (см. ниже) - Данные могут быть получены в результате:
всего вместе - Данные представляют собой:
все вместе - Данные — это …
необработанный материал, предоставляемый поставщиками данных и используемый потребителями для формирования информации на основе данных - Два основных типа переменных в статистике:
Качественные и количественные - Для какой шкалы применимы только такие операции как равно и не равно?
номинальная шкала - Для какой шкалы применимы только такие операции как равно, не равно, больше, меньше?
порядковая шкала - Задачей классификации можно назвать предсказание.
категориальной зависимой переменной, основываясь на выборке непрерывных и/или категориальных переменных - Задачей регрессии можно назвать предсказание.
числовой зависимой переменной, основываясь на выборке непрерывных и/или категориальных переменных - Задачи классификации решаются следующими алгоритмами:
- нейронные сети
- линейной регрессии
- Задачу классификации нельзя решить с помощью.
алгоритма Apriori - Закономерности, найденные в процессе использования технологии Data Mining должны обладать такими свойствами:
- быть практически полезными
- быть объективными
- быть неочевидными
- Изначальная предопределенность классов является характеристикой задачи …
классификации - Инструменты Data Mining
могут самостоятельно строить гипотезы о взаимосвязях в данных - Интервальная шкала – это шкала
разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла - К какой категории данных относится вес измеряемых объектов:
непрерывным данным - К классу описательных задач Data Mining относятся такие задачи:
- кластеризация
- поиск ассоциативных правил
- К классу прогнозирующих задач Data Mining относятся такие задачи:
- регрессия
- классификация
- Классификация относится к стратегии:
обучения с учителем - Классификация относится к:
- управляемому обучению
- контролируемому обучению
- Классификация — это .
отнесение объектов к одному из заранее известных классов - Метод деревьев решений применяется для решения задач …
классификации - Множество примеров, используемое для конструирования модели, называется.
обучающим множеством - Множество примеров, используемое для проверки работы сконструированной модели, называется.
тестовым множеством - Назовите факторы, обусловившие возникновение и развитие Data Mining:
- совершенствование алгоритмов обработки информации
- накопление большого количества ретроспективных данных
- совершенствование технологий хранения и записи данных
- совершенствование аппаратного и программного обеспечения
- Номинальная шкала – это шкала,
содержащая только категории, которые не могут упорядочиваться - Объект описывается как …
набор атрибутов - Объектом не является:
переменная - Основная характеристика задачи бинарной классификации:
зависимая переменная может принимать только два значения - Оцените правильность утверждения: «Извлечение полезных сведений невозможно без хорошего понимания сути данных»
утверждение верно - Оцените правильность утверждения:»Data Mining может заменить аналитика»
- технология всего лишь дает аналитику инструмент для облегчения и улучшения его работы
- технология не может дать ответы на те вопросы, которые не были заданы
- Подготовка данных в процессе Data Mining является:
существенным этапом работы - Порядковая шкала – это шкала, содержащая
категории, которые могут упорядочиваться
под сомнением
Data mining на практике. Подводные камни анализа данных / Ксения Петрова / COO dmlabs.org
- 03.12.2019 12:45 от admin Спасибо, изменил ответ 3 вопроса («в процессе работы Data Mining программы. «) с «только статистически достоверные результаты» на «большой процент ложной информации»
- 03.12.2019 11:50 от Гость 3 неверно
ответ: большой процент ложной инф
Добавить комментарий
- Английский язык
- Бухгалтерский учёт и анализ
- Вычислительные системы
- Интеллектуальный анализ данных
- Информатика и программирование
- Информационные сети
- Информационные системы и технологии
- История
- Математика
- Менеджмент
- Методы принятия управленческих решений
- Операционные системы
- Педагогика
- Психология
- Технологии обработки информации
- Физика
- Философия
- Экономика
- Электронное правительство
- Электронный документооборот
Источник: testanswer.ru
5.4 Технология Data Mining
По данным компании Gartner, неструктурированные документы составляют более 80% корпоративных данных, а количество внешних источников (интернет-ресурсов, блогов, форумов, СМИ) исчисляется миллионами. В них содержится гигантское количество данных, которые могут обеспечить компании существенное конкурентное преимущество. Основной вопрос — эффективность и скорость извлечения и анализа ценной информации.
Data Mining — «добыча» или «раскопка данных». Data Mining предназначены для решения задач интеллектуального анализа данных, что позволяет повысить эффективность принятия решений.
Data Mining — это процесс обнаружения в сырых данных:
1) ранее неизвестных и нетривиальных
2) практически полезных и доступных интерпретации знаний,
3) необходимых для принятия решений в различных сферах человеческой деятельности.
На рис. 28 представлены уровни знаний, извлекаемых из данных.
Рис. 28 Уровни знаний, извлекаемых из данных
Data Mining – это технология анализа информации с целью нахождения в уже накопленных предприятием данных ранее неизвестных, но практически полезных знаний, необходимых для принятия решений в различных областях человеческой деятельности.
Это процесс нахождения скрытых закономерностей в существующих данных.
Знания должны описывать новые связи между свойствами, предсказывать значения одних признаков на основе других.
Интеллектуальный анализ данных или «добыча данных» (Data Mining) позволяет проводить глубокие исследования данных, включающие:
- выявление скрытых зависимостей между данными
- выявление устойчивых бизнес-групп
- прогнозирование поведения бизнес-показателей
- оценку влияния решений на бизнес компании
- поиск аномалий и пр.
Типы закономерностей, которые позволяют выявлять методы Data Mining Выделяют пять стандартных типов закономерностей, которые позволяют выявлять методы Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и «кока-колу», а при наличии скидки за такой комплект «колу» приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка. Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником. С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил. Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных. Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается построить найти шаблоны, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем. На рис.29 представлены вопросы, на которые можно получить ответ, используя OLAP и технологию Data Mining. Рис. 29 Вопросы, на которые можно получить ответ, используяOLAPиData Mining. Для выполнения этих задач используют IBM SPSS, Oracle Data Mining, SAS Enterprise Miner. Методы Data Mining: нейронные сети, деревья решений, методы ограниченного перебора, генетические алгоритмы, эволюционное программирование, кластерные модели, комбинированные методы. Несмотря на обилие методов Data Mining, приоритет постепенно все более смещается в сторону логических алгоритмов поиска в данных if-then правил. С их помощью решаются задачи прогнозирования, классификации, распознавания образов, сегментации БД, извлечения из данных «скрытых» знаний, интерпретации данных, установления ассоциаций в БД и др. Результаты таких алгоритмов эффективны и легко интерпретируются. Но главной проблемой логических методов обнаружения закономерностей является проблема перебора вариантов за приемлемое время. ПрименениеData Mining Сфера применения Data Mining ничем не ограничена — она везде, где имеются какие-либо данные. Но в первую очередь методы Data Mining сегодня интересны компаниям, развертывающим проекты на основе информационных хранилищ данных (Data Warehousing).
- оценка влияния решений на бизнес компании
- прогнозирование движения клиентов
- повышение отклика на маркетинговые акции
- прогнозирование спроса и предложения
- анализ потребительских корзин
- выявление закономерностей и аномалий в данных
Некоторые бизнес-приложения Data MiningРозничная торговля. Предприятия розничной торговли сегодня собирают подробную информацию о каждой отдельной покупке, используя кредитные карточки с маркой магазина и компьютеризованные системы контроля. Вот типичные задачи, которые можно решать с помощью Data Mining в сфере розничной торговли:
- анализ покупательской корзины (анализ сходства) предназначен для выявления товаров, которые покупатели стремятся приобретать вместе. Знание покупательской корзины необходимо для улучшения рекламы, выработки стратегии создания запасов товаров и способов их раскладки в торговых залах.
- исследование временных шаблонов помогает торговым предприятиям принимать решения о создании товарных запасов. Оно дает ответы на вопросы типа «Если сегодня покупатель приобрел видеокамеру, то через какое время он вероятнее всего купит новые батарейки и пленку?»
- создание прогнозирующих моделей дает возможность торговым предприятиям узнавать характер потребностей различных категорий клиентов с определенным поведением, например, покупающих товары известных дизайнеров или посещающих распродажи. Эти знания нужны для разработки точно направленных, экономичных мероприятий по продвижению товаров.
Банковское дело. Достижения технологии Data Mining используются в банковском деле для решения следующих распространенных задач:
- выявление мошенничества с кредитными карточками. Путем анализа прошлых транзакций, которые впоследствии оказались мошенническими, банк выявляет некоторые стереотипы такого мошенничества.
- сегментация клиентов. Разбивая клиентов на различные категории, банки делают свою маркетинговую политику более целенаправленной и результативной, предлагая различные виды услуг разным группам клиентов.
- прогнозирование изменений клиентуры. Data Mining помогает банкам строить прогнозные модели ценности своих клиентов, и соответствующим образом обслуживать каждую категорию.
Телекоммуникации. В области телекоммуникаций методы Data Mining помогают компаниям более энергично продвигать свои программы маркетинга и ценообразования, чтобы удерживать существующих клиентов и привлекать новых. Типичные мероприятия:
- анализ записей о подробных характеристиках вызовов. Назначение такого анализа — выявление категорий клиентов с похожими стереотипами пользования их услугами и разработка привлекательных наборов цен и услуг;
- выявление лояльности клиентов. Data Mining можно использовать для определения характеристик клиентов, которые, один раз воспользовавшись услугами данной компании, с большой долей вероятности останутся ей верными. В итоге средства, выделяемые на маркетинг, можно тратить там, где отдача больше всего.
Страхование. Страховые компании в течение ряда лет накапливают большие объемы данных. Здесь обширное поле деятельности для методов Data Mining:
- выявление мошенничества. Страховые компании могут снизить уровень мошенничества, отыскивая определенные стереотипы в заявлениях о выплате страхового возмещения, характеризующих взаимоотношения между юристами, врачами и заявителями.
- анализ риска. Путем выявления сочетаний факторов, связанных с оплаченными заявлениями, страховщики могут уменьшить свои потери по обязательствам. Известен случай, когда в США крупная страховая компания обнаружила, что суммы, выплаченные по заявлениям людей, состоящих в браке, вдвое превышает суммы по заявлениям одиноких людей. Компания отреагировала на это новое знание пересмотром своей общей политики предоставления скидок семейным клиентам.
Источник: studfile.net