Если вы выбираете между этими системами визуализации, то статья обязательная к прочтению.
Информация взята телеграмм канала «Налейте аналитику», где была очень классно упакована в пару записей без лишней воды.
Плюсы PowerBI
Гибкая ценовая политика (https://powerbi.microsoft.com/ru-ru/pricing/). Есть лицензии Pro, которые стоят 10$ в месяц на пользователя. То есть, если в небольшой компании, скажем, 2 аналитика и 28 человек, которым нужен доступ на просмотр отчетов — то это выйдет в 300$ в месяц (250 тысяч рублей в год). Возможности в Pro-версии, конечно, порезаны, но многим с головой хватит и этого — обновление по расписанию есть, коннекторы к десяткам источников данных на месте. Premium-версия отличается возможностью развернуть PBI на своем сервере и выделенным сервером отчетов, что нужно для компаний со строгой политикой безопасности и работы с большими объемами данных
Низкий порог вхождения в создание отчетов, буквально возможность создать отчет, не написав ни одной строчки кода. Да, в PBI есть свой язык формул — DAX и язык запросов Power Query (как и в Excel), но для несложных отчетов про это можно не вспоминать. После загрузки данных в PBI для работы с ними открывается визуальный интерфейс, очень сильно напоминающий Excel, в котором табличные данные легко обрабатываются, преобразуются, добавляются новые столбцы и вычисляются новые меры. Опять же, если приводить в качестве аналогии Excel, то это как записать макрос, только проще.
Tableau: приложение для работы с базами данных
Много разнообразных визуализаций — от столбчатых диаграмм до диаграмм Ганта и карты мира.
Неплохая мобильная версия, в т.ч. приложения для IOS/Android. Как и в Tableau, посмотреть в дороге, не упала ли вчера выручка, очень подойдет.
По единичному личному опыту — неплохая русскоязычная поддержка, вопрос был решен в течение 2 дней.
Минусы Power BI
Отсутствие PowerBI Desktop — основного инструмента создания отчетов и подключения к данным — на Mac OS.
Ограничения на объемы. Смешные для некоторых компаний ограничения на объемы в лицензии Pro — это еще ничего (1Гб размер отчета/файла .pbix, 10Гб размер одного источника данных), т.к. в Premium на порядки больше, подробнее здесь (https://powerbi.microsoft.com/ru-ru/pricing/). А вот ограничение в 150 тысяч строк на экспорт из отчета в Excel/csv — это в 2021 году недопустимо.
Конечно, прекрасно, что любой пользователь опубликованного отчета может скачать сырые данные таблиц/графиков себе в Excel/csv и работать с ними самостоятельно. Но 150 тысяч строк? Excel уже давно поддерживает 2 в степени 20 строк (если калькулятора под рукой нет, то это 1 048 576 строк), я писал об этом здесь (https://t.me/naleite/6). И этот объем лицензией Premium не увеличить.
Отсутствие в лицензии Pro жизненно необходимых функций. Понятно, что MS стимулирует выбирать более дорогую лицензию — но, например, инкрементальное добавление данных есть только в премиуме, что уже совсем нехорошо.
Подключение к локальным источникам через персональный шлюз работает не очень хорошо. Обновление в оперативной памяти компьютера, на котором установлен PowerBI Desktop при использовании персонального шлюза, ограничивает объем данных, которые может вместить PBI, а также загружает оперативку компьютера под 100%.
Несмотря на обилие визуализаций, к ним иногда возникают вопросы. Во-первых, вырвиглазные цвета в стандартной цветовой схеме — ярко-красный, очень интенсивный цвет морской волны, обилие каких-то козявочных оттенков. Иногда, чтобы добиться приемлемого вида, если категорий много, сидишь только над цветами по полчаса. Во-вторых, например, сглаженная линия, которую в 2 клика можно сделать в Excel, тут недоступна, что делает многие графики неприятно ломаными.
Плюсы Tableau
Действительно классно визуализирует данные, превращая их в крутые дашборды, являющиеся образцом качества и дизайна (чем могут похвастаться далеко не все визуализаторы)
Достаточно легкий и интуитивно понятный в использовании
Обладает высокой производительностью, потому что тянет даже очень big data
Поддерживает мобильную версию (что крайне важно, если вы, например, делаете много дашбордов с KPI, а у ваших заказчиков возникла резкая потребность что-то проверить — можете быть уверены, качество на мобильной версии не поедет)
Огромное сообщество пользователей Tableau -на 99,9% вопросов вы найдете ответы в различных видео на ютубе, stackoverflow, официальных видео на сайте инструмента и т.д.)
Минусы Tableau
Дорого и даже очень, поэтому подходит в большинстве своем для крупных компаний, которые могут себе это позволить
Ценообразование негибкое, то есть, отсутствует индивидуальный подход к клиентам и всем из них предлагается расширенная лицензия, хотя она может быть не особо актуальна для компании
Не самый безопасный инструмент — не обеспечивает 100% защиту данных
Фактическое отсутствие постпродажного обслуживания — в вашу проблему навряд ли будут вникать, скорее, просто предложат докупить какой-то пакет, и на сим поддержка закончится
Вечные проблемы с версиями — что-то будет доступно в старой версии, а что-то — уже нет
Несмотря на опцию постановки каких-то отчетов на расписание, тем не менее что-то придется перепинывать вручную, что не всегда удобно
Чтобы сделать какие-то элементы, которые часто нужны в дашбордах, вам часто может понадобиться использование различных костылей с копированием элементов из Гугла, хитровыдуманных функций и просмотров видео с коллегами из Индии
Источник: vc.ru
Как я самостоятельно освоила Tableau
Я работала аналитиком по качеству, а затем переквалифицировалась в аналитика данных. Несколько лет назад, во время реорганизации нашей компании, появилась возможность тестировать качество продукта с использованием доступных данных, и я, не задумываясь, воспользовалась ею.
Поскольку я, как тестировщик, хорошо знала продукт, то быстро научилась работать с одноразовыми дампами базы данных и создавать дашборды с использованием их в Google таблицах. Воодушевленная своими успехами, я попросила начальство предоставить мне лицензионный ключ Tableau и доступ к хранилищу данных нашей организации с правом считывания информации. Это дало бы мне возможность охватить более широкую пользовательскую аудиторию компании и стандартизировать дашборды, созданные с использованием Google таблиц. Руководство одобрило мою инициативу.
И вот тогда-то я научилась писать приличные SQL-запросы для получения данных и приступила к изучению дашбордов Tableau. Помню, была мысль проштудировать учебные материалы, представленные на веб-сайте Tableau (к слову, они очень подробные и полезные). Но так и не смогла найти времени для этого.
Вот то, что на самом деле помогло мне освоить искусство визуализации данных с помощью Tableau.
1. Использование доступных/уже существующих дашбордов Tableau
При использовании в аналитической работе готовых дашбордов мне зачастую нужно было осмысливать базовые данные и добавлять новые фильтры для дальнейшего мониторинга тенденций. Для этого я скачивала копию с сервера и пыталась понять, как автор оригинала структурировал его.
Так я получила представление о вычисляемых полях, типах фильтров и различных параметрах отображения фильтров.
Если у вас нет доступа к каким-либо дашбордам, можете загрузить их из Tableau Public (подробнее об этом позже).
2. Онлайн-сообщество Tableau
Всякий раз, когда мне нужно было что-то впервые сделать с данными, о чем я понятия не имела — будь то смешивание разных источников, использование селективных фильтров, фильтров действий, LOD-положений, — я искала помощи на форумах Tableau. Должна сказать, что мне всегда удавалось найти ответ на заданный вопрос.
Следуя полученным советам, я либо пробовала сделать то, что намеревалась, либо, узнав, что какая-то функция не поддерживается, находила обходные пути для достижения аналогичного результата. Я задавала вопросы на форуме, и люди давали действительно полезные советы. Вот ссылка на форум сообщества: https://community.tableau.com/s/explore-forums
3. Практика
В то время я была вовлечена в довольно интенсивную деятельность и еженедельно встречалась с первыми лицами компании, чтобы представить им свои находки и открытия. Я много чего перепробовала тогда, поскольку другого способа анализа данных, кроме постоянной практики, в то время еще не знала. Даже сегодня восхищаюсь своими тогдашними дашбордами. Конечно, все они подлежат соглашению о неразглашении, поэтому не могут быть опубликованы где-либо в Интернете. Но это не мешает мне гордиться ими.
4. Tableau Public
Я пристрастилась к Tableau с первых же месяцев освоения этого софта. Меня захватывает сторителлинг с использованием интерактивных визуализаций данных. Поэтому я не перестаю изучать новые и интересные способы визуализации данных. В Tableau есть публичная галерея, где авторы со всего мира публикуют свои работы. Это отличный способ узнать, чего можно достичь с помощью tableau.
До сих пор помню первую визуализацию, которая поразила меня и возбудила мой интерес. Это была работа Криса Лава “Спасение на Titanic”. Вот эта визуализация.
Кроме нее, здесь множество других потрясающих визуализаций. Вы можете следить за авторами, которые регулярно публикуют свои работы, и учиться полезным навыкам у самих экспертов.
5. Конкурсы визуализации Tableau
Из сведений об авторе под одной из визуализаций в публичной галерее я узнала о Makeover Monday. Этот конкурс организован онлайн-проектом vizwiz, который предоставляет каждому участнику набор данных и возможность создавать визуализации для презентации аналитической информации. В конкурсе участвуют люди со всего мира, и вы можете черпать вдохновение из множества работ.
6. Другие ресурсы
В Твиттере есть профиль группы под названием #datafam. Это потрясающая группа. Вы обязательно должны подписаться на нее, чтобы получать ежедневную порцию вдохновения и знать, что происходит в мире визуализации данных.
У основателя VizWiz Энди Крибеля также есть канал на YouTube, где он публикует видео с советами по продвижению в tableau. Можете подписаться на его канал на YouTube https://www.youtube.com/c/AndyKriebel/featured, чтобы узнать больше.
Надеюсь, эта информация поможет вам совершить увлекательное путешествие по Tableau и со временем стать аналитиком данных.
- Пусть говорят… расходящиеся гистограммы!
- 15 идей для вашего приложения. Часть 3
- 5 простых способов визуализации данных на Python. С кодом
Источник: nuancesprog.ru
Pro Tableau. Визуальная аналитика для бизнеса
В этой статье пойдёт речь об отличном инструменте для анализа данных — Tableau. Если быть точнее, это не просто инструмент, это — BI платформа, которая, согласно ежегодному авторитетному исследованию Gartner Magic Quadrant for Business Intelligence and Analytics Platforms, является одним из лидеров рынка платформ для бизнес-аналитики. Приведу несколько примеров использования Tableau :
- Анализ небольшого (до 1 Гб) набора данных на своём компьютере. Источники данных: структурированные файлы, базы данных, различные сервисы ( Google Analytics , Amazon ,…) и пр. Для этого можно использовать приложение Tableau Desktop .
- Инфографика для журналистов. Результаты работы можно опубликовать в публичном облаке Tableau Public . Вот интересный пример.
- Курсовые и дипломные работы по анализу данных для студентов – Tableau Desktop . Этот инструмент не бесплатный, но существует бесплатная лицензия на 1 год для студентов.
- Корпоративная аналитическая система с использованием Tableau Server или Tableau Online . Интерактивные дэшборды для большинства пользователей и ad — hoc ( self — service BI) для продвинутых аналитиков.
Я со своими коллегами занимаюсь разработкой и внедрением отчётно-аналитических систем и хранилищ данных для крупных организаций (банки и промышленные предприятия), поэтому статья эта будет больше интересна тем, кто разрабатывает или внедряет корпоративные решения либо планирует этим заняться у себя в организации. К слову, мы для своих прикладных решений используем не только Tableau , но и другие BI платформы (например, Oracle BI). Также стоит отметить, что Tableau – это наш никем не навязанный выбор и при выборе мы детально изучали около десятка других BI продуктов (Qlik Sense , Qlik View , MS BI , Micro strategy и др.).
Я не буду описывать здесь базовые вещи, для этого есть хорошие видеоматериалы. Далее следуют практические советы по использованию Tableau , которые, надеюсь, кому-то пригодятся.
DWH. To be or not to be?!
Сейчас компании-интеграторы очень активно продвигают Tableau и другие похожие продукты (например, Qlik ), часто предлагая быстрое внедрение, что естественно не предполагает разработку единого хранилища данных ( DWH ). Приходят к «Бизнесу», делают небольшой пилотный проект, после чего бизнес-пользователи атакуют ИТ подразделение с требованием поскорее эту «красоту» внедрить. Как временное решение — это вариант, но если думать на перспективу, то аналитику и отчётность в более-менее крупной организации с множеством источников данных однозначно правильнее внедрять на базе хранилища. Тем более, DWH тоже можно внедрять поэтапно с параллельным запуском аналитики.
Также часто встречается точка зрения, что инструменты класса Data Discovery (или modern BI platforms), к которому относится Tableau , не подходят для крупных централизованных аналитических систем. Ниже я приведу пару примеров в подтверждение того, что это не так и Tableau используется в очень масштабных системах.
Если хранилище, то на какой СУБД? На мой взгляд для аналитики идеально подходит хранилище на MPP (massively parallel processing) DB ( Teradata , HP Vertica , Greenplum и др.). Мы для новых проектов выбрали HP Vertica , также связка Tableau + Vertica в последнее время стала очень популярна в России. Альтернатива — DWH на реляционной СУБД, мы используем Oracle (ниже подробнее про Oracle ).
Отдельно упомяну вариант для очень больших объёмов данных – Apache Kylin — Extreme OLAP engine for Hadoop . Мы его пока не тестировали, но возможно кто-то в комментариях поделится впечатлениями.
Примеры масштабных внедрений Tableau в СНГ
- Wargaming (разработчик – World of Tanks ) – компания активно развивает много-терабайтное хранилище данных с использованием технологий Big Data (hadoop, kafka , oracle и др.), а для аналитики используется Tableau .
- YOTA NETWORKS – ещё одно крупное хранилище на HP Vertica и аналитика на Tableau . Короткий комментарий от одного из участников проекта.
Уточню, что к этим проектам я отношения не имею.
Архитектура в части организации доступа к данным (extract vs live)
В Tableau существует 2 варианта подключения к источникам данных:
- Extract – предварительное извлечение со сжатием всех данных из источника на диск и загрузка в оперативную память. Возможно инкрементальное обновление. Хорошо работает, когда данных не очень много (в пределах объёма оперативной памяти).
- Live – Tableau запрашивает из источника только те данные, которые запросил пользователь (например, генерируются SQL запросы в случае реляционной БД). Это предпочтительный вариант, когда у вас есть DWH с объёмом данных 1 Тб и выше. Но есть существенный нюанс – структуры хранения данных должны быть хорошо оптимизированы для быстрого чтения.
Так как наши решения базируются на DWH , то чаще всего мы используем Live режим. В 2-х словах опишу, что собой представляет хранилище данных в нашей реализации. Состоит оно из следующих основных слоёв:
- S taging L ayer – промежуточный накопитель исходной неочищенной информации из источников.
- Detail Data Store ( DDS) – консолидированная, преобразованная и очищенная детальная информация. Данные х ран я тся в нормализованном виде ( 3NF ) .
- Access Layer ( Data Marts ) – детальные данные, производные расчётные показатели, некоторые агрегаты. Используются принципы dimensional modeling ( Kimball approach ). Основное требование – быстрое чтение данных для отчётов и аналитики.
Запросы Tableau идут на 3-й слой, где данные хранятся в таблицах измерений (dimensions) и фактов (facts/measures). Дополнительным преимуществом такого хранения данных является возможность быстрого описания физической модели данных в Tableau , так как Tableau тоже оперирует понятиями Dimensions ). Какой-то помесячный график в Tableau требует просуммировать все операции из этой таблицы с группировкой по месяцам. В итоге такой запрос будет выполняться в несколько параллельных потоков, что значительно ускоряет запрос (но и требует больше ресурсов сервера). Эта возможность также доступна только в Oracle Enterprise Edition .
Существуют и некоторые другие приёмы ускорения запросов Tableau , поэтому если будет интерес к более детальному описанию, пишите в комментариях. Стоит ещё отметить, что описанные подходы и идеи можно использовать и в других СУБД.
Оптимизация производительности на стороне Tableau
В дополнение к предыдущему пункту добавлю, что на стороне Tableau также существует немало возможностей по тонкой настройке производительность. Эти техники неплохо описаны в официальной документации, а также в многочисленных англоязычных блогах по Tableau. Отмечу, что порадовали мощные фичи в части производительности, появившиеся с версии 9.0, среди которых, например:
- Parallel Queries – когда на дэшборде располагается несколько визуализаций (графиков/таблиц) запросы к данным могут выполняться параллельно;
- Query Fusion – технология уменьшения количества запросов для сокращения времени загрузки визуализации;
- External Query Caching – реализованы заметные улучшения по кэшированию результатов запросов.
Ещё в Tableau есть очень полезный инструмент, который помогает оптимизировать дэшборды: Help > Settings and Perfomance > Start/Stop Perfomance Recording . Инструмент позволяет проанализировать все этапы формирования дэшборда: посмотреть, какие запросы отправляются в БД; сколько времени они выполняются; какое время занимает прорисовка графиков и некоторые другие события. На картинке пример такого анализа, где сравнивается формирование 1-го дэшборда в разных версиях Tableau (демонстрируются улучшения 9-й версии):
Эффектная визуализация
На мой взгляд, намного приятнее и интереснее анализировать данные, когда инструмент предоставляет возможность создания эффектной, красивой и интерактивной визуализации. И Tableau как раз тот инструмент, который в этом очень хорош. К примеру, по версии ресурса Information I s B eautiful.net Tableau Public вошёл в 3-ку лучших Free Dataviz Tool 2015 вместе с D 3. js и R . Приведу ещё примеры наших дэшбордов.
Также стоит отметить, что Tableau позволяет интегрировать (встраивать) дэшборды в Ваши web приложения, что продемонстрировано в видео:
Ложка дегтя в бочке меда
Про многочисленные преимущества Tableau Вы можете прочитать самостоятельно, я же отмечу недостатки продукта, которые существенны для нас и которые, мы надеемся, будут устранены в будущих версиях:
- Отсутствие возможности «рисовать» отчёты строгой формы ( pixel perfect reporting ). Мы разрабатываем комплексные отчётно-аналитические решения и пока используем инструмент своей разработки для таких отчётов. Будет здорово, если кто-то поделится опытом использования хорошего open — source инструмента.
- Отсутствие локализации на русский язык (важно для некоторых наших клиентов).
- Tableau Server доступен только для Windows . Ждём версии для Linux.
- Визуализации и дэшборды можно создавать 2-мя способами: Tableau Desktop и через web — browser в случае использования Tableau Server . Удобнее 1-й вариант, а хотелось более продвинутого интерфейса в «тонком» клиенте.
В заключение
Цель данной статьи не только в том, чтобы помочь кому-то полезным советом в использовании Tableau . Хотелось бы также услышать альтернативные мнения и Ваш опыт. Если будет интерес к данной теме, я и мои коллеги постараемся осветить эти и другие вопросы более подробно.
!
Источник: datareview.info