«Книга охватывает все основные аспекты Trino – от конкретных вариантов использования до способов применения этого механизма в крупном масштабе».
Ашиш Кумар Сингх, технический руководитель проектов в компании Pinterest
Выполняйте быстрые интерактивные аналитические операции с данными из...
Этот курс предназначен для специалистов, анализирующих огромные наборы данных, а также разработчиков, использующих R в своих проектах.
Цель курса – предоставить слушателям знания и навыки, необходимые для создания и запуска сценариев анализа большихданных на сервере Microsoft R. Также в курсе...
Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения в оперативной памяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его...
PRAR: Практическая архитектура данных
Классические методы, современные подходы и лучшие практики архитектуры и интеграции данных для проектных команд.
На примерах платформенных решений, корпоративных фабрик данных, микросервисов и веб-приложений.
Архитектура данных (Data Architecture):
Это...
Казалось бы, термин «большие данные» понятен и доступен только специалистам. Но автор этой книги доказывает, что анализданных можно организовать и в простом, понятном, очень эффективном и знакомом многим Excel. Причем не важно, сколько велик ваш массив данных. Техники, предложенные в этой...
Описание книги:
«В это новое издание Уэс внес изменения, так чтобы книга и дальше оставалась востребованным источником по всем аспектам анализа данных с применением Python и pandas. Горячо и настоятельно рекомендую».
Пол Берри, лектор и автор книги «Head First Python»
Перед вами авторитетное...
Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных.
Среди рассматриваемых тем:
• подключение к данным из...
Коммерческое бесстрашие
Мыслить так, чтобы достигать больших целей
Как создать внутреннее состояние и мотивационную среду для успеха в продажах.
Развивать бизнес без коммерческого мышления все равно что готовить сложное блюдо без рецепта. Можно иметь отличные ингредиенты и навыки, но...
Аналитика большихданных для руководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.
О продукте:
Сегодня...
«Благодаря простым и понятным объяснениям, практическим идеям и примерам эта книга представляет большую ценность».
Филипп Бах, разработчик библиотек DoubleML для Python и R
Почему получается тот или иной результат? Что могло бы привести к другому итогу? Это важнейшие вопросы...
BDAM: Аналитика большихданных для руководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.
О продукте:
Сегодня...
Книга является пособием для изучения технологий большихданных, охватывая основные и продвинутые аспекты работы с данными в распределенных системах. Начав с основ, она объясняет значение БД, их эволюцию и экосистему Hadoop, включая компоненты и инструменты: HDFS, MapReduce, Hive, Pig, HBase...
Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД
Введение в GreenPlum
Архитектура GreenPlum
Партиционирование таблиц, индексы
Транзакции и блокировки
Оптимизация и планы запросов
Лабораторная работа
Часть 2. Внешние данные и код: GreenPlum как агрегатор данных и исполнитель кода...
Описание
О чем эта книга
Автор этой книги понятным неспециалисту языком рассказывает о том, что такое большие данные, как они меняют мир и что нужно делать, чтобы повысить уровень аналитики в своей организации и принимать взвешенные решения, основанные на информации. Из этой книги вы узнаете...
Книга о том, как распознавать ложь, дезинформацию, фейковые новости и не попасться на удочку красивых графиков, убедительной статистики и наукообразных терминов.
В отличие от прямой лжи чушь звучит весьма правдоподобно. Это информация, про которую нельзя однозначно сказать, что она ложна, но...
Перед вами полноценный путеводитель в увлекательный мир обработки данных при помощи Pandas, NumPy и Scikit-learn. Она содержит множество примеров, которые помогут вам научиться преобразовывать сырые крупицы данных в настоящий шедевр из ценной информации и аналитических выводов. Книга написана...
Технология хранения и обработки большихданных Hadoop (Тимур Машнин)
Apache Hadoop - это платформа для распределенной обработки больших наборов данных на кластерах компьютеров с использованием простых моделей программирования. В этой книге вы познакомитесь с общей архитектурой платформы...
Программа курса Администрирование кластера Kafka
1. Введение в Kafka
Что такое Apache Kafka?
Сценарии использования Kafka
Компоненты Kafka и Kafka экосистемы
Архитектура Kafka
Кластер Zookeeper (Установка кластера Kafka без использования Zookeeper KIP-500)
2. Основные концепции Kafka
Как...
The Big Data Developer Course
Master the most in-demand big data skills: Hadoop, Sqoop, Hive, Spark, Scala, Cassandra, HBase, NIFI, Kafka and more
Чему вы научитесь:
Понимание архитектуры Hadoop
Понимание форматов файлов и возможность выбрать правильный формат для данного варианта...
Автор: Феррари А., Руссо М..
Дата выхода: май 2020 года
Объем, стр.: 288
ISBN: 978-5-97060-858-6
Формат: pdf от издательства
Если вы хотите использовать Power BI или Excel для анализа данных, реальные примеры из этой книги позволят вам иначе посмотреть на свои отчеты. С правильно...