Автор: Д. А. Храмов
                     

Серия книг:

Жанр: интернет,программирование

Издатель: ДМК Пресс

Дата выхода: 2017

Возрастное ограничение: 0+

Тип: книга

ISBN: 978-5-97060-459-5

Цена: 519 Руб

Всё,что регистрирует человек и созданные им машины,может считаться данными.Фиксируя новое и переводя архивы в цифровую форму,мы с каждым днём производим всё больше данных.Но гораздо чаще случается так,что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов,заметках в социальных сетях,логах серверов и т.п.Прежде чем начать работать с такими данными,их необходимо собрать и сохранить в пригодном для анализа виде.Решению этих вопросов и посвящена данная книга. Основной материал книги разделён на две части.В первой части дано краткое введение в R-описание среды разработки,языка и основных пакетов-расширений.Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными,извлечению данных из веб-страниц и из социальных сетей.Также рассмотрены необходимые технические вопросы: протокол HTTP,функции импорта данных различных форматов и регулярные выражения.Завершается рассказ созданием карт на основе собранных данных. Издание предназначено специалистам по анализу данных,а также программистам,интересующихся сбором данных в Интернете.!