Название: Базовые методы анализа данных: учебник и практикум для вузов, 3-е изд., перераб. и доп. Автор: Б.Г. Миркин Издательство: Юрайт Год: 2024 Страниц: 299 Язык: русский Формат: pdf Размер: 55.9 MB
Анализ данных — предмет, порожденный компьютерной революцией, приведшей к накоплению огромного количества конкретных данных о совокупностях объектов, таких как страны или регионы, веб-сайты, работодатели и работники, товары и продавцы. В отличие от классической математической статистики анализ данных не пытается вывести свойства окружающего мира исходя из специально собранных данных, а ориентирован на отыскание каких-либо паттернов, закономерностей, структуры в имеющихся данных.
В данном учебнике, подготовленном на основе большого международного опыта исследований и преподавания, излагаются основные методы анализа данных, относящихся прежде всего к одному или двум изучаемым признакам. Подробно рассмотрены вопросы анализа и интерпретации связей между двумя количественными, двумя качественными, а также качественным и количественным признаками. Из многомерных методов рассмотрены наивный Бэйесовский классификатор и метод К-средних для кластерного анализа, включая «интеллектуальную» версию с автоматическим определением числа кластеров и их начального местоположения. Изложение ориентировано на людей, предпочитающих не формулы, а вычисления, и содержит большое количество иллюстративных примеров применения рассматриваемых понятий к анализу реальных данных.
Термины «анализ данных» и «машинное обучение» часто рассматривают как взаимозаменяемые, т.е., синонимичные. В какой-то степени это можно объяснить тем, что зачастую эти дисциплины используют одни и те же методы многомерного анализа. Однако способы использования этих методов могут отличаться, и довольно сильно. Автор придерживается той точки зрения, что дисциплина анализа данных отличается тем, что обращается к данным как средству обогащения знаний о предметной области, прежде всего, в теоретическом аспекте, т.е. с точки зрения уточнения используемых понятий и отношений между ними. Машинное обучение же концентрируется на таких методах обработки данных, которые могут адаптироваться к данным, т.е. «учиться» в процессе решения задачи. Такое понимание близко к определениям, даваемым международными источниками.
Для студентов бакалавриата и магистратуры инженерно-технических специальностей, также может использоваться для самостоятельного изучения.
Скачать Базовые методы анализа данных: учебник и практикум для вузов, 3-е изд., перераб. и доп.
|