Методические указания и рекомендации «Анализ данных и статистика» в рамках дисциплины «Математика и информатика»
Тема «Анализ данных и статистика» в рамках дисциплины «Математика и информатика»
Дисциплину «Математика и информатика» студенты специальности 51.02.03 Библиотековедение изучают на 2 курсе. Данная дисциплина является логическим продолжением базовых курсов информатики и математики, которые изучаются на 1 курсе.
В рамках дисциплины «Математика и информатика» тема «Анализ данных и статистика» изучается, как самостоятельная учебная единица. Программа Microsoft Excel является программным обеспечение темы.
Цель обучения темы «Анализ данных и статистика» - научить студентов анализировать полученную информацию и проводить статистическую обработку данных с помощью компьютера.
В содержание темы можно выделить два компонента, один из них относится к математике, а другой к области информатики.
Содержание первого компонента:
- основы выборочного метода;
- выборка, ее характеристики;
- частотная таблица, числовые характеристики, полигон частот;
- интервальная таблица, числовые характеристики, гистограмма частот.
Содержание второго компонента:
- основы работы в программе MS EXCEL;
- сортировка данных;
- фильтры;
- условное форматирование;
- встроенные статистические функции;
- встроенные пакеты анализа данных;
- графическое представление данных.
В результате изучения темы обучающиеся должны уметь:
- собирать и обрабатывать информацию, необходимую для ориентации в своей профессиональной деятельности;
- оформлять в виде таблиц, графиков и диаграмм статистическую
информацию;
- вычислять основные статистические показатели;
- проводить анализ статистической информации и делать соответствующие выводы.
Хочется выделить ряд принципов, которые лежат в основе методических рекомендаций при изучении темы «Анализ данных и статистика».
Принцип междисциплинарных связей. Тема «Анализ данных и статистика» является математической, но преподается в рамках дисциплины информатики. К тому же, при составлении заданий для практических работ учитывается специфика студентов СПО специальности 51.02.03 Библиотековедение .
Принцип универсальности. Этот принцип заключается в том, что анализ и статистическая обработка данных является инструментом, которым учащиеся должны уметь пользоваться в исследовательской работе, в курсовом проектировании, при подготовке выпускной квалификационной работы. Главная цель рассматриваемых методов – предоставить количественные данные в сжатой форме, с тем, чтобы облегчить их понимание.
Принцип понятия анализа данных. Будем считать, что анализ данных – это:
- область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных данных;
- процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации и принятия решений.
Анализ данных имеет множество аспектов и подходов, охватывает разные методы в различных областях науки и деятельности.
Принцип многофункциональности пакета MS Excel. В программе MS Excel можно не только внести данные для обработки и хранения, но, главное, провести всесторонний анализ данных. При изучении темы «Анализ данных и статистика» будем использовать следующие типы анализа данных в MS Excel.
Первый тип - с помощью фильтра и сортировки.
Второй тип - c помощью условного форматирования.
Третий тип - с помощью графиков и диаграмм.
Четвертый тип - с помощью встроенных функций, включая статистические функции.
Пятый тип - с помощью встроенных пакетов. В состав Microsoft Excel входит пакет анализа, который позволяет осуществлять статистическую обработку данных в таблицах. В состав этого пакета входят разнообразные статистические методы.
Исходя из перечисленных принципов при изучении темы «Анализ данных и статистика» преподаватель ставит следующие цели и задачи:
- рассмотреть сущность каждого типа анализа
- провести практические занятия, на которых отрабатываются методы анализа
- научить пользоваться всеми методами в комплексе при решении задач на обработку и анализ данных
При изучении темы студенты должны знать:
- методы анализа данных
- базовые статистические функции, которые используются в программе MS Excel
При изучении темы студенты должны уметь:
- использовать методы анализа данных при решении задач, которые направлены на формирование профессиональных компетенций
- использовать при решении задач встроенные функции, включая статистические
- строить и читать графики и диаграммы
Тематическое планирование темы «Анализ данных и статистика»
Рассмотрим примерное тематическое планирование темы «Анализ данных и статистка» в рамках дисциплины «Математика и информатика» (Таблица 1).
Таблица 1 – Тематическое планирование темы «Анализ данных и статистика»
Наименование разделов и тем |
Содержание учебного материала, лабораторные работы и практические занятия, самостоятельная работа |
Объем часов |
Уровень освоения |
1 |
2 |
3 |
4 |
Тема «Анализ данных и статистика» |
Сущность выборочного метода. Выборка, ее представление и характеристики. Представление данных (таблицы, графики, диаграммы, гистограммы). Понятие о задачах математической статистики. Методы анализа данных в программе MS Excel. Сортировка данных. Использование фильтров. Условное форматирование. Встроенные статистические функции. Графики и диаграммы. Встроенные статистические пакеты.
|
4 |
1 |
Практические работы: Практическая работа №1 «Использование сортировки, условного форматирования и фильтра для представления данных» Практическая работа №2 «Использование встроенных функций в программе Microsoft Excel» Практическая работа №3 «Использование статистических функций и встроенных пакетов для анализа данных» |
6 |
|
|
Контрольная работа: Индивидуальная расчетная работа по теме «Обработка и анализ статистических данных» |
2 |
|
Содержание практических работ
Практическая работа №1 «Использование сортировки, условного форматирования и фильтра для представления данных»
Цель: научиться задавать сортировку по нескольким ключам, строить расширенный фильтр, использовать условное форматирование
Описание задания: на основе большого количества данных (рис.1), используя сортировку, фильтры и условное форматирование выполнить задания.
Отсортировать данные по фамилии клиента в алфавитном порядке.
Отсортировать данные по виду страхования, а для каждого вида страхования по стоимости страховки.
Используя условное форматирование, выделить ячейки красным цветом, все страховки, у которых истек срок страхования.
Используя фильтр, найти ответы на вопросы:
- Кто застраховал самую дорогую машину?
- Что застраховано у клиента с фамилией Корбут?
- Кто заплатил за страховку более 100000 рублей?
Рис. 1
Практическая работа №2«Использование встроенных функций для анализа данных»
Цель: научиться использовать встроенные функции СУММ, СУММЕСЛИ, СУММЕСЛИМН, СЧЕТ, СЧЕТЕСЛИ, СЧЕТЕСЛИМН, ЕСЛИ, СРЗНАЧ, СРЗНАЧЕСЛИ, СРЗНАЧЕСЛИМН, МАКС, МИН
Задание: используя возможности встроенных функций, заполнить пустые ячейки (рис.2).
Рис. 2
Практическая работа №3 «Использование статистических функций и встроенных пакетов для анализа данных»
Цель: научиться проводить анализ данных, используя статистические функции и возможности встроенного пакета для анализа данных.
Задание:
1) В Интернете найдите необходимую информацию о численности населения городов РФ. Для численности населения найти характеристики выборки (рис.3).
Рис. 3
2) Для предлагаемой выборки построить частотную таблицу (рис.4)
Рис. 4
3) Для предлагаемой выборки построить интервальную таблицу (рис.5).
Рис. 5
Контрольная работа «Обработка и анализ статистических данных»
Задание 1. Открыть сайт http://optom-knigi.ru/index.php/katalog-i-prajs-listy/22-print. Скачать с сайта любой прайс-лист на книги, который содержал бы представленную в таблице информацию о книгах. Количество книг должно быть не менее 100.
ISBN |
Автор |
Название |
Год |
Количество страниц |
Цена руб |
978-5-4461-0800-8 |
Назаров А. И. |
Обучение и развитие менеджеров отдела продаж |
2018 |
224 |
420,00
|
… |
… |
… |
… |
… |
… |
Задание 2. В программе Microsoft Excel решить следующие задачи:
Отсортировать данные таблицы по автору.
Используя условное форматирование, выделить красным цветом цену дорогих книг (цена более 500 руб).
Добавить столбец с название «цена в $». Построить формулу для перевода стоимости каждой книги в доллары по курсу 1$=73 руб.
Построить и заполнить таблицу по смыслу
Название и автор самой дорогой книга |
|
Название и автор самой тонкой книга |
|
ISBN книги, которая вышла в 2019 году и стоит больше 500 руб |
|
Общая стоимость всех книг |
|
Средняя цена одной книги |
|
Построить и заполнить таблицу по смыслу. Постройте гистограмму, которая бы отображала год выпуска и количество книг
Год |
Количество книг данного года выпуска |
2017 |
|
2018 |
|
2019 |
|
2020 |
|
Построить и заполнить таблицу по смыслу. Постройте круговую диаграмму, которая бы отображала, сколько стоят «тонкие» и «толстые» книг
Тип книги |
Общая стоимость книг данного типа |
«тонкие» - количество страниц до 200 |
|
«толстые» - количество страниц более 200 |
|
Уровень подготовленности студентов СПО не позволяет глубоко изучать вопросы математической статистики, но, опираясь на имеющиеся знания и используя возможности программы Microsoft Excel, можно сформировать у студентов понятие анализа данных, рассмотреть способы представления и характеристики выборки. Пакет Microsoft Excel должен стать инструментом для решения профессиональных задач по анализу и статистической обработке данных.
Список литературы
1. Бараз В.Р. Использование MS Excel для анализа статистических данных : учеб. пособие / В. Р. Бараз, В. Ф. Пегашкин; М-во образования и науки РФ; ФГАОУ ВПО «УрФУ им. первого Президента России Б.Н.Ельцина», Нижнетагил. техн. ин-т (филиал). − 2-е изд., перераб. и доп. − Нижний Тагил : НТИ (филиал) УрФУ, 2014. – 181 с.
2. Лапчик М.П. Методика преподавания информатики: Учеб. пособие для студ. пед. Вузов / М.П.Лапчик, И.Г.Семакин, Е.К.Хеннер; Под общей ред. М.П.Лапчика. – 2-е изд., стер. – М.: Издательский центр «Академия», 2005. – 624 с.