Урок информатики в 11 классе на тему «Корреляционное моделирование»
Кучаева Юлия Юрьевна, учитель информатики, высшей категории
Название предмета: Информатика и ИКТ
Класс: 11
УМК: Информатика и ИКТ, И.Г. Семакин, Е.К. Хеннер, 2012 год
Уровень обучения: базовый
Тема урока: Корреляционное моделирование
Общее количество часов, отведенное на изучение темы: 1
Место урока в системе уроков по теме: 29
Цель урока:
познакомить с понятием корреляционная зависимость и научить производить расчеты коэффициента корреляции при помощи MS Excel.
Задачи урока:
Образовательные: систематизация представлений учащихся по математическому моделированию, демонстрация применения метода математического моделирования для решения прикладных задач, установление и констатация связи наук математика-экономика-информатика;
Развивающие: развитие системно-аналитического стиля мышления (на основе использования анализа, сравнения, обобщения, формализации информации, выявление причинно-следственных связей), развитие умения принимать обдуманные, рациональные решения;
Воспитательные: повышение уровня экономической грамотности учащихся.
Техника безопасности: соблюдение правил поведения в кабинете ИВТ и требований во время работы за ПК.
Планируемые результаты:
познакомить с понятием корреляционная зависимость, коэффициентом корреляции, научить определять с помощью табличного процессора MS Excel и статистических функций наличие зависимости между факторами, анализировать влияние факторов на процесс.
Техническое обеспечение урока: компьютеры с операционной системой Windows XP, карточки с кроссвордами, карточки с практическим заданием, мультимедийный проектор, презентация.
Тип урока: комбинированный
Методы: словесные, наглядные, практические.
Формы работы: фронтальная, коллективная, в парах.
Содержание урока:
Организационный момент.
Проверка домашнего задания.
Изучение нового материала.
Физминутка.
Практическая работа. ТБ.
Оценки за практическую работу.
Закрепление полученных знаний.
Домашнее задание.
Ход урока:
Организационный момент.
Здравствуйте ребята. Проверьте подготовку к уроку. Отсутствующие на уроке.
Проверка домашнего задания.
Что называют статистикой? (Наука о сборе, измерении и анализе массовых количественных данных).
Что называется регрессионной моделью? (Регрессионная модель, есть, прежде всего, гипотеза, которая должна быть подвергнута статистической проверке, после чего, она принимается, или отвергается. График функций, проходящий вблизи экспериментальных точек, где отклонения должны быть минимальными и равномерными).
Что подразумевается под восстановлением значения по регрессионной модели? (Прогноз, производимый в пределах экспериментальных значений независимой переменной, называется восстановлением значения по регрессионной модели)
Что такое экстраполяция? (Прогнозирование за пределами экспериментальных данных называется экстраполяция).
Для чего используется регрессионная модель? (Для прогнозирования).
Изучение нового материала.
Регрессионные математические модели строятся в тех случаях, когда известно, что зависимость между двумя факторами существует и требуется получить ее математическое описание. Давайте рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является фактор A, на него могут оказывать влияние одновременно многие другие факторы: B, C, D и так далее.
Рассмотрим два типа задач:
1) Требуется, определить, оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А?
2) Какие из факторов B, C, D и так далее оказывают наибольшее влияние на фактор А?
В качестве примера сложной системы рассмотрим школу. Пусть, для первого типа задач фактором А, является средняя успеваемость учащихся школы, фактором В финансовые расходы школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п. Здесь влияние фактора В на фактор А не очевидно. Наверное, гораздо сильнее на успеваемость влияют другие, причины: уровень квалификации учителей, контингент учащихся, уровень технических средств обучения и другие.
Специалисты по статистике знают, что для того, чтобы выявить зависимость от какого-то определенного фактора, нужно максимально исключить влияние других факторов. Проще говоря, собирая, информацию из разных школ, нужно выбирать такие школы., в которых приблизительно одинаковый контингент учеников, квалификация учителей и пр., нехозяйственные расходы школ разные (у одних школ могут быть богатые спонсоры, у других— нет).
Итак, пусть хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу учеников в школе (руб./чел.), потраченных за определенный период времени (например, за последние 5 лет). Успеваемость же, пусть оценивается средним баллом учеников школы по результатам окончания последнего учебного года (Таблица 1).
№ п/п | Затраты (руб./чел.) | Успеваемость (средний балл) |
1 | 50 | 3,81 |
2 | 345 | 4,13 |
3 | 79 | 4,30 |
4 | 100 | 3,96 |
5 | 203 | 3,87 |
6 | 420 | 4,33 |
7 | 210 | 4,00 |
8 | 137 | 4,21 |
9 | 463 | 4,40 |
10 | 231 | 3,99 |
11 | 134 | 3,90 |
12 | 100 | 4,07 |
13 | 294 | 4,15 |
14 | 396 | 4,10 |
15 | 77 | 3,76 |
16 | 480 | 4,25 |
17 | 450 | 3,88 |
18 | 496 | 4,50 |
19 | 102 | 4,12 |
20 | 150 | 4,32 |
Итоги сбора данных по 20 школам, введенные в электронную таблицу, представлены на рис. 1.
Рис. 1.
На рис. 1 приведена точечная диаграмма, построенная по этим данным, достаточно знать следующее: коэффициент корреляции (обычно обозначаемый греческой буквой р) есть число, заключенное в диапазоне, если это число по модулю близко к 1, то имеет место сильная корреляция, если к 0, то слабая: близость ρ к +1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, близость к -1 означает обратное: значение р легко найти с помощью MS Excel без всяких, формул (разумеется, потому, что в MS Excel они встроены).
В Excel функция вычисления коэффициента корреляции называется КОРРЕЛ и входит в группу статистических функций. Как же ей воспользоваться? Установим курсор на любую свободную ячейку и запустим функцию КОРРЕЛ. Она запросит два диапазона значений. Укажем В2:В21 и С2:С21. После их ввода выведется ответ: р= 0,500273843. Эта величина говорит о среднем: уровне корреляции.
Наличие зависимости между хозяйственными затратами школы и успеваемостью нетрудно понять. Ученики с удовольствием: ходят в чистую, красивую, уютную школу, чувствуют там себя, как дома, и поэтому лучше учатся.
В следующем примере проводится исследование по определению зависимости успеваемости учащихся старших классов от двух факторов: обеспеченности школьной библиотеки учебниками и обеспеченности школы компьютерами. И та и другая характеристика количественно выражаются в процентах от нормы. Нормой обеспеченности учебниками является их полный комплект, то есть такое количество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы: книги. Нормой обеспеченности компьютерами будем считать такое их количество, при котором на каждые четыре старшеклассника в школе приходится: один: компьютер. Предполагается, что компьютерами ученики пользуются не только на информатике, но и на других уроках, а также во внеурочное время.
В таблице 2, приведены результаты измерения обоих факторов в 10 разных школах. Напомним, что влияние каждого фактора исследуется независимо от других (то есть влияние других существенных факторов должно быть приблизительно одинаковым).
Значения обеих величин: финансовых затрат и успеваемости учеников имеют значительный разброс и, на первый взгляд, взаимосвязи между ними не видно. Однако она вполне может существовать.
Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционнными зависимостями.
Раздел математической статистики, который исследует такие зависимости, называется корреляиионным анализом. Корреляционный анализ изучает усредненный закон поведения каждой из величин в зависимости от значений другой величины, а также меру такой зависимости.
Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зависимости. В таком случае мерой корреляционной зависимости является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым он вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие.
Обеспечение учебного процесса | ||||
№ | Обеспеченность учебниками (% ) | Успеваемость (ср. балл) | Обеспеченность компьютерами (%) | Успеваемость (ср. балл) |
1 | 50 | 3.81 | 10 | 3.98 |
2 | 78 | 4.15 | 25 | 4.01 |
3 | 94 | 4.69 | 19 | 4.34 |
4 | 65 | 4.37 | 78 | 4.41 |
5 . | 99 | 4.53 | 45 | 3.94 |
6 | 87 | 4:23 | 32 | 3.62 |
7 | 75о | 4.73 | 90 | 4.6 |
8 | 63 | 3.69 | 21 | 4.24 |
9 | 79 | 4.08 | 34 | 4.36 |
10 | 94 | 4.2 | 45 | 3.99 |
| р= 0,780931 | р = 0.572465 | ...... . |
Таблица 4. Сравнение двух корреляционных зависимостей
Для обеих зависимостей получены коэффициенты линейной корреляции, как видно из таблицы, корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением, и. успеваемостью (хотя и тот и другой коэффициенты корреляции не очень большие). Отсюда можно сделать вывод, что пока, еще книга остается более значительным источником знаний, чем компьютер.
Физминутка.
Игра «Обсерватория». Учитель говорит и выполняет упражнения, а ученики повторяют.
Мы пришли в обсерваторию топ-топ (топаем ногами).
Открываем дверь (имитируем открывание двери).
Выдвигаем телескоп (одну руку к глазу, второй «выдвигаем», т.е. вверх от себя по диагонали).
Протираем стеклышки (круговые движения руками).
На небе зажглась одна звездочка - чпок (рука вверх, на слово «чпок» разжать кулак).
На небе зажглось много звездочек чпок, чпок, чпок, чпок... (обе руки вверх, на каждый чпок разжимаем кулак).
По небу пролетела комета - Вау! (правая рука снизу влево вверх по диагонали на слово «Вау»).
По небу пролетела летающая тарелка - бла, бла, бла (на «бла, бла, бла» машем руками, как крыльями, но чтобы не побили друг друга, руки лучше согнуть в локтях).
Из тарелки высунулся инопланетянин - Привет!!! (на «Привет» приветственно помахать рукой).
Практическая работа. ТБ.
Повторить технику безопасности при работе за компьютером.
Алгоритм действий по выполнению работы описан в практической работе. Расчет корреляционных зависимостей в MS Excel – с помощью функции КОРРЕЛ получить расчеты корреляционной зависимости величин, создать график. Все задания смотрите в практическом задании.
Оценки за практическую работу.
Закрепление полученного материала.
(Работа с учебником). Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными. С помощью корреляционного анализа можно решить следующие задачи:
определить, оказывает ли один фактор существенное влияние на другой фактор;
из нескольких факторов выбрать наиболее существенный фактор.
Количественной мерой корреляции двух величин является коэффициент корреляции.
Значение коэффициента корреляции лежит между -1 И +1. Чем его значение ближе по модулю к 1, тем корреляция (связь) сильнее.
В MS Excel для определения коэффициента корреляции используется функция КОРРЕЛ из группы статистических функций.
Домашнее задание.
Параграф 38, вопросы после параграфа № 1 в тетради письменно.
Приложение
Компьютерный практикум «Корреляционное Моделирование»
1 . Выполнить задание (зад_1) на ПК в MS EXCEL.
Построить точечный график по данным представленным в таблице в MS EXCEL.
Вычислить значение коэффициента корреляции с помощью статистической функции КОРРЕЛ. Установив курсор в любую ячейку, например, В21 и вставив в нее функцию КОРРЕЛ. Указав два диапазона В2:В20 и С2:С20. Вычислить . Эта величина говорит о среднем уровне корреляции.
2. Выполнить задание (зад_2) на ПК в MS EXCEL. Вычислить значение коэффициента корреляции с помощью статистической функции КОРРЕЛ. Построить точечный график по данным представленным в таблице в MS EXCEL.
Обеспечение учебного процесса | ||||
№ | Обеспеченность учебниками % | Успеваемость сред. балл | Обеспеченность ПК % | Успеваемость сред. балл |
1 | 50 | 3,81 | 10 | 3,98 |
2 | 78 | 4,15 | 25 | 4,01 |
3 | 94 | 4,69 | 19 | 4,34 |
4 | 65 | 4,37 | 78 | 4,41 |
5 | 99 | 4,53 | 45 | 3,94 |
6 | 87 | 4,23 | 32 | 3,62 |
7 | 100 | 4,73 | 90 | 4,6 |
8 | 63 | 3,69 | 21 | 4,24 |
9 | 79 | 4,08 | 34 | 4,36 |
10 | 94 | 4,2 | 45 | 3,99 |
| ρ= | ρ= |
3. Выполнить задание (зад_3) на ПК в MS EXCEL. В приведенной ниже таблице содержатся данные о парных измерениях двух величин, произведенных в некоторой школе: температуры воздуха в классе x и доли простуженных учащихся y:
Данные измерений | |||||||||
x | y | x | y | x | y | x | y | x | y |
14 | 30 | 17 | 18 | 20 | 8 | 23 | 2 | 26 | 2 |
14 | 35 | 17 | 15 | 20 | 5 | 23 | 0 | 26 | 1 |
14 | 40 | 17 | 14 | 20 | 4 | 23 | 3 | 26 | 3 |
15 | 32 | 18 | 10 | 21 | 1 | 24 | 3 | 27 | 2 |
15 | 35 | 18 | 6 | 21 | 0 | 24 | 1 | 27 | 4 |
15 | 26 | 18 | 8 | 21 | 2 | 24 | 2 | 27 | 3 |
16 | 20 | 19 | 8 | 22 | 0 | 25 | 1 | 28 | 3 |
16 | 24 | 19 | 7 | 22 | 2 | 25 | 0 | 28 | 2 |
16 | 17 | 19 | 6 | 22 | 3 | 25 | 2 | 28 | 4 |
ρ= | | ρ= | | ρ= | | ρ= | | ρ= | |
Зависимость носит статистический характер, поскольку нельзя однозначно сказать, что при температуре 15 градусов в школе болеет 5% учащихся. Кроме температуры, есть и другие факторы, являющие на простудные заболевания, различные для разных школ, и все их проконтролировать невозможно.
Нужно представить следующие данные в электронной таблице следующим образом: табличное и графическое представление. Построить точечную диаграмму. Ответить на вопрос, можно ли на основании точечной диаграммы выдвинуть гипотезу о наличии линейной корреляции между величинами. Если ответ отрицательный, то исправьте данные в таблице, чтобы гипотеза о наличии линейной корреляции стала правдоподобна. Найти коэффициент корреляции, опровергнуть или подтвердить указанную гипотезу.