Практическая работа по информатике в 11 классе «Получение регрессионных моделей»

5
0
Материал опубликован 22 December 2023

Предмет: информатика.

Класс: 11

УМК: «Информатика и ИКТ» для 10-11 классов, базовый уровень. Автор Семакин И. Г. и др.

Тема урока: Моделирование зависимостей. Статистическое моделирование. Практическая работа «Получение регрессионных моделей»

Общее количество часов, отведенное на изучение темы: 2

Тип урока: Систематизации и обобщение знаний и умений

Форма организации урока: мультимедиа-урок


Задачи урока:

Образовательные:

А) формирование понятий статистического моделирования, регрессии, регрессионной модели;

В) обоснование выбора инструмента для моделирования регрессионных моделей.

Развивающие:

А) развитие навыков и умений сопоставлять, анализировать, обобщать знания;

Б) развитие навыков анализа итогов практической работы и изученного материала.

Воспитательные:

А) воспитание чувства взаимопонимания и взаимопомощи при выполнении микроисследования в малых группах.


Цели изучения темы в целом:

1. Создать условия для развития навыков разработки регрессионных моделей, показать взаимосвязь экономического моделирования с потребностями современного информационного общества.

2. Систематизировать знания, ранее полученные школьниками по теме «Моделирование» в курсе информатики 11 класса.


Цель урока:

Сформировать умение анализировать и разрабатывать регрессионные модели.

Планируемые результаты:

Обучающиеся должны знать:

формы представления зависимостей между величинами;

для решения каких задач используется статистика;

что такое регрессионная модель;

как происходит прогнозирование регрессионной модели.


Обучающиеся должны уметь:

используя табличный процессор строить регрессивные модели заданных типов;

осуществлять прогнозирование по регрессионной модели.


Оборудование: интерактивная доска, медиапроектор, компьютерный класс.


Дидактический материал, программное обеспечение: пакет СПО GeoGebra, презентация по теме урока, раздаточный материал (опорный конспект урока, оценочный лист).


План урока

1. Организационный момент – 3 минуты.

2. Постановка цели и задач урока. Мотивация учебной деятельности учащихся – 4 минуты.

3. Актуализация опорных знаний – 3 минуты.

4. Обобщение и систематизация знаний – 17 минут.

5. Применение знаний и умений в новой ситуации – 9 минут.

6. Контроль усвоения, обсуждение допущенных ошибок и их коррекция – 5 минут.

7. Домашнее задание – 2 минуты.

8. Рефлексия. Подведение итогов урока – 3 минуты.


Организационный момент


Приветствие. Проверка отсутствующих. Объявление темы урока.

Определяем правила проведения урока, виды и принципы оценивания деятельности учащихся. Ученики получают опорный конспект урока. Тему нашего урока обозначим как: «Регрессионное моделирование». Как вы думаете, о чем пойдет речь? (ученикам сложно предположить, помогаю).

1. Постановка цели урока

Анализ данных - область науки, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных (в широком смысле) данных.



Вопросы обучающимся:

1) Как Вы думаете, какое программное обеспечение имеет средства анализа данных? (CAD системы, MS Excel, пакет WPS office, пакет GeoGebra).

2) Какие вам известны формы представления зависимостей между величинами?

3) Что такое математическая модель?

4) Может ли математическая модель включать в себя только константы?

Приведите пример известной вам функциональной зависимости между характеристиками некоторой системы?


Цель нашего урока: обучиться использовать ПО GeoGebra для проведения анализа зависимостей величин.


2. Актуализация знаний

В состав ПО GeoGebra входит набор средств анализа данных (так называемый пакет анализа), предназначенный для проведения анализа данных. С помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Параллельно с аналитическим анализом производится графическая интерпретация набора данных.

Статистические данные приводятся в виде длинных и сложных статистических таблиц, поэтому бывает весьма трудно обнаружить в них имеющиеся неточности и ошибки.



Примеры:

Агент по продаже недвижимости мог бы вносить в каждый элемент реестра размер дома (в квадратных метрах), число спален, средний доход населения в этом районе в соответствии с данными переписи и субъективную оценку привлекательности дома. Как только эта информация собрана для различных домов, было бы интересно посмотреть, связаны ли и каким образом эти характеристики дома с ценой, по которой он был продан. Например, могло бы оказаться, что число спальных комнат является лучшим предсказывающим фактором для цены продажи дома в некотором специфическом районе, чем "привлекательность" дома (субъективная оценка). Могли бы также обнаружиться и "выбросы", т.е. дома, которые могли бы быть проданы дороже, учитывая их расположение и характеристики.

Специалисты по кадрам обычно решают задачи определения вознаграждения адекватного выполненной работе. Можно определить некоторое количество факторов или параметров, таких, как "размер ответственности" или "число подчиненных", которые, как ожидается, оказывают влияние на стоимость работы. Кадровый аналитик затем проводит исследование размеров окладов среди сравнимых компаний на рынке, записывая размер жалования и соответствующие характеристики (т.е. значения параметров) по различным позициям.

Ясно, что для решения данных задач необходимо построить математические модели, т.е. получить формулы зависимости, например, уровня заработной платы от "размера ответственности" или "числа подчиненных"; цены дома от количества спален, района и т.д.

Решать данные задачи можно, даже не зная глубоко математику, стоящую за применяемым аппаратом. Главное представлять суть решаемой проблемы, уметь собирать информацию и вводить в компьютер исходные данные, интерпретировать полученные результаты.

Графическое же представление статистических данных помогает легко и быстро выявить ничем не оправданные пики и впадины, явно не соответствующие изображаемым статистическим данным, аномалии и отклонения.

Регрессия является инструментом пакета анализа данных ПО GeoGebra. Линейный регрессионный анализ заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных.


3. Первичное восприятие и усвоение учебного материала


Регрессионный анализ проводится на основе различных математических функций:

линейной (у = а + bx);

параболической (y = a + bx + cx2);

экспоненциальной (y = a * exp(bx));

степенной (y = a*x^b);

гиперболической (y = b/x + a);

логарифмической (y = b * 1n(x) + a);

показательной (y = a * b^x).



Рассмотрим на примере построение регрессионной модели в GeoGebra и интерпретацию результатов. Возьмем линейный тип регрессии.

Задача. На 6 предприятиях была проанализирована среднемесячная заработная плата и количество уволившихся сотрудников. Необходимо определить зависимость числа уволившихся сотрудников от средней зарплаты.

Мt1703192401aa.png
одель линейной регрессии имеет следующий вид:

t1703192401ab.gif, где а – коэффициенты регрессии, х – влияющие переменные, n – число факторов.

В нашем примере в качестве y выступает показатель уволившихся работников. Влияющий фактор – заработная плата (х).

В ПО GeoGebra существуют встроенные функции, с помощью которых можно рассчитать параметры модели линейной регрессии.

Достаточно выбрать пиктограмму CAS и в открывшемся окне ввести и выделить необходимый набор данных для их анализа. После чего произойдёт их анализ и построение графической модели зависимости.


t1703192401ac.png


Откроется меню для выбора входных значений и параметров вывода (где отобразить результат). В полях для исходных данных указываем диапазон описываемого параметра (У) и влияющего на него фактора (Х). Остальное можно и не заполнять.

После нажатия ОК, программа отобразит расчеты на новом.


t1703192401ad.png

В первую очередь обращаем внимание на R-квадрат и коэффициенты. R-квадрат – коэффициент детерминации. В нашем примере – 0,903, или 90,3%. Это означает, что расчетные параметры модели на 90,3% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере – «очень хорошо».

t1703192401ae.png

Коэффициент -0,907 показывает весомость переменной Х на Y. То есть среднемесячная заработная плата в пределах данной модели влияет на количество уволившихся с весом -0,907 (это небольшая степень влияния). Знак «-» указывает на отрицательное влияние: чем больше зарплата, тем меньше уволившихся. Что справедливо.


4. Применение теоретических положений в условиях выполнения упражнений и задач

Экспериментальный раздел занятия: выполнение рассмотренного задания на компьютере, анализ полученных результатов.


5. Самостоятельное творческое использование сформированных умений и навыков.


Компьютерный практикум:

1) Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, постройте линию тренда для квадратичной модели и получите с помощью инструмента Регрессия более полные характеристики. Сравните результаты с линейной моделью.

2) Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, постройте линию тренда для квадратичной модели и получите с помощью инструмента Регрессия более полные характеристики. Выполните прогнозирование заработной платы для служащих, имеющих стаж работы 8,5 лет.


6. Динамическая пауза. Гимнастика для глаз


7. Обобщение усвоенного и включение его в систему ранее усвоенных УУД.


Подведение итогов урока.

1. Как по найденной регрессионной модели осуществляется прогнозирование переменной Y?

2. Какой вид имеет квадратичная модель регрессии? Какие переменные в уравнении используются в качестве независимых?

3. Какой вид имеет логарифмическая модель регрессии? Какая переменная в уравнении регрессии является независимой? Какое ограничение имеют значения переменной X в логарифмической модели?

4. Какой вид имеет степенная модель регрессии?

5. Какой вид имеет экспоненциальная модель регрессии? Как определяются коэффициенты a и b уравнения регрессии?

6. Подведи итог занятия, отметив, что было …


И (интересно) ______________

Т (традиционно) ______________

О (оригинально) ______________

Г (главным) ______________

Лист самооценки учащегося

Индивидуальная работа

Участие в проверке домашнего задания


Постановка вопросов учителю и одноклассникам


Индивидуальные ответы на вопросы


Степень удовлетворения собственной работой


Групповая работа

Роль в группе


Степень активности в групповом обсуждении


Участие в постановке вопросов другим группам


Степень удовлетворенности работой





8. Рефлексия деятельности.

Домашнее задание (обсуждаем с учащимися, каким должно быть домашнее задание, чтобы новый материал был качественно закреплен?).


Домашнее задание

Уровень знания: выучить основные понятия, знать обозначения по теме «Статистическое моделирование. Регрессионные модели».


Уровень понимания:

1. Разработать 5-6 контрольных вопросов по статистическому моделированию.

2. Привести примеры регрессионного моделирования.


Уровень применения:

1. Напишите условие задачи, требующей построение регрессионной модели.

2. Реализуйте данную задачу в ПО GeoGebra.


в формате Microsoft Word (.doc / .docx)
Комментарии
Комментариев пока нет.

Похожие публикации