Презентация к уроку по теме Инструмент для предварительной обработки данных (Pandas)

1
0
Материал опубликован 9 November

Предварительный просмотр презентации

Инструмент для предварительной обработки данных (Pandas) Автор: Хорошко И.Ю. Учитель информатики ГБОУ ЛНР «АИТЛ»

Повторим… Библиотека, которая необходима для работы с большим набором данных? Pandas 2) Как подключить эту библиотеку? 3) Какие типы данных есть в библиотеке для работы с большим массивом данных? Series, DateFrame 4) Какие способы заполнить данными DateFrame?

Рассмотрим набор данных

Предварительная обработка данных Тема урока:

Где взять данные? Https://data.unicef.org/resources/resource-type/datasets/

Где взять данные? https://data.world/datasets/open-data

Выбор данных Продажа квартир с 2001 по 2020 года

Импорт данных:

Просмотр данных

Просмотр выбранной части данных

Информация о данных

Статистическая информация о датасет

Создание таблицы базы данных engine = create_engine("sqlite://")

Вывод таблицы

Работа с запросами Town

Проверка нулевых значений

Удаление дубликатов: drop_duplicates() Атрибуты: keep - позволяет контролировать, какие дубликаты будут удалены: первый, последний или все subset – удаление дубликатов в заданных столбцах

Изменяем название столбцов

Запись в одну строку

Удаление пустот

Некоторые полезные методы

Подведем итоги: Для чего нам нужна библиотека Pandas? Какие основные этапы необходимо выполнить для предварительной обработки данных? Какие методы запомнились?

в формате MS Powerpoint (.ppt / .pptx)
Комментарии
Комментариев пока нет.