Курс Python → Очистка данных в Python
Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.
Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.
new_df = df.drop(columns=['Id', 'Name']).copy()
Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.
filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()
Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.
Другие уроки курса "Python"
- Отображение графиков в Jupyter с Matplotlib
- Bootle — простой веб-фреймворк
- Изменение списка срезом
- Методы и функции в Python
- Хранение переменных в Python.
- Поиск HTML-элементов с BeautifulSoup
- Отступы в Python
- Объединение словарей в Python
- Библиотека Rich: форматирование текста
- Создание копии списка в Python
- Pillow: работа с изображениями
- Распаковка аргументов в Python
- Измерение потребления памяти при сортировке
- Частичное применение функций в Python
- Переопределение метода __pow__
- Оператор Walrus в Python 3.8
- Работа с географическими данными в Python
- Объединение, распаковка и деструктуризация
- Проверка файла .py на синтаксис.
- Работа с изменяемыми списками
- Работа с timedelta
- Парсинг веб-страниц с Beautiful Soup
- Удаление знаков препинания в Python
- Обход дочерних элементов BeautifulSoup
- Преобразование чисел в Python
- Именованные срезы в Python
- Работа с модулем bisect
- Приближение чисел в Python
- Установка Python3.7 и PIP
- Переопределение метода __lshift__
- Цикл for с enumerate() в Python
- Создание GUI с Tkinter: Entry
- Блок else в обработке исключений
- Метод rxor для операции побитового исключающего «или»
- Генераторы списков в Python
- Инверсия списка и строки в Python
- Структура данных deque в Python
- Оптимизация памяти с __slots__
- Работа с множествами в Python
- Упрощение условных выражений с тернарным оператором
- Основы Python за 14 дней
- Решение переменной Шредингера
- Блок else в циклах Python
- Вложенные генераторы в Python
- Добавление вложенных списков
- Карта бомбоубежищ в Москве и Питере
- Сортировка в Python
- F-строки в Python















