Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Создание панели меню Tkinter
  2. Инициализация переменных
  3. Передача неизвестных аргументов в Python.
  4. JSON-esque в Python
  5. Установка и использование Logzero
  6. Принцип одной функции
  7. Метод bool() в Python
  8. Методы работы со списками
  9. Руководство по использованию Colorama
  10. Удаление ресурса в Python
  11. Изменяемые и неизменяемые объекты
  12. Настройка шрифта и цвета в Tkinter
  13. Использование *args
  14. Классы данных в Python
  15. Декораторы в Python
  16. Метод enumerate() в Python
  17. Оператор Walrus: правильное использование
  18. Изменения в обработке логических значений
  19. Создание словарей и множеств в Python.
  20. Вложенные генераторы в Python
  21. Склеивание строк без циклов
  22. Создание новой даты в Python
  23. Метод join() с набором
  24. Работа с исключениями в Python
  25. Повторение и перенос строки
  26. Генерация строк с .join()
  27. Разделение строк в Python
  28. Python enumerate() для работы с индексами
  29. Проверка вхождения подстроки
  30. Кортеж в Python: создание и использование
  31. Итераторы с потерямиZIP
  32. Декоратор total_ordering для сравнения объектов
  33. Установка и использование библиотеки google
  34. Создание словаря через dict comprehension
  35. Сохранение и загрузка модели в PyTorch
  36. Получение локальных переменных в Python
  37. Повторение элементов в Python
  38. Работа с типами данных в Python с помощью pydantic.
  39. Округление чисел с помощью round
  40. Многопоточность в Python
  41. Работа с часовыми поясами в Python.
  42. Python Метод Union Множеств
  43. Создание итератора
  44. Работа с Enum в Python3.
  45. Установка User-Agent в Python
  46. Работа с утверждениями в Python
  47. Python union() функция — объединение множеств

Marketello читают маркетологи из крутых компаний