Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Пустой оператор pass в Python
  2. Принципы программирования
  3. Сортировка в Python
  4. Получение текущей даты и времени с помощью datetime
  5. Преобразование строк в числа в Python
  6. Округление чисел с помощью round
  7. Работа с классами данных
  8. Итерация по итерируемым объектам
  9. Обмен переменными в Jupyter
  10. Python Менеджер контекста
  11. Метод lt для сортировки объектов
  12. Деление в Python
  13. Раздувающийся словарь в Python
  14. Метод join() для объединения строк
  15. Сравнение строк в Python
  16. Форматирование строк в Python
  17. Преобразование Word в PDF с Spire.Doc
  18. Счетчик в Python: most_common()
  19. Оператор (*) в Python
  20. Работа с итераторами в Python
  21. Numpy: использование Ellipsis
  22. Combobox в Tkinter
  23. Получение обратного списка чисел
  24. Многострочные комментарии в Python
  25. Комментарии в Python
  26. Эффективная конкатенация строк с использованием join()
  27. Условное добавление элементов в список
  28. Библиотека schedule: планировщик задач
  29. Передача аргументов через **arguments
  30. Установка Home Assistant
  31. Глубокое копирование объектов
  32. Работа с SQLite в Python
  33. Работа с модулем random
  34. Функции в одну строку
  35. Работа с кортежами в Python
  36. Генераторы данных
  37. Конкатенация строк с join() в Python
  38. Преобразование списка в словарь через генератор
  39. Проверка условий в Python
  40. Оптимизация сравнения в Python
  41. Работа с изображениями Pillow
  42. Оператор is в Python
  43. Работа с процессами в Python
  44. Работа с модулем bisect
  45. Метод Event.wait() в Python
  46. Измерение времени выполнения кода
  47. Оператор == в Python

Marketello читают маркетологи из крутых компаний