Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Добавление элементов в список
  2. Создание GUI с Tkinter: Entry
  3. Замена подстроки
  4. Python: отсутствие точек с запятыми
  5. Зарезервированные слова в Python
  6. Генерация строк с .join()
  7. Метод сравнения объектов в Python
  8. Установка пакетов с помощью pip
  9. Создание пар из последовательностей
  10. Лямбда-функции в defaultdict
  11. Использование двоеточия в Python
  12. Закрытие файла в Python
  13. Метод __float__ в Python
  14. Функция print() — вывод информации
  15. Функции range() в Python
  16. Python enumerate() для работы с индексами
  17. Оператор обр. импликации
  18. Декораторы в Python
  19. Импорт классов из другого файла
  20. Переопределение метода __and__
  21. Перезапуск ячейки в Jupyter Notebook с dostoevsky
  22. Преобразование объекта в строку
  23. Модуль subprocess: запуск внешних команд
  24. Транспонирование 2D-массива с помощью zip
  25. Аннотации типов в Python
  26. Хеши в Python
  27. Операторы увеличения и уменьшения переменной
  28. Работа с библиотекой requests
  29. Оптимизация гиперпараметров с Scikit Optimize
  30. Python и Монти Пайтон
  31. Работа с пакетами
  32. Руководство по библиотеке pydantic
  33. Перевод двоичного кода в целое число
  34. Поиск индекса элемента
  35. Тестирование с unittest
  36. Генерация случайных чисел в Python
  37. Работа со слайсами
  38. Принципы Zen of Python
  39. Список методов и атрибутов
  40. Бесконечные списки в Python
  41. Приближение чисел в Python
  42. Обработка исключений в Python 3
  43. Удаление специальных символов
  44. Метод join() для объединения строк
  45. Функции в Python: создание и вызов
  46. Расширение операции побитового «и» в Python

Marketello читают маркетологи из крутых компаний