Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Разработка игры Pong с turtle
  2. EMOT преобразование эмодзи в текст
  3. Загрузка постов Instagram
  4. Работа с collections в Python
  5. Извлечение чисел из текста
  6. Добавление Progressbar в Python
  7. Импорт модулей в Python 3.12
  8. Библиотека sh: использование команд bash в Python
  9. Измерение времени выполнения кода
  10. Избегайте изменяемых аргументов
  11. Оптимизация создания строк
  12. Перевод двоичного кода в целое число
  13. Распаковка элементов последовательности
  14. Фильтры Pillow: NEAREST, BILINEAR, BICUBIC
  15. Транспонирование 2D-массива с помощью zip
  16. Методы обработки строк в Python
  17. Работа с аргументами командной строки в Python
  18. Преобразование range в итератор
  19. Импорт с альтернативным именем
  20. Метод join() для объединения строк
  21. Псевдонимы в Python
  22. Перевод эмодзи и эмотиконов.
  23. Расчет времени выполнения кода
  24. Переопределение метода divmod
  25. Модуль pprint
  26. Solidity для DeFi Ethereum
  27. Обход словаря в Python
  28. Генераторы списков в Python
  29. Метод remove() для удаления элемента из списка
  30. Запуск внешнего кода в Jupyter
  31. Создание лямбда-функций
  32. Сглаживание списка
  33. Форматирование вывода с F-строками
  34. Подсчет элементов в Python
  35. Работа с функцией next() в Python
  36. Печать в одной строке
  37. Списки в Python: синтаксис представления
  38. Создание новых списков в Python
  39. Проверка условий в Python
  40. Обработка ошибок в Python
  41. Управление доступом к модулю
  42. Установка виртуального окружения Python
  43. Функции высшего порядка в Python
  44. Работа с массивами в Python
  45. Создание директории в Python
  46. Flask: создание веб-приложений
  47. Работа с кортежами в Python
  48. Python Тесты и Гайды

Marketello читают маркетологи из крутых компаний