Курс Python → Очистка данных в Python

Для дальнейшей обработки данных в Python часто приходится выполнять различные манипуляции с датафреймами. Одним из способов очистки данных является удаление ненужных столбцов, создание новых столбцов на основе существующих данных или удаление строк, не соответствующих определенным условиям.

Например, если у нас есть датафрейм с несколькими столбцами, нам может потребоваться удалить столбцы с определенными именами. Для этого можно воспользоваться методом drop, указав нужные столбцы в параметре columns. Новый датафрейм с отброшенными столбцами будет возвращен в качестве результата.


new_df = df.drop(columns=['Id', 'Name']).copy()

Также часто требуется проверить значения в столбце на определенное условие и сохранить только те строки, которые соответствуют этому условию. Например, если мы хотим сохранить только строки, в которых значение столбца Type равно ‘frozen’ или ‘green’, можно воспользоваться логическим индексированием.


filtered_df = df[df['Type'].isin(['frozen', 'green'])].copy()

Таким образом, путем комбинации различных методов работы с датафреймами в Python можно эффективно очищать данные от ненужной информации и подготавливать их для дальнейшего анализа или использования.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Проверка подстроки в строке с помощью in
  2. Структуры данных в Python
  3. Переопределение метода __lshift__
  4. Улучшение читаемости кода в Python
  5. Python groupby() из itertools: работа с повторяющимися элементами
  6. Метод __ixor__ для побитового исключающего ИЛИ
  7. Извлечение аудио из видео
  8. Работа с итераторами через срезы
  9. Импортирование в Python
  10. Работа с словарями в Python
  11. Работа с библиотекой xkcd
  12. Генераторы данных
  13. Асинхронное программирование с asyncio
  14. Библиотека Emoji: использование смайлов в Python
  15. Установка и использование emoji
  16. Python: отличительная особенность — отступы
  17. Тип CodeType в Python.
  18. Извлечение новостей с newspaper3k
  19. Скачать видео с YouTube
  20. Очистка данных в Python
  21. Создание копии итератора
  22. Нахождение хеша для бесконечности и NaN в Python
  23. Открытие и редактирование скриптов Python
  24. Функции классификации комплексных чисел
  25. Различия символов в Python
  26. Установка и загрузка Instaloader
  27. Запуск внешних программ с subprocess
  28. Объединение словарей в Python
  29. Numpy: разбиение массивов
  30. Подсказки типов в Python
  31. Итерация по коллекции в Python
  32. Декораторы в Python
  33. Метаклассы в Python
  34. Группы исключений в Python
  35. Создание словарей в Python
  36. Python и Монти Пайтон
  37. Добавление вложенных списков
  38. Открытие, чтение и закрытие файла
  39. Метод __iand__ для пользовательских классов
  40. Объединение списков в Python
  41. Переопределение метода __or__()
  42. Работа с комплексными числами
  43. Очистка списка от False, None, 0, «»
  44. Операции с матрицами в Python
  45. Замер времени выполнения кода
  46. Удаление ключа из словаря
  47. Подсчет вхождений элементов
  48. Работа с временем в Python
  49. Сглаживание списка

Marketello читают маркетологи из крутых компаний