Курс Python → Обработка данных в Python

Для дальнейшей обработки данных в Python существует несколько методов, которые позволяют очистить данные от лишней информации и подготовить их для анализа. Один из таких методов — отбрасывание ненужных столбцов в датафрейме. Например, если у нас есть датафрейм с данными и нам не нужны столбцы с именами Id и Name, мы можем использовать метод drop() для удаления этих столбцов и создания новой копии датафрейма.


import pandas as pd

# Создаем датафрейм df с данными
df = pd.DataFrame({'Id': [1, 2, 3],
                   'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 35]})

# Отбрасываем столбцы Id и Name
new_df = df.drop(['Id', 'Name'], axis=1)
print(new_df)

Еще один способ обработки данных — фильтрация строк по определенному условию. Например, если мы хотим оставить только те строки, где значение в столбце Type равно ‘frozen’ или ‘green’, мы можем использовать метод loc[] для фильтрации данных и сохранения только нужных строк.


# Фильтруем строки по значению столбца Type
filtered_df = df.loc[df['Type'].isin(['frozen', 'green'])]
print(filtered_df)

Таким образом, обработка данных в Python включает в себя различные методы работы с датафреймами, такие как удаление столбцов, создание новых столбцов из существующих данных и фильтрация строк по определенным условиям. Эти методы позволяют подготовить данные для дальнейшего анализа и обработки в вашем проекте.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Повторение элементов в Python
  2. Атрибуты массивов в Numpy
  3. Библиотека Emoji: использование смайлов в Python
  4. Запрос DELETE с библиотекой requests
  5. Настройка нарезки списков
  6. Декораторы с аргументами
  7. Удаление символов новой строки в Python.
  8. Конкатенация строк с помощью join()
  9. Равенство и идентичность в Python
  10. Проверка типов с использованием isinstance
  11. Множественное присваивание в Python
  12. Применение промокода в Много лосося
  13. Создание namedtuple списком полей
  14. Создание уникального множества
  15. Оператор распаковки в Python
  16. Добавление вложенных списков
  17. Метод __ixor__ для побитового исключающего ИЛИ
  18. Создание таблиц в Python с PrettyTable
  19. Обход словаря в Python
  20. Создание тестовых данных с Faker
  21. Правила именования переменных
  22. Функция zip() — объединение последовательностей
  23. Проверка существования переменной с оператором :=
  24. Обработка ошибок в JSON данных
  25. Копирование словарей и списков в Python
  26. Конвертация изображений в PDF
  27. Работа с WindowsPath()
  28. Retrying в Python: повторные вызовы
  29. Запуск асинхронной корутины
  30. Активация Matplotlib в Jupyter
  31. Ограничение итераций в Python
  32. Методы и функции в Python
  33. Просмотр внешнего файла в Python
  34. Создание спинбокса в tkinter
  35. Форматирование данных с помощью pprint
  36. Оператор деления для класса Rational
  37. Сортировка слиянием
  38. JMESPath в Python
  39. Метод hash в Python
  40. Сумма элементов списка
  41. Проверка на истинность объектов в Python
  42. Метод bool() в Python
  43. Concrete Paths в Python
  44. Функция zip() для объединения списков
  45. Итерация по копии коллекции
  46. Удаление специальных символов с помощью re.sub

Marketello читают маркетологи из крутых компаний