Курс Python → Обработка данных в Python

Для дальнейшей обработки данных в Python существует несколько методов, которые позволяют очистить данные от лишней информации и подготовить их для анализа. Один из таких методов — отбрасывание ненужных столбцов в датафрейме. Например, если у нас есть датафрейм с данными и нам не нужны столбцы с именами Id и Name, мы можем использовать метод drop() для удаления этих столбцов и создания новой копии датафрейма.


import pandas as pd

# Создаем датафрейм df с данными
df = pd.DataFrame({'Id': [1, 2, 3],
                   'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 35]})

# Отбрасываем столбцы Id и Name
new_df = df.drop(['Id', 'Name'], axis=1)
print(new_df)

Еще один способ обработки данных — фильтрация строк по определенному условию. Например, если мы хотим оставить только те строки, где значение в столбце Type равно ‘frozen’ или ‘green’, мы можем использовать метод loc[] для фильтрации данных и сохранения только нужных строк.


# Фильтруем строки по значению столбца Type
filtered_df = df.loc[df['Type'].isin(['frozen', 'green'])]
print(filtered_df)

Таким образом, обработка данных в Python включает в себя различные методы работы с датафреймами, такие как удаление столбцов, создание новых столбцов из существующих данных и фильтрация строк по определенным условиям. Эти методы позволяют подготовить данные для дальнейшего анализа и обработки в вашем проекте.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Создание генераторов в Python
  2. Инверсия списка/строки в Python
  3. Вызов внешних программ в Python с помощью sh
  4. Защита данных в Python
  5. Инверсия списков и строк в Python
  6. Генерация UUID в Python
  7. Модуль inspect: получение информации о объектах
  8. F-строки в Python 3.8
  9. Заказ карты Тинькофф Black
  10. Оптимизация методов в Python 3.7
  11. Многопроцессорное программирование в Python
  12. Итерация по коллекции в Python
  13. Генерация случайных чисел в Python
  14. Подсчет элементов в Python
  15. Оптимизация памяти с __slots__
  16. Метод split() в Python
  17. Генераторы в Python
  18. Форматирование строк в Python
  19. Переопределение метода divmod
  20. Преобразование данных в Python
  21. Метод ifloordiv для пользовательских классов
  22. Объединение Python и Shell
  23. Модуль Antigravity в Python 3
  24. Структурирование данных с Pydantic
  25. Метод eq для сравнения объектов
  26. Перемещение и удаление файлов в Python
  27. Оператор in и not in в Python
  28. Курс по дообучению ChatGPT
  29. Поиск частых элементов в списке
  30. Операторы += в Python
  31. Протокол управления контекстом
  32. Эффективная конкатенация строк с использованием join()
  33. Лимиты на ресурсы Python
  34. Атрибуты класса и экземпляра в Python
  35. Безопасные SQL-запросы в Python 3.11
  36. Функция zip() — объединение последовательностей
  37. Установка пакета в Python
  38. Работа с комплексными числами
  39. Класс UserDict: дополнительная функциональность
  40. Получение текущего времени в Python
  41. Счетчик ссылок в Python
  42. Запуск внешнего кода в Jupyter
  43. Python Ellipsis использование
  44. Применение функции к списку
  45. Python reversed() vs срез[::-1]
  46. Работа с Telegram API на Python
  47. Перевод эмодзи и эмотиконов.
  48. Взаимодействие с внешними процессами в Python
  49. Бинарный поиск

Marketello читают маркетологи из крутых компаний