Курс Python → Обработка данных в Python

Для дальнейшей обработки данных в Python существует несколько методов, которые позволяют очистить данные от лишней информации и подготовить их для анализа. Один из таких методов — отбрасывание ненужных столбцов в датафрейме. Например, если у нас есть датафрейм с данными и нам не нужны столбцы с именами Id и Name, мы можем использовать метод drop() для удаления этих столбцов и создания новой копии датафрейма.


import pandas as pd

# Создаем датафрейм df с данными
df = pd.DataFrame({'Id': [1, 2, 3],
                   'Name': ['Alice', 'Bob', 'Charlie'],
                   'Age': [25, 30, 35]})

# Отбрасываем столбцы Id и Name
new_df = df.drop(['Id', 'Name'], axis=1)
print(new_df)

Еще один способ обработки данных — фильтрация строк по определенному условию. Например, если мы хотим оставить только те строки, где значение в столбце Type равно ‘frozen’ или ‘green’, мы можем использовать метод loc[] для фильтрации данных и сохранения только нужных строк.


# Фильтруем строки по значению столбца Type
filtered_df = df.loc[df['Type'].isin(['frozen', 'green'])]
print(filtered_df)

Таким образом, обработка данных в Python включает в себя различные методы работы с датафреймами, такие как удаление столбцов, создание новых столбцов из существующих данных и фильтрация строк по определенным условиям. Эти методы позволяют подготовить данные для дальнейшего анализа и обработки в вашем проекте.

Твои коллеги будут рады, поделись в

Автор урока

Дмитрий Комаровский
Дмитрий Комаровский

Автоматизация процессов
в КраснодарБанки.ру

Другие уроки курса "Python"

  1. Работа со строками в Python
  2. Работа с необработанными строками
  3. Вывод с переменной через запятую
  4. Эффективная конкатенация строк с использованием join()
  5. Хранение данных
  6. Удаление ссылок в Python
  7. Метод rlshift для битового сдвига
  8. Взаимодействие с sys
  9. Замена текста в Python
  10. Работа с файлами в Python
  11. Регистрация на хакатоне
  12. Создание новых функций через partial
  13. Лямбда-функции в defaultdict
  14. Antigravity модуль
  15. Красивый вывод списка
  16. Разделение строки с помощью re.split()
  17. Поиск анаграмм с Counter
  18. Получение частей дроби
  19. Структура данных deque в Python
  20. Модуль math: константы π и e
  21. Сортировка в Python
  22. Работа с deque в Python
  23. Доступ к локальным переменным
  24. Любовь к Python
  25. Модуль xkcd: добавление юмора в Python
  26. Удаление файлов с shutil.os.remove()
  27. Изменение списка срезами
  28. Создание словарей в Python
  29. Присоединение элементов коллекции
  30. Использование двоеточия в Python
  31. Форматирование данных с помощью pprint
  32. Измерение потребления памяти при сортировке
  33. Нахождение максимального значения и его индекса в списке
  34. Мониторинг памяти с Pympler
  35. Генераторы списков
  36. Структурирование данных с Pydantic
  37. Функция zip() в Python
  38. Отладка производительности Python
  39. Цикл for с enumerate() в Python
  40. Проверка условий: all и any
  41. Beautiful Soup — извлечение данных из HTML
  42. Создание новых функций с помощью functools.partial
  43. Удаление дубликатов с помощью множеств
  44. Обработка элементов в Python
  45. Переопределение метода delitem в Python

Marketello читают маркетологи из крутых компаний