مقدمه
اگر بخوای با دادهها در پایتون کار کنی، تقریباً غیرممکنه که با Pandas سروکار نداشته باشی. Pandas یکی از قویترین و محبوبترین کتابخانههای پایتونه که برای پردازش، تحلیل، فیلتر، مرتبسازی و خلاصهسازی دادهها استفاده میشه.
در این آموزش، پرکاربردترین قابلیتهای Pandas رو با مثالهایی ساده بررسی میکنیم.
۱. شروع کار با Pandas
اول باید Pandas رو نصب و وارد کنیم:
pip install pandas
import pandas as pd
۲. خواندن دادهها (Import)
df = pd.read_csv('data.csv') # خواندن فایل CSV
df = pd.read_excel('file.xlsx') # خواندن فایل اکسل
۳. نمایش اولیه دادهها
()df.head # نمایش ۵ ردیف اول
()df.tail # نمایش ۵ ردیف آخر
()df.shape # تعداد سطر و ستون
()df.info # اطلاعات کلی درباره ستونها
()df.describe # آمار خلاصهای از ستونهای عددی
۴. انتخاب و فیلتر کردن دادهها
df['column_name'] # انتخاب یک ستون
df[['col1', 'col2']] # انتخاب چند ستون
df[df['age'] > 30] # فیلتر بر اساس شرط
df[df['gender'] == 'female']
۵. افزودن یا تغییر ستون
df['new_col'] = df['price'] * 1.2 # ستون جدید با عملیات روی ستونهای دیگر df['discount'] = 1000 # مقدار ثابت برای همه سطرها
۶. حذف سطر یا ستون
df.drop('column_name', axis=1, inplace=True) # حذف ستون df.drop(0, axis=0, inplace=True # حذف سطر با ایندکس 0
۷. مرتبسازی دادهها
df.sort_values('age') # بر اساس یک ستون
df.sort_values(['age', 'income'], ascending=[True, False])
۸. گروهبندی (GroupBy)
()df.groupby('gender')['income'].mean # میانگین درآمد بر اساس جنسیت
()df.groupby('category').sum
۹. پاکسازی دادهها
()df.isnull().sum # شمارش مقادیر گمشده
df.dropna(inplace=True) # حذف سطرهایی که مقدار گمشده دارند
df.fillna(0, inplace=True) # جایگزینی مقادیر گمشده با صفر
۱۰. تغییر نام ستونها
df.rename(columns={'old': 'new'}, inplace=True)
df.columns = ['name', 'age', 'salary'] # تغییر همه ستونها
۱۱. ذخیره دادهها
df.to_csv('output.csv', index=False)
df.to_excel('output.xlsx', index=False)
✅ جمعبندی
کتابخانه Pandas مثل یک چاقوی سوئیسی برای تحلیل داده در پایتونه. با استفاده از ابزارهایی مثل groupby
, filter
, sort
, و describe
، میتونی به راحتی با دادهها کار کنی و بینشهای ارزشمندی ازشون استخراج کنی.
📌 پیشنهاد مطالعه بعدی:
پروژه عملی تحلیل فروش فروشگاه
آموزش تصویری ساخت داشبورد با Pandas و Matplotlib
ترکیب Pandas با NumPy برای تحلیلهای عددی