54- كورس لغة بايثون Python شرح – Pandas Tutorial

Pandas Tutorial in Python

Pandas Tutorial in Python

تُعتبر مكتبة Pandas واحدة من المكتبات الأساسية في لغة البرمجة بايثون لتحليل ومعالجة البيانات. تُستخدم هذه المكتبة بشكل واسع في علم البيانات وتوفر أدوات قوية ومرنة للتعامل مع البيانات عبر هياكل بيانات سهلة الاستخدام. في هذا المقال، سنقدم شرحًا مفصلًا عن كيفية استخدام Pandas مع أمثلة توضيحية.

التهيئة والبداية مع Pandas

قبل البدء في استخدام Pandas، يجب عليك التأكد من تثبيتها على نظامك. يمكنك القيام بذلك باستخدام مدير الحزم pip:

pip install pandas

بعد التثبيت، يمكنك بدء استخدام المكتبة عن طريق استيرادها في مشروعك:

import pandas as pd

Pandas تعتمد بشكل رئيسي على هياكل بيانات تُعرف بـ DataFrame و Series. DataFrame هي بنية ثنائية الأبعاد تشبه الجداول في قواعد البيانات أو جداول البيانات. بينما Series هي بنية أحادية البُعد تشبه القوائم.

إدخال البيانات إلى Pandas

يمكنك إدخال البيانات إلى Pandas من مصادر متعددة مثل ملفات CSV، Excel، قواعد البيانات، وغيرها. لنأخذ مثالًا على كيفية قراءة ملف CSV:

df = pd.read_csv('data.csv')

بعد قراءة البيانات، يمكنك عرض أول خمس صفوف للتأكد من أن البيانات قد تمت قراءتها بشكل صحيح:

print(df.head())

يمكنك أيضًا قراءة ملفات Excel باستخدام الدالة التالية:

df = pd.read_excel('data.xlsx', sheet_name='Sheet1')

تتيح لك Pandas كذلك إنشاء DataFrame يدويًا باستخدام القوائم أو القواميس. إليك مثال على إنشاء DataFrame باستخدام قاموس:

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(df)

التعامل مع البيانات في Pandas

تتيح لك Pandas العديد من العمليات لتحليل البيانات ومعالجتها. على سبيل المثال، يمكنك تصفية البيانات بناءً على شروط معينة. لنفترض أن لدينا DataFrame يحتوي على بيانات الموظفين ونريد استخراج الموظفين الذين تزيد أعمارهم عن 30 عامًا:

filtered_df = df[df['Age'] > 30]
print(filtered_df)

يمكنك أيضًا إضافة أعمدة جديدة إلى DataFrame. لنفترض أننا نريد إضافة عمود جديد يُسمى “Salary” يحتوي على رواتب الموظفين:

df['Salary'] = [50000, 60000, 70000]
print(df)

كما يمكنك استخدام Pandas لتنفيذ عمليات رياضية، مثل حساب المتوسط الحسابي لعمر الموظفين:

average_age = df['Age'].mean()
print("Average Age:", average_age)

الاستنتاج

توفر مكتبة Pandas مجموعة واسعة من الأدوات القوية والمفيدة لتحليل ومعالجة البيانات في بايثون. من خلال توفير هياكل بيانات مرنة وسهلة الاستخدام، يمكن للمستخدمين تنفيذ العديد من العمليات والتحليلات على البيانات بسهولة وفعالية. هذه المقدمة تغطي الأساسيات، ولكن Pandas تحتوي على الكثير من الخصائص والوظائف المتقدمة التي يمكن استكشافها لتحقيق المزيد من التحليل الدقيق والمعمق للبيانات.