مقدمة في الانحدار الخطي باستخدام Python
الانحدار الخطي هو أحد الأساليب الإحصائية الأساسية المستخدمة في تعلم الآلة لتحليل العلاقات بين المتغيرات. الهدف الرئيسي من استخدام الانحدار الخطي هو إنشاء نموذج يمكنه التنبؤ بقيمة متغير تابع استنادًا إلى متغير مستقل واحد أو أكثر. في سياق تعلم الآلة، يتم استخدام هذا النموذج للتنبؤ بالقيم المستقبلية أو لفهم العلاقات بين المتغيرات.
فهم الانحدار الخطي
الانحدار الخطي يعتمد على فرضية أن هناك علاقة خطية بين المتغير التابع (المتغير الذي نحاول التنبؤ به) والمتغيرات المستقلة (المتغيرات التي نستخدمها للتنبؤ). يتم تمثيل هذه العلاقة باستخدام معادلة خطية من الشكل التالي:
[ y = a + bX + epsilon ]
حيث:
– ( y ) هو المتغير التابع.
– ( a ) هو الثابت أو المعامل المقطوع.
– ( b ) هو المعامل الذي يمثل ميل الخط.
– ( X ) هو المتغير المستقل.
– ( epsilon ) هو الخطأ العشوائي.
لفهم هذا بشكل أفضل، دعونا نلقي نظرة على مثال عملي باستخدام Python.
تطبيق الانحدار الخطي في Python
يمكن تنفيذ الانحدار الخطي في Python باستخدام مكتبة `scikit-learn`، وهي مكتبة قوية ومستخدمة على نطاق واسع في مجال تعلم الآلة. فيما يلي مثال يوضح كيفية استخدام الانحدار الخطي لتوقع أسعار المنازل بناءً على مساحتها.
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
# بيانات وهمية لمساحة المنازل وأسعارها
X = np.array([50, 60, 70, 80, 90, 100, 110]).reshape((-1, 1))
y = np.array([150, 180, 210, 240, 270, 300, 330])
# إنشاء نموذج الانحدار الخطي
model = LinearRegression()
# تدريب النموذج باستخدام البيانات
model.fit(X, y)
# التنبؤ بأسعار المنازل الجديدة
X_new = np.array([55, 85, 105]).reshape((-1, 1))
y_pred = model.predict(X_new)
# عرض النتائج
plt.scatter(X, y, color='blue', label='البيانات الأصلية')
plt.plot(X_new, y_pred, color='red', label='خط الانحدار')
plt.xlabel('مساحة المنزل (متر مربع)')
plt.ylabel('سعر المنزل (ألف دولار)')
plt.title('الانحدار الخطي لأسعار المنازل')
plt.legend()
plt.show()
في هذا المثال، قمنا بإنشاء نموذج انحدار خطي باستخدام `LinearRegression` من مكتبة `scikit-learn`. ثم قمنا بتدريب النموذج باستخدام بيانات المساحة والأسعار، وبعدها استخدمناه للتنبؤ بأسعار منازل جديدة. يمكننا أيضًا تصور العلاقة بين المساحة والسعر باستخدام مكتبة `matplotlib` لرسم خط الانحدار.
توسيع النموذج للانحدار المتعدد
بالإضافة إلى الانحدار الخطي البسيط، يمكن توسيع النموذج ليشمل الانحدار الخطي المتعدد، حيث يتم استخدام أكثر من متغير مستقل واحد للتنبؤ بالمتغير التابع. يتم تمثيل هذا النموذج بمعادلة خطية متعددة الأبعاد. على سبيل المثال، يمكن توقع أسعار المنازل بناءً على المساحة وعدد الغرف والموقع.
استخدام الانحدار الخطي المتعدد في Python لا يختلف كثيرًا عن الانحدار البسيط. يظل `LinearRegression` الأداة المستخدمة، ولكن يجب أن يكون `X` عبارة عن مصفوفة تحتوي على أكثر من عمود واحد لتمثيل المتغيرات المستقلة المتعددة. هذا التوسع يوفر قدرة أكبر على التنبؤ، ولكنه يتطلب أيضًا المزيد من البيانات لضمان دقة النموذج.
