مقدمة حول الانحدار اللوجستي
الانحدار اللوجستي هو نوع من النماذج الإحصائية التي تُستخدم للتنبؤ بالنتائج الثنائية، حيث يكون الناتج متغيرًا ثنائيًا يأخذ قيمتين فقط مثل النجاح والفشل أو نعم ولا. يُعتبر الانحدار اللوجستي أداة قوية في تعلم الآلة والإحصاءات، ويستخدم بشكل شائع في التصنيف الثنائي، مثل تصنيف الرسائل الإلكترونية إلى “بريد عشوائي” أو “ليس بريد عشوائي”، أو تحديد ما إذا كان العميل سيشتري منتجًا أم لا. يعتمد الانحدار اللوجستي على دالة لوجستية لإرجاع احتمالية النتيجة المتوقعة.
في Python، يمكن تنفيذ الانحدار اللوجستي بسهولة باستخدام مكتبة Scikit-Learn، وهي واحدة من أكثر المكتبات شيوعًا لتطبيقات تعلم الآلة. يتطلب تنفيذ الانحدار اللوجستي في Python بضع خطوات بسيطة تشمل استيراد المكتبة، تقسيم البيانات إلى مجموعات التدريب والاختبار، تهيئة النموذج، وتدريب النموذج على البيانات، وأخيرًا اختبار دقته.
تطبيق الانحدار اللوجستي باستخدام Python
لتوضيح كيفية استخدام الانحدار اللوجستي في Python، سنقوم بتطبيقه على مجموعة بيانات بسيطة. سنستخدم مكتبة Scikit-Learn وPandas وNumPy في هذا المثال. أولاً، سنقوم باستيراد المكتبات اللازمة:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
بعد ذلك، سننشئ مجموعة بيانات بسيطة لاستخدامها في النموذج:
# إنشاء مجموعة بيانات بسيطة
data = {
'Feature1': [1, 2, 3, 4, 5],
'Feature2': [10, 9, 8, 7, 6],
'Label': [0, 0, 1, 1, 1]
}
df = pd.DataFrame(data)
# تقسيم البيانات إلى ميزات وتصنيفات
X = df[['Feature1', 'Feature2']]
y = df['Label']
# تقسيم البيانات إلى مجموعات التدريب والاختبار
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
الآن، سنقوم بتهيئة نموذج الانحدار اللوجستي وتدريبه على بيانات التدريب:
# تهيئة نموذج الانحدار اللوجستي
model = LogisticRegression()
# تدريب النموذج
model.fit(X_train, y_train)
أخيرًا، سنقوم بتقييم دقة النموذج باستخدام بيانات الاختبار:
# إجراء التنبؤات
y_pred = model.predict(X_test)
# حساب دقة النموذج
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy * 100:.2f}%')
في هذا المثال البسيط، قمنا بتطبيق الانحدار اللوجستي لتصنيف البيانات إلى فئتين. يعتبر هذا التطبيق نموذجًا أساسيًا ولكنه يوضح كيفية استخدام الانحدار اللوجستي في Python. يمكن توسيع هذا المثال ليشمل مجموعات بيانات أكبر وأكثر تعقيدًا باستخدام نفس النهج.
