76- كورس برمجة Machine Learning بلغة البايثون Python شرح – Data Distribution

توزيع البيانات في بايثون

مقدمة حول توزيع البيانات في بايثون

يعتبر توزيع البيانات من المفاهيم الأساسية في علم الإحصاء وتحليل البيانات، حيث يُستخدم لوصف كيفية انتشار البيانات وتوزيعها عبر مجموعة معينة. في لغة البرمجة بايثون، توجد العديد من المكتبات والأدوات التي تُسهل عملية تحليل وتوزيع البيانات، مثل مكتبة NumPy ومكتبة Pandas. يُتيح فهم توزيع البيانات للمحللين اتخاذ قرارات مستنيرة وإجراء التنبؤات بناءً على النمط الذي تتبعه البيانات.

على سبيل المثال، يمكن استخدام توزيع البيانات لتحديد ما إذا كانت البيانات تتبع توزيعًا طبيعيًا أو أنها مُنحرفة نحو جانب معين. هذه المعلومات يمكن أن تكون ذات قيمة كبيرة في مجموعة متنوعة من التطبيقات مثل التمويل، الطب، والتسويق.

أمثلة عملية على توزيع البيانات باستخدام بايثون

لإجراء تحليل توزيع البيانات في بايثون، يمكن استخدام مكتبة Matplotlib لإنشاء الرسوم البيانية التي توضح كيفية توزيع البيانات. على سبيل المثال، يمكننا استخدام مكتبة NumPy لتوليد مجموعة من البيانات العشوائية ثم استخدام Matplotlib لرسمها.


import numpy as np
import matplotlib.pyplot as plt

# توليد بيانات عشوائية تتبع التوزيع الطبيعي
data = np.random.normal(loc=0, scale=1, size=1000)

# إنشاء الرسم البياني للتوزيع
plt.hist(data, bins=30, density=True, alpha=0.6, color='g')

# إضافة خط التوزيع الطبيعي
xmin, xmax = plt.xlim()
x = np.linspace(xmin, xmax, 100)
p = np.exp(-((x - 0) ** 2) / (2 * 1 ** 2)) / (np.sqrt(2 * np.pi) * 1)
plt.plot(x, p, 'k', linewidth=2)
plt.title("Histogram of Normally Distributed Data")
plt.show()

في هذا المثال، قمنا باستخدام مكتبة NumPy لتوليد بيانات عشوائية تتبع التوزيع الطبيعي بمعدل 0 وانحراف معياري 1. بعد ذلك، استخدمنا مكتبة Matplotlib لإنشاء الرسم البياني الذي يوضح توزيع البيانات وكيفية تطابقها مع منحنى التوزيع الطبيعي. هذه الوسائل البسيطة توفر لنا نظرة سريعة حول خصائص البيانات وكيفية توزيعها، مما يسهل اتخاذ القرارات بناءً على التحليل الإحصائي.