دراسات وابحاث

تطور الحوسبة الإحصائية: رحلة آسرة عبر التاريخ

تطور الحوسبة الإحصائية: رحلة آسرة عبر التاريخ

مصر:إيهاب محمد زايد

من المعترف به على نطاق واسع أن أهم التطورات الأساسية في مجال الإحصاء خلال أكثر من 60 عامًا الماضية كانت مدفوعة بتكنولوجيا المعلومات (IT). لا ينبغي لنا أن نقلل من أهمية القلم والورقة كشكل من أشكال تكنولوجيا المعلومات، ولكن منذ أن بدأ الناس في استخدام أجهزة الكمبيوتر لإجراء التحليل الإحصائي، قمنا بالفعل بتغيير الدور الذي تلعبه الإحصائيات في أبحاثنا وكذلك في الحياة العادية.

 

هذه لمحة تاريخية موجزة، وسنعرض بعضًا من حزم برامج الإحصاءات العامة الرئيسية التي تم تطويرها منذ عام 1957 فصاعدًا. سيتم تجاهل البرامج الإحصائية التي تم تطويرها لأغراض خاصة. نحن أيضًا نتجاهل “برنامج الإحصاء” الأكثر استخدامًا على نطاق واسع كما ذكر بريان ريبلي (2002) في مقولته الشهيرة: “دعونا لا نخدع أنفسنا: إن برنامج الإحصاء الأكثر استخدامًا على نطاق واسع هو برنامج Excel”.

 

بعض الحزم التي طورها الإحصائيون للإحصائيين، والتي لا تزال قيد التطوير لتشمل أحدث التطورات في مجال الإحصاءات.

 

الآلات الحاسبة لرونالد فيشر

بدأ الإحصائيون الرواد مثل رونالد فيشر في إجراء إحصائياتهم على قطع من الورق ثم قاموا بالترقية لاحقًا لاستخدام الآلات الحاسبة. اشترى فيشر أول آلة حاسبة مليونير عندما كان يرأس قسم الإحصاء في شركة روثامستد للأبحاث في أوائل العشرينيات من القرن الماضي. 

 

كانت تكلفتها حوالي 200 جنيه إسترليني في ذلك الوقت، وهو ما يعادل في القوة الشرائية حوالي 9141 جنيهًا إسترلينيًا في عام 2020. ولم تتمكن هذه الآلة الحاسبة الميكانيكية من حساب المنتج المباشر إلا، ولكنها كانت مفيدة جدًا للإحصائيين في ذلك الوقت كما ذكر فيشر: “معظم تم تعلم الإحصائيات على الجهاز.” تم استخدام الآلة الحاسبة بشكل كبير من قبل خليفة فيشر فرانك ييتس (رئيس القسم 1933-1968) وساهم في الكثير من أبحاث ييتس، مثل التصميمات التي تحتوي على خلط بين تفاعلات المعالجة والكتل، أو المخططات المنقسمة، أو شبه المضروب.

 

نص بديل

 

فرانك ييتس

 

تقرير روثامستد السنوي لعام 1952: “لقد اشتمل العمل التحليلي مرة أخرى على جهد حاسوبي كبير جدًا.”

 

بداية عصر الكمبيوتر

منذ أوائل الخمسينيات دخلنا عصر الكمبيوتر. كان الكمبيوتر في ذلك الوقت يشبه إلى حد ما نظيره الحديث، سواء كان Elliott 401 من المملكة المتحدة أو سلسلة IBM 700/7000 في الولايات المتحدة. على الرغم من أن أول حزمة إحصائية موثقة، BMDP، تم تطويرها بدءًا من عام 1957 لحاسبات IBM المركزية في مرفق الحوسبة الصحية بجامعة كاليفورنيا، إلا أنه على الجانب الآخر من المحيط الأطلسي، بدأ الإحصائيون في Rothamsted Research مساعيهم للبرمجة على Elliot 401 في عام 1954.

 

نص بديل

 

برمجة البرامج الإحصائية

عندما نقوم بتدريس الإحصاء في المدارس أو الجامعات، كثيرًا ما يشتكي الطلاب من صعوبات البرمجة. إن النظر إلى البرمجة في الخمسينيات من القرن الماضي سيمنح الطلاب المعاصرين تقديرًا لمدى سهولة البرمجة اليوم!

 

يخدم Elliott 401 مستخدمًا واحدًا في كل مرة ويطلب كل المدخلات على شريط ورقي (انس لوحة المفاتيح ومحرر IDE الذكي). قدمت الإخراج إلى آلة كاتبة كهربائية. يجب أن تكون جميع البرمجة في كود الآلة مع التعليمات والبيانات على قرص دوار بطول كلمة 32 بت، و5 “كلمات” لمخزن الوصول السريع، و7 مسارات وصول وسيطة مكونة من 128 كلمة، و16 مسارًا إضافيًا يمكن اختيارها واحدًا تلو الآخر (= 2949 كلمة – 128 للنظام).

 

شريط ورقي للكمبيوتر

 

ملاءمة الثوابت للتأثيرات والتفاعلات الرئيسية في الجداول متعددة الاتجاهات (1957)، والانحدار والانحدار المتعدد (1956)، وملاءمة العديد من المنحنيات القياسية بالإضافة إلى التحليل متعدد المتغيرات للجذور والمتجهات الكامنة (1955).

 

على الرغم من أن الأمر يبدو واعدًا جدًا مع ظهور البرامج الإحصائية للبحث، إلا أنه تم إجراء تحليلات إحصائية روتينية أيضًا ولا تزال تمثل تحديًا كبيرًا، على الأقل من الناحية الحسابية. على سبيل المثال، في عام 1963، وهو العام الأخير لاستخدام أجهزة الكمبيوتر إليوت 401 وإليوت 402، 

 

قام الإحصائيون في أبحاث روثامستد بتحليل 14357 متغيرًا للبيانات، واستغرق ذلك 4731 ساعة لإكمال المهمة. من الصعب تخيل استهلاك الطاقة وكذلك كمية الشريط الورقي المستخدم في البرمجة. من المحتمل أن يكون الشريط الورقي (الملتصق ببعضه البعض) طويلًا بما يكفي ليدور حول خط الاستواء.

 

تطوير البرامج الإحصائية: Genstat، SAS، SPSS

تم استخدام مجموعة البرامج المذكورة أعلاه بشكل أساسي للبحوث الزراعية في روثامستد ولم يتم إعطاؤها اسمًا شاملاً حتى أصبح جون نيلدر رئيسًا لقسم الإحصاء في عام 1968. بدأ تطوير Genstat (الإحصائيات العامة) منذ ذلك العام وتم تنفيذ البرمجة في عام 1968. FORTRAN، في البداية على جهاز IBM. 

 

في نفس العام، في جامعة ولاية كارولينا الشمالية، تم تطوير SAS (برنامج التحليل الإحصائي) في وقت واحد تقريبًا بواسطة إحصائيين حسابيين، وذلك أيضًا لتحليل البيانات الزراعية لتحسين غلات المحاصيل. في نفس الوقت تقريبًا، بدأ علماء الاجتماع في جامعة شيكاغو في تطوير SPSS (الحزمة الإحصائية للعلوم الاجتماعية). 

 

على الرغم من أن الحزم الثلاث (الجنرال stat وSAS وSPSS) لأغراض مختلفة وتباينت وظائفها إلى حد ما في وقت لاحق، حيث غطت الوظائف الأساسية منهجيات إحصائية مماثلة.

 

تم إصدار الإصدار الأول من SPSS في عام 1968. وفي عام 1970، تم إصدار الإصدار الأول من Genstat مع وظائف ANOVA والانحدار والمكونات الرئيسية وتحليل الإحداثيات الرئيسية والتحليل العنقودي أحادي الارتباط والحسابات العامة على المتجهات والمصفوفات والجداول. 

 

تم إصدار النسخة الأولى من SAS، SAS 71، وتمت تسميتها على اسم سنة إصدارها. تمت كتابة الإصدارات الأولى من حزم البرامج الثلاث بلغة FORTRAN وتم تصميمها لأجهزة الكمبيوتر الكبيرة.

 

منذ ثمانينيات القرن العشرين، ومع ظهور أجهزة الكمبيوتر الشخصية، بدأ ظهور جيل ثانٍ من البرامج الإحصائية. كان هناك إصدار MS-DOS من Genstat (Genstat 4.03) تم إصداره مع واجهة سطر أوامر تفاعلية في عام 1980.

 

جينستات 4.03 لـ MSDOS

 

وفي حوالي عام 1985، أصدرت SAS وSPSS أيضًا نسخة لأجهزة الكمبيوتر الشخصية. في الثمانينيات، دخل المزيد من اللاعبين إلى هذا السوق: تم تطوير STATA منذ عام 1985 وتم تطوير JMP منذ عام 1989. وكان JMP، منذ البداية، مخصصًا لأجهزة كمبيوتر Macintosh. نتيجة لذلك، ركز برنامج JMP بشكل قوي على التصور بالإضافة إلى الرسومات منذ بدايته.

 

ظهور اللغة الإحصائية R

بدأ تطوير الجيل الثالث من أنظمة الحوسبة الإحصائية قبل ظهور برامج مثل Genstat 4.03e أو SAS 6.01. قاد هذا التطور جون تشامبرز ومجموعته في مختبرات بيل منذ السبعينيات. نتيجة عملهم هي لغة S. 

 

وقد تم تطويرها إلى لغة للأغراض العامة مع تطبيقات للاستدلالات الإحصائية الكلاسيكية والحديثة. كانت لغة S متاحة مجانًا، وكان جمهورها في الأساس مستخدمين أكاديميين متطورين. بعد استحواذ شركة Insightful Corporation على لغة S وتغيير علامتها التجارية لتصبح S-PLUS،

 

 تم استخدام حزمة البرامج الإحصائية الرائدة من الجيل الثالث على نطاق واسع في كل من الإحصاءات النظرية والعملية في التسعينيات، خاصة قبل إصدار نسخة تجريبية مستقرة من البرنامج المجاني والمجاني. برنامج مفتوح المصدر R في عام 2000. 

 

تم تطوير R بواسطة روس إيهكا وروبرت جنتلمان في جامعة أوكلاند، نيوزيلندا، ويستخدم حاليًا على نطاق واسع من قبل الإحصائيين في الأوساط الأكاديمية والصناعة، جنبًا إلى جنب مع مطوري البرامج الإحصائية وعمال مناجم البيانات وخبراء البيانات. المحللين.

 

كان على برامج مثل Genstat وSAS وSPSS والعديد من الحزم الأخرى التعامل مع التحدي الذي تمثله لغة R. وقد طورت كل حزمة من حزم البرامج القديمة هذه واجهة R أو حتى مترجمات R لتوقع التغيير في سلوك المستخدم والاعتماد المتزايد باستمرار لـ R. 

 

بيئة الحوسبة R على سبيل المثال، تحتوي SAS وSPSS على بعض مكونات R الإضافية للتحدث مع بعضها البعض. تم تطوير برنامج ASReml-R من VSNi لمستخدمي ASReml الذين يرغبون في تشغيل تحليل النماذج المختلطة داخل بيئة R، ويوجد حاليًا عدد أكبر من مستخدمي ASReml-R مقارنة بمستخدمي ASReml المستقلين. 

 

المستخدمون الذين يحتاجون إلى تركيبات نموذجية ذات تأثيرات مختلطة موثوقة وقوية اعتمدوا ASReml-R كبديل لحزم الطراز R المختلطة الأخرى نظرًا لأدائها المتفوق وبناء الجملة المبسط. بالنسبة لمستخدمي Genstat، تم تطوير msanova أيضًا كحزمة R لتزويد مستخدمي ANOVA التقليديين بواجهة R لتشغيل تحليلاتهم.

 

ماذا بعد؟

ليس لدينا أي فكرة واضحة عما سيمثله الجيل الرابع من البرامج الإحصائية. R، باعتباره برنامجًا مفتوح المصدر ومنصة للنماذج الأولية والتدريس، لديه القدرة على المساعدة في هذا التغيير في الابتكار الإحصائي. 

 

ومن الأمثلة على ذلك حزمة R Shiny، حيث يمكن تطوير تطبيقات الويب بسهولة لتوفير الحوسبة الإحصائية كخدمات عبر الإنترنت. لكن جميع البرمجيات مفتوحة المصدر والتجارية يجب أن تواجه نفس التحديات المتمثلة في توفير تحليلات إحصائية سريعة وموثوقة وقوية تسمح بتكرار الأبحاث،

 

 والأهم من ذلك، استخدام الاستدلال الإحصائي والنظرية السليمة والصحيحة، وهو أمر كان رونالد فيشر يتوقعه من جهاز الكمبيوتر الخاص به!

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى