hadoop

استطلاع نبض السوق حول Hadoop

Hadoop هي منصّة لتخزين ومعالجة البيانات بشكل موزّع وبشكل متواز على أكثر من من عنصر في شبكة الأجهزة التي تكوّنه، وهي مقاربة جديدة في عالم البيانات الضخمة تسمح بالحصول على نتائج قويّة باستخدام شبكة من الأجهزة المتواضعة نسبيا.

نتيجة الإستطلاع

العامل الرئيسي في الوقت الراهن لتبنّي حلول البيانات الضخمة المبنيّة على منصّة Hadoop حسب أبرز الإحصائيات عرضتها مؤخّرا ِAtSale له ارتباط أساسي ليس بتقليل تكلفة التشغيل والتبنّي بل بكونه المنصّة التي تقود سباق الإبتكار في سماء البيانات الضّخمة في الوقت الراهن.

صحيح أنّ Hadoop إنطلق في بداياته كمنصّة كانت تفتقر لبعض الأدوات المتكاملة – والتي كانت في جزء منها حينها على هيئة مشاريع في طور الحضانة – لتوفير البيئة المثالية لحلّ المشاكل العامّة المتعلّقة بالبيانات الضخمة ومعالجاتها، بل جاءت المنصّة حينها في سياق محدّد مرتبط أساسا بطريقة توزيع البيانات والمعالجة الموازية كسألوب توسّع أفقي فعّال جاء ليستعاض به عن التوسّع العمودي الذي أرهق كبار المصنّعين الذين تنافسوا على استعراض خوادم ضخمة تقدّم أداءا خياليّا لكن بأسعار خيالية في نفس الآن.

وفق احصائيات AtSale التي نشرت مؤخّرا ، فإنّ العامل الرئيسي في الوقت الراهن الذي يقود عمليّات تبنّي منصّة Hadoop هو كونه استثمارا استراتيجيا مهمّ (62%) وأنّه منصّة قلبت معادلات السوق ووجب التوفّر عليه لمواكبة السّوق -دون معرفة حتمية بأهميّته- (15%) مقابل ما لا يجاوز 17% رأوا فيه فرصة لتوفير التكاليف التشغيلية وتقليلها في قسم الـIT في مؤسساتهم وهذا بلا شكّ تطوّر لافت للإنتباه، فمعظم النقاشات التي جرت خلال السنوات الماضية ارتكزت بشكل حاسم على إبراز الفوائد الإقتصادية المرتبطة بتوفير التكاليف التشغيلية خاصة أنّ مبدأ Hadoop يقوم بالأساس على القيام بالعميات المعقّدة المعتادة لكن على أكثر من جهاز عادي المواصفات مع تجنّب مخاطر فقد البيانات من خلال عمليات النسخ المتماثل للبيانات على اكثر من جهاز، كما أنّ تكلفة حفظ نفس كمية البيانات بين التوسّع العمودي ونظيرها الأفقي تقلّ بأكثر من عشرة اضعاف وهو رقم مثير للشهيّة بلا شكّ.

يعتقد البعض أنّ الأمر عائد لكون المنافع الإقتصادية من ناحية التوفير في التكاليف التشغيلية باتت واضحة و لا تستهوي لوحدها المؤسسات بل هناك خطوة إضافية تمّ خطوها للأمام نحو استشراف المنافع الإقتصادية المترتّبة بشكل مباشر لكن بالأخص وبشكل غير مباشر على المؤسسات وقدرتها التنافسيّة في السوق.

الدراسة أوضحت كذلك أنّ عمليّات تبني منصّة Hadoop في انتشار واسع في الوقت الراهن (حوالي 77% من المستطلعة أرائهم يمتلكون ما بين عشرة إلى خمسمائة جهاز في شبكة المعالجة لديهم، بينما 88% لديهم تجربة استخدام للمنصّة تفوق الستّة أشهر) وهو ما يعطي في الواقع مؤشّرا قويّا حول مستقبل المنصّة.

وقد ذكر حوالي 76% ممّن تمّ استجوابهم أنّهم راضون تماما عن النتائج المتحصّل عليها ولديهم ثقة أنّهم سيستمروّن في توسيع شبكتهم من الأجهزة المعالِجة خلال الثلاث أشهر الموالية، بينما رأى 21% آخرون أنّهم سيحافطون على نفس مستوى الاستثمار في نفس حدوده في الوقت الراهن، كذا يعطي دلالة بكلّ تأكيد حول فرص التشغيل الهائلة القادمة في السوق والتي تعني الاستثمار الفعّال في الوقت والانخراط في مشاريع تكوين مستمرّ حول المنصّة والأنظمة المحيطة بها بشكل عام.

وبخصوص الحديث حول العائد على الاستثمار ROI، فقد ذكر49% من المستطلعة أرائهم أنّهم وصلوا درجة واضحة من ملامسة النتائج وأنّهم راضون تماما عن ذلك، بينما يرى 45% آخرون أنّهم في انتظار حصول ذلك وأنّ الأمر سيستغرق بعض الوقت وقد يضطرون للانتظار بعض الأشهر الإضافية، تظل الفئة المتشائمة حاضرة بكلّ تأكيد إذ يعتقد 6% أنّه حان الوقت للتراجع عن هذا الإستثمار كونه لم يكن مجديا وسوف لن يكون في المدى المنظور.

الأمر المثير للتهكّم ربّما الذي أبرزته الدراسة هو أنّه حتى من ابرزوا تشاؤمهم من هذا الاستثمار لم يبدو ندمهم وسيستمرون في متابعة التطوّرات الحاصلة في عالم Hadoop خاصة على مستوى المعالجات كونهم يعتقدون أن المستقبل هناك لا محالة.

لماذا تبنّي Hadoop؟

هذا الحديث يأخدنا لمعرفة المزيد حول دوافع المستخدمين وراء تبنّي منصّة Hadoop للبيانات الضخمة، الأمر على ما يبدو ليس مرتبطا مباشرة بالمال، ليس بالنسبة لأغلب المؤسسات على الأقلّ.

الحاجة الملحّة للتوسّع الأفقي تربّع على قائمة أبرز الدوافع، إذ أنّ كلّ دراسات الجدوى تتحدّث عن منافع قويّة وراء التوسّع الأفقي بدل العمودي، سواءا القدرة على التسامح مع الأعطال في حالة استخدام أكثر من جهاز، أو عمليات الصيانة والتجديد التي تكون أيسر عادة في حالة شبكات المعالجة عنها في الأجهزة الضخمة.

هنالك ايضا الحاجة لبناء تطبيقات تشغيلية ضخمة، سواءا لمعالجة البيانات اليومية أو إعداد التقارير التحليلية أو حتى ذكاء الأعمال بشكل عام.

تقليل التكاليف؟ كما ذكرنا سالفا فإنّ النسبة لا تتعدّى 17% لدى المستطلعة ارائهم، بينما تحدّث 14% عن توليد منافع مالية مباشرة من وراء هذه التحليلات أيّ أنّ تطبيقاتهم تستعمل قدرات Hadoop لتقديم خدمات مدفوعة.

طبعا هذه الدراسة مثيرة للإهتمام بشكل كبير، كون معظم المؤسسات لها رغبة في استخدام Hadoop كمنصّة ETL (بما نسبته 74%) تليها ذكاء الأعمال (بما نسبته 64%) ثم علم البيانات (بما نسبته 62%)، وهذا مرّة أخرى أمثر مثير للإهتمام كون المؤسّسات – الناشئة على وجه الخصوص – سابقا كانت تتمّ توصيتها باستخدام Hadoop كمنصّة ETL كحل منخفض التكلفة في حال لم يكن يمقدورهم تحمّل تكاليف منصّات أخرى أكثر فاعلية على غرار Informatica, IBM أو Oracle، الأمور إختلفت كثيرا منذ ذلك الحين على ما يبدو.

خلاصة التقرير تشير لقدرة Hadoop على تقديم حلول أكثر فعالية لأبرز المسائل المتعلّقة بذكاء الأعمال كونه بني حول أسس معالجة بيانات صحيحة ومنطقية تماما، هنالك الكثير من الأمل المعقود حول مستقبل Hadoop سواء داعموه أو من قاموا بتبنّيه ليغدو أكثر من مجرّد منصة ETL.

على قدر البذل يكون العطاء

الدراسة تؤكّد أنّ العائد على الاستثمار يتناسب مع الدافع الرئيسي وراء تبنّي Hadoop كمنصّة توسّع أفقي. صحيح أنّ Hadoop وبعض المنصّات الأخرى هي منصّات مفتوحة المصدر لكن هذا لا يعني دوما أن تشغيلها سيكون منخفض التكلفة، يجب الاستثمار كذلك حول رسوم تشغيلها، وبالأخضّ تكوين المهندسين حولها وهو ما يأخد بعض الوقت والجهد وربما النَّفَسْ. من المهمّ كذلك اعتبار الموارد التكنولوجية التي تتوفّرها أيّ مؤسسة كعامل جوهريّ في التنافسية الإقتصادية للمؤسّسات وهو يعني العمل على تغيير بعض الذهنيّات.

ختاما!

فإنّ Hadoop منصّة مثالية للتوسّع الافقي للبنية التحتية لمعالجة البيانات في المؤسسات الحديثة وهو حل مثالي لمعالجة البيانات بشكلها التقليدي مثل كلّ أدوات ETL التقليدية لكن أيضا لمعالجة البيانات غير المنتظمة أو شبه المنتظمة وهو ما يعطي المؤسسات بلا شكّ قدرات تنافسية على الصعيد التكنولوجي وأيضا الإقتصادي على المدى المتوسّط والمنظور.

 

Hadoop هي مسألة “إبتكار” وليس “تقليل تكاليف”
  • 0.00 / 5 5
  كيف وجدت هذا المقال؟  

ماذا لو شاركتنا رأيك؟

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *