جودة البيانات مقابل كثرة البيانات أيهما أهم بالنسبة لأنظمة الذكاء الإصطناعي ؟
![]() |
هل تميز أنظمة الذكاء الإصطناعي بين جودة البيانات و كميتها |
تعمل أنظمة الذكاء الإصطناعي على تحليل البيانات التي يتم جمعها و تقديمها لها لتحليلها و العمل على إستنباط القرارات الإستراتيجية بناءً عليها، لذلك فمن المهم بمكان أن تكون تلك البيانات، على كثرتها، ذات جودة و قيمة عالية حتى تكون النتائج التي تكلف وقتا و جهدا و مالا للشركات محفزة و مطورة للأعمال و ليست العكس
إن أهمية التركيز على جودة البيانات أكثر من كثرة البيانات مجال جدير بالإهتمام حيث أن حقيقة باتت مترسخة لدى المهتمين و الخبراء بمجال علم البيانات و الذكاء الإصطناعي هي كون تلك الأنظمة (AI) لا تميز بين الجودة و الكثرة في البيانات التي تتلقاها، و بالتالي يمكن أن تفترض الخوارزميات التي تعمل بالذكاء الإصطناعي أن تلك البيانات موثوقة فقط و تقوم بتحليل بيانات سيئة أو مغلوطة ضمن البيانات الصحيحة ما يؤدي إلى نتائج مضللة تشجع الشركات على إتخاذ قرارات مهدرة و خاطئة أو نتائج غير قابلة للتنفيذ في أحسن الأحوال
من ناحية أخرى، تعتبر كيفية تعامل أنظمة الذكاء الإصطناعي و التعلم الآلي مع البيانات أمرا مهما أيضا لمعرفة مدى وجوب تنقية البيانات و تحديد جودتها على حساب كميتها
فالأنظمة التي تعمل بالذكاء الإصطناعي (AI) و التعلم الآلي (ML) تحتاج إلى التدريب بإستخدام مجموعة من البيانات التي يجب أن تكون ذات جودة عالية، حيث أن أي قراءة لبيانات مغلوطة و إن كانت صغيرة قد تكون ناتجة عن إشارات خاطئة أو تحيز صغير في المستشعر سيفهمها النظام على أنها بيانات معتبرة و تفسد عمل الخوارزميات منذ البداية مثل أن يقرأ نظام التعلم الآلي الذي يشغل السيارات ذاتية القيادة بيانات مغلوطة عن أضواء المرور (بناء على بيانات شاذة لضعف الأضواء) فتتطور تلك البيانات المغلوطة و إن كانت بكميات قليلة و يتدرب النظام على إعتبارها قاعدة صحيحة و أصلية
لكن، و رغم أنه من المتعذر الحصول على كميات هائلة من البيانات مع نسبة دقة عالية جدا إلا أن الإعتماد على الذكاء الإصطناعي أمر مهم لعدد هائل و متزايد من الشركات، الأمر الذي إستوجب مزيدا من العمل على تحليل البيانات و فحصها و هو ما لا يمكن أن يتم بدقة إلا بالإعتماد على القدرات البشرية من علماء الإحصاء و خبراء في علم البيانات حيث أنهم يعرفون كيفية فحص البيانات و تحليلها و هذا ما زاد من الطلب عليهم في سوق الشغل
أيضا، من الممكن القول أن أنظمة الذكاء الإصطناعي و التعلم الآلي باتت متخمة بالبيانات و ليس من الضروري مزيد الطلب على كميات كبيرة من البيانات (دون النظر إلى جودتها) بقدر ما هو مطلوب من العاملين في هذا المجال البحث عن بيانات موثوقة و ذات جودة عالية لسببين رئيسيين، أولاهما ما تقدم من خطر إعتماد أنظمة التعلم الآلي على بيانات مغلوطة و رديئة و ما ينتج عنه من إستنباطات خاطئة و بالتالي إستنتاجات و توصيات مضرة أما الثاني فالتكلفة التي تتطلبها تلك البيانات من تخزين و تجميع و تحليل، رغم توفر وسائل و تقنيات التخزين السحابي، رغم عدم جني منفعة أو طائل منها بالنسبة للشركات
فالأنظمة التي تعمل بالذكاء الإصطناعي (AI) و التعلم الآلي (ML) تحتاج إلى التدريب بإستخدام مجموعة من البيانات التي يجب أن تكون ذات جودة عالية، حيث أن أي قراءة لبيانات مغلوطة و إن كانت صغيرة قد تكون ناتجة عن إشارات خاطئة أو تحيز صغير في المستشعر سيفهمها النظام على أنها بيانات معتبرة و تفسد عمل الخوارزميات منذ البداية مثل أن يقرأ نظام التعلم الآلي الذي يشغل السيارات ذاتية القيادة بيانات مغلوطة عن أضواء المرور (بناء على بيانات شاذة لضعف الأضواء) فتتطور تلك البيانات المغلوطة و إن كانت بكميات قليلة و يتدرب النظام على إعتبارها قاعدة صحيحة و أصلية
إقرأ أيضا في نفس الموضوع كيفية العمل على تحليل البيانات الضخمة
لكن، و رغم أنه من المتعذر الحصول على كميات هائلة من البيانات مع نسبة دقة عالية جدا إلا أن الإعتماد على الذكاء الإصطناعي أمر مهم لعدد هائل و متزايد من الشركات، الأمر الذي إستوجب مزيدا من العمل على تحليل البيانات و فحصها و هو ما لا يمكن أن يتم بدقة إلا بالإعتماد على القدرات البشرية من علماء الإحصاء و خبراء في علم البيانات حيث أنهم يعرفون كيفية فحص البيانات و تحليلها و هذا ما زاد من الطلب عليهم في سوق الشغل
أيضا، من الممكن القول أن أنظمة الذكاء الإصطناعي و التعلم الآلي باتت متخمة بالبيانات و ليس من الضروري مزيد الطلب على كميات كبيرة من البيانات (دون النظر إلى جودتها) بقدر ما هو مطلوب من العاملين في هذا المجال البحث عن بيانات موثوقة و ذات جودة عالية لسببين رئيسيين، أولاهما ما تقدم من خطر إعتماد أنظمة التعلم الآلي على بيانات مغلوطة و رديئة و ما ينتج عنه من إستنباطات خاطئة و بالتالي إستنتاجات و توصيات مضرة أما الثاني فالتكلفة التي تتطلبها تلك البيانات من تخزين و تجميع و تحليل، رغم توفر وسائل و تقنيات التخزين السحابي، رغم عدم جني منفعة أو طائل منها بالنسبة للشركات
و بشكل عام، فإن البيانات و ما لها من أهمية كونها المادة الأولية لأنظمة الذكاء الإصطناعي و التعلم الآلي و التي من خلالها يتغير العالم بشكل مستمر و ترتسم صورة مستقبلية أكثر ذكاءً لعمل الشركات التقنية و المؤسسات الخاصة و الحكومية يمكنها أن تكون تدميرية بالنسبة للشركات التي تعتمدها أو مضرة في أحسن الأحوال و هو يجعل فحص البيانات و إخراج البيانات ذات الجودة على حساب كميتها أمرا مهما و ضروريا خاصة و أن أنظمة الذكاء الإصطناعي لا تميز، حتى الآن على الأقل، بين جودة البيانات و كثرتها .