کلان داده ها: حجم بازار و روند آتی

سعید قربانی

0
118

ناظر اقتصاد: در گزارش پیش رو، به بررسی مفهوم کلان داده خوهیم پرداخت، همچنین حجم بازار و روند آتی متصور برای کلان داده‌ها را مورد بررسی قرار خواهیم داد.

امروزه فناوری اطلاعات در مرکز توجه علوم مدرن و کسب‌وکار است. این فناوری از تراکنش‌های برخط، رایانامه‌ها، ویدیوها، صدا، تصاویر، جریان‌های کلیک، گزارش خطاها، پست‌ها، گزارش‌های جستجو، رکوردهای اطلاعات سلامت، عملیات متقابل در شبکه‌های اجتماعی، داده‌های علمی، حسگرها، تلفن‌های همراه و نرم‌افزارهای روی تلفن‌های همراه تولید می‌شوند.

پایگاه داده‌های حاوی این داده‌ها به‌ سرعت رشد می‌کنند و نظارت، فرم دهی، ذخیره، مدیریت، اشتراک‌گذاری، آنالیز و مجازی‌سازی آن‌ها از طریق ابزارهای نرم‌افزاری معمول دشوار است. یکی از چالش‌های مهم محققین این است که با رشد سریع کلان داده‌ها، نیاز به طراحی سکو‌های رایانش ابری مناسب جهت آنالیز و بروز رسانی داده به‌سرعت افزایش می‌یابد.

با رشد سریع فناوری اطلاعات در برنامه‌های کاربردی نوظهور مانند تحلیل شبکه‌های اجتماعی، تحلیل وب منظم و تحلیل شبکه زیستی و غیره مجموعه متنوعی از داده‌ها جهت پردازش پیوسته با سرعت بسیار بالا موردنیاز است. مدیریت مؤثر و تحلیل مقیاس بزرگ داده جذابیت‌هایی را در این حوزه ارائه می‌کند اما با چالش‌های حیاتی نیز مواجه است. کلان داده‌ها یکی از طلایه‌داران حال حاضر و آینده تحقیقاتی در دنیا است که حوزه‌های بسیاری نظیر تحقیقات علمی، مدیریت دولتی، صنایع، سازمان‌ها و بنگاه‌ها را متحول خواهد کرد.

مؤسسه تحقیقاتی گارتنر کلان داده را در میان ده روند فناوری برتر دنیا در سال ۲۰۱۳ و همچنین در میان ده روند فناوری حیاتی در پنج سال آینده معرفی کرده است. تغییرات سریع فناوری در دنیای پرتکاپوی حوزه فناوری اطلاعات و ارتباطات دولت‌ها را وادار کرده است تا راهبردهای خود را همگام با تکامل فناوری‌ها در دنیا از نو تعریف کنند یا حداقل همگام با دنیا جهت‌گیری‌های خود را برای مهاجرت به سمت فنّاوری‌های جدید و استفاده از آن‌ها اصلاح کنند.

نظر به شکل‌گیری موج توجه ویژه به موضوع داده‌های کلان در کشورهای دنیا و با عنایت به گزارش‌های گروه‌های مطالعاتی نظیر گارتنر و با توجه به مورد توجه قرار گرفتن این حوزه در ژورنال‌های معتبر و همچنین در اجلاس‌های معتبری نظیر TDWI 2014 و INFORMS، توجه ویژه به این حوزه و رصد تغییرات آن در کشور را به امری الزامی بدل کرده است.

کلان داده ها: حجم بازار و روند آتی

در دو دهه گذشته، رشد پیوسته توان محاسباتی سبب رشد جریان فزاینده‌ای از داده ‌شده است. داده عظیم نه‌ تنها دسترسی آن بیشتر شده است، بلکه برای رایانه‌ها قابل‌فهم‌تر نیز شده‌اند. به‌عنوان‌مثال، آزمایش‌های فیزیکی با انرژی بالای جدید به‌طورکلی بیشتر از یک ترابایت داده در هر روز تولید می‌کند. محیط وب شبکه اجتماعی مشهور فیس‌بوک، در شرایط عادی دارای ۵۷۰ میلیون بازدید در هر ماه بوده و در همین مدت سه میلیارد تصویر جدید را در خود ذخیره‌سازی کرده و ۲۵ میلیارد صفحه جدید از اطلاعات را در خود می‌گنجاند.

اخیراً، داده‌های کلان توجه تعداد زیادی از دانشگاهیان، صنایع و همچنین دولتی‌ها را به خود منعطف کرده است. رشد روزافزون حجم داده و ایجاد داده‌های عظیم از طریق رایانش ابری در سال‌های اخیر در بسیاری از کاربردها دیده‌ شده است. داده‌های کلان چالش مهمی است که احتیاج به زیرساختی قوی برای اطمینان از انجام موفق پردازش‌ها و آنالیزهای موردنیاز دارد. موضوع حائز اهمیت این است که چگونه می‌توان از زیرساخت رایانش ابری برای دسترسی، پردازش و آنالیز داده‌های کلان استفاده کرد.

رشد انفجاری در حجم، سرعت و تنوع داده‌های تولیدشده توسط دستگاه‌های ارتباطی همراه و برنامه‌های کاربردی ابری در ازدیاد داده‌های عظیم نقش داشته است. راه‌حل‌های موجود برای ذخیره‌سازی کارآمد داده‌ها و مدیریت آن‌ها نمی‌توانند نیازهای چنین داده‌های ناهمگنی که مقدار داده‌ها به‌طور مداوم در حال افزایش هستند را برآورد سازند. با توجه به‌سرعت در حال رشد اندازه شاخص‌ها و زمان جستجو، راه‌حل‌های موجود برای مدیریت و بازیابی مؤثر داده‌ها ناکارآمد می‌شوند.

مفهوم کلان داده

عبارت کلان داده(Big Data) مدت‌ها است که برای اشاره به حجم‌های عظیمی از داده‌‌ها که توسط سازمان‌های بزرگی مانند گوگل یا ناسا ذخیره و تحلیل می‌شوند مورد استفاده قرار می‌گیرد؛ اما به تازگی، این عبارت بیشتر برای اشاره به مجموعه‌ داده‌های بزرگی گفته می‌شود که به‌قدری بزرگ و حجیم هستند که با ابزارهای مدیریتی و پایگاه‌های داده سنتی و معمولی قابل مدیریت نیستند. مشکلات اصلی در کار با این نوع داده‌‌ها مربوط به برداشت و جمع‌آوری، ذخیره‌سازی، جست‌وجو، اشتراک‌گذاری، تحلیل و نمایش آن‌ها است.

این مبحث، به این دلیل هر روز جذابیت و مقبولیت بیشتری پیدا می‌کند که با استفاده از تحلیل حجم‌های بیشتری از داده‌ها، می‌توان تحلیل‌های بهتر و پیشرفته‌تری را برای مقاصد مختلف، از جمله مقاصد تجاری، پزشکی‌ و امنیتی، انجام داد و نتایج مناسب‌تری را دریافت کرد.

بیشتر تحلیل‌های مورد نیاز در پردازش داده‌های عظیم، توسط دانشمندان در علومی مانند هواشناسی، ژنتیک، شبیه‌سازی‌های پیچیده فیزیک، تحقیقات زیست‌شناسی و محیطی، جست‌وجوی اینترنت، تحلیل‌های اقتصادی و مالی و تجاری مورد استفاده قرار می‌گیرد. حجم داده‌های ذخیره‌شده در مجموعه‌های داده‌ای Big Data ، عموماً به خاطر تولید و جمع‌آوری داده‌‌ها از مجموعه بزرگی از تجهیزات و ابزارهای مختلف مانند گوشی‌های موبایل، حسگرهای محیطی، لاگ نرم‌افزارهای مختلف، دوربین‌ها، میکروفون‌ها، دستگاه‌های تشخیص RFID، شبکه‌های حسگر بی‌سیم و غیره با سرعت خیره‌کننده‌ای در حال افزایش است.

روندهای کلان داده

blueتحلیل بازار کلان داده‌ها نشان دهنده این حقیقت است که حجم بازار کلان داده تا سال ۲۰۲۷ به ۱۰۳ میلیارد دلار خواهد رسید.

کلان داده ها: حجم بازار و روند آتی
نمودار ۱: حجم بازار کلان داده‌ها در افق ۲۰۲۷ (میلیارد دلار)

blueطبق پیش‌بینی‌های صورت گرفته، تا اواخر سال ۲۰۱۹ حجم بازار کلان داده حدود ۲۰ درصد رشد خواهد داشت.
blueدر سال ۲۰۲۰ هر فردی حدود ۱.۷ مگابایت در عرض فقط یک ثانیه تولید خواهد نمود.
blueکاربران اینترنت حدود ۲.۵ کوانتیلیون(quintillion) بایت داده در هر روز تولید خواهد نمود.
blueتا سال ۲۰۲۵ حدود ۹۷.۲ درصد سازمان‌ها در کلان داده‌ها و هوش مصنوعی سرمایه‌گذرای خواهند کرد.
blueبررسی روندها حکایت از این دارد که کلان داده‌ها منجر به تغییراتی اساسی در کسب و کار اصلی صنایعی مانند انرژی، سیستم بهداشت، خدمات بهداشت و خدمات حرفه‌ای شده است.

کلان داده ها: حجم بازار و روند آتی
شکل ۱: تغییر در کسب و کار اصلی صنایع به واسطه کلان داده

کاربردهای مهم کلان داده‌ها

یکی از روندهای جاری در حوزه پایش جامعه اطلاعاتی و بررسی میزان دستیابی به اهداف توسعه ملی و بین‌المللی، بهره‌گیری از داده‌های عظیم به‌ عنوان منبعی مکمل برای آمارها و داده‌های فناوری اطلاعات است. نقش کلان داده‌های عظیم در پایش جامعه اطلاعاتی فناوری اطلاعات و ارتباطات عبارت‌اند از:

  • بهره‌گیری از داده‌های کلان به‌ عنوان منبعی مکمل برای آمارهای فاوا؛
  • مقرون ‌به‌صرفه بودن خدمات فناوری اطلاعات و ارتباطات؛
  • مهارت‌های فناوری اطلاعات و ارتباطات؛
  • اثرات فناوری اطلاعات و ارتباطات؛
  • اشتغال در بخش فناوری اطلاعات و ارتباطات؛
  • شاخص جهانی آمادگی امنیت سایبری (GCI)؛
  • بانکداری سیار؛
  • استفاده از فناوری اطلاعات و ارتباطات در کسب‌وکارها
  • محیط‌زیست و فناوری اطلاعات و ارتباطات

کاربرد داده‌های کلان در شرکت‌ها، می‌تواند بهره‌وری تولید و رقابت‌پذیری را از جنبه‌های بسیاری بالا ببرد. به طور خاص، در بازاریابی، با تحلیل داده‌های بزرگ، شرکت‌ها می‌توانند با دقت بیشتری رفتار مشتری را پیش‌بینی نمایند و شرایط همکاری بهتری را در تجارت پیدا کنند.

شرکت‌ها می‌توانند در برنامه‌ریزی و معرفی طرح‌های فروش، بعد از مقایسه داده‌های حجیم، قیمت کالاهای خودشان را بهینه سازند تا کارآمدی، بهره‌وری و رضایت بخشی تجاری، بهینه‌سازی نیروی کار، پیش‌بینی درست و دقیق تخصیص الزام‌های پرسنلی، پرهیز و دوری از ظرفیت تولید اضافی و کاهش هزینه انجام کار را بهبود بخشند. همچنین، این شرکت‌ها می‌توانند در زنجیره تأمین نیازهای اساسی خود را با استفاده از داده های بزرگ، بهینه سازی موجودی انبار و نیازهای ضروری خویش را برای کاهش توقف بین تأمین و تقاضا، کنترل بودجه و بهبود خدمات اداره کنند.

از دیگر کاربردهای داده‌های بزرگ، تولید محصولات نرم افزاری هوشمند است که بر اساس داده‌های موجود یا اطلاعات دریافت شده از تعامل با کاربران سامان می‌یابد؛ برای مثال، وقتی یک محقق علوم اسلامی در جستجوی موضوعی خاص است، داده‌های بزرگ در این زمینه او را در دستیابی به مطالب منسجم، جامع و دقیق یاری می‌رسانند و همه منابع و محتواهای معتبر، میان رشته‌ای و مرتبط با موضوع را در اختیار او قرار خواهد داد.

کاربرد داده‌های کلان مبتنی در اینترنت اشیاء (IoT)

برای مثال، کامیون‌های UPS به حسگرها ، آداپتورهای بی‌سیم و GPS مجهز هستند که دفتر مرکزی می‌تواند موقعیت‌های کامیون را دنبال کند و از خرابی موتور یا مشکلات احتمالی در طول مسیر جلوگیری نماید. در همین حال، این سیستم به UPS کمک می‌کند که کارمندانش را نیز مدیریت و نظارت کند و مسیرهای تحویل را بهینه سازد. مسیرهای تحویل بهینه که مختص به کامیون‌های UPS است، از سابقه تجربه رانندگی آن‌ها استخراج شده است.

همچنین، شهر هوشمند، یک محدوده پژوهشی بر اساس کاربرد داده‌های IoT می باشد؛ برای مثال، همکاری پروژه شهر هوشمند بین Miami-Dade در فلوریدا و IBM نزدیک به ۳۵ نوع دپارتمان دولتی را در آن‌ها به هم متصل می‌کند و در نتیجه، دولت، می‌تواند اطلاعات بهتری برای پشتیبانی و تصمیم‌گیری برای مدیریت منابع آبی، کنترل ترافیک و بهبود امنیت عمومی به دست آورد.

کاربرد داده‌های کلان در شبکه‌های اجتماعی

SNS آنلاین، یک ساختار اجتماعی تشکیل شده از افراد اجتماعی و اتصالات میان افراد بر اساس یک شبکه اطلاعاتی است. کلان داده‌های SNS آنلاین، از پیام‌های فوری و آنلاین، میکروبلاگ و یا فضای اشتراک می‌باشد که فعالیت‌های مختلف کاربر را اداره می‌کند. تحلیل‌های داده‌های بزرگ در SNS آنلاین، روش تحلیلی محاسباتی ارائه شده را برای فهم روابط جامعه انسانی توسط نظریات و روش‌ها بیان می‌نماید که شامل: ریاضیات، انفورماتیک، جامعه شناسی و یا علم مدیریت است و از آنها در سه بُعد: ساختار شبکه، تعامل گروهی و گسترش اطلاعات استفاده می‌کند.

این برنامه، شامل توانایی‌هایی همچون: تحلیل هوش شبکه‌ای، بازاریابی اجتماعی، پشتیبانی تصمیم‌گیری‌های دولتی و تحصیل آنلاین می باشد.

امنیت کلان داده‌ها

نگران کننده‌ترین مسئله دوران کنونی، حریم خصوصی و امنیت اطلاعات می‌باشد. از آنجا که حریم خصوصی برای فرد و انواع داده‌های سازمانی بسیار ضروری است، تبدیل به یک چالش عمده برای کلان داده‌ها شده است. جلوگیری از نشت داده‌ها در هنگام پردازش و دفاع از حملات بیرونی، نیازمند نوعی مدل امنیت داده محور قابل اعتماد است. این فناوری، همچنین باید از تهدیدات امنیتی که ممکن است در هنگام ذخیره‌سازی چنین داده‌های بزرگی رخ می‌دهد، مراقبت کند.

در عصر داده‌های بزرگ، همان‌طور که حجم داده‌ها به سرعت رشد می‌کند، خطرات امنیتی شدیدتری وجود دارد؛ در حالی که ثابت شده روش‌های حفاظت داده‌های سنّتی، برای داده‌های بزرگ کارآمد نیستند؛ به خصوص حریم خصوصی داده‌های بزرگ که با چالش‌های امنیتی زیر مواجه می‌شود:

  • حفاظت از حریم خصوصی حین کسب داده: علایق و ویژگی‌های شخصی و عادات کاربران می‌تواند به راحتی کسب شود و کاربران متوجه نخواهند شد.
  • داده‌های حریم خصوصی می‌توانند حین ذخیره سازی، انتقال و استفاده، نشتی پیدا کنند؛ حتی اگر با تأیید کاربران به دست آید. از این رو، می‌توان نتیجه گرفت که حریم خصوصی کلان داده‌ها می‌تواند به وسیله دو رویکرد مختلف حفظ شود: یکی، تحمیل قوانین به فرد و سازمان، و روش دیگر، توسعه حریم خصوصی.

بنابراین، داده‌های بزرگ، چالش‌هایی برای رمزگذاری داده‌های با مقیاس بزرگ و تراکم بالا به ارمغان می‌آورد. عملکرد روش‌های رمزگذاری در داده‌های کوچک و متوسط، نمی‌تواند تقاضای داده‌های بزرگ را برآورده کند؛ چرا که باید روش‌های رمزنگاری داده‌های بزرگ کارآمد شود و توسعه یابد. ازاین رو، در این خصوص باید طرح‌های مؤثر مدیریت امنیت، کنترل دسترسی و ارتباطات امن برای داده‌های ساخت یافته، نیمه ساخت یافته و غیرساخت یافته مورد بررسی و تحقیق قرار گیرد.

جمع‌بندی

در این گزارش به بررسی مفهوم کلان داده پرداخته شد و مهم‌ترین کاربردهای آن را مورد بررسی قرار گرفت. مطالعه روند کلان داده حکایت از این دارد که حجم بازار کلان داده‌ها از ۴۹ میلیارد دلار در سال ۲۰۱۹ به بیش از ۱۰۳ میلیارد دلار در سال ۲۰۲۷ خواهد رسید. همچنین ساختار کسب و کارها با ظهور کلان داده‌ها متحول شده و خواهد شد.

بهره‌گیری از داده‌های کلان به‌عنوان منبعی مکمل برای آمارهای فاوا؛ مقرون‌به‌صرفه بودن خدمات فناوری اطلاعات و ارتباطات؛ مهارت‌های فناوری اطلاعات و ارتباطات؛ اثرات فناوری اطلاعات و ارتباطات؛ اشتغال در بخش فناوری اطلاعات و ارتباطات؛ و شاخص جهانی آمادگی امنیت سایبری (GCI) از جمله مهم‌ترین زمینه‌هایی است که کلان داده‌ها در آن کاربرد دارند.

نظر بدهید