آشنایی با بیگ دیتا و کاربرد های آن

bigdata2

بیگ دیتا (Big Data) اصطلاحی ست که در فارسی به آن کلان داده گفته می شود و بهره گیری از آن می تواند موجب رشد ساختارمند یک مجموعه شود. به طور کلی به مجموعه اطلاعات عظیمی که تحلیل آن توسط یک فرد یا یک نرم افزار ساده انجام پذیر نیست، بیگ دیتا  گفته می شود. این در حالی است که بررسی دقیق و منطقی این داده ها سبب بهتر شدن تصمیم گیری ها و هدفمند کردن فرآیند های یک کسب و کار مانند فروش محصول، تبلیغات، کمپین ها و رویدادهای مختلف شده و علاوه بر آن تا حد بسیار زیادی کاهش هزینه و ریسک را به همراه دارد. همانطور که بیگ دیتا پیوسته در حال تغییر است و روز به روز رشد می کند، تکنیک ها و راهکار های تحلیل آن نیز به همان نسبت در حال پیشرفت می باشد.

امروزه تحلیل و بررسی بیگ دیتا به اندازه دسترسی و استفاده از اینترنت ضروری است. میتوان گفت که بیگ دیتا اطلاعاتی ست با سرعت بالا، انواع زیاد و در حجم گسترده که تحلیل و بررسی درست آن موجب کاهش هزینه و ریسک می شود و از سوی دیگر به روش و استراتژی خاصی برای استخراج اطلاعات هدفمند نیازمند است.

در اصطلاح به ویژگی های بیگ دیتا “V” گفته می شود و از آن با عنوان های  3V یا 5V نام می برند. در این قسمت این پنج ویژگی را به طور مختصر بررسی می کنیم.

  1. مقدار (Volume) : به حجم و اندازه داده های ایجاد، گردآوری و ذخیره شده که میتواند درحجم زیاد موجب کاهش هزینه شود.
  2. گوناگونی (Variety) : گوناگونی داده ها از نظر عددی، اطلاعات سنتی، صدا و ایمیلی و … است که می توان آن را در بخش های مالی، اقتصادی و مدریتی و … نیز دسته بندی کرد. این گوناگونی داده ها به تحلیلگران کمک می کند تا که با بهره گیری درست به یک نتیجه هدفمند دست پیدا کنند.
  3.  سرعت (Velocity) : سرعت تولید و پردازش اطلاعات در جهت میسر نمودن اهداف و چالش های پیش رو که در مسیر توسعه و پیشرفت قرار دارند. سرعت داده های تولید شده تنها در سال 2010 به میزان تمامی داده هایی بود که از ابتدا تا سال 2003 تولید شده بود و رویارویی با چنین حجم وسیعی از اطلاعاتی که روزبه روز تولید و ذخیره سازی می شود ، به چالشی جدی برای همگی سازمان ها و تحلیلگران تبدیل شده است.
  4. تغییر پذیری (Variability) : یکی از مشکلات پر اهمیت در خصوص بیگ دیتا ، ایجاد تغییرات در اطلاعات ورودیست، چرا که هرگونه تغییر در اطلاعات ممکن است موجب عدم تطابق و ناپایداری داده ها شده و هرچه میزان این ناپایداری افزایش یابد کنترل و اداره ی آن سخت تر می شود.
  5. اطمینان (Veracity) : کیفیت اطلاعات ذخیره شده ممکن است تا اندازه ای متفاوت باشد که تحلیل دقیق آن ها را با مشکل مواجه کند.

مرکز بازیابی اطلاعات هارد امین پایتخت

© کپی رایت - ریکاوری هارد و بازیابی اطلاعات امین پایتخت