این تصور که “داده ها نفت جدید هستند” مدت زیادی است که وجود داشته است. به طور کلی به ریاضیدان کلایو هامبی نسبت داده می شود :

دیتا نفت جدید است. مانند نفت، داده ها ارزشمند هستند، اما اگر تصفیه نشده باشند، واقعاً قابل استفاده نیستند. باید به گاز، پلاستیک، مواد شیمیایی و غیره تبدیل شود تا یک موجودیت ارزشمند ایجاد شود که فعالیت سودآور را هدایت کند. بنابراین، باید داده ها تجزیه و تحلیل شوند تا ارزش داشته باشند.

داده ها نفت جدید هستند زیرا از داده ها می توان برای استخراج بینش استفاده کرد. بسته به کاری که یک شرکت انجام می دهد، بینش ها می توانند باعث حفظ مشتری، افزایش فروش، مدل های جدید درآمد، تبلیغات و غیره شوند. اگر داده ها نفت جدید هستند، بینش ها پول جدید هستند.

داشتن داده کافی نیست. فرد نیاز به یک روش داده دارد – مجموعه ای از اصولی که معمولاً درک می شود و به طور مداوم اجرا می شود برای مدیریت داده ها. برای ایجاد یک روش داده خوب و جلوگیری از آتش سوزی مربوط به داده ها، سازمان ها باید به چهار اصل زیر توجه کنند:

منشأ داده (داده های من از کجا آمده اند؟)

داده ها فراوان است، اما همه آنها با کیفیت یکسان نیستند. برخی از داده ها کثیف هستند (پر از اشتباهات و حذفیات). برخی از داده ها کاملاً اشتباه هستند و برخی دیگر تخیلی هستند. این به ویژه اگر به داده های دامنه عمومی تکیه کنید صادق است. برخی از مجموعه‌های داده حاوی سوگیری هستند – که در صورت استفاده در هوش مصنوعی می‌تواند خطرات عمده‌ای برای کسب‌وکارها ایجاد کند. برخی به سادگی حاوی اشتباهاتی هستند – همانطور که در پروژه اخیر MIT بیان شده است. درک کامل از جایی که داده ها از کجا می آیند برای دانستن اینکه آیا بینش هایی که داده ها تولید می کنند ارزشمند هستند یا حتی ایمن هستند، ضروری است.

حریم خصوصی داده ها (من اجازه دارم با این داده ها چه کار کنم؟)

با رواج بیشتر هوش مصنوعی – شهرها، ایالت ها و کشورها قوانین جدیدی در مورد نحوه استفاده از اطلاعات مصرف کننده و حقوق مصرف کنندگان در مورد استفاده از داده های خود وضع می کنند. نمونه های کلیدی عبارتند از CCPA در کالیفرنیا در ایالات متحده و بندهای “حق توضیح” در GDPR اتحادیه اروپا. از آنجایی که قوانینی از این دست در حال گسترش هستند، کاربران داده های منشأ انسانی باید توجه ویژه ای به نحوه استفاده و محافظت از این داده ها داشته باشند.

حفاظت از داده ها (چگونه می توانم مطمئن شوم که داده ها را از دست نمی دهم؟)

حریم خصوصی داده ها یکی از اشکال حفاظت از داده ها است – اطمینان از اینکه دسترسی به داده ها برای محافظت از حریم خصوصی کنترل می شود. یکی دیگر از جنبه های مهم حفاظت از داده ها این است که اطمینان حاصل شود که داده ها در دسترس کسانی است که به آن نیاز دارند. هر چه داده‌ها برای یک شرکت اهمیت بیشتری پیدا کند، ضرر آن بیشتر می‌تواند بر کسب‌وکار تأثیر بگذارد (این مثال را ببینید که چگونه Pixar به دلیل یک رویداد از دست دادن داده، داستان اسباب‌بازی 2 را تقریباً از دست داد ).

آماده سازی داده (چگونه از داده به داده مفید بروم؟)

همانطور که نقل قول بالا اشاره می کند – داده های خام، مانند نفت خام، خیلی مفید نیستند. برای اینکه داده ها برای بینش مورد استفاده قرار گیرند، باید اصلاح شوند (فرآیندی به نام آماده سازی داده، تمیز کردن داده ها، یا مهندسی ویژگی زمانی که به روشی بسیار متمرکز بر هوش مصنوعی انجام شود). داشتن یک استراتژی خوب (و قابل تکرار) برای آماده سازی داده ها کلیدی است. آماده‌سازی داده‌ها می‌تواند تفاوت قابل‌توجهی در کیفیت بینش‌های تولید شده از داده‌ها یا کیفیت هوش مصنوعی آموزش داده شده از داده‌ها ایجاد کند.

همه اش را بگذار کنار هم

این چهار اصل با هم، هسته اصلی یک داده خوب را تشکیل می دهند

  • منشأ: بدانید اطلاعات شما از کجا آمده است
  • حریم خصوصی: بدانید که از چه کسی آمده است و برای استفاده از آن از چه قوانینی باید پیروی کنید
  • حفاظت: داده ها را از دست ندهید 🙂
  • آماده سازی: بدانید که چگونه داده ها را پالایش کنید، و به یاد داشته باشید که چگونه داده ها را پالایش کرده اید تا بتوانید آن را بارها و بارها به طور مداوم انجام دهید.

با تکامل مدل‌های کسب‌وکار، شرکت‌های بیشتری احتمالاً متوجه می‌شوند که داده‌ها بزرگترین دارایی آنهاست. اصول فوق به محافظت و رشد این دارایی کمک می کند.

بدون نظر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *