واژه‌نامه داده و تحلیل

هم‌زمان با ورود حوزه‌های جدید علم و فناوری به یک کشور، مجموعه‌ی گسترده‌ای از عبارت و اصطلاحات جدید هم با آن وارد می‌شود. متخصصان این حوزه‌های نو نیز با دلایل و انگیزه‌های گوناگون، گاه عامدانه و گاه ناخودآگاه، تشریح و معادل‌سازی واژگان جدید ناآشنا را شروع می‌کنند.

در حوزه داده و تحلیل، سال‌هاست که در ایران اصطلاحات و واژگان آماری در بین تحلیل‌گران و آمارگران به صورت استاندارد جاری است، ولی واژگان مباحث تحلیلیِ جدید که مبتنی بر شیوه‌های نوین رایانه‌ای هستند، مانند “یادگیری ماشین” و “یادگیری عمیق” به تازگی متداول شده‌اند. ازاین‌رو امروزه با حجمی از واژه‌های نو و کهنه طرف هستیم که یا همه با معادل فارسی و معانی آن آشنا نیستند، یا عبارات معادل فارسی ندارند و یا اجماعی درباره‌ی برگردان فارسی آن‌ها وجود ندارد.

واژه‌نامه‌ی حاضر به منظور ایجاد یک رویه یکسان و مرجع در معادل‌سازی واژگان حوزه داده و تحلیل، ترجمه و تنظیم گردیده است و امیدواریم برای مدیران سازمان‌ها، متخصصان و علاقه‌مندان این حوزه و هر کسی که به‌نوعی با این حوزه سروکار دارد، مفید واقع شود.

https://www.sahab.ir/glossary/

1 پسندیده

کلمات ابتدایی علم داده را بیشتر بشناسید.

۱. استخراج داده: وقتی از استخراج داده حرف می‌زنیم، در واقع صحبت از گرفتن داده‌ها از فاصل‌هایی‌ست که در اصل برای تعامل انسان‌ها و ترجمه آنها به فرمتی قابل خوانده شدن توسط ماشین طراحی شده‌اند.

۲. تمیزکاری داده: عبارتند از تلاش برای بهبود کیفیت کلی داده‌ها با حذف یا اصلاح داده‌های نادرست، ناقص یا غیر مرتبط از یک سیستم داده.

۳. مصورسازی داده: این یک اصطلاحی عمومی است که هر تلاشی برای کمک به مردم در درک اهمیت داده‌ها با قرار دادن آن در یک زمینه بصری را توصیف می‌کند. همچنین الگوها، روند‌ها و همبستگی‌هایی که ممکن است در داده‌های مبتنی بر متن ناشناخته بماند، می‌تواند با مصورسازی داده‌ها ساده‌تر شود.

۴. تجزیه و تحلیل داده‌ها: فرآیند بررسی مجموعه داده‌ها به منظور به دست آوردن نتیجه‌گیری در مورد اطلاعات آنها را، به طور فزاینده با کمک سیستم‌های تخصصی و نرم افزار.

۵. ابرداده: ابرداده داده‌های مربوط به داده‌هاست. ابرداده نشان دهنده اطلاعات پشت صحنه‌ست که در همه جا، توسط هر صنعت، به روش های مختلف استفاده می‌شود. ابرداده را می توان در سیستم‌های اطلاعاتی، رسانه‌های اجتماعی، وب‌سایت‌ها، نرم‌افزار، تصاویر، خدمات موسیقی، خرده فروشی آنلاین و غیره پیدا کرد.

۶. دانشمند علم داده: کارشناسی‌ست در استخراج بینش و ارزش داده‌ها. این نقش شامل استفاده از مهارت‌ها در تجزیه و تحلیل، دانش کامپیوتر، ریاضیات، آمار، خلاقیت، تجسم داده‌ها و ارتباطات و همچنین کسب و کار و استراتژی است.

۷. همبستگی: یک اندازه گیری آماری است که نشان می‌دهد میزان دو یا چند متغیر در کنار یکدیگر متفاوت است. گاهی اوقات سردرگمی در ارتباط با علیت وجود دارد. به یاد داشته باشید، فقط به این دلیل که دو چیز همبستگی دارند به این معنا نیست که یکی علت دیگریست.

۸. داده‌‌ی بزرگ: از این داده به عنوان یک اصطلاح برای توصیف مجموعه‌ای از مجموعه داده‌های بسیار بزرگ و پیچیده استفاده می‌شود که پردازش آن با استفاده از ابزارهای مدیریت پایگاه داده یا برنامه‌های پردازش داده‌های سنتی صورت می‌گیرد.

۹. داده کاوی: عمل خودکار جستجو در انبار بزرگ داده‌ها برای کشف الگوها و روندی که فراتر از تجزیه و تحلیل ساده است را داده کاوی می‌نامند. در این روش از الگوریتم‌های ریاضی پیشرفته برای تجزیه و تحلیل داده‌ها و احتمال وقوع رویدادهای آینده استفاده می‌شود.

۱۰. عادی سازی: عادی‌سازی داده‌ها شامل حذف واحد اندازه‌گیری آن‌هاست و این کار به شما اجازه می دهد تا راحت‌تر داده‌ها را از مکان‌های مختلف با هم مقایسه کنید.

منبع

1 پسندیده