کلمات هم داده هستند
یکی از موضوعاتی که شرکت کنندگان در کارگاه های آموزشی تصویرسازی با دادهها اغلب با آن دست به گریبان هستند چالش کار با داده های کیفی، در مقابل دادههای کمی است. وقتی یک ارائه بصری از دادهها را تصور میکنید اغلب دادهها به صورت عددی در ذهن می آید: درصدها، تعدادها، زمان ها و امثال آن. کار با این نوع دادهها نسبتاً سادهتر است. مقیاس بندی این دادهها هم بهتر صورت می گیرد. ما برای ترکیب یا جداسازی این دادهها اطلاعات بیشتری در اختیار داریم. بازه ها و دادههای خارج از محدوده هم با سهولت بیشتری پیدا می شود. در عین حال میتوانیم روند های آتی را نیز پیشبینی کنیم.
با این همه میدانیم که همیشه نمیشود فقط با اعداد سر و کار داشت.
در برخی حوزه های کاری یا پروژه های خاص جمع آوری و تحلیل متون برای یافتن دیدگاهی که موجب یک تغییر مثبت در فرایند کار شود. به طور مثال اعداد میتوانند به ما نشان دهند که چه تعدادی از اعضای جامعه ما در یک مشوق خاص برای یک سرویس عمومی درگیر هستند اما اعداد به خودی خود به ما نمیگویند چرا برخی در این فرایندها مشارکت نمیکنند، یا به طور مثال احساس عمومی در مورد یک مشوق خاص چگونه است – در این موارد مصاحبه ها، نظرسنجی ها و یا فرمها به ما کمک میکند تا دادههایی را جمع آوری کنیم که لزوماً ما را ناچار به تحلیل متن می کند.
بیشک بسیاری دست کم یک بار به تحلیل مشارکت در شبکههای اجتماعی در سطحی فراتر از تعداد دنبال کنندگان یک هشتگ خاص پرداخته اند. شمارش دادههایی مانند تعداد لایک ها، توییت ها و کلیک ها نسبتاً امری بدیهی به شمار میرود اما بررسی کامل یک متن که افراد در شبکههای اجتماعی منتشر میکنند، و ایجاد یک تصویر معنادار از مفاهیم برآمده از آن کاری به مراتب دشوار تر است. تحلیل و آنالیز احساسات بیشک یک رویکرد است اما در نهایت این تحلیل – به صورت یک خلاصه عددی از یک فعالیت الگوریتمی برای دسته بندی متن – در نهایت و در بهترین حالت ممکن یک دید تک بعدی از یک مجموعه اطلاعات غنی به ما می دهد.
در ادامه به برخی سؤالات مهم در خصوص داده های کیفی میپردازیم.
چطور میتوان کاری کرد که دیگران به اندازه دادههای کمی به دادههای کیفی نیز اهمیت بدهند؟
اعداد کیفیت جالبی در ذهن انسانها دارند. مثلاً اختصاص یک مقدار عددی به هر چیز – مثلاً کیفیت یک فیلم سینمایی یا کیفیت بازی یک بازیکن بیسبال یا اینکه چقدر برای امتحانات دانشگاه آماده هستید – باعث میشود تا ارزیابی شما به ظاهر شکلی عینی، رسمی و بدون خطا به خود بگیرد. در عین حال هر گونه توصیف متنی و کلامی از آن چیز باعث میشود تا دادهها تنها به شکل نظر شخصی وانمود شوند.
اگر بگویم «با جمعی از افراد در مورد یک رستوران صحبت کردیم و بیشتر آنها نظر مثبتی درباره آن داشتند» خواهید گفت: بسیار خوب اما این فقط نظر شخصی آنها است. اما اگر بگوییم «نمره این رستوران ۴.۳ از ۵ است» ناگهان این واقعیت که رتبه و نمره این رستوران یک مقدار کمی است باعث میشود تا اطلاعات ما در مورد کیفیت آن شکلی رسمی به خود بگیرد – حتی با اینکه میدانیم این رتبه بندی ها و نمرهها بیشتر بر اساس ترجمان ذهنی افراد از نظرات خود در قالب یک مقیاس عددی قراردادی بیان شدهاند که متفاوت از ذهن افراد شرکت کننده در این سیستم نمره دهی است.
داده، داده است. نمیتوان گفت که اعداد ذاتاً دادههایی درست تر یا رسمی تر از داده های کیفی هستند. این ایده که هر چیزی به عنوان دادههای صرفاً عینی وجود دارد خود یک مغلطه به شمار میرود چه رسد به اینکه باور داشته باشیم که تنها دادههای کمی میتوانند اطلاعات عینی در اختیار ما قرار دهند.
دادهها به صورت خود انگیخته به وجود نمی آیند. باید دادهها را سنجش و جمعآوری کرد و این مراحل توسط افراد یا ماشینهایی که به طور خودکار برنامههای ایجاد شده توسط انسانها را انجام میدهند به مرحله اجرا می رسد. در تمامی این زنجیره گردآوری دادهها، انسانها برای اینکه چه دادههایی را ثبت کنند، هر چند وقت یکبار اقدام به ثبت دادهها کنند، چه چیزهایی را مستثنی کنند، چطور دادهها را با هم تجمیع کنند، چطور دادهها را نرمالیزه کنند، چه میزان از آن را به اشتراک بگذارند و امثال این مباحث، تصمیم گیری می کنند.
تمام این مسائل خواه دادههای مورد بحث کمی باشند یا کیفی، در خصوص دادهها صدق می کند. درواقع میتوان گفت که کار روی داده های کیفی به مراتب سخت تر از دادههای کمی است چرا که تجمیع یا فیلتر آن دشوار تر است. در نهایت این ایده که اعداد، دادههای قابل باور هستند اما کلمات اینگونه نیستند، یک سوتفاهم است.
آیا میتوان از ابر کلمات برای نشان دادن داده های کیفی استفاده کرد؟
به طور کلی نمیشود گفت که این کار امکانپذیر نیست (به استثنای برخی موارد خاص). ابر کلمات به طور کلی به عنوان یک ابزار قوی برای تحلیل بصری شناخته نمی شود. الگوریتم هایی که ابر کلمات را میسازند تا حدودی مبهم هستند چرا که نمیتوان اطمینان داشت که دقیقاً چرا این کلمات با این ابعاد در کلیت تصویر قرار گرفته اند.
فرض کنیم شما از ابر کلمات برای پاسخ به این سؤال استفاده کنید که «چه کلماتی بیشتر در یک مجموعه شامل ۱۰۰۰ سند به کار رفته است». فرض کنیم دو کلمهای که بیش از بقیه و با اختلاف زیاد در این اسناد تکرار شدهاند کلمات cat و supercalifragilisticexpialidocious باشن.
ابر کلمات شما به چه شکلی در خواهد آمد؟ آیا این دو کلمه اندازه فونت یکسان دارند؟ اگر اینطور باشد، درواقع ابر کلمات شما را گمراه میکند چرا که cat به نسبت ابعاد، بسیار کوچکتر ازکلمه دیگر پر تکرار در این جا، یعنی supercalifragilisticexpialidocious است. بنابراین cat باید با سایز فونت بسیار بزرگتری نمایش داده شود تا اندازه دو کلمه تقریباً برابر باشد اما آیا این باعث نمیشود که اینطور به نظر برسد که cat کلمه متداول تری در این ابر کلمات بوده است؟
در اینجا ما دچار یک دوگانگی هستیم. درواقع یا باید از افراد بخواهیم که مقایسه میان دو کلمه را بر اساس مساحت هر واژه انجام دهند و یا اینکه دادهها را به صورتی نمایش دهیم که کاملاً موجب گمراهی می شود. هم چنین در نظر داشته باشید که این سادهترین حالت ممکن برای تحلیل ابر کلمات است که در این مثال در نظر گرفته ایم.
درواقع ابر کلمات را میتوان به عنوان یک عنصر تصویری سرگرمی به کار برد (مثلاً به عنوان پس زمینه یک گزارش یا چیزی شبیه به آن) و یا از آن به عنوان یک نقطه آغاز کلی برای تحلیل اکتشافی استفاده کرد.ما ابر کلمات بهترین راه برای ارائه دیدگاه ما نیستند. ابر کلماتی که در بالای این مقاله مشاهده میکنید درواقع ابر کلمات همین مقاله است. اما آیا این ابر کلمات میتواند به خوبی نکات اصلی این پست را نشان دهد؟ آیا اطلاعات کافی به ما می دهد؟ احتمالاً خیر. اما هدف من از قرار دادن این ابر کلمات بیشتر نوعی تزئین چشمگیر صفحه است.
در عین حال بیایید به موضوع اصلی برگردیم: کاربرد واقعی ابر کلمات چیست؟ درواقع اعمال تحلیل کمی برای داده های کیفی. ابر کلمات صرفاً شمارنده میزان تعداد دفعاتی است که هر کلمه در متن ظاهر میشود و خود کلمات را به صورت چکیده ای از دادهها نمایش می دهد. این فرایند را نمیتوان تحلیل کیفی داده های کیفی دانست بلکه تلاشی است برای استفاده از ابزارهای کمی برای تصویر سازی دادهها و اینکه دادهها قرار نیست به این ترتیب نمایش داده شوند.
راه مناسب برای استفاده از داده های کیفی برای ارتباط تصویری با مخاطب چیست؟
وقتی زمان بیان دیدگاه به صورت روشن و سریع از دل مجموعه داده های کیفی به مخاطب فرا میرسد، ممکن است اصلاً از چارتها و گراف ها استفاده نکنید. توصیه ما این است که اگر استفاده از متن ساده یا اعداد به صورت مجزا بهترین راه انتقال پیام به مخاطب است، حتماً از همین راه استفاده کنید.
با این حال در بیشتر موارد ناگزیر برخی داده های کیفی نیاز به تجمیع دارند. ممکن است ما نیازمند تحلیل احساسات، مدل سازی از موضوعات یا تکنیک های مختلفی باشیم که خارج از حوصله ای مقاله است. حاصل این فرایندهای تجمیعی هر چه که باشد و هر نوع نمایش بصری که برای این کار انتخاب کنید، همیشه فرصت این وجود دارد که گراف یا چارتی را با بخشی از اطلاعات کیفی مرتبط همراه نموده و نمایش دهید.
با اضافه کردن این متن ها به نمودار، به آن ارزشی می افزایید و حس و حال انسانی تری به نمودارها می دهید. اغلب هم چنان که به جداول و چارتها نگاه میکنیم، تا حدودی از واقعیت موجود در زیر این تصاویر غافل می شویم، و یادمان میرود که اعداد درواقع رویه ای از زندگی واقعی انسانها را نمایش می دهند.با وارد کردن یادداشتها در کنار نمودار به صورت مستقیم و برآمده از منبع دادهها میشود این ایده را تقویت کرد و پیام نهایی را شفافتر و قدرتمند تر بیان نمود.
منبع:
https://www.storytellingwithdata.com/blog/2020/11/8/words-are-data-too
ارسال نظر