ایده های تجسم برای جلوگیری از همپوشانی خط در طرح سری زمانی چندگانه
دکتر استرنج ، شخصیت داستانی ، ابرقهرمان مورد علاقه من است. یکی از توانایی های باورنکردنی او دیدن امکانات وقایع است. جالب خواهد بود اگر بتوانم همزمان چیزهای زیادی را مانند او ببینم. در واقع ، من می توانم این کار را بدون داشتن ابرقدرت انجام دهم. فقط یک نوع صحیح از تجسم و پایتون کافی است.
داده های سری زمانی چندگانه
یک طرح سری زمانی با یک خط یک نمودار مفید برای بیان داده ها با توالی های طولانی است. این محور X تشکیل شده است که نشان دهنده جدول زمانی و محور y است که مقدار آن را نشان می دهد. این یک روش استاندارد است زیرا مفهوم ساده و آسان برای درک آن است. این طرح می تواند به ما در استخراج برخی از اطلاعات بینش مانند روندها و اثرات فصلی کمک کند.
با این حال ، بسیاری از خطوط در طرح سری زمانی می توانند کارها را دشوار کنند. بیایید مثالهای زیر را در نظر بگیریم.
تصویر اول: طرح خط سری چند زمان PM2. 5 را در 25 منطقه سئول ، 2019 نشان می دهد. تصویر دوم: همان مجموعه داده در طرح شعاعی. آلودگی هوا در داده های سئول از Kaggle. تصاویر توسط نویسنده.
این ممکن است اغراق آمیز به نظر برسد ، اما گاهی اوقات می توان با این نوع داده ها روبرو شد ، همانطور که در آینده نشان داده می شود. تصویر اول برای تمایز بین خطوط دشوار است و خواندن آن دشوار است. با همان مجموعه داده ، توطئه های شعاعی در تصویر دوم ، که به عنوان یک ایده در این مقاله توضیح داده می شود ، به رسیدگی به طرح همپوشانی کمک می کند.
در این مقاله 8 ایده تجسم با کد پایتون برای کنار آمدن با هرج و مرج در ترسیم داده های سری زمانی چندین نشان داده شده است. بیا شروع کنیم.
داده دریافت کنید
برای کار با یک نمونه مورد واقعی ، من از آلودگی هوا در مجموعه داده های سئول از Kaggle (Link) استفاده خواهم کرد. داده ها توسط دولت کلانشهر سئول تهیه شده است. این مربوط به اطلاعات آلودگی هوا است که شامل SO2 ، NO2 ، CO ، O3 ، PM10 و PM2. 5 بین سالهای 2017 و 2019 از 25 ولسوالی در سئول ، پایتخت کره جنوبی است.
در این مقاله ، PM2. 5 از 25 ولسوالی متغیر اصلی است که به عنوان خطوط سری زمانی ترسیم شده است. PM2. 5 به عنوان یک ذرات ریز با قطر کوچکتر از 2. 5 میکرومتر تعریف شده است. این نوعی آلودگی در نظر گرفته می شود که باعث اثرات سلامتی کوتاه مدت می شود.
تجسم PM2. 5 از بسیاری از مناطق به مقایسه چگونگی تأثیر آلودگی بر شهر کمک می کند.
داده های واردات
با کتابخانه های واردات شروع کنید.
اندازه گیری_summary. csv را با پاندا بخوانید.
داده ها را کاوش کنید
اکنون که قبلاً مجموعه داده را وارد کرده ایم. با بررسی مقدار گمشده و نوع داده هر ستون ادامه دهید.
خبر خوب این است که هیچ ارزش از دست رفته وجود ندارد. مرحله بعدی بررسی تعداد کدهای ایستگاه مجزا است.
در کل 25 ایستگاه وجود دارد. کدهای ایستگاه را بررسی کنید.
داده های پیش پردازش
از 101 تا 125 ، کدهای ایستگاه نمایانگر ولسوالی های سئول است. شخصاً استفاده از نام های منطقه برای برچسب زدن به تجسم راحت تر است زیرا خواندن آن راحت تر است. برای ایجاد ستون "منطقه" از ستون "آدرس" استفاده می شود.
برای استفاده بعداً لیستی با نام 25 منطقه ایجاد کنید.
سه ستون دیگر ، YM (ماه) ، سال و ماه را آماده کنید تا با برخی از نمودارها اعمال شود. برای تجسم آسانتر ، ما آنها را به طور متوسط ماهانه DataFrame گروه بندی خواهیم کرد.
داده های ترسیم
اکنون که همه چیز آماده است ، اجازه دهید طرح چند سری زمانی را انجام دهیم.
طرح های چند سری زمانی میانگین ماهانه PM2. 5 ماهانه از 25 منطقه در سئول از سال 2017 تا 2019 را نشان می دهد. تصویر توسط نویسنده.
خواندن خطوط همپوشانی دشوار است. در سال 2017 می توان دریافت که میزان PM2. 5 در بسیاری از ایستگاه ها در همان جهت پیش رفت. با این حال ، در سال 2018 و 2019 ، خطوط آلودگی به طور خودسرانه پیش رفت و تشخیص آن دشوار است.
ایده های تجسم
هدف اصلی این مقاله راهنمایی با برخی از ایده های تجسم با پایتون برای رسیدگی به داده های سری زمانی است.
قبل از ادامه ، باید چیزی را روشن کنم. تجسم توصیه شده در این مقاله عمدتاً برای مقابله با توطئه های همپوشانی است زیرا این مسئله در ترسیم داده های سری زمانی چندین مشکل است ، همانطور که قبلاً دیدیم.
هر نمودار دارای جوانب مثبت و منفی است. بدیهی است ، هیچ چیز کامل نیست. برخی ممکن است فقط برای یک اثر چشم نواز باشند. اما همه آنها با هدف مقایسه توالی بین دسته ها یک هدف دارند.
1. تغییر چیزی جز تعاملی طرح.
Plotly یک کتابخانه نمودار برای ساخت نمودارهای تعاملی است. نمودار تعاملی به بزرگنمایی در منطقه با خطوط همپوشانی کمک می کند.
نتیجه استفاده از طرح ریزی برای ایجاد یک طرح خطوط زمانی چند زمان تعاملی. تصاویر توسط نویسنده.
با طرح ریزی ، نمودار منطقه تعاملی نیز می تواند ساخته شود.
2. مقایسه یک به یک با سری زمانی کوچک.
با کتابخانه Seabo ، می توانیم سریال های کوچک چندگانه را انجام دهیم. ایده پشت این توطئه ها این است که هر خط را یک به یک ترسیم کنید در حالی که هنوز آنها را با شبح خطوط دیگر مقایسه می کنید. کد موجود در لینک وب سایت رسمی در اینجا است.
3. تغییر نقطه نظر با شبکه Facet
FaceTgrid از Seabo می تواند برای ساخت شبکه های چند نقشه استفاده شود. در این حالت ، ویژگی های "ماه" و "سال" به ترتیب به عنوان ردیف و ستون تعیین می شوند. از دیدگاه دیگر ، مقادیر می توانند به طور همزمان ماهانه در عمودی و سالانه به صورت افقی مقایسه شوند.
4. استفاده از رنگ با نقشه گرما
نقشه گرما داده ها را به یک نمودار دو بعدی نشان می دهد که مقادیر در رنگ ها را نشان می دهد. برای مقابله با داده های سری زمانی ، می توانیم گروه ها را بر روی عمودی و جدول زمانی در ابعاد افقی تنظیم کنیم. تفاوت در رنگ به تمایز بین گروه ها کمک می کند.
محور dataframe
نقشه گرما میانگین ماهانه PM2. 5 را از 25 منطقه در سئول از سال 2017 تا 2019 نشان می دهد. تصویر توسط نویسنده.
5- استفاده از زوایا با نمودار رادار
ما می توانیم محور زاویه ای را در طرح پراکندگی در طرح ریزی قرار دهیم تا یک نمودار رادار تعاملی ایجاد کنیم. هر ماه به عنوان یک متغیر در دایره انتخاب می شود. به عنوان مثال ، در این مقاله ، ما یک نمودار رادار ایجاد خواهیم کرد که میانگین ماهانه PM2. 5 از 25 منطقه در سال 2019 را مقایسه می کند.
DataFrame را فقط با داده های سال 2019 فیلتر کنید
نمودار راداری ایجاد کنید. نکته خوب در مورد استفاده از طرح ریزی این است که نمودار رادار تعاملی است. بنابراین می توانیم به راحتی نمودار را فیلتر کنیم.
بگذارید با پر کردن ناحیه رادار هر یک از یک به یک و مقایسه هر یک با بقیه ، بیشتر پیش برویم. سپس یک کولاژ عکس ایجاد کنید.
یک تابع را برای ایجاد کولاژ عکس تعریف کنید. من این روش عالی را برای ترکیب توطئه های این لینک روی پشته سرریز پیدا کردم.
از عملکرد استفاده کنید
6. فانتزی طرح نوار با طرح نوار دایره ای (طرح مسابقه مسابقه)
مفهوم یک طرح نوار دایره ای (طرح مسابقه مسابقه) بسیار ساده است زیرا فقط توطئه های نوار در یک دایره است. ما می توانیم ماهانه طرح نوار دایره ای را ترسیم کنیم و سپس یک کولاژ عکس تهیه کنیم تا روند کار را در طول زمان مقایسه کنیم.
تصویر زیر نمونه ای از طرح نوار دایره ای را که می خواهیم ایجاد کنیم نشان می دهد. ضرر این نمودار این است که مقایسه بین دسته ها دشوار است. به هر حال ، این یک انتخاب خوب برای جلب توجه با یک اثر چشم نواز است.
یک تابع را برای ایجاد یک طرح نوار دایره ای تعریف کنید
عملکرد را اعمال کنید
یک کولاژ عکس ایجاد کنید
توطئه های نوار دایره ای ماهانه PM2. 5 را از 25 منطقه در سئول از سال 2017 تا 2019 نشان می دهد. تصاویر نویسنده.
7. شروع از مرکز با طرح شعاعی
مانند طرح نوار دایره ای ، طرح شعاعی بر اساس نمودارهای نوار است که به جای مختصات دکارتی از مختصات قطبی استفاده می کنند. این نوع نمودار هنگام مقایسه دسته های واقع در دور از یکدیگر ناخوشایند است ، اما این یک انتخاب عالی برای جلب توجه است. می توان از آن در اینفوگرافیک استفاده کرد.
تصویر زیر نمونه ای از توطئه های شعاعی را نشان می دهد که میانگین PM2. 5 از 25 منطقه در ژانویه 2019 را نشان می دهد.
عملکرد را اعمال کنید
یک کولاژ عکس ایجاد کنید
8. نشان دادن تراکم با تراکم همپوشانی (طرح خط الراس)
تراکم همپوشانی (طرح خط الراس) با تنظیم یک محور به عنوان جدول زمانی می تواند با داده های سری زمانی چندین مورد استفاده شود. طرح نوار دایره ای و طرح شعاعی را دوست دارد ، طرح ریج می تواند توجه مردم را به خود جلب کند. کد موجود در وب سایت رسمی Seabo در اینجا است.
تصویر زیر نمونه ای از طرح ریج با تراکم PM2. 5 در منطقه ای در سال 2019 را نشان می دهد.
تابعی را برای ایجاد طرح خط الراس تعریف کنید
عملکرد را اعمال کنید
ایجاد کولاژ عکس
خلاصه
در این مقاله برخی از تجسمات با نمونه های کد پایتون برای رسیدگی به خطوط روکش در طرح سری چند زمان نشان داده شده است. دو مفهوم اصلی با استفاده از توطئه های تعاملی و جدا کردن آنها. نمودار تعاملی با گزینه هایی که به کاربران امکان می دهد دسته ها را آزادانه انتخاب کنند ، مفید است ، در حالی که جدا کردن توطئه ها به کاربران کمک می کند تا آنها را به راحتی مقایسه کنند.
اینها فقط برخی از ایده ها هستند. من مطمئن هستم که ایده های تجسم بیشتری برای رسیدگی به داده های سری زمانی نسبت به نمودارهای ذکر شده در این مقاله وجود دارد. اگر سوالی یا پیشنهادی دارید ، لطفاً در صورت تمایل نظر خود را ترک کنید. با تشکر از خواندن
این مقاله های دیگر در مورد تجسم داده ها است که ممکن است جالب باشد.
استراتژی برای تجارت گزینه های...
ما را در سایت استراتژی برای تجارت گزینه های دنبال می کنید
برچسب :
نویسنده : فریبا کامران
بازدید : 35
تاريخ : دوشنبه
22 خرداد
1402 ساعت: 18:02