دو فرمت ذخیره کردن داده در علوم داده
| پنجشنبه, ۱۷ آذر ۱۴۰۱، ۰۶:۰۵ ب.ظ |
۰ نظر
دادههامونو میتونیم به دو صورت tidy format یا long format و wide format ذخیره کنیم. هر کدوم هم تو علم داده کاربرد خاص خودشون رو دارند بعضی از بستههای R بر اساس long format کار میکنندن.
wide format
نمونه و مثال از wide format زیاد دیدین و احتمالا خودتون هم داده هاتون رو این جوری ذخیره میکردین. در این فرمت هر ستون به یک متغیر تعلق داره و هر سفر یک مشاهده یا obsesrvation هست.
مثال:
میانگین دما در تابستان | جمعیت | ارتفاع از سطح دریا |
20 | 300,000 | 1600 |
35 |
400,000 |
1 |