وب لاگ امیرحسین اسعدی

آنچه یادگرفتم، خواندم و دیدم رو اینجا به اشتراک می‌گذارم
I share what I learned, read and saw

طبقه بندی موضوعی
آخرین نظرات
  • ۸ خرداد ۰۲، ۱۵:۲۲ - احمد صداقت زاده
    عالی

۱ مطلب با کلمه‌ی کلیدی «زبان R» ثبت شده است

دو فرمت ذخیره کردن داده در علوم داده

داده‌هامونو میتونیم به دو صورت tidy format یا long format و wide format  ذخیره کنیم. هر کدوم هم تو علم داده کاربرد خاص خودشون رو دارند بعضی از بسته‌های R بر اساس long format کار میکنندن.

wide format

نمونه و مثال از wide format زیاد دیدین و احتمالا خودتون هم داده هاتون رو این جوری ذخیره میکردین. در این فرمت هر ستون به یک متغیر تعلق داره و هر سفر یک مشاهده یا obsesrvation هست.

مثال:

میانگین دما در تابستان جمعیت ارتفاع از سطح دریا
20 300,000 1600

35

400,000

1