კატეგორიული მონაცემები რიცხვითი მონაცემების წინააღმდეგ
მონაცემები არის ფაქტები ან ინფორმაცია, რომელიც შეგროვებულია მითითების ან ანალიზის მიზნით. ხშირად ეს მონაცემები გროვდება, როგორც დაინტერესებული სუბიექტის ატრიბუტი. ეს ატრიბუტი შეიძლება განსხვავდებოდეს ერთიდან მეორეზე, ამიტომ ეს განსხვავებული ატრიბუტი შეიძლება ჩაითვალოს ცვლადად. ცვლადებს შეუძლიათ მიიღონ მნიშვნელობების სხვადასხვა ფორმები და ისინი თანდაყოლილია შეგროვებულ მონაცემებში.
ცვლადები შეიძლება იყოს ხარისხობრივი ან რაოდენობრივი; ანუ, თუ ცვლადი რაოდენობრივია, პასუხები არის რიცხვები და გაზომილი ატრიბუტის სიდიდე შეიძლება გამოითვალოს გარკვეული სიზუსტით.მეორე ტიპი, ხარისხობრივი ცვლადები ზომავს ხარისხობრივ ატრიბუტებს და ცვლადების მიერ მიღებული მნიშვნელობები არ შეიძლება იყოს მოცემული ზომის ან სიდიდის მიხედვით. თავად ცვლადები ცნობილია როგორც კატეგორიული ცვლადები და კატეგორიული ცვლადის საშუალებით შეგროვებული მონაცემები არის კატეგორიული მონაცემები.
მეტი რიცხვითი მონაცემების შესახებ
რიცხობრივი მონაცემები ძირითადად არის რაოდენობრივი მონაცემები, რომლებიც მიღებულია ცვლადისგან და მნიშვნელობას აქვს ზომის/სიდიდის განცდა. მიღებული რიცხვითი მონაცემები კიდევ სამ კატეგორიად იყოფა სტენლი სმიტ სტივენსის მიერ შემუშავებული თეორიის საფუძველზე. რიცხვითი მონაცემები შეიძლება იყოს რიგითი, ინტერვალით ან თანაფარდობით. მონაცემთა ტიპი განისაზღვრება მნიშვნელობების გაზომვის მეთოდით, ხოლო ტიპები ცნობილია როგორც გაზომვის დონეები.
ადამიანის წონა, მანძილი ორ წერტილს შორის, ტემპერატურა და აქციის ფასი არის რიცხვითი მონაცემების მაგალითები.
სტატისტიკაში, მეთოდების უმეტესობა მიღებულია რიცხვითი მონაცემების ანალიზისთვის. ძირითადი აღწერილობითი სტატისტიკა და რეგრესია და სხვა დასკვნის მეთოდები ძირითადად გამოიყენება რიცხვითი მონაცემების ანალიზისთვის.
მეტი კატეგორიული მონაცემების შესახებ
კატეგორიული მონაცემები არის მნიშვნელობები თვისებრივი ცვლადის, ხშირად რიცხვის, სიტყვის ან სიმბოლოსთვის. ისინი ასახავს იმ ფაქტს, რომ განხილულ შემთხვევაში ცვლადი მიეკუთვნება რამდენიმე ხელმისაწვდომი არჩევანიდან ერთ-ერთს. ამიტომ ისინი ერთ-ერთ კატეგორიას განეკუთვნებიან; აქედან გამომდინარე, სახელი კატეგორიულია.
ადამიანის პოლიტიკური კუთვნილება, პიროვნების ეროვნება, ადამიანის საყვარელი ფერი და პაციენტის სისხლის ჯგუფი თვისობრივი ატრიბუტებია. ზოგჯერ რიცხვი შეიძლება მივიღოთ როგორც კატეგორიული მნიშვნელობა, მაგრამ თავად რიცხვი არ წარმოადგენს გაზომილი ატრიბუტის სიდიდეს. საფოსტო კოდი არის ერთი მაგალითი.
ასევე, ნებისმიერი კატეგორიული მნიშვნელობები ეკუთვნის ნომინალურ მონაცემთა ტიპს, რომელიც არის სხვა ტიპი, რომელიც დაფუძნებულია გაზომვების დონეებზე. კატეგორიული მონაცემების ანალიზისთვის გამოყენებული მეთოდები განსხვავდება რიცხვითი მონაცემებისგან, მაგრამ ძირითადი პრინციპი შეიძლება იყოს იგივე.
რა განსხვავებაა კატეგორიულ და ციფრულ მონაცემებს შორის?
• რიცხვითი მონაცემები არის რაოდენობრივი ცვლადისთვის მიღებული მნიშვნელობები და ახასიათებს სიდიდის განცდა, რომელიც დაკავშირებულია ცვლადის კონტექსტთან (აქედან გამომდინარე, ისინი ყოველთვის არიან რიცხვები ან სიმბოლოები, რომლებსაც აქვთ რიცხვითი მნიშვნელობა). კატეგორიული მონაცემები არის ხარისხობრივი ცვლადისთვის მიღებული მნიშვნელობები; კატეგორიული მონაცემების რიცხვებს არ გააჩნიათ სიდიდის გრძნობა.
• რიცხვითი მონაცემები ყოველთვის მიეკუთვნება რიგითი, თანაფარდობის ან ინტერვალის ტიპს, ხოლო კატეგორიული მონაცემები ეკუთვნის ნომინალურ ტიპს.
• რაოდენობრივი მონაცემების გასაანალიზებლად გამოყენებული მეთოდები განსხვავდება კატეგორიული მონაცემებისთვის გამოყენებული მეთოდებისგან, მაშინაც კი, თუ პრინციპები ერთნაირია, ყოველ შემთხვევაში, განაცხადს აქვს მნიშვნელოვანი განსხვავებები.
• რიცხვითი მონაცემები გაანალიზებულია სტატისტიკური მეთოდების გამოყენებით აღწერით სტატისტიკაში, რეგრესიაში, დროის სერიებში და მრავალი სხვა.
• კატეგორიული მონაცემებისთვის ჩვეულებრივ გამოიყენება აღწერითი მეთოდები და გრაფიკული მეთოდები. ასევე გამოიყენება ზოგიერთი არაპარამეტრული ტესტი.