ვარიანსი კოვარიანსის წინააღმდეგ
ვარიანსი და კოვარიანსი არის ორი საზომი, რომელიც გამოიყენება სტატისტიკაში. ვარიაცია არის მონაცემთა გაფანტვის საზომი, ხოლო კოვარიანსი მიუთითებს ორი შემთხვევითი ცვლადის ერთად ცვლილების ხარისხზე. ვარიანტობა საკმაოდ ინტუიციური ცნებაა, მაგრამ კოვარიანტობა მათემატიკურად განსაზღვრავს არც ისე ინტუიციურად.
მეტი ვარიანსის შესახებ
ვარიანტობა არის მონაცემების დისპერსიის საზომი განაწილების საშუალო მნიშვნელობიდან. ის გვიჩვენებს, თუ რამდენად შორს არის მონაცემთა წერტილები განაწილების საშუალოდან. ეს არის ალბათობის განაწილების ერთ-ერთი პირველადი აღმწერი და განაწილების ერთ-ერთი მომენტი.ასევე, დისპერსია არის პოპულაციის პარამეტრი, ხოლო ნიმუშის ვარიაცია პოპულაციისგან მოქმედებს როგორც პოპულაციის დისპერსიის შემფასებელი. ერთი პერსპექტივიდან, იგი განისაზღვრება, როგორც სტანდარტული გადახრის კვადრატი.
უბრალო ენაზე, ის შეიძლება აღიწეროს, როგორც თითოეულ მონაცემთა წერტილსა და განაწილების საშუალოს შორის მანძილის კვადრატების საშუალო. დისპერსიის გამოსათვლელად გამოიყენება შემდეგი ფორმულა.
Var(X)=E[(X-µ)2] პოპულაციისთვის და
Var(X)=E[(X-‾x)2] ნიმუშისთვის
შეიძლება კიდევ უფრო გამარტივდეს და მივცეთ Var(X)=E[X2]-(E[X])2.
Variance-ს აქვს გარკვეული ხელმოწერის თვისებები და ხშირად გამოიყენება სტატისტიკაში, რათა გამარტივდეს გამოყენება. ვარიაცია არაუარყოფითია, რადგან ის არის მანძილების კვადრატი. თუმცა, დისპერსიის დიაპაზონი არ არის შეზღუდული და დამოკიდებულია კონკრეტულ განაწილებაზე. მუდმივი შემთხვევითი ცვლადის დისპერსია არის ნული, ხოლო ვარიაცია არ იცვლება მდებარეობის პარამეტრთან მიმართებაში.
მეტი კოვარიანსის შესახებ
სტატისტიკურ თეორიაში, კოვარიანსი არის საზომი იმისა, თუ რამდენად იცვლება ორი შემთხვევითი ცვლადი ერთად. სხვა სიტყვებით რომ ვთქვათ, კოვარიანსი არის ორ შემთხვევით ცვლადს შორის კორელაციის სიძლიერის საზომი. ასევე, ის შეიძლება ჩაითვალოს ორი შემთხვევითი ცვლადის დისპერსიის კონცეფციის განზოგადებად.
კოვარიანსი ორი შემთხვევითი ცვლადის X და Y, რომლებიც ერთობლივად არის განაწილებული სასრული მეორე იმპულსით, ცნობილია, როგორც σXY=E[(X-E[X])(Y-E[Y])]. აქედან, დისპერსია შეიძლება ჩაითვალოს, როგორც კოვარიანტობის განსაკუთრებული შემთხვევა, სადაც ორი ცვლადი ერთნაირია. Cov(X, X)=Var(X)
კოვარიანსის ნორმალიზებით შეიძლება მივიღოთ წრფივი კორელაციის კოეფიციენტი ან პირსონის კორელაციის კოეფიციენტი, რომელიც განისაზღვრება, როგორც ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
გრაფიკულად, კოვარიანტობა მონაცემთა წერტილების წყვილს შორის შეიძლება ჩაითვალოს, როგორც მართკუთხედის ფართობი მონაცემთა წერტილებით საპირისპირო წვეროებზე.ის შეიძლება განიმარტოს, როგორც ორ მონაცემთა წერტილს შორის გამიჯვნის სიდიდის საზომი. მართკუთხედების მთელი პოპულაციის გათვალისწინებით, ყველა მონაცემის შესაბამისი მართკუთხედების გადაფარვა შეიძლება ჩაითვალოს განცალკევების სიძლიერედ; ორი ცვლადის ვარიაცია. კოვარიანტობა ორ განზომილებაშია, ორი ცვლადის გამო, მაგრამ მისი ერთ ცვლადზე გამარტივება იძლევა სინგლის ვარიანსს, როგორც გამოყოფა ერთ განზომილებაში.
რა განსხვავებაა ვარიანსსა და კოვარიანსს შორის?
• ვარიაცია არის პოპულაციაში გავრცელების/დისპერსიის საზომი, ხოლო კოვარიანსი განიხილება, როგორც ორი შემთხვევითი ცვლადის ვარიაციის საზომი ან კორელაციის სიძლიერე.
• ვარიაცია შეიძლება ჩაითვალოს კოვარიანტობის განსაკუთრებულ შემთხვევად.
• ვარიაცია და კოვარიანტობა დამოკიდებულია მონაცემთა მნიშვნელობების სიდიდეზე და მათი შედარება შეუძლებელია; შესაბამისად, ისინი ნორმალიზდება. კოვარიანტობა ნორმალიზდება კორელაციის კოეფიციენტად (იყოფა ორი შემთხვევითი ცვლადის სტანდარტული გადახრების ნამრავლზე) და დისპერსიის ნორმალიზება სტანდარტულ გადახრაში (კვადრატული ფესვის აღებით)