საშუალოდ მედიანის წინააღმდეგ რეჟიმის წინააღმდეგ
საშუალო, მედიანა და რეჟიმი არის ცენტრალური ტენდენციის ძირითადი საზომები, რომლებიც გამოიყენება აღწერილ სტატისტიკაში. ისინი სრულიად განსხვავდებიან ერთმანეთისგან და ასევე განსხვავებულია შემთხვევები, როდესაც ისინი გამოიყენება მონაცემთა შეჯამებისთვის.
საშუალოდ
საშუალო არითმეტიკული არის მონაცემთა მნიშვნელობების ჯამი გაყოფილი მონაცემთა მნიშვნელობების რაოდენობაზე, ანუ
[ლატექსი]\ბარი{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
თუ მონაცემები არის ნიმუშის სივრციდან, მას უწოდებენ საშუალო ნიმუშის ([latex]\bar{x} [/latex]), რომელიც არის ნიმუშის აღწერილობითი სტატისტიკა.მიუხედავად იმისა, რომ ეს არის ყველაზე ხშირად გამოყენებული აღწერითი საზომი ნიმუშისთვის, ეს არ არის მყარი სტატისტიკა. ის ძალიან მგრძნობიარეა გარე და რხევების მიმართ.
მაგალითად, განვიხილოთ კონკრეტული ქალაქის მოქალაქეების საშუალო შემოსავალი. მას შემდეგ, რაც ყველა მონაცემი შეჯამებულია და შემდეგ იყოფა, უკიდურესად მდიდარი ადამიანის შემოსავალი მნიშვნელოვნად მოქმედებს საშუალოზე. ამიტომ, საშუალო მნიშვნელობები ყოველთვის არ არის მონაცემების კარგი წარმოდგენა.
ასევე, ალტერნატიული სიგნალის შემთხვევაში, ელემენტში გამავალი დენი პერიოდულად იცვლება დადებითი მიმართულებიდან უარყოფით მიმართულებამდე და პირიქით. თუ ავიღებთ ელემენტში გამავალ საშუალო დენს ერთ პერიოდში, ის მისცემს 0-ს, რაც იმას ნიშნავს, რომ ელემენტს არ გაუვლია დენი, რაც აშკარად არ შეესაბამება სინამდვილეს. ამიტომ, ამ შემთხვევაშიც არითმეტიკული საშუალო არ არის კარგი საზომი.
არითმეტიკული საშუალო კარგი მაჩვენებელია, როდესაც მონაცემები თანაბრად ნაწილდება.ნორმალური განაწილებისთვის, საშუალო ტოლია რეჟიმისა და მედიანას. მას ასევე აქვს ყველაზე დაბალი ნარჩენები ფესვის საშუალო კვადრატის შეცდომის განხილვისას; მაშასადამე, საუკეთესო აღწერითი საზომია, როდესაც საჭიროა მონაცემთა ნაკრების წარმოდგენა ერთი რიცხვით.
მედიანი
საშუალო მონაცემთა წერტილის მნიშვნელობები ყველა მონაცემთა მნიშვნელობის ზრდადი თანმიმდევრობით მოწყობის შემდეგ განისაზღვრება, როგორც მონაცემთა ნაკრების მედიანა. მედიანა არის მე-2 კვარტლი, მე-5 დეცილი და 50 პროცენტი.
• თუ დაკვირვებების რაოდენობა (მონაცემთა რაოდენობა) კენტია, მაშინ მედიანა არის დაკვირვება ზუსტად მოწესრიგებული სიის შუაში.
• თუ დაკვირვებების რაოდენობა (მონაცემთა წერტილები) ლუწია, მაშინ მედიანა არის ორი შუა დაკვირვების საშუალო მოწესრიგებული სიაში.
მედიანი დაკვირვებას ორ ჯგუფად ყოფს; ანუ ჯგუფი (50%) უფრო მაღალი მნიშვნელობების და ჯგუფი (50%) საშუალოზე დაბალი მნიშვნელობებით. მედიანები სპეციალურად გამოიყენება დახრილ დისტრიბუციებში და წარმოადგენენ მონაცემებს არითმეტიკულ საშუალოზე საკმაოდ უკეთესად.
რეჟიმი
რეჟიმი არის ყველაზე გავრცელებული რიცხვი დაკვირვებების ერთობლიობაში. მონაცემთა ნაკრების რეჟიმი გამოითვლება ნაკრებში თითოეული ელემენტის სიხშირის აღმოჩენით.
• თუ მნიშვნელობა არ არის ერთზე მეტჯერ, მაშინ მონაცემთა ნაკრები არ აქვს რეჟიმი.
• წინააღმდეგ შემთხვევაში, ნებისმიერი მნიშვნელობა, რომელიც გვხვდება უდიდესი სიხშირით, არის მონაცემთა ნაკრების რეჟიმი.
ნაკრებში შეიძლება არსებობდეს 1-ზე მეტი რეჟიმი; შესაბამისად, რეჟიმი არ არის მონაცემთა ნაკრების უნიკალური სტატისტიკა. ერთიანი განაწილებისას არის ერთი რეჟიმი. დისკრეტული ალბათობის განაწილების რეჟიმი არის წერტილი, სადაც ალბათობის მასის ფუნქცია აღწევს თავის უმაღლეს წერტილს. ზემოაღნიშნული ინტერპრეტაციებიდან გამომდინარე, შეგვიძლია ვთქვათ, რომ გლობალური მაქსიმუმები რეჟიმებია.
განიხილეთ სამივე ღონისძიების გამოყენება შემდეგი მონაცემთა ნაკრებისთვის.
მონაცემები: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
საშუალო=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8.12
მედიანი=9 (მე-13 ელემენტი)
რეჟიმი=9 (სიხშირე 9=5)
რა განსხვავებაა საშუალოს, მედიანასა და რეჟიმს შორის?
• საშუალო არითმეტიკული არის მნიშვნელობების (დაკვირვებების) ჯამი გაყოფილი დაკვირვებების რაოდენობაზე. ეს არ არის მყარი სტატისტიკა და დიდად არის დამოკიდებული ნორმალურ განაწილების ბუნებაზე განხილული განაწილების ფარგლებში. ერთმა გამონაკლისმა შეიძლება გამოიწვიოს მნიშვნელოვანი ცვლა საშუალოში, რომელიც იძლევა შედარებით შეცდომაში შემყვან მნიშვნელობებს. კონცეფცია შეიძლება გავრცელდეს გეომეტრიულ საშუალოზე, ჰარმონიულ საშუალოზე, შეწონილ საშუალოზე და ასე შემდეგ.
• მედიანა არის დაკვირვებათა სიმრავლის საშუალო მნიშვნელობები და მასზე შედარებით ნაკლებად მოქმედებს გამოკვეთილები. ეს შეიძლება იყოს კარგი შეფასება, როგორც შემაჯამებელი სტატისტიკა ძალზე დახრილ შემთხვევებში.
• რეჟიმი არის ყველაზე გავრცელებული დაკვირვების მნიშვნელობები მონაცემთა ნაკრებში. თუ განაწილება დადებითია დახრილი, რეჟიმი დევს მარცხნივ მედიანაზე და, თუ უარყოფითად არის დახრილი, რეჟიმი დევს პირდაპირ მედიანასთან.
• თუ დადებითად არის დახრილი, საშუალო სწორია მედიანამდე; თუ უარყოფითად დახრილი საშუალო არის მედიანის მარცხნივ.
• ნორმალურ განაწილებაში სამივე, საშუალო, რეჟიმი და მედიანა ტოლია.