ძირითადი განსხვავება – მეთვალყურეობის ქვეშ და უკონტროლო მანქანათმცოდნეობის
ზედამხედველობითი სწავლება და ზედამხედველობის გარეშე სწავლა მანქანური სწავლის ორი ძირითადი კონცეფციაა. ზედამხედველობითი სწავლება არის მანქანათმცოდნეობის ამოცანა ფუნქციის შესასწავლად, რომელიც ასახავს შეყვანას გამოსავალზე შეყვანის-გამომავალი წყვილების მაგალითის საფუძველზე. ზედამხედველობის გარეშე სწავლა არის მანქანათმცოდნეობის ამოცანა, რომელიც მიზნად ისახავს ფუნქციის დასკვნას, რათა აღწეროს ფარული სტრუქტურა არალეიბლიანი მონაცემებისგან. მთავარი განსხვავება ზედამხედველობის ქვეშ და ზედამხედველობის ქვეშ მყოფი მანქანათმცოდნეობას შორის არის ის, რომ ზედამხედველობის ქვეშ სწავლება იყენებს ლეიბლირებულ მონაცემებს, ხოლო ზედამხედველობის გარეშე სწავლა იყენებს არალეიბლირებულ მონაცემებს.
მანქანური სწავლება არის კომპიუტერული მეცნიერების სფერო, რომელიც აძლევს კომპიუტერულ სისტემას შესაძლებლობას ისწავლოს მონაცემებიდან მკაფიოდ დაპროგრამების გარეშე.ეს საშუალებას გაძლევთ გაანალიზოთ მონაცემები და განვსაზღვროთ მასში არსებული შაბლონები. მანქანათმცოდნეობის მრავალი პროგრამა არსებობს. ზოგიერთი მათგანია სახის ამოცნობა, ჟესტების ამოცნობა და მეტყველების ამოცნობა. არსებობს სხვადასხვა ალგორითმები, რომლებიც დაკავშირებულია მანქანურ სწავლებასთან. ზოგიერთი მათგანია რეგრესია, კლასიფიკაცია და კლასტერირება. ყველაზე გავრცელებული პროგრამირების ენები მანქანურ სწავლაზე დაფუძნებული აპლიკაციების შესაქმნელად არის R და Python. ასევე შეიძლება გამოყენებულ იქნას სხვა ენები, როგორიცაა Java, C++ და Matlab.
რა არის ზედამხედველობითი სწავლება?
მანქანურ სწავლაზე დაფუძნებულ სისტემებში მოდელი მუშაობს ალგორითმის მიხედვით. ზედამხედველობის ქვეშ მყოფი სწავლებისას მოდელის ზედამხედველობა ხდება. პირველ რიგში, საჭიროა მოდელის მომზადება. მიღებული ცოდნით მას შეუძლია იწინასწარმეტყველოს პასუხები მომავალი შემთხვევებისთვის. მოდელი მომზადებულია ეტიკეტირებული მონაცემთა ნაკრების გამოყენებით. როდესაც სისტემას ეძლევა ნიმუშის მონაცემები, მას შეუძლია შედეგის პროგნოზირება. ქვემოთ მოცემულია მცირე ამონაწერი პოპულარული IRIS მონაცემთა ნაკრებიდან.
ზემოხსენებული ცხრილის მიხედვით, სეპალის სიგრძე, სეპალის სიგანე, პატელის სიგრძე, პატელის სიგანე და სახეობა ეწოდება ატრიბუტებს. სვეტები ცნობილია როგორც მახასიათებლები. ერთ მწკრივს აქვს მონაცემები ყველა ატრიბუტისთვის. ამიტომ, ერთ რიგს დაკვირვება ეწოდება. მონაცემები შეიძლება იყოს რიცხვითი ან კატეგორიული. მოდელს ეძლევა დაკვირვებები შესაბამისი სახეობის სახელწოდებით. როდესაც ხდება ახალი დაკვირვება, მოდელმა უნდა იწინასწარმეტყველოს სახეობის სახეობა, რომელსაც იგი ეკუთვნის.
ზედამხედველობით სწავლაში არსებობს კლასიფიკაციისა და რეგრესიის ალგორითმები. კლასიფიკაცია არის ეტიკეტირებული მონაცემების კლასიფიკაციის პროცესი. მოდელმა შექმნა საზღვრები, რომლებიც გამოყოფდა მონაცემთა კატეგორიებს. როდესაც მოდელს მიეწოდება ახალი მონაცემები, მას შეუძლია კატეგორიზაცია მოახდინოს იმის მიხედვით, თუ სად არსებობს წერტილი. K-Nearest Neighbors (KNN) არის კლასიფიკაციის მოდელი. k მნიშვნელობიდან გამომდინარე, წყდება კატეგორია. მაგალითად, როდესაც k არის 5, თუ კონკრეტული მონაცემთა წერტილი ახლოს არის რვა მონაცემთა წერტილთან A კატეგორიაში და ექვსი მონაცემთა წერტილი B კატეგორიაში, მაშინ მონაცემთა წერტილი კლასიფიცირდება როგორც A..
რეგრესია არის წინა მონაცემების ტენდენციის პროგნოზირების პროცესი ახალი მონაცემების შედეგის პროგნოზირებისთვის. რეგრესიაში გამომავალი შეიძლება შედგებოდეს ერთი ან მეტი უწყვეტი ცვლადისგან. პროგნოზი კეთდება ხაზის გამოყენებით, რომელიც მოიცავს მონაცემთა უმეტეს რაოდენობას. უმარტივესი რეგრესიის მოდელი არის წრფივი რეგრესია. ის სწრაფია და არ საჭიროებს რეგულირების პარამეტრებს, როგორიცაა KNN-ში. თუ მონაცემები აჩვენებს პარაბოლურ ტენდენციას, მაშინ ხაზოვანი რეგრესიის მოდელი არ არის შესაფერისი.
ეს არის ზედამხედველობითი სწავლის ალგორითმების რამდენიმე მაგალითი. ზოგადად, ზედამხედველობის ქვეშ მყოფი სწავლის მეთოდებიდან მიღებული შედეგები უფრო ზუსტი და სანდოა, რადგან შეყვანის მონაცემები კარგად არის ცნობილი და ეტიკეტირებული. ამიტომ, მანქანამ უნდა გააანალიზოს მხოლოდ ფარული შაბლონები.
რა არის უკონტროლო სწავლა?
უკონტროლო სწავლებისას მოდელი არ ექვემდებარება ზედამხედველობას. მოდელი მუშაობს დამოუკიდებლად, შედეგების პროგნოზირებისთვის. ის იყენებს მანქანათმცოდნეობის ალგორითმებს, რათა დასკვნამდე მივიდეს ეტიკეტირებულ მონაცემებზე. ზოგადად, უკონტროლო სწავლის ალგორითმები უფრო რთულია, ვიდრე ზედამხედველობის ქვეშ მყოფი სწავლის ალგორითმები, რადგან ცოტა ინფორმაციაა. კლასტერირება არის უკონტროლო სწავლის სახეობა. ის შეიძლება გამოყენებულ იქნას ალგორითმების გამოყენებით უცნობი მონაცემების დასაჯგუფებლად. k-საშუალო და სიმკვრივეზე დაფუძნებული კლასტერირება არის ორი კლასტერული ალგორითმი.
k-საშუალო ალგორითმი, ათავსებს k ცენტროიდს შემთხვევითად თითოეული კლასტერისთვის. შემდეგ თითოეული მონაცემთა წერტილი ენიჭება უახლოეს ცენტროიდს. ევკლიდური მანძილი გამოიყენება მონაცემთა წერტილიდან ცენტრამდე მანძილის გამოსათვლელად. მონაცემთა პუნქტები იყოფა ჯგუფებად. k ცენტროიდების პოზიციები კვლავ გამოითვლება. ახალი ცენტროიდის პოზიცია განისაზღვრება ჯგუფის ყველა წერტილის საშუალოთ. ისევ თითოეული მონაცემთა წერტილი ენიჭება უახლოეს ცენტროიდს.ეს პროცესი მეორდება მანამ, სანამ ცენტროიდები აღარ შეიცვლება. k-mean არის სწრაფი დაჯგუფების ალგორითმი, მაგრამ არ არის მითითებული კლასტერიზაციის წერტილების ინიციალიზაცია. ასევე, კლასტერული წერტილების ინიციალიზაციაზე დაფუძნებული კლასტერული მოდელების დიდი ვარიაციაა.
დაჯგუფების კიდევ ერთი ალგორითმი არის სიმკვრივეზე დაფუძნებული კლასტერირება. იგი ასევე ცნობილია როგორც სიმკვრივეზე დაფუძნებული სივრცითი კლასტერული პროგრამები ხმაურით. ის მუშაობს კასეტურის განსაზღვრით, როგორც სიმკვრივით დაკავშირებული წერტილების მაქსიმალური ნაკრები. ეს არის ორი პარამეტრი, რომელიც გამოიყენება სიმკვრივეზე დაფუძნებული კლასტერიზაციისთვის. ისინი არის Ɛ (ეპსილონი) და მინიმალური ქულები. Ɛ არის უბნის მაქსიმალური რადიუსი. მინიმალური ქულები არის ქულების მინიმალური რაოდენობა Ɛ სამეზობლოში კლასტერის დასადგენად. ეს არის კლასტერიზაციის რამდენიმე მაგალითი, რომელიც ხვდება უკონტროლო სწავლაში.
ზოგადად, უკონტროლო სასწავლო ალგორითმებიდან მიღებული შედეგები არ არის ძალიან ზუსტი და სანდო, რადგან მანქანამ უნდა განსაზღვროს და დაასახელოს შეყვანის მონაცემები ფარული შაბლონებისა და ფუნქციების დადგენამდე.
რა მსგავსებაა ზედამხედველობის ქვეშ და უკონტროლო მანქანათმცოდნეობას შორის?
როგორც ზედამხედველობითი, ასევე ზედამხედველობის გარეშე სწავლება მანქანური სწავლების სახეებია
რა განსხვავებაა ზედამხედველობის ქვეშ და უკონტროლო მანქანათმცოდნეობას შორის?
ზედამხედველობა vs უკონტროლო მანქანათმცოდნეობა |
|
ზედამხედველობის ქვეშ მყოფი სწავლება არის მანქანათმცოდნეობის ამოცანა ფუნქციის შესასწავლად, რომელიც ასახავს შეყვანას გამოსავალზე შეყვანის-გამომავალი წყვილების მაგალითის საფუძველზე. | უკონტროლო სწავლება არის მანქანათმცოდნეობის ამოცანა, რომელიც გულისხმობს ფუნქციის დასკვნას, რომელიც აღწერს ფარული სტრუქტურის არალეიბლირებულ მონაცემებს. |
ძირითადი ფუნქციონირება | |
ზედამხედველობის ქვეშ მყოფი სწავლებისას მოდელი წინასწარმეტყველებს შედეგს ეტიკეტირებული შეყვანის მონაცემების საფუძველზე. | უკონტროლო სწავლებისას მოდელი წინასწარმეტყველებს შედეგს ეტიკეტირებული მონაცემების გარეშე, შაბლონების დამოუკიდებლად იდენტიფიცირებით. |
შედეგების სიზუსტე | |
ზედამხედველობითი სწავლის მეთოდებით მიღებული შედეგები უფრო ზუსტი და სანდოა. | შესწავლის უკონტროლო მეთოდებით მიღებული შედეგები არ არის ძალიან ზუსტი და სანდო. |
მთავარი ალგორითმები | |
არსებობს რეგრესიის და კლასიფიკაციის ალგორითმები ზედამხედველობით სწავლაში. | არსებობს ალგორითმები კლასტერიზაციისთვის უკონტროლო სწავლაში. |
შეჯამება – ზედამხედველობის წინააღმდეგ მანქანური სწავლების უკონტროლო წინააღმდეგ
ზედამხედველობითი სწავლება და ზედამხედველობის გარეშე სწავლა მანქანური სწავლების ორი ტიპია.ზედამხედველობით სწავლა არის მანქანათმცოდნეობის ამოცანა ფუნქციის შესასწავლად, რომელიც ასახავს შეყვანას გამოსავალზე, შეყვანის-გამომავალი წყვილების მაგალითის საფუძველზე. ზედამხედველობის გარეშე სწავლა არის მანქანათმცოდნეობის ამოცანა, რომელიც გულისხმობს ფუნქციის დასკვნას, რათა აღწეროს ფარული სტრუქტურა არალეიბლიანი მონაცემებისგან. განსხვავება ზედამხედველობასა და ზედამხედველობის ქვეშ მყოფ მანქანურ სწავლებას შორის არის ის, რომ ზედამხედველობის ქვეშ სწავლა იყენებს ეტიკეტირებულ მონაცემებს, ხოლო ზედამხედველობის გარეშე დახრილობა იყენებს არალეიბლირებულ მონაცემებს.