DBMS vs მონაცემთა მოპოვება
DBMS (მონაცემთა ბაზის მართვის სისტემა) არის სრული სისტემა, რომელიც გამოიყენება ციფრული მონაცემთა ბაზების მართვისთვის, რომელიც საშუალებას იძლევა მონაცემთა ბაზის შინაარსის შენახვა, მონაცემთა შექმნა/შენახვა, ძიება და სხვა ფუნქციონალობა. მეორეს მხრივ, მონაცემთა მოპოვება არის კომპიუტერული მეცნიერების დარგი, რომელიც ეხება ადრე უცნობი და საინტერესო ინფორმაციის მოპოვებას ნედლი მონაცემებიდან. ჩვეულებრივ, მონაცემთა მოპოვების პროცესის შესატანად გამოყენებული მონაცემები ინახება მონაცემთა ბაზებში. მომხმარებლები, რომლებიც მიდრეკილნი არიან სტატისტიკისკენ, იყენებენ მონაცემთა მოპოვებას. ისინი იყენებენ სტატისტიკურ მოდელებს მონაცემებში ფარული შაბლონების მოსაძებნად. მონაცემთა მაინერები დაინტერესებულნი არიან იპოვონ სასარგებლო ურთიერთობები მონაცემთა სხვადასხვა ელემენტებს შორის, რაც საბოლოო ჯამში მომგებიანია ბიზნესისთვის.
DBMS
DBMS, რომელსაც ზოგჯერ უბრალოდ მონაცემთა ბაზის მენეჯერს უწოდებენ, არის კომპიუტერული პროგრამების კრებული, რომელიც ეძღვნება სისტემაში დაინსტალირებული ყველა მონაცემთა ბაზის მართვას (მაგ., მყარ დისკს ან ქსელს). მსოფლიოში არსებობს მონაცემთა ბაზების მართვის სხვადასხვა ტიპის სისტემები და ზოგიერთი მათგანი შექმნილია კონკრეტული მიზნებისთვის კონფიგურირებული მონაცემთა ბაზების სათანადო მართვისთვის. ყველაზე პოპულარული კომერციული მონაცემთა ბაზის მართვის სისტემებია Oracle, DB2 და Microsoft Access. ყველა ეს პროდუქტი უზრუნველყოფს სხვადასხვა დონის პრივილეგიების განაწილების საშუალებას სხვადასხვა მომხმარებლისთვის, რაც შესაძლებელს ხდის DBMS ცენტრალიზებულ კონტროლს ერთი ადმინისტრატორის მიერ ან გადანაწილდეს რამდენიმე სხვადასხვა ადამიანზე. მონაცემთა ბაზის მართვის ნებისმიერ სისტემაში ოთხი მნიშვნელოვანი ელემენტია. ეს არის მოდელირების ენა, მონაცემთა სტრუქტურები, შეკითხვის ენა და ტრანზაქციების მექანიზმი. მოდელირების ენა განსაზღვრავს DBMS-ში განთავსებული თითოეული მონაცემთა ბაზის ენას.ამჟამად პრაქტიკაშია რამდენიმე პოპულარული მიდგომა, როგორიცაა იერარქიული, ქსელური, რელაციური და ობიექტი. მონაცემთა სტრუქტურები ხელს უწყობს ისეთი მონაცემების ორგანიზებას, როგორიცაა ინდივიდუალური ჩანაწერები, ფაილები, ველები და მათი განმარტებები და ობიექტები, როგორიცაა ვიზუალური მედია. მონაცემთა შეკითხვის ენა ინარჩუნებს მონაცემთა ბაზის უსაფრთხოებას შესვლის მონაცემების მონიტორინგით, სხვადასხვა მომხმარებლისთვის წვდომის უფლებით და სისტემაში მონაცემების დასამატებლად პროტოკოლებით. SQL არის პოპულარული შეკითხვის ენა, რომელიც გამოიყენება ურთიერთობების მონაცემთა ბაზის მართვის სისტემებში. დაბოლოს, მექანიზმი, რომელიც საშუალებას აძლევს ტრანზაქციებს, ეხმარება ერთდროულობასა და სიმრავლეს. ეს მექანიზმი დარწმუნდება, რომ ერთი და იგივე ჩანაწერი არ შეიცვლება რამდენიმე მომხმარებლის მიერ ერთდროულად, რითაც შეინარჩუნებს მონაცემთა მთლიანობას. გარდა ამისა, DBMS უზრუნველყოფს სარეზერვო და სხვა შესაძლებლობებსაც.
მონაცემთა მოპოვება
მონაცემთა მოპოვება ასევე ცნობილია როგორც ცოდნის აღმოჩენა მონაცემებში (KDD). როგორც ზემოთ აღვნიშნეთ, ეს არის კომპიუტერული მეცნიერების ფელიდი, რომელიც ეხება ადრე უცნობი და საინტერესო ინფორმაციის მოპოვებას ნედლი მონაცემებიდან.მონაცემთა ექსპონენციალური ზრდის გამო, განსაკუთრებით ისეთ სფეროებში, როგორიცაა ბიზნესი, მონაცემთა მოპოვება გახდა ძალიან მნიშვნელოვანი ინსტრუმენტი ამ დიდი სიმდიდრის მონაცემთა ბიზნეს ინტელექტად გადაქცევისთვის, რადგან შაბლონების ხელით მოპოვება გასული რამდენიმე ათწლეულის განმავლობაში შეუძლებელი გახდა. მაგალითად, ის ამჟამად გამოიყენება სხვადასხვა აპლიკაციებისთვის, როგორიცაა სოციალური ქსელის ანალიზი, თაღლითობის გამოვლენა და მარკეტინგი. მონაცემთა მოპოვება ჩვეულებრივ ეხება შემდეგ ოთხ ამოცანას: კლასტერიზაცია, კლასიფიკაცია, რეგრესია და ასოციაცია. კლასტერირება არის მსგავსი ჯგუფების იდენტიფიცირება არასტრუქტურირებული მონაცემებიდან. კლასიფიკაცია არის სწავლის წესები, რომლებიც შეიძლება გამოყენებულ იქნას ახალ მონაცემებზე და, როგორც წესი, მოიცავს შემდეგ ნაბიჯებს: მონაცემთა წინასწარი დამუშავება, მოდელირების დიზაინი, სწავლა/მახასიათებლის შერჩევა და შეფასება/ვალიდაცია. რეგრესია არის ფუნქციების პოვნა მინიმალური შეცდომით მონაცემთა მოდელისთვის. და ასოციაცია ეძებს ურთიერთობებს ცვლადებს შორის. მონაცემთა მოპოვება ჩვეულებრივ გამოიყენება კითხვებზე პასუხის გასაცემად, როგორიც არის, რა არის ძირითადი პროდუქტები, რომლებიც ხელს შეუწყობს მომავალ წელს Wal-Mart-ში მაღალი მოგების მიღებას?
რა განსხვავებაა DBMS-სა და მონაცემთა მაინინგს შორის?
DBMS არის სრულფასოვანი სისტემა საბინაო და ციფრული მონაცემთა ბაზების მართვისთვის. თუმცა მონაცემთა მოპოვება არის ტექნიკა ან კონცეფცია კომპიუტერულ მეცნიერებაში, რომელიც ეხება სასარგებლო და ადრე უცნობი ინფორმაციის ამოღებას ნედლი მონაცემებიდან. უმეტეს შემთხვევაში, ეს ნედლეული მონაცემები ინახება ძალიან დიდ მონაცემთა ბაზებში. ამიტომ, მონაცემთა მაინერები იყენებენ DBMS-ის არსებულ ფუნქციებს, რათა ამუშავებენ, მართონ და წინასწარ დაამუშავონ ნედლეული მონაცემები მონაცემთა მოპოვების პროცესამდე და მის დროს. თუმცა, მხოლოდ DBMS სისტემა არ შეიძლება გამოყენებულ იქნას მონაცემების გასაანალიზებლად. მაგრამ, ზოგიერთ DBMS-ს ამჟამად აქვს ჩაშენებული მონაცემთა ანალიზის ხელსაწყოები ან შესაძლებლობები.