Save as PDF
Opens your browser print dialog — select "Save as PDF" to download.
B.Tech., VI Semester
Examination, May 2024
Grading System (GS)
Data Mining and Warehousing
Note:
i) Attempt any five questions.
किन्हीं पाँच प्रश्नों को हल कीजिए।
ii) All questions carry equal marks.
सभी प्रश्नों के समान अंक है।
iii) In case of any doubt or dispute the English version question should be treated as final.
किसी भी प्रकार के संदेह अथवा विवाद की स्थिति में अंग्रेजी भाषा के प्रश्न को अंतिम माना जायेगा।
a) What is the importance of data marts in data warehouse?
डाटा वेयरहाउस में डाटा मार्ट का क्या महत्त्व है?
b) Explain in detail about data preprocessing.
डाटा प्रीप्रोसेसिंग के बारे में विस्तार से समझाइए।
a) Compare and contrast operational database systems with data warehouse.
डाटा वेयरहाउस के साथ ऑपरेशनल डाटाबेस सिस्टम की तुलना करें।
a) With necessary diagrams and examples of data cubes explain various OLAP operations.
आवश्यक आरेखों और डाटा क्यूब्स के उदाहरणों के साथ विभिन्न OLAP संचालनों की व्याख्या करें।
b) Discuss about Data Warehouse hardware and operational design.
डाटा वेयरहाउस हार्डवेयर और ऑपरेशनल डिजाइन के बारे में चर्चा करें।
a) Describe the various phases in knowledge discovery process with a neat diagram.
ज्ञान की खोज प्रक्रिया के विभिन्न चरणों का स्वच्छ आरेख दें, साथ वर्णन कीजिए।
b) Discuss about fuzzy sets and fuzzy logic.
फ़ज़ी सेट्स और फ़ज़ी लॉजिक के बारे में चर्चा करें।
a) Is the data warehouse prerequisite for data mining? Does the data warehouse helps data mining? If so in what ways explain?
क्या डाटा माइनिंग के लिए डाटा वेयरहाउस पूर्वापेक्षा है? क्या डाटा वेयरहाउस माइनिंग में मदद करता है? यदि हाँ तो किस प्रकार समझाइए?
b) What is meant by classification? Justify why clustering is said to be supervised learning. How the classifier accuracy determined and also explains its various types.
वर्गीकरण से क्या तात्पर्य है? क्लस्टरिंग को पर्यवेक्षित शिक्षण क्यों कहा जाता है, इसका औचित्य सिद्ध करें। क्लासिफायर की सटीकता कैसे निर्धारित होती है और इसके विभिन्न प्रकार भी बतलाइए।
a) Explain Rule based algorithm for classification. Discuss the usage of information gain in this.
क्लासिफिकेशन के लिए नियम आधारित एल्गोरिथम को समझाइए। इसमें सूचना लाभ के उपयोग की चर्चा कीजिए।
b) Discuss about K-nearest-neighbors algorithm.
K-निकटतम-पड़ोसी एल्गोरिथम के बारे में चर्चा करें।
a) Explain different data types used in clustering.
क्लस्टरिंग में उपयोग किए जाने वाले विभिन्न डाटा प्रकारों की व्याख्या कीजिए।
b) Describe example of data set for which Apriori check would actually increase the cost.
डाटा सेट के उदाहरण का वर्णन करें ��िसके लिए एप्रियोरी चेक वास्तव में लागत में वृद्धि करेगा।
Write short notes on any two:
किन्हीं दो पर संक्षिप्त टिप्पणियाँ लिखिए।
a) Data Warehouse design
अ) डाटा वेयरहाउस डिजाइन
b) OLAP queries
ब) OLAP प्रश्न
c) Data types and quality of data
स) डाटा प्रकार और डाटा की गुणवत्ता
d) BIRCH algorithm
द) BIRCH एल्गोरिथम