Save as PDF

Opens your browser print dialog — select "Save as PDF" to download.

S/2025/7496 Total Pages : 4

Fifth Semester

Computer Science & Engineering

Scheme OCBC 2022

DATA SCIENCES: DATA WAREHOUSING AND DATA MINING

Time : Three Hours Maximum Marks : 70

Note : i) Attempt total six questions. Question No. 1 (Objective type) is compulsory. From the remaining questions attempt any five.

कुल छः प्रश्न हल कीजिए। प्रश्न क्रमांक 1 (वस्तुनिष्ठ प्रकार का) अनिवार्य है। शेष प्रश्नों में से किन्हीं पाँच को हल कीजिए।

ii) In case of any doubt or dispute, the English version question should be treated as final.

किसी भी प्रकार के संदेह अथवा विवाद की स्थिति में अंग्रेजी भाषा के प्रश्न को अंतिम माना जायेगा।

1.

Choose the correct answer. 2 each

सही उत्तर का चयन कीजिए।

i) A central repository of information that can be analysed to make more informed decisions is known as

i) सूचना का एक केंद्रीय भंडार जिसे अधिक सूचित निर्णय लेने के लिए विश्लेषण किया जा सकता है, कहलाता है

  • (a) Data mining
  • (b) Data storing
  • (c) Data sorting
  • (d) Data warehouses
  • (अ) डाटा माइनिंग
  • (ब) डाटा स्टोरिंग
  • (स) डाटा सोर्टिंग
  • (द) डाटा वेयरहाउसिंग

ii) What is data mining?

ii) डाटा माइनिंग क्या है

  • (a) Deleting unnecessary data
  • (b) Sorting data alphabetically
  • (c) Storing data securely
  • (d) Extracting useful patterns or information from large data sets
  • (अ) अनावश्यक डाटा हटाना
  • (ब) डाटा को वर्णानुक्रम में क्रमबद्ध करना
  • (स) डाटा को सुरक्षित रूप में संग्रहीत करना
  • (द) बड़े डाटासेट से उपयोगी पैटर्न या जानकारी निकालना

iii) Pick the wrong data mining functionality among the given data mining functionalities

iii) दी गई डाटा माइनिंग कार्यक्षमताओं में से गलत डाटा माइनिंग कार्यक्षमता चुनें

  • (a) Classification
  • (b) Clustering
  • (c) Class description
  • (d) Object description
  • (अ) वर्गीकरण
  • (ब) क्लस्टरिंग
  • (स) वर्ग विवरण
  • (द) वस्तु विवरण

iv) If the class information is used during discretization process, it is called.

iv) यदि वर्ग की जानकारी का उपयोग विव्रेकीकरण प्रक्रिया के दौरान किया जाता है, तो इसे __________ कहा जाता है।

  • (a) Supervised discretization
  • (b) Unsupervised discretization
  • (c) Clustered discretization
  • (d) Disorganised discretization
  • (अ) पर्यवेक्षित विवेकीकरण
  • (ब) अपर्यवेक्षित विवेकीकरण
  • (स) संकुलित विवेकीकरण
  • (द) अव्यवस्थित विवेकीकरण

v) After cleaning and integrating data from heterogeneous sources, the data is stored in __________

v) विभिन्न स्रोतों से डाटा को साफ करने और एकीकृत करने के बाद, डाटा को __________ में संग्रहित किया जाता है

  • (a) Flat files
  • (b) Database
  • (c) Data warehouse
  • (d) Directories
  • (अ) फ्लैट फाइलें
  • (ब) डाटाबेस
  • (स) डाटा वेयरहाउस
  • (द) डायरेक्टरीज
2.

a) How to classify data mining systems? Discuss. 2

a) डाटा माइनिंग सिस्टम को कैसे वर्गीकृत करें। चर्चा करें।

b) What is KDD? Explain about data mining as a step in the process of knowledge discovery. 4

b) KDD क्या है? ज्ञान खोज की प्रक्रिया में एक कदम के रूप में डाटा माइनिंग के बारे में बताएं।

c) Discuss about data mining task primitives with examples. 6

c) डाटा माइनिंग टास्क प्रिमिटिव के बारे में उदाहरण सहित चर्चा करें।

3.

a) Define data warehouse. Discuss design principles. 2

a) डाटा वेयर हाउस को परिभाषित करें। डिजाइन सिद्धांतों पर चर्चा करें।

b) Compare OLTP and OLAP. 4

b) OLTP और OLAP की तुलना करें।

c) Describe in brief about data warehouse implementation. 6

c) डाटा वेयरहाउस कार्यान्वयन के बारे में संक्षेप में वर्णन करें।

4.

a) What is the need of data preprocessing? 2

a) डाटा प्रीप्रोसेसिंग की क्या आवश्यकता है?

b) Write a note attribute selection measures. 4

b) विशेषता चयन उपायों पर एक नोट लिखें।

c) Explain the data cube? 6

c) डाटा क्यूब को स्पष्ट करें?

5.

a) What is meant by frequent item set in pattern mining? 2

a) पैटर्न माइनिंग में बारंबार आइटम सेट का क्या मतलब है?

b) Discuss about Naive Bayesian classification. 4

b) नैव बायसियन वर्गीकरण के बारे में चर्चा करें।

c) Describe in detail about rule based classification. 6

c) नियम आधारित वर्गीकरण के बारे में विस्तार से वर्णन करें।

6.

a) What is an outlier? Mention its applications. 2

a) बाह्य क्या है? इसके अनुप्रयोग का उल्लेख करें।

b) Write about Lazy learners for classification. 4

b) वर्गीकरण के लिए आलसी शिक्षार्थियों के बारे में लिखें।

c) Discuss the key issues in Hierarchical clustering. 6

c) हायरार्किकल क्लस्टरिंग में प्रमुख मुद्दों पर चर्चा करें।

7.

a) List out all partitioning methods for clustering data. 2

a) क्लस्टरिंग डाटा के लिए सभी विभाजन विधियों को सूची बद्ध करें।

b) Categorise various kinds of association rules with example. 4

b) विभिन्न प्रकार के एसोसिएशन नियमों को उदाहरण सहित वर्गीकृत करें।

c) Write any one partitioning based clustering methods. 6

c) कोई एक विभाजन आधारित क्लस्टरिंग विधियों लिखें।