Save as PDF
Opens your browser print dialog — select "Save as PDF" to download.
S/2025/7504
Total Pages : 4
Fifth Semester
Information Technology
Scheme OCBC 2022
INTRODUCTION TO DATA SCIENCE
Time : Three Hours
Maximum Marks : 70
Note :
i) Attempt total six questions. Question No. 1 (Objective type) is compulsory. From the remaining questions attempt any five.
कुल छः प्रश्नों को हल कीजिए। प्रश्न क्रमांक 1 (वस्तुनिष्ठ प्रकार का) अनिवार्य है। शेष प्रश्नों में से किन्हीं पाँच को हल कीजिए।
ii) In case of any doubt or dispute, the English version question should be treated as final.
किसी भी प्रकार के संदेह अथवा विवाद की स्थिति में अंग्रेजी भाषा के प्रश्न को अंतिम माना जायेगा।
1.
Choose the correct answer.
सही उत्तर का चयन कीजिए।
5 × 2 = 10
i)
What does the acronym “EDA” stand for in Data Science?
डेटा साइंस में संक्षिप्त नाम “EDA” का क्या अर्थ है?
ii)
Which of the following is NOT a key skill required for a Data scientist?
निम्नलिखित में से कौन सा डाटा वैज्ञानिक के लिए आवश्यक प्रमुख कौशल नहीं है?
iii)
In Data Science, what is the term for a dataset that contains both input features and output labels?
डेटा साइंस में, उस डेटासेट के लिए क्या शब्द है जिसमें इनपुट सुविधाएँ और आउटपुट लेबल दोनों शामिल हैं?
iv)
Which step in the Data Science process involves selecting the appropriate model and algorithm for analysis?
डेटा साइंस प्रक्रिया के किस चरण में विश्लेषण के लिए उपयुक्त मॉडल और एल्गोरिदम का चयन करना शामिल है?
v)
Which technology is often used to process and analyze large-scale sets in Data Science?
डेटा साइंस में बड़े पैमाने पर डेटा सेट को संसाधित और विश्लेषण करने के लिए अक्सर किस तकनीक का उपयोग किया जाता है?
2.
a)
What is Data?
डेटा क्या है?
2
b)
What are the applications of Data Science? Explain the role of machine learning in Data Science.
डेटा साइंस के अनुप्रयोग क्या है? डेटा साइंस में मशीन लर्निंग की भूमिका स्पष्ट करें।
4
c)
What is machine generated data? Define structured and unstructured data?
मशीन जनरेटेड डाटा क्या है? स्ट्रक्चर्ड और अनस्ट्रक्चर्ड डेटा को परिभाषित करें।
6
3.
a)
Define variance with it's formula.
वेरिएंस को उसके सूत्र सहित परिभाषित करें।
2
b)
Explain probability distribution function? Write it's formula and explain probability distribution of a discrete random variable.
संभाव्यता वितरण फलन की व्याख्या करें, इसका सूत्र लिखें और असतत यादृच्छिक चर के संभाव्यता वितरण की व्याख्या करें।
4
c)
What is confidence interval, write it's fundamentals and calculate the range using a sample data?
कॉन्फिडेंस इंटरवल क्या है? इसके मूल सिद्धांत लिखें और नमूना डेटा का उपयोग करके सीमा की गणना करें।
6
4.
a)
What are importances of exploratory Data Analysis?
खोजपूर्ण डेटा विश्लेषण के क्या महत्व है?
2
b)
Write about the tools which are used for exploratory Data Analysis? Explain it in detail.
उन उपकरणों के बारे में लिखें जिनका उपयोग खोजपूर्ण डेटा विश्लेषण के लिए किया जाता है? इसे विस्तार में बताइए।
4
c)
Explain in detail about the Matplotlib and seaborn library of Python? And write their uses in (EDA) Exploratory Data Analysis?
पायथन की मेटप्लोटलिब और सीबॉर्न लाइब्रेरी के बारे में विस्तार से बताइए। खोजपूर्ण डेटा विश्लेषण में उनके उपयोग लिखिए।
6
5.
a)
Define Data collection.
डेटा संग्रहण को परिभाषित करें।
2
b)
What are challenges in Data collection? Explain them in detail.
डेटा संग्रह में क्या चुनौतियाँ है? उन्हें विस्तार में समझाइए।
4
c)
Explain Data cleaning in detail and write the process which is used in data cleaning.
डेटा क्लीनिंग के बारे में विस्तार से बताइए वह प्रक्रिया लिखें जिसका उपयोग डेटा क्लीनिंग में किया जाता है?
6
6.
a)
Define Data Visualization. Write down it's importance.
डेटा विजुअलाइजेशन को परिभाषित करें। इसका महत्व लिखिए।
2
b)
Write any four advantages and disadvantages of data visualization.
डेटा विजुअलाइजेशन के कोई चार फायदे और नुकसान लिखें।
4
c)
Which type of data is used for data visualization? Why is data visualization is important?
डेटा विजुअलाइजेशन के लिए किस प्रकार के डेटा का उपयोग किया जाता है? डेटा विजुअलाइजेशन क्यों महत्वपूर्ण है?
6
7.
a)
Define Linear regression.
रेखीय प्रतिगमन को परिभाषित करें।
2
b)
Explain Hypothesis testing method.
परिकल्पना परीक्षण विधि समझाएँ।
4
c)
Explain mean, mode, median with a numerical problem.
एक संख्यात्मक समस्या के साथ माध्य, बहुलक, मध्यिका समझाएँ।
6
8.
a)
What are the key steps process involved in data science workflow?
डेटा साइंस वर्कफ़्लो में शामिल मुख्य चरण प्रक्रिया क्या है?
2
b)
What is Data Mining? Explain data pre-processing technique.
डेटा माइनिंग क्या है? डेटा प्री-प्रोसेसिंग तकनीकों की व्याख्या करें।
4
c)
What are the different fields where data mining is used?
वे कौन से विभिन्न क्षेत्र है जहाँ डेटा माइनिंग का उपयोग किया जाता है?
6