डेटा विश्लेषण में आर
Online
अवधि
5 Days
बोली
अंग्रेज़ी
गति
पुरा समय
आवेदन की आखरी तारीक
आवेदन की अंतिम तिथि
सबसे पहले वाली तारिक
सबसे पहले आरंभ तिथि का अनुरोध करें
ट्यूशन शुल्क
EUR 930 *
अध्ययन प्रारूप
दूरस्थ शिक्षा
* पेशेवरों के लिए I छात्र और पीएचडी छात्र EUR 730 I छात्र पीएचडी छात्र और VU एम्स्टर्डम, एम्स्टर्डम UMC या ऑरोरा नेटवर्क पार्टनर के कर्मचारी EUR 630
परिचय
डेटा विश्लेषण में R जैसी सांख्यिकीय भाषाओं के बढ़ते उपयोग के साथ, अब उन्हें समझने का समय आ गया है!
आर एक ओपन-सोर्स प्रोग्रामिंग भाषा है जो सांख्यिकी के क्षेत्र में अपनी बहुमुखी प्रतिभा के कारण डेटा विज्ञान में बहुत महत्वपूर्ण हो गई है। आर का उपयोग आमतौर पर तब किया जाता है जब कार्य को स्टैंडअलोन या वितरित कंप्यूटिंग के लिए डेटा के विशेष विश्लेषण की आवश्यकता होती है। आर डेटा अन्वेषण के लिए भी एकदम सही है। इसका उपयोग किसी भी तरह के विश्लेषण कार्य में किया जा सकता है, क्योंकि इसमें कई उपकरण हैं और यह बहुत विस्तार योग्य भी है।
यह पाठ्यक्रम सांख्यिकीय मॉडलों को समझने और परिणामों का विश्लेषण करने पर ध्यान केंद्रित करता है, साथ ही आर के साथ काम करना भी सिखाता है। नए लोगों को सॉफ्टवेयर से परिचित कराने के साथ-साथ, यह बुनियादी और अधिक उन्नत सांख्यिकी भी प्रस्तुत करता है।
आदर्श छात्र
Who can join?
अंतिम वर्ष के स्नातक, परास्नातक छात्र, पीएचडी उम्मीदवार, और पेशेवर जो आर की मूल बातें और कुछ और उन्नत कौशल सीखने और उन्हें अपने डेटा विश्लेषण समस्याओं को हल करने के लिए लागू करने में रुचि रखते हैं, वे आवेदन करने के लिए स्वागत योग्य हैं। सांख्यिकी का बुनियादी ज्ञान (कम से कम स्नातक पाठ्यक्रम) आवेदन करने के लिए एक शर्त है।
दाखिले
पाठ्यक्रम
छात्रों को ओपन-सोर्स प्रोग्रामिंग भाषा आर की विशाल क्षमता की खोज करने और विविध प्रकृति की सांख्यिकीय समस्याओं का विश्लेषण करने के लिए कौशल और उपकरणों की एक श्रृंखला विकसित करने के लिए आर में डेटा विश्लेषण के लिए आवेदन करना चाहिए।
लगभग सभी प्रमुख संगठन और विश्वविद्यालय R का उपयोग करते हैं। गूगल न केवल R का उपयोग करता है, बल्कि उसने इस भाषा के लिए ऐसे मानक भी लिखे हैं जो व्यापक रूप से स्वीकार किए जाते हैं।
यह पाठ्यक्रम सांख्यिकीय मॉडलों को समझने और परिणामों का विश्लेषण करने पर ध्यान केंद्रित करता है, साथ ही आर के साथ काम करना भी सिखाता है। नए लोगों को सॉफ्टवेयर से परिचित कराने के साथ-साथ, यह बुनियादी और अधिक उन्नत सांख्यिकी भी प्रस्तुत करता है।
हम वर्णनात्मक सांख्यिकी और डेटा के दृश्य प्रतिनिधित्व से शुरू करेंगे, जो कि अधिकांश सांख्यिकीय विश्लेषणों के लिए पहला कदम है। फिर हम रैखिक प्रतिगमन मॉडल पेश करते हैं, जो दो मुख्य उद्देश्यों के साथ व्यापक रूप से इस्तेमाल किया जाने वाला मॉडल है: डेटा के बीच संबंधों को मॉडलिंग करना और भविष्य के अवलोकनों की भविष्यवाणी करना। उसके बाद, हम गैर-सामान्य रूप से वितरित चर का विश्लेषण करने के लिए रैखिक मॉडल को सामान्यीकृत रैखिक ढांचे तक विस्तारित करेंगे।
Each day consists of short lectures with examples and exercises in which you apply what you have learned right away. At the end of the course, there will be a written assignment which will be graded.
अतिरिक्त पाठ्यक्रम जानकारी के लिए नीचे पढ़ना जारी रखें।
Day 1: Introduction
- आर का परिचय
- Data handling
- डेटा फ़ाइलें पढ़ना/लिखना
हम आर एनवायरनमेंट और आर स्टूडियो की मूल बातें समझाने से शुरू करते हैं। आप सीखेंगे कि आर में मुख्य डेटा प्रकारों के साथ कैसे काम करना है: वेक्टर, फैक्टर, मैट्रिक्स, लिस्ट और डेटा फ्रेम। आप चर बनाना, केस और चर चुनना और प्लॉट का उपयोग करना सीखेंगे। माध्य और मानक विचलन की गणना करने के लिए सरल फ़ंक्शन पेश किए गए हैं।
Day 2: Data & functions
- डेटा निर्माण
- डेटा विज़ुअलाइज़ेशन
- फ़ंक्शन और लूप
आप R में डेटा फ़ाइल पढ़ेंगे, और आप सीखेंगे कि R में वर्णनात्मक सांख्यिकी और आवृत्तियों की गणना कैसे करें। पिछले दिन चर्चा किए गए फ़ंक्शन इस सर्वेक्षण डेटासेट पर लागू किए जाएँगे। इसके अतिरिक्त, विभिन्न लूप कमांड जो आपको पूरे डेटासेट पर जटिल कार्य चलाने की अनुमति देते हैं, पर चर्चा की गई है। हम लूप के विकल्प के रूप में वेक्टराइजेशन का परिचय देते हैं। हालाँकि लूप अधिक सहज है, लेकिन वेक्टराइजेशन बहुत तेज़ है। पूरे पाठ्यक्रम में, हम टी-टेस्ट, रैखिक प्रतिगमन और लॉग-संभावना अनुपात परीक्षण के लिए फ़ंक्शन लिखने में इन कौशलों का अभ्यास करेंगे।
Day 3: Simple regression
- फ़ंक्शन और लूप
- सरल रेखीय प्रतिगमन
- तुलना का मतलब: टी-टेस्ट
We will discuss how the linear model is related to the t-test. You will learn how to interpret the results with one independent dummy or interval variable, and how you can test the assumptions of linear regression.
Day 4: Multiple regression
- प्रतिगमन मॉडल के सिद्धांत और मान्यताएँ
- एकाधिक रेखीय प्रतिगमन
- एकाधिक रेखीय प्रतिगमन
This day builds on day 3 in which we treat simple regression. The multiple regression model additionally adds the concept of ‘ceteris paribus’. We will also treat confounding and interaction effects, and when and how to use mean centering.
Day 5: Logistic regression
- χ2 (ची-स्क्वेर्ड परीक्षण)
- संभार तन्त्र परावर्तन
- Recap
We will introduce logistic regression as part of the generalized linear framework. We will calculate the odds ratio and discuss how it is related to the chi-square test and logistic regression. Furthermore, we will discuss the log-likelihood ratio test to compare two or more models.
असाइनमेंट और ग्रेडिंग
कोर्स के अंत में, आपको एक असाइनमेंट पूरा करना होगा जिसे ग्रेड किया जाएगा। अभ्यास और असाइनमेंट का फोकस आर में कोडिंग और सामान्यीकृत रैखिक प्रतिगमन मॉडल को लागू करने और व्याख्या करने का तरीका है। असाइनमेंट जमा करने की अंतिम तिथि 19 जनवरी, शुक्रवार को 23:59 CET है।
कार्यक्रम का परिणाम
पाठ्यक्रम के अंत तक, छात्र विभिन्न लोकप्रिय आर पैकेजों से परिचित हो जाएंगे और विभिन्न सांख्यिकीय विश्लेषण करने, उनके कार्यों को लिखने और अपने डेटा को प्रस्तुत करने के लिए आकर्षक प्लॉट का उपयोग करने में सक्षम होंगे।