एक वरिष्ठ डेटा वैज्ञानिक के अनुसार, स्टोकेस्टिक ग्रेडिएंट डिसेंट का उपयोग करने के विशिष्ट लाभों में से एक यह है कि यह ग्रेडिएंट डिसेंट और बैच ग्रेडिएंट डिसेंट की तुलना में तेजी से गणना करता है… इसके अलावा, पर बड़े पैमाने पर डेटासेट, स्टोकेस्टिक ग्रेडिएंट डिसेंट तेजी से अभिसरण कर सकता है क्योंकि यह अधिक बार अपडेट करता है।
स्टोकेस्टिक ग्रेडिएंट डिसेंट किसके लिए प्रयोग किया जाता है?
स्टोकेस्टिक ग्रेडिएंट डिसेंट एक अनुकूलन एल्गोरिथम है जिसका अक्सर उपयोग किया जाता है मशीन लर्निंग अनुप्रयोगों में मॉडल मापदंडों को खोजने के लिए जो पूर्वानुमानित और वास्तविक आउटपुट के बीच सबसे उपयुक्त फिट के अनुरूप होते हैं यह एक सटीक लेकिन शक्तिशाली तकनीक है. मशीन लर्निंग अनुप्रयोगों में स्टोकेस्टिक ग्रेडिएंट डिसेंट का व्यापक रूप से उपयोग किया जाता है।
कन्वेंशनल न्यूरल नेटवर्क को प्रशिक्षित करने के लिए हमें स्टैण्डर्ड ग्रेडिएंट डिसेंट के बजाय स्टोकेस्टिक ग्रैडिएंट डिसेंट का उपयोग करने की आवश्यकता क्यों है?
स्टोकेस्टिक ग्रेडिएंट डिसेंट प्रत्येक अवलोकन के लिए मापदंडों को अपडेट करता है जिससे अधिक संख्या में अपडेट होते हैं। तो यह एक तेज दृष्टिकोण है जो त्वरित निर्णय लेने में मदद करता है। इस एनिमेशन में विभिन्न दिशाओं में त्वरित अपडेट देखे जा सकते हैं।
हम ग्रेडिएंट डिसेंट क्यों पसंद करते हैं?
रेखीय प्रतिगमन के लिए ग्रेडिएंट डिसेंट का उपयोग करने का मुख्य कारण कम्प्यूटेशनल जटिलता है: यह कुछ मामलों में ग्रेडिएंट डिसेंट का उपयोग करके समाधान खोजने के लिए कम्प्यूटेशनल रूप से सस्ता (तेज़) है। यहां, आपको मैट्रिक्स X′X की गणना करने की आवश्यकता है, फिर इसे उल्टा करें (नीचे नोट देखें)। यह एक महंगा हिसाब है।
एसजीडी का उपयोग क्यों किया जाता है?
स्टोकेस्टिक ग्रेडिएंट डिसेंट (अक्सर संक्षिप्त SGD) उपयुक्त चिकनाई गुणों के साथ एक उद्देश्य फ़ंक्शन को अनुकूलित करने के लिए एक पुनरावृत्त विधि है (उदाहरण के लिए अलग-अलग या उप-भिन्न)।