Data mining: Data mining को data या knowledge discovery भी कहते है। data mining, बहुत बड़े data के group में से small data को search करने की process है। इस process में परम्परागत statistics, artificial intelligence तथा computer graphics का use किया जाता है।
दूसरे शब्दों में कहें तो , “Data mining एक useful technique है जिसका use करके companies बहुत बड़े data के group में से important information को निकालती है.”
Data mining का use करके hidden patterns और useful data को search किया जाता है और फिर इन patterns और data के base पर decision making की जाती है और Data mining की process का use करके organizations business में आने वाली problems को solve करते हैं.
data mining में data को analyze करने के लिए data mining tools का use किया जाता है। ये tool बहुत ही powerful होते है।
data mining के निम्नलिखित goals होते है:
1. Explanatory – इसमें देखी गयी घटना या परिस्थिति को explain किया जाता है।
2. Confirmatory – इसमें संभावनाओ से मुक्त परिकल्पनाओं की confirmation की जाती है।
3. Analyzatry – इसमें नए डेटा को analyze किया जाता है जिससे positive feedback दी जा सके।
Advantage of Data Mining:
- Data mining की तकनीक के द्वारा कंपनी knowledge पर आधारित information को प्राप्त करती है.
- इसके द्वारा organizations अपने production और operation को बेहतर करते हैं.
- डाटा माइनिंग दूसरे statistical data applications की तुलना में cost effective है अर्थात् इससे cost (मूल्य) की बचत होती है.
- इसके द्वारा आसानी से decisions को लिया जा सकता है.
- इसे नए systems में implement करना बहुत ही easy होता है.
- इसकी speed बहुत ही तेज होती है जिससे बड़े data को कम समय में analyze कर लिया जाता है.
- यह profitable customers को आसानी से खोज लेता है जिससे product को sale करना आसान हो जाता है और customer से relationship भी बेहतर होती है.
Disadvantage of Data Mining:
- इसका बड़ा नुकसान यह है कि इसमें data की security और privacy नहीं होती है. इसमें सभी data को इक्कठा किया जाता है जैसे कि social media के message, photos आदि. इससे लोगों की privacy खत्म होती है.
- डाटा माइनिंग के द्वारा collect किया गया data ज्यादातर incomplete (अधूरा) होता है.
- इसमें irrelevant (बेकार) data को भी एकत्र किया जाता है.
Data Mining की विशेषताएं:
- यह future prediction करता है. इसका अर्थ है कि यह भविष्य में होने वाली घटनाओं को predict करता है.
- यह बड़े datasets और database को focus करता है.
- इसमें pattern की prediction, automatic होती है और यह behaviour analysis पर आधारित होती है.
- यह काम में आने वाली information को create करता है.
Data Mining के Types:
- Predictive Data Mining Analysis
- Descriptive Data Mining Analysis
- Predictive Data Mining Analysis
यह future में होने वाली घटनाओं को predict करता है. यह चार प्रकार का होता है.
- Classification Analysis
- Regression Analysis
- Time Serious Analysis
- Prediction Analysis
- Descriptive Data Mining Analysis
इसका use data को useful information में changes करने के लिए किया जाता है. इसके भी चार types होते हैं:-
- Clustering Analysis
- Summarization Analysis
- Association Rules Analysis
- Sequence Discovery Analysis
Applications of Data Mining:
- Healthcare के क्षेत्र में – इसका प्रयोग करके मरीज के रोग के बारें में पता लगाया जाता है. यह ऐसे hospitals के बारें में जानकरी देता है जहाँ मरीज का इलाज कम पैसों और कम समय में हो जाए.
- Market के क्षेत्र में – डाटा माइनिंग के द्वारा customer के behavior का पता लगाया जाता है. इसमें यह देखा जाता है कि अगर customer ने कुछ समान ख़रीदा है तो वह इसके साथ दूसरा कौन सा सामान खरीदेगा.
- Education के क्षेत्र में – डाटा माइनिंग का प्रयोग करके student के result को predict किया जाता है. यह ये भी बताता है कि कैसे किसी student को teach करे और क्या teach करें.
- Fraud को detect करने में – आजकल बहुत सारें frauds हो रहे हैं. जिससे लाखों लोगों का पैसा बर्बाद हो जाता है. इससे बचने में डाटा माइनिंग मदद करता है.