Data Warehouse: Data Warehouse(DW) एक relational database है जिसे transaction processing के बजाय query and analysis के लिए designed किया गया है। इसमें single and multiple sources से transaction data से प्राप्त historical data शामिल है।
Data Warehouse एकीकृत, enterprise-wide, historical data provide करता है और data modeling and analysis के लिए decision-makers के लिए support provide करने पर focus है।
एक Data Warehouse entire organization के लिए specific data का एक group है, न केवल users के एक particular group के लिए।
इसका use daily operations और transaction processing के लिए नहीं किया जाता है बल्कि decisions लेने के लिए किया जाता है।
Data Warehouse को following attributes के साथ data system के रूप में देखा जा सकता है:
- यह various applications के data का use करते हुए, investigative task के लिए design किया गया एक database है।
- यह अपेक्षाकृत long interactions के साथ अपेक्षाकृत small number में clients का support करता है।
- इसमें information का historical perspective provide करने के लिए current and historical data शामिल हैं।
- इसका उपयोग read-intensive है।
- इसमें कुछ large tables होते हैं।
“Data Warehouse management के decisions के support में information का एक subject-oriented, integrated, and time-variant store है।”
Characteristics of Data Warehouse:
- Subject-Oriented:
Modeling और decision-makers के लिए data के analysis पर एक data warehouse लक्ष्य। इसलिए, data warehouse आमतौर पर किसी particular subject, जैसे कि customer, product, or sales के बारे में एक concise and straightforward view provide करते हैं, global organization’s के ongoing operations के बजाय। यह उन data को छोड़कर किया जाता है जो subject से संबंधित नहीं होते हैं और इस subject को समझने के लिए users द्वारा needed सभी data शामिल होते हैं। - Integrated:
एक data warehouse RDBMS, flat files, and online transaction records जैसे विभिन्न heterogeneous data sources को integrate करता है। data data sources के बीच naming conventions, attributes के type, आदि में consistency ensure करने के लिए data warehousing के दौरान data की cleaning and integration करने की requirement होती है। - Time-Variant:
Historical information एक data warehouse में रखी जाती है। Example के लिए, कोई व्यक्ति 3 महीने, 6 महीने, 12 महीने, या पिछले data से data पुनर्प्राप्त कर सकता है। एक transactions system के साथ ये variations, जहां अक्सर केवल सबसे current file रखी जाती है। - Non-Volatile:
Data warehouse physically separate data storage है, जो source operational RDBMS से बदल जाता है। Data का operational update data warehouse में नहीं होता है, यानी, update, insert, and delete operations नहीं किए जाते हैं। आमतौर पर data access में केवल दो procedures की requirement होती है: Data का Initial loading और data तक पहुंच। इसलिए, DW को transaction processing, recovery, and concurrency capabilities की requirement नहीं है, जो data retrieval के substantial speedup के लिए अनुमति देता है। Non-Volatile define करता है कि एक बार warehouse में entry किया, और data को change नहीं चाहिए।
History of Data Warehouse:
Data warehousing का idea 1980 के दशक के उत्तरार्ध में आया जब IBM के researchers Barry Devlin and Paul Murphy ने “Business Data Warehouse” की स्थापना की।
संक्षेप में, data warehousing idea को परिचालन प्रणाली से decision support environment तक information के flow के लिए एक architectural model का support करने की योजना बनाई गई थी। अवधारणा प्रवाह से जुड़ी विभिन्न problems को संबोधित करने का प्रयास करती है, मुख्य रूप से इससे जुड़ी उच्च लागत।
data warehousing architecture की absence में, कई decision support environments का support करने के लिए space की एक बड़ी मात्रा की requirement थी। बड़े निगमों में, independent रूप से काम करने के लिए विभिन्न decision support environment के लिए यह सामान्य था।
Goals of Data Warehousing:
- To help reporting as well as analysis
- Maintain the organization’s historical information
- Be the foundation for decision making.
Benefits of Data Warehouse:
- Business trends को समझें और better forecasting decisions लें।
- Data Warehouses को बड़ी मात्रा में data का perform करने के लिए design किया गया है।
- Data warehouses की structure end-users को navigate करने, understand, and query करने के लिए अधिक सुलभ है।
- कई normalized databases में जटिल होने वाली क्वेरीज़ data warehouses में build and maintain रखने में आसान हो सकती हैं।
- बहुत सारे users से बहुत सारी information की मांग को manage करने के लिए Data warehousing एक प्रभावी तरीका है।
- Data warehousing historical data की एक बड़ी मात्रा का analyze करने की capability provide करता है।
Need for Data Warehouse:
1) Business User: Business Users को past से summarized data देखने के लिए Data warehouse की आवश्यकता होती है। चूंकि ये लोग non-technical हैं, इसलिए Data को elementary form में present किया जा सकता है।
2) Store historical data: Data Warehouse को past से समय variable data store करने के लिए आवश्यक है। इस input का use various purposes के लिए किया जाता है।
3) Make strategic decisions: data warehouse में data के आधार पर कुछ strategies हो सकती हैं। इसलिए, strategic decisions लेने में data warehouse का योगदान है।
4) For data consistency and quality: different sources से data को एक आम जगह पर लाना, users data में uniformity and consistency लाने के लिए प्रभावी रूप से work कर सकता है।
5) High response time: Data warehouse को कुछ unexpected loads और प्रकार के queries के लिए ready रहना होगा, जो एक significant degree flexibility और quick response time की मांग करता है।