layout | title | permalink | order |
---|---|---|---|
page |
१८. शब्दावली |
/शब्दावली/ |
18 |
लिङ्क डाटा वर्णन गर्नका लागि प्रयोग गरिन्छ । यो आफैमा एउटा डाटाको ढाँचा भने हैन, यसलाई एक्सएमल ढाँचाको प्रयोग गरेर व्यक्त गर्न सकिन्छ ।
इन्टरनेट, कम्प्युटर विद्युतीय प्रविधि अन्तर्गत विकास भएको एक बिश्वब्यापी सञ्जाल वा कम्प्युटरहरूको समूह हो जसमा संसार भरिका कम्प्युटर र सो सँग सम्बन्धित उपकरणहरू एक अर्कासँग सम्पर्कमा रही सूचनाहरू आदान प्रदान गर्न सक्छन् ।
एक्स्टेन्सिबल मार्कअप ल्यानयेज, संरचित डाटा प्रतिनिधित्व को लागि एक सरल र शक्तिशाली मानक हो ।
एक्सएलएस स्वामित्व स्प्रिेडसिट ढाँचा हो, यो लोकप्रिय माईक्रोसफ्ट एक्सेल स्प्रेडशीट प्याकेज फाइलको मूल स्वरूप हो । जबकि हाल XML आधारित .xlsx भेद प्रयोग र पुरानो संस्करण, .xls फाइलहरू प्रयोग गरिन्छ ।
डाटा प्रयोग वा पुन: प्रकाशन गर्दा स्रोत खुलाउन एट्रिब्युसन दिईन्छ । डाटा अनुमतिमा डाटा लाइसेन्स प्रयोग गर्ने स्रोत खुलाउनुपर्ने आवश्यकता हुन सक्छ ।
एप भन्नाले विशेषगरी वेब, मोबाइल फोन अथवा त्यस्तै प्लाटफर्ममा चलाउन डिजाइन गरिएको एउटा सफ्टवेयर हो । एप्सको सहायताबाट ठूलो डाटाबेसहरूसँग सजिलै कनेक्ट गर्न सकिन्छ र एप्स खुल्ला डाटा खपत गर्ने एक शक्तिशाली तरिका पनि हो । खुल्ला डाटा प्रत्यक्ष, व्यक्तिगत र स्थान विशेष (जीआइएस) को हुन सक्दछ ।
एप्लिकेसन प्रोगामिङ् इन्टरफेस सामान्यतया प्रोगाम वा एप्सहरूबाट सीधा डाटा पढ्नको लागि डाटा प्रकाशकद्वारा प्रदान गरेको एक तरिका हो । यसले सम्पूर्ण डाटाहरू डाउनलोड नगरी डाटाका केहि भाग मात्र वितरण गर्न पनि सहायता गर्छ ।
डेटाबेसलाई धेरै प्रकारका प्रश्न सोध्नका लागि धेरै प्रयोग गरिने एक भाषा हो ।
किहोल मार्कअप भाषा (KML) एक्सएमल (XML) मा आधारित भू-डाटा को लागि प्रयोग गरिने खुल्ला ढाँचाको एक रुप हो ।
यथेस्ट वा धेरै मात्रामा डाटा सङ्कलन गर्ने कार्यलाई स्वयंसेवकहरूले सहजै गर्न सक्ने खालका स-साना कार्यहरूमा बिभाजन गर्नु नै क्राउडसोर्सिङ हो । उदाहरणको लागि एक क्राउडसोर्सड विश्वकोश विकिपेडिया, र विज्ञान सम्बन्धी डाटाको लागि ग्यालेक्सी जू, जसमा गैर-विशेषज्ञ स्वयंसेवकहरूलाई तारापुञ्जको देखावटका आधारमा वर्गीकरण गर्न लगाएर वैज्ञानिक डाटा क्राउडसोर्सिङ गरिएको थियो ।
यो सन् २००१ मा स्थापित एक गैर नाफामुखी संगठन हो, जसले धेरै स्तरिय लाइसेन्सहरू प्रकाशित गरेर सामग्रीको पुन: उपयोग लाई बढावा दिन्छ । केहि लाइसेन्सहरू खुल्ला हुन्छन् र केहिमा गैर-व्यावसायिक दफा समावेश गरिएको हुन्छ, जसले गर्दा सृजनात्मक सामग्री पुन: प्रयोगको लागि तिनीहरूको स्पष्ट व्याख्या र अर्थका साथ जारी गर्न सकिन्छ ।
खुल्ला आन्दोलनले धेरै पारदर्शिता, सहयोग, पुन: प्रयोग, निःशुल्क पहुँच र संसारको सबैभन्दा अहम समस्याको समाधान तिर काम गर्न खोज्दछ । यसमा खुल्ला डाटा, खुल्ला सरकार, खुल्ला विकास र खुल्ला विज्ञान धेरै शामिल हुन्छ ।
यदि डाटामा खुल्ला पहुँच, प्रयोग परिमार्जन गर्न र जोकोहीले कुनै पनि उद्देश्यका लागि वितरण गर्न मिल्छ भने त्यस्ता डाटालाई खुल्ला डाटा भनिन्छ ।
प्रयोगमा कुनै प्रतिबन्ध नभई कम से कम खुल्ला स्रोत सफ्टवेयर उपकरण संग प्रक्रिया गर्न मिल्ने ढाँचा खुल्ला ढाँचा हो ।
खुल्ला विज्ञानको अभ्यास खुल्ला सिद्धान्त अनुसार गरिन्छ जसमा खोजहरूको परिणामको पत्रिका सबैमा पहुँच हुनेगरी नि:शुल्क प्रकाशन तथा सोर्स कोडको सबैको सहकार्यमा नि:शुल्क उपलब्धता र खुल्ला सफ्टवेयेर डाटा उपकरणहरूको विकाश तथा प्रयोग पर्दछन् ।
साधारणतया प्राविधिक मानक भन्नाले लाइसेन्स प्रतिबन्ध बुझ्ने गरिन्छ । खुल्ला मानक विक्रेता-तटस्थ विकासका आधारमा पनि मानक व्याख्या गरिन्छ ।
सफ्टवेयेरहरू जसको सोर्स कोड खुल्ला लाइसेन्स अन्तर्गत उपलब्ध गराइएको हुन्छ । सफ्टवेयेर नि:शुल्क उपलब्ध हुन्छ र साथ साथै बिषय अनुरुप प्राविधिक सीप भएकाहरूले सोर्स कोड बुझ्न, यसलाई परिमार्जन गरि कोड को आफ्नै संस्करण चलाउन, आफुलाई मन लागेका विशेषताहरू थप्न र त्रुटीहरू हटाउन सक्छन् ।
खुल्ला सरकार भन्नाले पारदर्शी, जवाफदेही र नागरिकको उत्तरदायी पक्षमा खुल्ला आन्दोलन गरि काम गर्नुलाई बुझिन्छ ।
लाइसेन्सको एक प्रतिबन्धित भाग जसमा सामग्री खुल्ला 'व्यावसायिक' उद्देश्यका लागि पुन: प्रयोग गर्न सकिदैन भनेर खुलाइएको हुन्छ । खुल्ला परिभाषा अनुसार यस्तो सामग्री वा डेटा विषय गैर-व्यावसायिक प्रतिबन्ध अनुसार खुल्ला छैन ।
आफ्नो निजी जीवनको व्यक्तिगत जानकारी सार्वजनिक गर्न जरुरी छैन र यो कुरा हरेक व्यक्तिको व्यक्तिगत अधिकारमा समावेश छ । गोपनीयता मानव अधिकार घोषणापत्र र युरोपेली कन्वेंशन मानव अधिकारद्वारा मान्यता प्राप्त छ ।
कुनै पनि कम्प्युटर प्रणाली, जसले भौगोलिक सूचना पढ्न, प्रदर्शन, विश्लेषण र भौगोलिक डाटा परिमार्जन गर्न सक्छ ।
ग्लोबल स्थिति प्रणाली, एक उपग्रह आधारित प्रणाली हो, जसले कुनै पनि उपयुक्त रिसीभर उपकरण (आधुनिक स्मार्टफोन लगायत) उपयोगले सही स्थानको जानकारी गराउछ । जीपीएस स्थान आधारित धेरै एप्समा उपयोगी भएको छ, जस्तै मार्ग-फेला पार्न वा आफ्नो वर्तमान स्थान आधारित मौसम पूर्वानुमान जानकारी पाउन ।
यो JSON जस्तै हो, तर यसमा भू-डाटालाई बर्णन गर्न अन्य विशेषताहरू थप गरिएको हुन्छन् । यसैले यो भू-डाटा साटासाटको लागि एक लोकप्रिय ढाँचा हो ।
जेसन (जाभास्क्रिप्ट आब्जेक्ट नोटेसन) साधारण तर धेरै प्रभावकारी डाटाको ढाँचा हो । यसले जटिल डाटा संरचनाको वर्णन गर्नुका साथै उच्च रूपमा मिसिन पठनीय र स्वतन्त्र रूपमा प्रोग्रमिंग भाषामा प्रयोग गर्न सकिन्छ ।
TSV डाटा साझेदारी गर्न पाठ फाइल ढाँचाको एक साधारण रुप हो । यो ढाँचा अत्यन्तै सरल र अत्यधिक मिसिन पठनीय हुन्छ ।
डाटा सन्दर्भ वा विश्लेषणका लागि संकलित तथ्य र तथ्याङ्कहरू हुन् । धेरैजसो डाटाले स्प्रेडसिटहरु वा डेटाबेसमा धेरै टेबलहरूमा संख्यात्मक जानकारी राख्ने क्रमबद्घ संग्रह बुझाउछ ।
डाटाका लगभग सबै रोचक प्रयोगहरूमा विभिन्न स्रोतका डाटा एकिकृत गर्नुपर्ने हुन्छ । यसो गर्नलाई विभिन्न डेटासेटहरू मिल्नेखालका छन्न भनेर सुनिश्चित गर्न आवश्यक छ र तिनीहरूले एउटै अब्जेक्टको नाम, एकै इकाई वा निर्देशांक प्रयोग गर्नुपर्छ ।
यदि व्यक्तिगत डाटा अपूर्ण तरिकाले अज्ञातिकरण गरिएको छ भने, यसका टुक्राहरूलाई जोड्दै (अन्य स्रोतबाट उपलब्ध डाटा) व्यक्तिगत पहिचान खुल्ने डाटा बनाउन सक्ने सम्भावना रहन जान्छ । यस्तो प्रकाशित नहुनुपर्ने व्यक्तिगत डाटालाई अज्ञातिकरण गरिएको डाटाबाट भएको चुहावट मान्न सकिन्छ ।
डाटाको पत्रकारिता गर्नु नै डाटा पत्रकारिता हो । डाटा पत्रकारितामा अनुसन्धान, राम्रो डाटामा आधारित कथा बनाई बताउने, डाटा सफाई गर्ने, डाटा बुझ्न कथा बनाउने, अन्वेषण गर्ने र डाटालाई चित्र बनाई देखाउने खालका सान्दर्भिक सीप आवश्यक हुन्छन् ।
डाटा पोर्टल डाटा प्रकाशनका लागि वेब प्लाटफर्म हो । डाटा पोर्टलको उद्देश्य डाटा सूची प्रदान गर्नु र प्रयोगकर्तालाई डाटा उपलब्ध मात्र नगराई डाटा पत्ता लगाउन समेत सजिलो बनाउनु हो । डाटा पोर्टलले डाटा प्रकाशन गर्ने संस्थालाई सुविधाजनक प्रकाशन कार्यप्रवाह प्रदान गर्दै डाटा प्रकाशन, खोज, डाटा पूर्वावलोकन, स्वचालित डाटा प्रकासन लगायतका सुबिधाका लागि वेब तथा मेसिन इन्टरफेस प्रदान गर्दछ ।
डाटालाई स्वचालित वा अर्ध-स्वचालित उपकरणमा उपयोगी हुने रुपमा परिवर्तन गर्ने व्यक्तिलाई डाटा र्याङ्गलर भनिन्छ । डाटा र्याङ्गलिङ्गमा डाटा सफाई पनि समावेश हुन सक्छ ।
डाटाको सङ्कलन, संग्रह, संरक्षण र उपयोग देखि यसको सम्पूर्ण जीवन चक्र मार्फत डाटा ह्यान्डल गर्न प्रयोग हुने नीतिहरू, प्रक्रिया, र प्राविधिक विकल्प नै डाटा व्यवस्थापन हो । डाटा व्यवस्थापन नीतिले डाटाको गुणस्तर, उपलब्धता, सुरक्षा, संरक्षण, आदिको ख्याल राख्नुपर्छ ।
डेटासेट विभिन्न तरिकाको डाटा सङ्कलन प्रणाली द्वारा बनाईएको हुन्छ जस्तै मार्गदर्शन वा स्वचालित माप (जस्तै मौसम डाटा), सर्वेक्षण (जनगणना डाटा), निर्णय (बजेट डाटा) वा निरन्तर लेनदेन (खर्च डाटा) को रेकर्ड देखि, धेरै रेकर्ड एकत्रीकरण (अपराध डाटा) , गणितीय मोडेलिंग (जनसंख्या अनुमानहरू), आदि ।
उपभोग गर्न सजिलो बनाउन डेटासेटको प्रशोधन गर्ने काम डाटा सफाई हो । यसमा त्रुटिहरू सच्याउने, डाटामा एकरुपता ल्याउने, फरम्याटिङ जस्ता मिसिन अपठनिय तत्त्वहरू हटाउने, पङ्क्ति र स्तम्भ शीर्षकहरूका लागि मानक लेबल प्रयोग गर्ने, संख्या, मिति, र अन्य मात्राको उचित प्रतिनिधित्व सुनिस्चित गर्ने, उपयुक्त फाईल फर्म्याटमा रुपान्तरण गर्ने, प्रयोग भइरहेको अर्को डाटासेटसँग लेबल मिलाउने, इत्यादी पर्न सक्छन् ।
डाटा गुणस्तर डाटाको उपयोगिता मापन गर्ने एक उपाय हो । एक आदर्श डेटासेट सही, पूर्ण, प्रकाशन समयानुकूल, राम्रो सँग बस्तुहरूको नामाकरण र ह्यान्डलिङ्ग गरिएको वा सीधा मिसिन पठनीय डाटा, नोमेनक्लेचर स्तर अनुरुपको र प्रयोगकर्ताले सजिलै बुझ्न सक्ने गरि पर्याप्त मेटाडाटा संग प्रकाशित गरिएको जस्तै कसले प्रकासित गरेको हो र डेटासेटमा भेरियेबलको अर्थ मिल्ने हुनुपर्दछ ।
डेटासेट कुनै पनि डाटाको संगठित संग्रह हो । डेटासेटले डेटाबेस, स्प्रेडसिट वा अन्य डाटा फाइलको संग्रहलाई पनि जनाउँछ ।
नागरिक तथा सामाजिक समस्याहरू सम्बोधन गर्न सामान्यता अनलाइन उपकरण र समुदायहरूको निर्माण गरिनु पर्दछ । उदाहरणको रुपमा उपकरणहरू जसको मद्दतबाट प्रयोगकर्ताहरूले आफ्नो जस्तै सोच र चासो भएको स्थानीय मान्छे सँग भेट गर्न, आफ्नो स्थानीय परिषद्को बिग्रिएको पूर्वाधारको रिपोर्ट गर्न र सबै मिलेर आफ्नो छरछिमेक बाट फोहोर, दुर्गन्ध हटाउन सक्छन् । स्थानीय स्तरको खुल्ला डाटा नागरिक ह्याकिङ परियोजनाका लागि विशेष उपयोगी छ ।
यदि सम्भावित प्रयोगकर्ताले डाटा पत्ता लगाउन सक्दैन र डाटा अवस्थित छ छैन भन्ने कुरा पनि थाहा छैन भने खुल्ला डाटा प्रकाशित हुनु मात्र पर्याप्त हुदैन । अनियमित तरिकाले डाटा प्रकाशित गर्नु भन्दा सरकारको र अन्य ठूलो डाटा प्रकाशकले डाटा पोर्टलमा डेटासेट राखी प्रयोगकर्ता लाई पत्ता लगाउन दिएर मद्दत गर्न सक्छन् ।
सरकारले र अन्य संगठनहरू आफ्नो कार्य र निर्णय बनाउने प्रक्रिया पारदर्शी हुनुपर्छ भन्ने मान्यता छ । पारदर्शिता खुल्ला सरकारको एउटा पक्ष हो । पारदर्शिताको उल्लेख्य वृद्धिले खुल्ला डाटामा लाभ पुग्दछ ।
पीडिएफ (पोटेबल डकुमेन्ट फर्माट) मूलत एडोब सिस्टमको स्वामित्व रहेको फाइल ढाँचा हो । पीडिएफ फाइलका डाटाहरू मिसिन पठनीय हुदैनन् ।
पुन: प्रयोग डाटालाई एकचोटी संकलन गरेर प्रसोधन गरिसकेपछि भिन्न उद्देश्यको लागि अनगिन्ति चोटी प्रयोग गर्न सकिन्छ ।
प्रतिलिपि अधिकार भन्नाले बौद्धिक सम्पत्ति (जस्तै पुस्तक) को निर्माता स्वामित्वको कानुनी अधिकार हो । जबकि व्यक्तिगत डाटा (तथ्य) मा प्रतिलिपि अधिकार हुन सक्दैन तर एउटा डेटाबेस भित्रको डाटाको चयन र व्यवस्था लाई सुरक्षा प्रतिलिपि अधिकारद्वारा कभर गर्न सकिन्छ । एक प्रतिलिपि अधिकार प्राप्त व्यक्तिले आफ्नो संरक्षित सामाग्रीमा सम्बन्धित लाइसेन्सहरूको प्रयोग गरेर अन्यले पनि प्रयोग गर्न सकोस भनेर इजाजतपत्रको रुपमा अधिकार प्रदान गर्न सक्छन् ।
प्राथमिक डाटा भन्नाले मूल डाटा जुन प्रशोधन नगरिएको मुख्य श्रोतबाट आएको हुन्छ । त्यसलाई प्रशोधन गरि दृश्य, प्रकाशित अनुसन्धान वा व्याख्या आदिको लागि प्रयोग गर्न सकिन्छ ।
फाइलले कम्प्युटर डिस्कमा कसरी विवरण बस्छ त्यसलाई जनाउछ । फाइल ढांचा धेरै जसो फाइलको नामको अन्तिमा जोडिएको भागले जनाउछ । उदहारणको लागि ‘data.csv’ मा data फाइल नाम हो र अन्तिमा .csv फाइल ढांचा हो ।
यदि कुनै एउटा व्यक्तिले सबै डाटासेटहरू आफ्नो मेसिनमा सजिलै र सुलभ ढंगले एकमुष्ठ रुपमा डाउनलोड गर्न सक्छ भने हामी भन्न सक्छौ कि डाटा बल्कमा उपलब्ध छ । डाटाको सानो सानो भाग मात्र डाउनलोड गर्न मिल्छ भने हामी त्यसलाई बल्क भन्दैनौँ, उदाहरणको लागि तपाईं एक समयमा डाटाको केही भाग डाउनलोड गर्नबाट प्रतिबन्धित हुनुभएको छ र सम्पूर्ण डेटासेट प्राप्त गर्नको लागि हजारौं वा लाखौं अनुरोध आवश्यक पर्दछ । बल्कमा डाटाको उपलब्धताको प्रावधान खुल्ला डाटाको आवश्यकता हो ।
बिटटोरेन्ट ठूला फाइल तथा डाटा साटासाट गरिरहेका कम्पूटरहरू बीचको ब्यान्डविथ बिभाजन गर्ने एउटा प्रोटोकल हो । बिट टोरेन्टको माध्यमबाट कुनै एक निश्चित स्रोतबाट नभई विभिन्न साथीहरूमाझ एक अर्काकोबाट फाइल तथा डाटा डाउनलोड गर्न सकिन्छ ।
ब्यान्डविथ भनेको कम्प्युटरहरू बीच डाटा साटासाट गर्ने दर हो । सिमित ब्यान्डविथको कारणले गर्दा एप्सहरूले एक प्रयोगकर्ताको अनुरोध पूरा गर्न आवश्यक न्यूनतम डाटा मात्र डाउनलोड गर्ने लक्ष्य राख्दछन् ।
कुनै पनि डेटासेट जसमा स्थानको डाटा जस्तै अक्षांश र देशान्तर वा अन्य निर्धारित इन्कोडिङ हुन्छ । भौगोलिक डाटामा नक्सा, परिवहन मार्गहरू, पर्यावरण डाटा, र अन्य थुप्रै प्रकारका भौगोलिक डाटाहरू समावेश गरेर प्रकाशित गर्न सकिन्छ ।
भ्रष्टाचार भन्नाले सार्वजनिक पद वा रकमको दुरुपयोग हो । उदाहरणको लागि पैसा गायब बनाउनु, घूस लिनु, अव्यावहारिक खर्चको दावी गर्नु, सार्वजनिक सेवाहरू तथा नियुक्तिमा साथीभाई अथवा इष्टमित्रको समर्थन गर्नु, इत्यादि । खुल्ला डाटा साथसाथै खुल्ला सरकार भ्रष्टाचार विरुद्धको लडाईका लागि एक महत्वपूर्ण उपकरण हो ।
डाटाको ढाँचा जुन मानवद्वारा सजिलै पढ्न सकिन्छ जस्तै पीडिएफ (PDF) मानव द्वारा पढ्न सकिन्छ तर संरचित डाटा नभएकाले मिसिन पठनीय हुदैनन् ।
डाटाको ढाँचा जुन कम्प्युटरमा स्वचालित रूपमा पढ्न र प्रशोधन गर्न सकिन्छ जस्तै सीएसभी (CSV), जेसन (JSON), एक्सएमएल (XML) आदि ।
मेटाडाटा भन्नाले डेटासेटको शीर्षक र वर्णन, संग्रह, लेखक वा प्रकाशक, क्षेत्र र समय अवधि, लाइसेन्स, जारी र मिति, आदि जस्ता सूचना हुन् ।
युनिफम रिसोर्स आइडेण्टिफायर र युनिफम रिसोर्स लोकेटर (URL) http://.. वेब साइटको वेब ठेगाना वा श्रोत हो । केही वस्तुको लागि परिचायक रूपमा लिङ्क डाटा उपयोग हुँदा एउटा युनिफम रिसोर्स लोकेटरको (URL) प्रयोग गरिन्छ ।
एक कानुनी साधन जसको मद्दतबाट कुनै निकाय वा व्यक्तिले आफ्नो संरक्षित काममा प्रतिलिपि अधिकार राख्न सक्छ । यदि डाटामा खुल्ला परिभाषा अनुरूप एउटा स्पष्ट लागू लाइसेन्स गरिएको छ भने डाटा र सामग्री खुल्ला हुन्छ ।
डाटा (जस्तै एउटा नेटवर्कमा रेलको हालको स्थान) जो निरन्तर अद्यावधिक भइरहेको छ जहाँ क्वेरि डाटाको नयाँ संस्करणको विरुद्धमा हुन आवश्यक छ ।
यो बैठक र सम्मेलन जस्तै हुन्छ तर यसको कुनै अग्रिम एजेन्डाहरू तय गरिएको हुदैन । सहभागीहरूले विभिन्न स्थापित प्रविधी प्रयोगमा ल्याई संयुक्त रूपमा के बिषयमा छलफल गर्ने हो, त्यसै दिन निर्धारण गर्छन । परम्परागत सम्मेलन सत्रमा केही थप वक्तालाई निमन्त्रण गरिएको हुन सक्छ ।
सरकार डाटामा भारी मात्रामा आर्थिक डाटा, डेमोग्राफिक डाटा, खर्च डाटा, अपराध डाटा, परिवहन डाटा, आदि गोप्य बाहेकको डाटा सङ्कलन समावेश हुन्छ । यस्ता डाटालाई व्यापार, अनुसन्धान, नागरिक समाज, डाटा पत्रकारितामा खुल्ला गरि पुन: प्रगोगका लागि क्षमता वृद्धि गर्न सकिन्छ ।
बस्तु वा सामग्रीहरू जसमा कुनै पनि प्रकारको प्रयोगको लागि प्रतिलिपि अधिकार हुदैन त्यो सार्वजनिक डोमेन अन्तर्गत पर्दछ । सी सी जिरो एउटा सार्वजनिक डोमेनमा समर्पित छ जसले सबै अधिकार त्याग्न र सार्वजनिक डोमेनमा राख्न सम्भव बनाइ दिएको छ ।
सिएसभी यानिकी अल्पविराम विभाजित डाटा फाइलको एक ढाँचा हो । यसमा डाटा सादा र सरल रुपमा प्रस्तुत हुन्छन् जसमा प्रत्येक पंक्ति र प्रत्येक अल्पविरामले डाटा छुट्टाउँछ । यो धेरै सरल भएकाले खुल्ला ढाँचाको रूपमा उपयोग गर्न सजिलो छ र व्यापक खुल्ला डाटा प्रकाशन लागि प्रयोग गरिन्छ ।
सीक्यान ओपेन नलेजद्वारा निर्माण तथा कायम गरिएको डाटा पोर्टलहरू बनाउने एउटा खुल्ला रुपमा उपलब्ध सफ्टवेयर प्लाटफर्म हो । सीक्यान लगभग २० वटा देशका सरकारहरूले आफ्नो डाटा प्रकाशनको लागि अधिकारिक प्लाटफर्मको रुपमा उपयोग गर्दछन र त्यसका साथसाथै अन्य धेरै स्थानीय, समुदाय, वैज्ञानिक शक्तिहरू र अन्य डाटा पोर्टलहरूले पनि डाटा प्रकाशनको निमित्त प्रयोग गर्दछन ।
सूचना भन्नाले डाटाको एक संरचित संग्रह जुन मनिसले बुझ्न सक्ने रुपमा त्यसको जानकारी उपलब्ध हुनुपर्छ ।
वेबसाइट वा पीडीएफ कागजातबाट र मिसिन-पठनीय नभएको स्रोतबाट डाटा निकाल्दै मिसिन-पठनीय संरचित डाटा सिर्जना गर्नु स्क्रय्पिङ्ग गर्नु हो ।
स्प्रेडसिट भन्नाले डाटाको तालिका जुन विभिन्न विशेष प्रोग्राम जस्तो कि माईक्रोसफ्ट एक्सेल वा ओपनअफिस क्याल्कले क्रियात्मक रूपमा गणना गर्न सक्छ ।
सफ्टवेयर को कुनै एक अंश निर्माण गर्न प्रोग्रामर द्वारा लिखित कम्प्युटर कोडहरू स्रोत कोड हुन् । प्रयोगकर्ताको कम्प्युटरमा स्रोत कोड प्रयोग गर्दा सामान्यतया कम्पाइल गरिएको हुन्छ । त्यसैले प्रयोगकर्ता कहिल्यै त्यसको मूल स्रोत कोड खुल्ला रूपमा प्रकाशित नगरेसम्म देख्दैन ।
प्रकाशित कागजात र अनुसन्धान अन्य परिणाम, विशेष गरी सार्वजनिक-आर्थिक सहायता अनुसन्धान पहुँचको सिद्धान्तमा सबैलाई खुल्ला उपलब्ध हुनुपर्छ ।
स्वामित्व सफ्टवेयर कम्पनीको अधिनमा हुन्छ र यसको प्रयोगमा पनि कम्पनीले प्रतिबन्धित लगाएको हुन्छ ।स्वामित्व सफ्टवेयर प्रयोगकर्ताले सामान्यतया सफ्टवेयर प्रयोग गर्न पैसा तिर्नुपर्छ, स्रोत कोड परिमार्जन, सफ्टवेयर प्रतिलिपि बनाउन वा आफ्नै उत्पादनको रूपमा बेच्न मिल्दैन । कम्पनी स्वामित्वमा हुने र कम्पनीले नियन्त्रण गर्ने ढाँचालाई स्वामित्व फाइलको ढाँचा भनिन्छ जस्तै उदहारण को लागि एक्सएलएस र एक्सएलएस एक्स जुन माइक्रोसफ्ट को स्वामित्वमा हुन्छ ।
यो कार्यक्रम सामान्यतया एक वा दुई दिनको हुन्छ जसमा डेभेलोपर, विषय विशेषज्ञहरू र अन्य क्षत्रका व्यक्तिहरू मिलेर र डाटा को भारी मात्रामा प्रयोग गरेर एप्स, भीजुअलाइजेसन र प्रोटोटाइपहरूको निर्माण गर्दछन् जसले एक विशेष डोमेनको समस्या सम्बोधन गर्ने लक्ष्य लिएको हुन्छ ।