इस कैसे-कैसे मार्गदर्शिका में, हम जावा में Word दस्तावेज़ से **निकालने Text की चरण-दर-चरण प्रक्रिया पर चर्चा करेंगे। इसके अलावा, आप सीखेंगे कि मावेन रिपॉजिटरी से आवश्यक लाइब्रेरी कैसे सेट करें और इस मैनुअल का उपयोग कैसे करें ताकि जावा का उपयोग करके ** DOCX से टेक्स्ट निकालने की कार्यक्षमता बनाई जा सके। नमूना कोड स्निपेट के साथ दस्तावेज़ों से टेक्स्ट निकालने के मुख्य बिंदु यहां दिए गए हैं।
जावा में वर्ड डॉक्यूमेंट से टेक्स्ट निकालने के चरण
- Word दस्तावेज़ से टेक्स्ट निकालने के लिए जावा प्रोजेक्ट में मावेन रिपॉजिटरी से GroupDocs.Parser for Java इंस्टॉल करें
- किसी Word फ़ाइल से पाठ निकालने के लिए कार्यक्षमता विकसित करने के लिए आवश्यक कक्षाएं आयात करें
- इनपुट वर्ड दस्तावेज़ लोड करने के लिए Parser क्लास को इंस्टेंट करें ताकि उसमें से टेक्स्ट निकाला जा सके
- पार्सर वर्ग की getText विधि को लागू करें और TextReader ऑब्जेक्ट प्राप्त करें
- अंत में, पाठक का पाठ पढ़ें
हमने उन सभी बिंदुओं को सूचीबद्ध किया है जो जावा एप्लिकेशन में *वर्ड डॉक्यूमेंट से *रीड टेक्स्ट बनाने के लिए आवश्यक हैं। विंडोज, मैकओएस और लिनक्स सहित किसी भी सामान्य ऑपरेटिंग सिस्टम में इन चरणों का पालन करना बहुत सरल है। इसके अलावा, आप किसी भी अतिरिक्त सॉफ़्टवेयर को स्थापित किए बिना दस्तावेज़ों से टेक्स्ट निकालने के लिए आसानी से एपीआई का उपभोग कर सकते हैं।
जावा में वर्ड डॉक्यूमेंट से टेक्स्ट निकालने के लिए कोड
उपरोक्त कोड स्निपेट Word क्षमता से जावा टेक्स्ट एक्सट्रैक्टर के कार्यान्वयन को दर्शाता है। जैसा कि आप देख सकते हैं कि पुस्तकालय की स्थापना और आवश्यक वर्ग को आयात करने के बाद पार्सिंग के लिए इनपुट DOCX दस्तावेज़ को लोड करने के लिए पार्सर वर्ग का उपयोग किया जाता है। उसके बाद, हमने टेक्स्ट रीडर ऑब्जेक्ट प्राप्त करने के लिए गेटटेक्स्ट विधि का उपभोग किया है और फिर पाठक से टेक्स्ट पढ़ा है।
हमने जावा का उपयोग करके वर्ड डॉक्यूमेंट से टेक्स्ट निकालने की विस्तृत प्रक्रिया पर चर्चा की है और इसके लिए एक नमूना कोड तैयार किया है। हाल ही में, हमने जावा में Word दस्तावेज़ से चित्र निकालने पर एक लेख प्रकाशित किया है, अधिक जानकारी के लिए जावा का उपयोग करके Word दस्तावेज़ से छवियाँ कैसे निकालें मार्गदर्शिका देखें।