Σε αυτό το αναλυτικό άρθρο, θα επικεντρωθούμε στη διαδικασία βήμα προς βήμα για εξαγωγή κειμένου από το PowerPoint χρησιμοποιώντας Java και πώς να μετατρέψετε αυτές τις οδηγίες στην ανάπτυξη της εφαρμογής για εξαγωγή κειμένου από το PPTX σε Java. Επιπλέον, θα χρησιμοποιήσουμε μερικές απλές κλήσεις API της βιβλιοθήκης εξαγωγής δεδομένων εγγράφων για την εξαγωγή του κειμένου από έγγραφα. Ακολουθούν τα βασικά βήματα καθώς και ένα δείγμα κώδικα για την εξαγωγή κειμένου από το PowerPoint σε Java.
Βήματα για την εξαγωγή κειμένου από το PowerPoint χρησιμοποιώντας Java
- Ρύθμιση του GroupDocs.Parser for Java από το αποθετήριο Maven στο έργο Java για εξαγωγή κειμένου από το έγγραφο του PowerPoint
- Εισαγάγετε βασικές τάξεις για την ανάπτυξη της λειτουργικότητας για την εξαγωγή κειμένου από ένα αρχείο PowerPoint
- Δημιουργήστε μια παρουσία της κλάσης Parser για τη φόρτωση του εγγράφου εισόδου του PowerPoint για εξαγωγή κειμένου από αυτό
- Καλέστε τη μέθοδο getText για να αποκτήσετε το αντικείμενο TextReader
- Τέλος, διαβάστε το κείμενο από τον αναγνώστη και εκτυπώστε το
Έχουμε παραθέσει όλα τα σημεία που είναι απαραίτητα για τη δημιουργία του εξαγωγή κειμένου από το PPT χρησιμοποιώντας Java. Αυτά τα βήματα είναι απλά για τη λήψη του κειμένου από το αρχείο PowerPoint και μπορούν να χρησιμοποιηθούν σε οποιοδήποτε κοινό λειτουργικό σύστημα όπως τα Windows, το Linux και το macOS. Επιπλέον, αυτές οι οδηγίες δεν απαιτούν τη ρύθμιση πρόσθετου λογισμικού για την υλοποίηση της λειτουργικότητας.
Κώδικας για εξαγωγή κειμένου από το PowerPoint χρησιμοποιώντας Java
Στο προηγούμενο απόσπασμα κώδικα, έχουμε αναπτύξει την εφαρμογή get Text from PowerPoint Java για να δείξουμε την υλοποίηση της δυνατότητας. Για να εξαγάγετε κείμενο από το αρχείο PPT, πρέπει να ρυθμίσετε την απαιτούμενη βιβλιοθήκη και, στη συνέχεια, να συμπεριλάβετε τις απαραίτητες κλάσεις. Μετά από αυτό, φορτώστε το αρχείο εισόδου PPTX αρχικοποιώντας την κλάση Parser και χρησιμοποιήστε τη μέθοδο getText για να αποκτήσετε τη συλλογή TextReader. Στο τέλος, πρέπει να εκτυπώσετε το κείμενο διαβάζοντας το κείμενο από τον αναγνώστη.
Συζητήσαμε τη λεπτομερή διαδικασία για την ανάπτυξη της δυνατότητας Java get Text from PowerPoint και δημιουργήσαμε ένα δείγμα κώδικα για αυτό. Πρόσφατα, δημοσιεύσαμε ένα άρθρο σχετικά με την εξαγωγή κειμένου από HTML χρησιμοποιώντας Java, ρίξτε μια ματιά στον οδηγό πώς να εξάγετε κείμενο από HTML σε Java για περισσότερες πληροφορίες.