Ανάγνωση αρχείων .doc μέσα από την κονσόλα

Σπάνια χρειάζομαι το OpenOffice μιας και δεν ασχολούμαι με κάτι που να απαιτεί τη χρήση του. Τα τελευταία χρόνια απλά το αφήνω να υπάρχει, αφού έρχεται με τη διανομή μου.

Παλιότερα όμως, ιδιαίτερα την εποχή που πειραματιζόμουν με μικροσκοπικές, custom δημιουργίες διανομών, δεν το εγκαθιστούσα καθόλου. Αργότερα, όταν πέρασα στις έτοιμες διανομές, ο χρόνος εκκίνησής του ήταν απελπιστικά μεγάλος, στα τότε μηχανήματά μου και προτιμούσα να μην το ανοίξω καλύτερα.

Που και που όμως, έπεφτε στα χέρια μου κάποιο αρχείο που ήθελα να δω, συνήθως με τη μορφή M$ Word doc. Για αρκετό καιρό χρησιμοποιούσα την εντολή catdoc, μαζί με το όνομα του αρχείου και το διάβαζα στην κονσόλα. Φυσικά χωρίς καμμιά μορφοποίηση. Κάποια στιγμή όμως πέτυχα ένα tip (με κάθε επιφύλαξη, νομίζω ήταν σε βιβλίο του Jono Bacon, αλλά έχει περάσει καιρός και δεν είμαι σίγουρη) και από τότε έχω ένα script γι αυτή τη δουλειά.

Για να δούμε λοιπόν ένα αρχείο .doc στην κονσόλα, που να διατηρεί όμως κάποια στοιχειώδη μορφοποίηση και να δουλεύουν τα τυχόν links που περιέχει, χρειάζομαστε τα προγραμματάκια wv και w3m, καθώς και ένα script που θα αυτοματοποιεί τη χρήση τους. Το πρώτο είναι ένα σετ εργαλείων που μας επιτρέπει να διαβάζουμε m$ word αρχεία και το δεύτερο είναι ένας text-based browser.

Ανοίγουμε έναν editor και κάνουμε επικόλληση το παρακάτω:

#!/bin/bash
wvWare -x /usr/lib/wv/wvHtml.xml $1 2>/dev/null | w3m -T text/html

Σώζουμε σαν viewdoc, κάνουμε το script εκτελέσιμο και το μεταφέρουμε σε φάκελο στο path μας:

chmod +x viewdoc
sudo cp viewdoc /usr/local/bin

Για να δούμε τώρα το αρχείο super.doc στην κονσόλα, αρκεί να δώσουμε την εντολή:

viewdoc super.doc

Αν στο αρχείο υπάρχει link και το επιλέξουμε, τότε αναλαμβάνει ο w3m και μας μεταφέρει στο δικτυακό τόπο, χωρίς να φύγουμε από την κονσόλα.

Ποιός ο λόγος για τα παραπάνω; Γιατί απλά γίνονται, γιατί χρειάζομαι μόνο ένα script 2 γραμμών που το έχω ήδη έτοιμο και γιατί το σερφάρισμα μέσα από τον w3m και την κονσόλα, έχει κάτι από μια άλλη εποχή.

Advertisements

5 thoughts on “Ανάγνωση αρχείων .doc μέσα από την κονσόλα

  1. Όλες οι ιστοσελίδες σήμερα χρησιμοποιούν CSS και έτσι το σερφάρισμα από την κονσόλα είναι περίπου αδύνατον, δυστυχώς, τίποτε δεν εμφανίζεται σωστά…

    Όσο για τα .doc αρχεία, αν κάποιος μου στείλει ένα θα διαμαρτυρηθώ στον βαθμό που έχω την δυνατότητα. Όχι, δεν νομίζω ότι η αντίδραση αυτή είναι σχολαστική ή φανατική. Η χρήση ανοιχτού ή κλειστού λογισμικού είναι επιλογή του καθενός αλλά η χρήση ανοιχτών προτύπων (μορφών αρχείων) θα έπρεπε να είναι υποχρεωτική για όλους.

  2. Πρέπει να ομολογήσω ότι το theme του window manager σου είναι εντυπωσιακό. Νομίζω ότι είναι KDE με κάποιο theme, σωστά; Θα μπορούσες να μας δώσεις τις σχετικές πληροφορίες;

  3. Σ ευχαριστώ Σοφία. 🙂
    Λοιπόν είναι Gnome με θέμα το Elegant Brit. Σχετικές πληροφορίες και links για downloads των επί μέρους συστατικών του, έχω εδώ. Επειδή όμως φαντάζομαι σε ενδιαφέρει για KDE, έκανα μια μικρή έρευνα και το μόνο που υπάρχει αυτή τη στιγμή είναι πρόταση για μετατροπή. Ίσως με κάποιες τρίπλες να μπορείς να το χρησιμοποιήσεις. Δες εδώ σχετικά.

    Να αναφέρω επίσης (μπορεί να βοηθάει) ότι το εικονίδια είναι εμπνευσμένα από το θέμα areao4.2 της *heylove από το deviantart. Παίρνοντας αυτά, συν ότι υπάρχει στα links του σχετικού θέματος, ίσως το φέρεις στα μέτρα σου, έστω και με το χέρι.

  4. πως μπορω να μετατρεψω ενα κειμενο xml (για την ακριβεια θελω να μετατρεψω το ιστορικο συνομιλιων στο msn ) σε κειμενο του word (doc). πολυ θα εκτιμουσα την οποια βοηθεια …ευχαριστω εκ των προτερων

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση / Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση / Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση / Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση / Αλλαγή )

Σύνδεση με %s