Deutsch
Quelltexte/ Codesnippets

DOCX Dateien auslesen

 

Sven
Bader
Für eine Volltextsuche habe ich diese Funktion geschrieben, mit Anpassungen funktioniert es auch mit XLSX, PPTX, ODT, ODP, ODS und PAGES. Man muss letztendlich die Datei entzippen und die korrekte XML darin identifizieren. Bei XLSX ist es etwas verzweigter.

Profan Kompatibilität:
Die Unzip funktioniert ab X4, davor muss man sich eine DLL dafür suchen
Utf8_Decode geht ab X3, davor kann man sich etwas mit Translate$() zusammenbauen, das zumindest häufige Zeichen wie Umlaute ersetzt.


Proc ReadDocx

    Parameters inputFile$
    Declare content$, filesize&, tempFile$, B#
    tempFile$ =  $TempDir + "docxopener" + "\\word\\document.xml"
    'Entpacken

    ifnot (FileExists(inputFile$))

        Print inputFile$;" nicht gefunden!"
        Return

    endif

    UnZip  inputFile$, ($TempDir + "docxopener") ,"word\document.xml"
    filesize& = FileSize(tempFile$)

    if (filesize& < 0)

        Print "Fehler beim Entpacken!"
        Return

    endif

    'Lesen
    Dim B#, filesize& + 1
    Assign #1, tempFile$
    OpenRW #1
    BlockRead(#1, B#, 0, filesize&)
    Erase #1
    Close #1
    content$ = String$(B#,0)
    'Schön machen
    content$ = Utf8Decode(content$)
    content$ = Translate$(content$,"<w:p","\n<w:p")'Paragraph Start DOCX
    content$ = Translate$(content$,":p>",":p>\n\n")'Paragraph Ende
    content$ = Translate$(content$,":tab/>",":tab/> ")'Tab
    content$ = Translate$(content$,":br/>",":br/>\n")'Break
    content$ = Translate$(content$,":line-break/>",":line-break/>\n")'Break
    content$ = Translate$(content$,"  "," ")
    Set("RegEx", 1)
    content$ = Translate$(content$,"<[^>]*>","")'Strip Tags
    Set("RegEx", 0)
    content$ = Trim$(content$)
    Return content$

EndProc

Cls
messagebox ReadDocx("test.docx") ,"",0
Waitinput
End

193 kB
Bezeichnung:Screenshot docx
Hochgeladen:11.07.2021
Ladeanzahl74
Herunterladen
11 kB
Bezeichnung:Quelltext und test.docx
Version:1.0
Hochgeladen:11.07.2021
Ladeanzahl61
Herunterladen
 
11.07.2021  
 



Zum Quelltext


Thementitel, max. 100 Zeichen.
 

Systemprofile:

Kein Systemprofil angelegt. [anlegen]

XProfan:

 Beitrag  Schrift  Smilies  ▼ 

Bitte anmelden um einen Beitrag zu verfassen.
 

Themenoptionen

1.527 Betrachtungen

Unbenanntvor 0 min.
Sven Bader22.12.2022
Torsten Boo09.06.2022
p.specht18.11.2021
RudiB.18.11.2021
Mehr...

Themeninformationen

Dieses Thema hat 1 Teilnehmer:

Sven Bader (1x)


Admins  |  AGB  |  Anwendungen  |  Autoren  |  Chat  |  Datenschutz  |  Download  |  Eingangshalle  |  Hilfe  |  Händlerportal  |  Impressum  |  Mart  |  Schnittstellen  |  SDK  |  Services  |  Spiele  |  Suche  |  Support

Ein Projekt aller XProfaner, die es gibt!


Mein XProfan
Private Nachrichten
Eigenes Ablageforum
Themen-Merkliste
Eigene Beiträge
Eigene Themen
Zwischenablage
Abmelden
 Deutsch English Français Español Italia
Übersetzungen

Datenschutz


Wir verwenden Cookies nur als Session-Cookies wegen der technischen Notwendigkeit und bei uns gibt es keine Cookies von Drittanbietern.

Wenn du hier auf unsere Webseite klickst oder navigierst, stimmst du unserer Erfassung von Informationen in unseren Cookies auf XProfan.Net zu.

Weitere Informationen zu unseren Cookies und dazu, wie du die Kontrolle darüber behältst, findest du in unserer nachfolgenden Datenschutzerklärung.


einverstandenDatenschutzerklärung
Ich möchte keinen Cookie