| |
|
|
Christof Neuß | Hallo,
ich habe folgende Herausforderung:
Ich bekomme XML-Dateien vom Bundesanzeiger, in denen Bilanzen/Jahresabschlüsse hinterlegt sind (pro Firma eine XML-Datei). Sie enthalten also Text und Zahlen. Der reine Text interessiert mich an der Stelle nicht. Aufgabe ist es, die richtigen Zahlen auszulesen und in eine Tabellenform zu bringen (z.B. dBase-Datei oder CSV-Datei). Ich weiß noch nicht, ob die Zahlen immer an derselben Stelle stehen (müsste aber eigentlich so sein).
Hat sich schon mal jemand mit sowas beschäftigt? XML-Dateien haben ja einen bestimmten Aufbau. Den kann man natürlich auslesen. Ist aber mühsam, wenn man das nur für ein kleines Projekt machen muss. Gibts sowas wie eine Unit, eine Inc o.ä. hierfür.
DANKE für jeden Hinweis, jede Hilfe. |
|
|
| |
|
|
|
| Irgendwo hier herje hab ich einen rein in XProfan geschriebenen XML-Parser gepostet.
Es könnte sein dass das hier [...] war.
Poste doch mal so eine xml-Datei. |
|
|
| |
|
|
|
Christof Neuß | Hi iF,
hier erstmal eine Harcopy, welche Dateien alles geliefert werden. Die eigentlichen Daten stehen wohl in der 071012004466.xml.
Diese Datei hänge ich auch mal an. Es geht mit den Daten bzw. mit der Bilanz los ab Texteintrag 1. Barreserve...
Von dieser Sorte bekomme ich dann ca. 700 Stück.
Ansonsten kann ich die Datei ja auch ganz normal öffnen und nach den Texten der Bilanz suchen und dann danach die Werte suchen. Dauert zwar etwas, sollte aber gehen, oder? Dann behandle ich die Datei eben wie eine normale Textdatei. |
|
|
| |
|
|
|
Christof Neuß | Oh, ähem, den MapEditor hab ich ausprobiert. Meldet mir aber, das max. 31kb geladen werden können. Oder mach ich wieder was falsch?
Hab jetzt das Programm aufgerufen, rechte Maustaste gedrückt und über Load XML-Data from file versucht die Daten einzulesen... |
|
|
| |
|
|
|
| Mit der von Dir hochgeladenen XML ist irgendwas Quark - vielleicht kannst Du den Inhalt der XML (sollte reiner Text sein ähnlich HTML) nach [...] hochladen. |
|
|
| |
|
|
|
Frank Abbing | iF
Mit der von Dir hochgeladenen XML ist irgendwas Quark - vielleicht kannst Du den Inhalt der XML (sollte reiner Text sein ähnlich HTML) nach [...] hochladen.
Ja, am besten vorher zippen. In der jetzigen Form ist die Datei nicht einsehbar. |
|
|
| |
|
|
|
| Herje in welchem Code war denn nur mein kleiner xml-Parser hmpf - ich erinnere mich an eine select-Struktur mit der man sehr schön die einzelnen Nodes mit Ihren Properties/Werten abrufen konnte... |
|
|
| |
|
|
|
Christof Neuß | Ok, hab jetzt mal alles in ein ZIP-Archiv gepackt. |
|
|
| |
|
|
|
Frank Abbing | Naja, ich weiß ja nicht genau welche Daten du genau benötigst. Ein Lösungsansatz wäre vielleicht nach der Buchstabenfolge < /A > (ohne Leerzeichen, ansonsten hier Darstellungsfehler) zu suchen und den davor in der Zeile stehenden Text zu durchsuchen, ob er Buchstaben enthält, oder eine eine Zahl ist, bzw. die Anzahl der gefundenen < /A > benutzen um die betreffende Zahl auszulesen. Wie ich das sehe sollte dein Unterfangen nicht unmöglich sein. |
|
|
| |
|
|
|
Christof Neuß | Ok, merci bis hierhin.
Ich werd jetzt mal versuchen, einfach den Text auszulesen. Scheint gar nicht so schwierig zu sein.
Werde vom Erfolg/Misserfolg berichten, wenn es so weit ist... |
|
|
| |
|
|
|
Thomas Freier | Zum Text auslesen würde ich auf Franks Module zurückgreifen. Z.B. die 071012004466.xml im I-Explorer geöffnet: 1. als PDF gespeichert und mit Franks PTTGui.exe geöffnet. Bild HD_Teil1.png und HD_Teil2.png. Dann als *.txt speichern oder 2. im I-Explorer alles markieren, kopieren und als *.txt gespeichert. Geöffnet mit Quellcode_einlesen.prf aus den ListView-Beispielen. Bild HD_Teil1.png. Wenn die Vorbegriffe bei allen Seiten identisch sind, müssten die nachfolgenden Zahlen auch leicht auszulesen sein. |
|
|
| |
|
|
|
Thomas Freier | Da die *.xml als *.html gespeichert werden kann, könnte folgendes interessant sein: [web]https://www.sautin.com/html-to-rtf/developers.htm[/web]. Das kostenlose HTMLtoRTF ist bedingt brauchbar (Zeichensatz). |
|
|
| |
|
|