| |||||||
| Stammtisch Hier wird über alles gesprochen ausser Online-Marketing. |
![]() |
| | Themen-Optionen | Thema durchsuchen | Ansicht |
|
#1
| |||
| |||
| als ich suche ein tool das mir xml dateien sauber splittet. und zwar exakt so als ob ich diese arbeit mit strg.c und strg.v erlediegen würde. ein makro allerdings nutzt mir nicht. die datei um die es geht ist eine xml mit über einem GB und lässt sich schlicht mit keinem programm öffnen. eventuell kennt sich auch einer mit den wiki daten in php aus. ich beckomme die daten ums verecken nicht sauber in eine accesss oder anderen datenbank herein. die eigentlichen texte werden nie mit übernommen. anstelle der texte steht immer nur etwas wie "Block" oder ähnliches. bitte keiner antworten der aktiv gegen blackhead ist. die daten so ich sie habhaft werde, werden definitiv nicht nach allg. gültigen äthischen regeln genutzt ich möchte von keinem der mir hilft hinterher höhren, hätte ich das gewusst dann hätte ich nichts gesagt.gruß iluminatus |
|
#2
| |||
| |||
| Mit ein paar Zeilen PHP-Script sollte es möglich sein, ein CSV zu erstellen. Wenn die Daten interessant sind, tausche ich die Datei gegen eine CSV-Version ![]() Gruß Johannes |
|
#3
| |||
| |||
| Ich kenn zwar ein paar Splitt Programme aber die Trennen das nicht sehr sauber und schneiden oft was ab. Wie steht es denn mit deinen PHP Kenntnissen ? Hier mal ein bisschen Code weil ich meinen guten Tag habe - damit kannst du dann ein bisschen spielen bzw. hast mal ein paar Anhaltspunkte zum suchen.... Code:
|
|
#4
| |||
| |||
| Zitat:
Ist da nicht auch Schluss bei 64000 Zeilen? Wenn die XML ein Gig hat, muss Du sie dann doch trotzdem vorher splitten, oder nicht? |
|
#5
| |||
| |||
| CSV ist ja nur eine ganz normale Textdatei, in der die Werte durch ein ";" getrennt sind und für jeden neuen Datensatz eine neue Zeile eröffnet wird ![]() Die Limitation ist also die maximale Dateigrösse Deines Betriebssystems oder die Möglichkeiten, die Datei zu bearbeiten. Ich habe hier einige Keywords-CSV-Datein liegen, die knapp über 3GB haben und die Verarbeitung ist kein Problem. Gruß Johannes |
|
#6
| |||
| |||
| CSV (comma seperated file) ist bei Windows automatisch mit Excel verknüpft deswegen wahrscheinlich auch die Zahl 64000. Da macht Excel zu.... wenn ich friday da richtig verstanden habe. |
|
#7
| |||
| |||
| Aso, das kann gut sein. Ausser zur Verwaltung der Stundenkontigente der Content-Girls habe ich Excel noch nie angefasst ![]() Gruß Johannes |
|
#8
| |||
| |||
| kein Excel, kein TV - so langsam mach ich mir Sorgen um dich.... |
|
#9
| |||
| |||
| Ich trinke auch kein Alkohol und ernähre mich ausschliesslich vegan! |
|
#10
| |||
| |||
| mann bin ich verdorben..... Aber ich esse nur Tiere die selber keine Tiere essen -> Vegetarier 2. Klasser |