Vorheriges Thema anzeigen :: Nächstes Thema anzeigen |
Autor |
Nachricht |
Franz Walsch •->

Anmeldedatum: 09.12.2001 Beiträge: 3 Wohnort: Germany
|
Verfasst am: 09.12.2001 - 21:24 Titel: Tex-Edit/insert/und HTML-Seiten |
|
|
Hi
ein sicherlich recht einfaches Problem für euch Experten. :-)
Leider muß ich aber das Problem lösen - und ich kenne mich mich AppleScript leider nicht gut aus.
Also wenn jmd. ein paar Minuten Zeit dafür hätte wäre ich wirklich sehr dankbar.
Das Problem ist folgendes:
Ich habe einen Ordner mit einer kompletten Website und will alle Dokumente die Text enthalten können in ein Textfile bekommen.
Meine bisherige Überlegung:
Ich mache das in Tex-Edit Plus, da der ³insert²-Befehl ganz passend scheint.
Tex-Edit ist auch scriptfähig, also...
Nur das Script fehlt mir leider noch :-)
Schick wäre wenn ich das Script aufrufen kann und er fragt mich welchen Ordner er bearbeiten soll (zur Not ginge natürlich auch ein Ordner mit einem bestimmten Namen der auf dem startup-volume liegt)
Dann wäre es gut wenn er alle files aus dem Ordner (und auch Unterordnern) sucht die Text haben (mit ³files whose name contains ".htm"², wenn ich das richtig sehe (ansonsten würde er ja auch die Bilder reinziehen))
Also theoretisch weiß ich was ich will - nur wie ich das in ein Script bekomme ist mir nicht so ganz klar.
Das ist doch sicher eine dankbare Aufgabe für euch. ;-)
Wäre wirklich sehr nett wenn mir da jmd. weiterhelfen könnte.
Grüße
Franz _________________ Franz Walsch |
|
Nach oben |
|
 |
Snow Administrator


Anmeldedatum: 21.11.2000 Beiträge: 1946 Wohnort: Deiningen
|
Verfasst am: 10.12.2001 - 20:25 Titel: Tex-Edit/insert/und HTML-Seiten |
|
|
Hallo Franz,
ich muss da zuerst nochmal nachfragen.
Willst du die Namen der Textdateien in einer Datei aufgelistet haben oder soll der gesamte Inhalt jeder einzelnen Textdatei in einer "Sammeldatei" zusammen gefasst werden? _________________ Peter
-
Fischer-Bayern.de|Shadetreemicro.com |
|
Nach oben |
|
 |
Franz Walsch •->

Anmeldedatum: 09.12.2001 Beiträge: 3 Wohnort: Germany
|
Verfasst am: 10.12.2001 - 21:17 Titel: Tex-Edit/insert/und HTML-Seiten |
|
|
Hallo Snow
das zweite ist richtig - ich benötige eine "Sammeldatei" mit allen Texten.
(den html-kram rausbekommen ist dann kein größeres Problem mehr)
Danke daß du es dir angucken willst!
Franz _________________ Franz Walsch |
|
Nach oben |
|
 |
macgix •--->


Anmeldedatum: 13.12.2000 Beiträge: 206 Wohnort: K–ln
|
Verfasst am: 14.12.2001 - 18:39 Titel: Tex-Edit/insert/und HTML-Seiten |
|
|
Hallo Franz,
die Lösung ist nicht schwer. Mit Tex-Edit Plus liegst Du richtig. Der Befehl tell document 1 to insert contents of [filepath] leistet genau das, was Du suchst.
Ich würde jedoch aus Gründen des RAM-Speicherbedarfs etwas anders vorgehen.
1) Zuerst mit tell application "Finder" to set Arbeitsordner to (duplicate [filereference]) as string eine Kopie des Ordners mit den HTML Seiten als Arbeitsordner erzeugen (Danach enthält "Arbeitsordner" den Pfad zum kopierten Ordner mit dem weiterzuarbeiten ist)
2) Alle darin enthaltenen Dateien der Reihe nach in Tex-Edit Plus öffnen und das Script "Strip <html> +" von Marc K. Meyers, dass Du auf der Tex-Edit Plus Scripting Site findest, auf jede einzelne Datei anwendest und die Datei dann erstmal mit tell document 1 to save with closing wieder sicherst.
3) Ein leeres Dokument in Tex-Edit Plus erzeugen und sichern!
4) Tex-Edit Plus anweisen der Reihe nach alle HMTL-Dateien per Insert-Befehl aneinanderzureihen (repeat loop)
5) (Sollten sich die Dateien in Unterordnern befinden bedient man sich eines entsprechend rekursiv wandernden Skriptskeletts und wendet die oben erwähnten Funktionen nur auf Dateien des Typs "TEXT" und mit
tell application "Finder" to set tVal to (file type of [filepath as alias] is "TEXT" and name ends with ".html" )
if tVal is true then
-- mach was damit, also "Strip <HTML> +" zuerst und "insert contents" später
end if
an!)
5) Am Ende das Dokument sichern und das nächste aufrufen bis alle Dokumente bearbeitet worden sind
Fertig!
Gruß,
Thomas _________________ [macgix] |
|
Nach oben |
|
 |
macgix •--->


Anmeldedatum: 13.12.2000 Beiträge: 206 Wohnort: K–ln
|
Verfasst am: 14.12.2001 - 18:46 Titel: Tex-Edit/insert/und HTML-Seiten |
|
|
"Strip +" meint eigentlich "Strip < HTML > +" ohne die Leerzeichen zwischen den grösser als/kleiner als Zeichen, da hat das Forum wieder mal Hunger gehabt wie mir scheint...  _________________ [macgix] |
|
Nach oben |
|
 |
macgix •--->


Anmeldedatum: 13.12.2000 Beiträge: 206 Wohnort: K–ln
|
Verfasst am: 14.12.2001 - 18:49 Titel: Tex-Edit/insert/und HTML-Seiten |
|
|
... und statt save with closing muss es dann noch close with saving heissen.
Sorry! _________________ [macgix] |
|
Nach oben |
|
 |
Franz Walsch •->

Anmeldedatum: 09.12.2001 Beiträge: 3 Wohnort: Germany
|
Verfasst am: 16.12.2001 - 12:25 Titel: Tex-Edit/insert/und HTML-Seiten |
|
|
Hi macgix,
das hilft mir schon weiter.
Erstmal vielen Dank für deine Ausführungen!
Das "Strip < HTML > +" ist aber eher langsam und läßt auch alle deutschen (und sicher auch anderen) sonderzeichen drin.
Das geht mit SuperReplace bedeutend schneller und sauberer.
(Ich glaube so 5 Sekunden auf nem iMac um etwa 900.000 Zeichen auf 500.000 runterzuschrauben.)
Grüße
Franz _________________ Franz Walsch |
|
Nach oben |
|
 |
macgix •--->


Anmeldedatum: 13.12.2000 Beiträge: 206 Wohnort: K–ln
|
Verfasst am: 16.12.2001 - 22:22 Titel: Tex-Edit/insert/und HTML-Seiten |
|
|
Hallo Franz,
stimmt natürlich! SuperReplace, das es ja schon sehr lange gibt, war immer schon "Super". Typisch, dass der betriebsblinde Dauerscripter nicht daran denkt...
 _________________ [macgix] |
|
Nach oben |
|
 |
|