Vorheriges Thema anzeigen :: Nächstes Thema anzeigen |
Autor |
Nachricht |
faust •->

Anmeldedatum: 25.02.2012 Beiträge: 15
|
Verfasst am: 27.11.2012 - 13:28 Titel: Lesen aus Safari |
|
|
Hallo Fans
Ich möchte einen Text aus einer Web-Seite auslesen. Wenn die Seite nicht zu kompliziert ausschaut, so funktioniert das ganz einfach mit
open location "http://www.xyz.de"
set s to text of document 1
Wenn die Seite komplex ist, so geht das nicht mehr.
Beispiel: http://www.mactechnews.de, ich möchte die neueste Meldung auslesen. |
|
Nach oben |
|
 |
woodpecker •--->

Anmeldedatum: 12.10.2010 Beiträge: 150 Wohnort: Roggentin/Rostock
|
Verfasst am: 27.11.2012 - 17:44 Titel: |
|
|
Zitat: | Wenn die Seite komplex ist, so geht das nicht mehr. |
Hallo faust,
was geht den da nicht? Bei mir geht es.
Allerdings musst Du das Komma aus der URL entfernen. |
|
Nach oben |
|
 |
faust •->

Anmeldedatum: 25.02.2012 Beiträge: 15
|
Verfasst am: 27.11.2012 - 18:32 Titel: |
|
|
Danke.
Geht ja auch bei mir, mein Mac hatte wohl einige schwache Minuten.
Komma ist schon klar, ist ein Satzzeichen.
Wenn ich jetzt einen Teil der Seite haben möchte, zB immer den ersten Beitrag, so muss ich diesen aus dem Gewusel (Quelltext), das ich erhalte, irgendwie extrahieren.
Heisst: Indem ich item delimiters, ... verwende und den Anfang und das Ende möglichst gut beschreibe?
Was nicht so ganz einfach ist. Oder gibt's da was Eleganteres? |
|
Nach oben |
|
 |
woodpecker •--->

Anmeldedatum: 12.10.2010 Beiträge: 150 Wohnort: Roggentin/Rostock
|
Verfasst am: 27.11.2012 - 19:06 Titel: |
|
|
Zitat: | Heisst: Indem ich item delimiters, ... verwende und den Anfang und das Ende möglichst gut beschreibe? |
Ganz genau so musst Du es machen.
Zitat: | Was nicht so ganz einfach ist. Oder gibt's da was Eleganteres? |
Das stimmt auch wieder. Auf jeden Fall lohnt es sich, dass Du Dich in dem Zusammenhang mit der Verwendung von regulären Ausdrücken vertraut machst. Dann kannst Du mit "do shell script" auf die UNIX-Tools des OS X zurückgreifen (sed, awk, perl, grep). Mit reinen AS-Bordmitteln wird es seeehr schwierig.
Damit Du eine Vorstellung hast, wie es aussehen könnte, habe ich mal alle Zeilen der betreffenden Website extrahiert, in denen eine Zeitangabe vorkommt. Das Kommando dazu sieht so aus:
Code: | do shell script "sed -n /[0-2][0-9]:[0-5][0-9]/p" |
Und das sind die ersten Zeilen des Outputs:
Code: | 16:36 Uhr∙Wirtschaft∙ sb
15:58 Uhr∙Software∙ sb
14:43 Uhr∙Hardware - Gerüchte∙ sb
14:42 Uhr∙Hardware∙ fen
13:00 Uhr∙Hardware∙ sb
12:03 Uhr∙Hardware - Gerüchte∙ sb
11:18 Uhr∙Spiele∙ sb
09:23 Uhr∙Software∙ sb
08:50 Uhr∙Software∙ sb
08:32 Uhr∙Software∙ sb
08:11 Uhr∙Hardware - Gerüchte∙ sb
16:30 Uhr∙Wirtschaft∙ sb
16:05 Uhr∙Hardware∙ sb
14:19 Uhr∙Internet∙ sb
12:59 Uhr∙Publikationen∙ sb
|
Zu dieser Thematik gibt es in diesem Forum aber schon eine ganze Menge Threads. Da musst Du einfach mal nach den Stichworten "do shell script","awk","sed","perl" u.s.w. suchen. |
|
Nach oben |
|
 |
Skeeve •---->


Anmeldedatum: 20.04.2006 Beiträge: 1068
|
Verfasst am: 27.11.2012 - 19:58 Titel: |
|
|
Und um meinen Cent dazuzugeben: Ich würde das ganze gleich mit Perl und LWP oder mindestens mit curl und Perl lösen.
Ist allemal besser als auf einen (langsamen) Browser zu bauen. _________________ "All problems are solved in slightly less than half an hour" (Chumbawamba, "Hey Hey We're The Junkies") |
|
Nach oben |
|
 |
faust •->

Anmeldedatum: 25.02.2012 Beiträge: 15
|
Verfasst am: 27.11.2012 - 21:55 Titel: |
|
|
Thanks.
Perl und LPW sind mir leider nicht geläufig, ebensowenig shell scripts. Ich werde versuchen, mich da mal ein bisschen reinzuknien.
Die Variante mit gewöhnlichem Apple Script bringt immerhin ein einigermassen knapp brauchbares Resultat. |
|
Nach oben |
|
 |
|