Autor Beitrag
MathiasSimmack
Ehemaliges Mitglied
Erhaltene Danke: 1



BeitragVerfasst: Fr 15.12.06 21:30 
Ich habe etwas Text (Dump einer SQL-Datenbank), der wie folgt aussieht:
ausblenden Quelltext
1:
'Irgendein Satz. "Hallo, Welt!" <a href="bla.png">Bild</a>. Noch mehr Text. Und "angeführt".'					

Wie müsste der reguläre Ausdruck aussehen, wenn ich "Hallo, Welt!" und "angeführt" ausfiltern und etwas bearbeiten möchte. Also nur den wirklichen Text. Der Link <a> bzw. dessen Ziel soll außen vor bleiben.

Zu früh gesendet: Ich bin nicht der Regex-Meister, wollte ich noch sagen. :oops:
Kha
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Beiträge: 3803
Erhaltene Danke: 176

Arch Linux
Python, C, C++ (vim)
BeitragVerfasst: Sa 16.12.06 12:13 
So sollte es funktionieren, jedenfalls solange der Text auch valide ist ;) .
ausblenden Quelltext
1:
(^|>)[^<]+(?<Foo>"[^<]+")					
MathiasSimmack
Ehemaliges Mitglied
Erhaltene Danke: 1



BeitragVerfasst: Sa 16.12.06 15:41 
Der Text ist valid. Ich habe nur gerade gemerkt, dass das, was ich vorhatte, unnötig ist. :lol:

Ich mache eine Kopie meiner eigenen SQL-Datenbank mit meinen Beiträgen, usw. Ich habe leider keinen Einfluss auf den Output von phpMyAdmin, so dass Umlaute und Sonderzeichen etwas merkwürdig gespeichert sind. Ein ü sieht bspw. so aus ü. Aber das ist nicht weiter tragisch. Mein kleines Tool rattert durch die Zeilen und konvertiert diesen Zeichensalat wieder zurück in HTML-Code.

Bei der Gelegenheit wollte ich auch gern die Anführungszeichen ersetzen, so dass der passende HTML-Code drin steht (also nicht bloß &quot;, sondern &ldquo; und &rdquo;), aber das macht WordPress bereits von sich aus. Das kann ich mir also sparen. ;)

Trotzdem Danke.