[uplug] quanta+ unicode und HTML tidy syntax checking

Hermann Schwarting hfs at gmx.de
Mo Mai 8 18:05:28 CEST 2006


Am Montag, 8. Mai 2006 15:30 schrieb Sebastian Zschernig:

> Es kommen die Nummern 128, 145, 156, 158 und 159 jeweils mehrfach
> vor. (Die gecheckte html-Datei ist in utf-8 kodiert.)

Hallo Sebastian,

die Zeichen mit den Nummern 128 bis 159 sind nur im Zeichensatz Latin1 
(auch genannt code page 1252, MS Windows character set oder ANSI) 
aber *nicht* in ISO-8859-1 definiert. Ich nehme mal an, Du hast die 
Dateien ursprünglich unter Windows erstellt. Tidy ersetzt 
("replacing") diese Vorkommen durch die entsprechenden 
Unicode-Zeichen. Dass die Meldungen auch nach Speichern und 
nochmaligem Durchlauf kamen, liegt wahrscheinlich daran, dass Quanta 
Tidy nur zur Diagnose einsetzt aber die HTML-Datei nicht ändern lässt 
(kenne nur tidy, aber nicht Quanta). Du solltest einerseits sicher 
sein, dass die Dateien *wirklich* als utf-8 gespeichert werden und 
andererseits das Encoding im HTML-Header angeben. Wenn Du Dir bei 
einer Datei nicht sicher bist, dann lass sie in einem Hex-Editor oder 
zur Not mit xxd anzeigen.

> Ich denke mal ich kanns ignorieren, denn im firefox sehe ich keine
> Probleme.

Das wiederum liegt wohl daran, dass es derart viele schlechte 
HTML-Seiten da draußen gibt, dass Firefox genötigt ist, auch falsch 
kodierte Dateien "richtig" anzuzeigen.

> 2.
> Allerdings ist folgendes auch verrückt:
>
> quanta+ zeigt mir da, wo ich per Tastatur einen geschützten
> Bindestrich eingebe (unicode hex2011) (habe ich mir in die Xmodmap
> eingebaut) ein Leerzeichen an. firefox bringt dann den
> Bindestrich...

Das liegt entweder daran, dass das Encoding nicht so ganz klappt 
(s.o.) oder dass der Bindestrich nicht in der Schriftart enthalten 
ist, die Quanta verwendet. Normalerweise sollte da aber ein leeres 
Kästchen und kein Leerzeichen erscheinen?

Eine ausführliche Seite zum Thema -- allerdings natürlich auf 
Englisch -- ist
[ http://www.cs.tut.fi/~jkorpela/www/windows-chars.html ].

Viele Grüße,
Hermann

-- 
Sie werden nicht gern Zombies genannt.
Sag lieber "eingeschränkt Lebende"!
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : nicht verfügbar
Dateityp    : application/pgp-signature
Dateigröße  : 191 bytes
Beschreibung: nicht verfügbar
URL         : <http://lists.astaup.de/pipermail/uplug/attachments/20060508/907bb6f9/attachment.sig>


Mehr Informationen über die Mailingliste upLUG