[uplug] quanta+ unicode und tidy

Sebastian Zschernig zscherni at arcor.de
Mo Mai 29 20:02:19 CEST 2006


Hallo Hermann.

On Monday 08 May 2006 18:05, Hermann Schwarting wrote:
> Am Montag, 8. Mai 2006 15:30 schrieb Sebastian Zschernig:
> > Es kommen die Nummern 128, 145, 156, 158 und 159 jeweils mehrfach
> > vor. (Die gecheckte html-Datei ist in utf-8 kodiert.)
>
> Hallo Sebastian,
>
> die Zeichen mit den Nummern 128 bis 159 sind nur im Zeichensatz
> Latin1 (auch genannt code page 1252, MS Windows character set oder
> ANSI) aber *nicht* in ISO-8859-1 definiert. Ich nehme mal an, Du hast
> die Dateien ursprünglich unter Windows erstellt. Tidy ersetzt
> ("replacing") diese Vorkommen durch die entsprechenden
> Unicode-Zeichen. Dass die Meldungen auch nach Speichern und
> nochmaligem Durchlauf kamen, liegt wahrscheinlich daran, dass Quanta
> Tidy nur zur Diagnose einsetzt aber die HTML-Datei nicht ändern lässt
> (kenne nur tidy, aber nicht Quanta). Du solltest einerseits sicher
> sein, dass die Dateien *wirklich* als utf-8 gespeichert werden und
> andererseits das Encoding im HTML-Header angeben. Wenn Du Dir bei
> einer Datei nicht sicher bist, dann lass sie in einem Hex-Editor oder
> zur Not mit xxd anzeigen.
>

Ich bin nun völlig verwirrt: habe mit gedit, kate und quanta ein paar 
Zeichen eingegeben (immer explizit utf-8 als codierung angegeben) und 
dann mit Ghex angeguckt.
Aber da erscheinen ganz andere Nummern als erwartet.
Erwartet hätte ich die unicode-Nummern
a 61
b 62
c 63
ß DF
Ä C4
Ö D6
Ü DC
‑ 2011
jedoch
abcßÄÖÜ‑ werden als 61 62 63 C3 9F C3 84 C3 96 C3 9C E2 80 91 0A
angezeigt.
0A scheint das Dateiende zu markieren (?)

Die Programme kommen aber alle damit klar und wie gesagt zeigt auch der 
firefox meine html-Dateien alle richtig an.

Dabei meckert tidy nur über ÄÖÜß, nicht aber über äöü und ‑. (Und 
komischerweise unter Angabe leicht falscher Zeile/Spalte-Positionen.)


> > Allerdings ist folgendes auch verrückt:
> >
> > quanta+ zeigt mir da, wo ich per Tastatur einen geschützten
> > Bindestrich eingebe (unicode hex2011) (habe ich mir in die Xmodmap
> > eingebaut) ein Leerzeichen an. firefox bringt dann den
> > Bindestrich...
>
> Das liegt entweder daran, dass das Encoding nicht so ganz klappt
> (s.o.) oder dass der Bindestrich nicht in der Schriftart enthalten
> ist, die Quanta verwendet. Normalerweise sollte da aber ein leeres
> Kästchen und kein Leerzeichen erscheinen?

Leider wird wirklich kein Kästchen sondern ein Leerzeichen angezeigt.

Gruß

Sebastian

PS:

Ich habe die Seite mit dem Tastaturlayout nochmal geändert: 
http://home.arcor.de/zscherni/heimseite/tips.html
http://home.arcor.de/zscherni/heimseite/Tastaturlayout_uni.html

Für bullets und dt. Gänsefüßchen brauchst Du nur bei comma und period zu 
gucken...
Obwohl ich ja auch geschützte Leerzeichen und Bindestriche empfehle 
(siehe space und minus).



Mehr Informationen über die Mailingliste upLUG