Discussion:
æ, ø og å??
(for gammel til at besvare)
Hans Henrik Hansen
2021-01-15 23:27:03 UTC
Permalink
Hvorfor pokker kan jeg ikke få denne side:

http://www.hansogoline.dk/slfst_test.htm

til at vise æ, ø og å??

content="text/html; charset=UTF-8", bliver tilsyneladende 'ignoreret'!?

Ikke engang i 'vis kildekode' (Firefox) vises bogstaverne korrekt!

Disclaimer: Det er en tyve år gammel side, som sjældent besøges, så ud
over karakterene vil jeg ikke 'bruge krudt' på at bringe den i mere
'civiliseret' stand! :)
--
med venlig hilsen,
Hans
Kim Ludvigsen
2021-01-15 23:46:23 UTC
Permalink
Post by Hans Henrik Hansen
http://www.hansogoline.dk/slfst_test.htm
til at vise æ, ø og å??
content="text/html; charset=UTF-8", bliver tilsyneladende 'ignoreret'!?
Nej, tværtimod. Problemet opstår, fordi UTF-8 har effekt, og fordi din
tekst ikke er i UTF-8. Der var nu heller ikke ret mange dansk-rettede
programmer, der brugte UTF-8 dengang.

Du har to muligheder: Enten skal du ændre dine tekster til UFT-8 og så
uploade dem i stedet for de nuværende tekster. Eller også skal du ændre
charset til den reelle tegnkodning.

Jeg tør ikke sige, hvad din tegnkodning er - du kan prøve med:
ISO-8859-1
--
Mvh. Kim Ludvigsen
Hans Henrik Hansen
2021-01-16 00:18:05 UTC
Permalink
Kim Ludvigsen <***@kimsside.dk> wrote:

.....
Post by Kim Ludvigsen
Nej, tværtimod. Problemet opstår, fordi UTF-8 har effekt, og fordi din
tekst ikke er i UTF-8. Der var nu heller ikke ret mange dansk-rettede
programmer, der brugte UTF-8 dengang.
Du har to muligheder: Enten skal du ændre dine tekster til UFT-8 og så
uploade dem i stedet for de nuværende tekster. Eller også skal du ændre
charset til den reelle tegnkodning.
ISO-8859-1
Tak for superhurtigt svar! :)

Problemet er i mellemtiden løst ved at jeg i min web-editor ('Sublime
Text') valgte 'Save with encoding' (UTF-8)
--
med venlig hilsen,
Hans
Hans Henrik Hansen
2021-01-16 09:41:59 UTC
Permalink
Hans Henrik Hansen <***@webspeed.dk> wrote:
....
Post by Hans Henrik Hansen
Problemet er i mellemtiden løst ved at jeg i min web-editor ('Sublime
Text') valgte 'Save with encoding' (UTF-8)
og nu 'virker' det så! Men jeg forstår i grunden ikke _hvorfor_?:
Hvad 'sker der' i grunden, når man vælger 'Save with Encoding'?

Mit udgangspunkt var den snart tyve år gamle side:
view-source:http://www.hansogoline.dk/slfst.htm

, hvor æ, ø og å i kildekoden er angivet som '&aelig;'...etc.

Det ville jeg ændre, så jeg tilføjede 'charset=utf-8' i headeren og
ændrede '&aelig;'...etc. i teksten til 'æ'...etc., hvilket resulterede i
at æ, ø og å blev vis som sorte rhomber med '?' i midten.

Netop da jeg havde 'affyret' mit spørgsmål, dæmrede erindringen om
tidligere succes med 'Save with Encoding'.
Da jeg valgte dette, ændrede kildekoden sig således, at der i stedet for
æ etc. stod et '?'...men ikke kun dét: Hvis der før havde stået æ eller
å, blev den _efterfølgende_ karakter samtidigt fjernet!? Havde der stået
ø, blev alene ø'et erstattet med '?'!??

Konsekvensen var, at jeg ikke kunne bruge 'find/erstat' - men i stedet
måtte 'rette igennem manuelt'!

Men nu jeg er faktsik meget interesseret i en 'forklaring' på mine
(natlige) oplevelser! :)
--
med venlig hilsen,
Hans
Bertel Lund Hansen
2021-01-16 10:12:06 UTC
Permalink
Post by Hans Henrik Hansen
Hvad 'sker der' i grunden, når man vælger 'Save with Encoding'?
Man gemmer altid med en encoding. Når man vælger den specifikt,
ved man hvilken der bliver brugt.

Den korte forklaring på dit problem er at "de gamle encodings"
(f.eks. iso-8859-1) bruger én byte til hvert tegn. UTF-8 som skal
kunne kode tusindvis af tegn (langt over 256), bruger 2, 3 eller
flere bytes til hvert tegn. Tegn med kodenummer mindre end 128
forbliver uændret, men alle de større tegn bliver så elementer i
en flerbytekode. Når utf-omkoderen så møder "æl" (f.eks. i
"ælling") så signalerer æ'et at der nu kommer en flerbytekode, så
enten findes den kode ikke hvilket udløser en firkant eller
lignende, eller også findes den, og så omsættes "æl" til et tegn
som slet ikke hører hjemme i teksten og som evt. ser underligt
ud. Derved bliver to tegn til ét, så det ser ud som om der er
forsvundet noget.

Her er en utf-tekst set i en iso-editor som omsætter hver byte
til ét tegn:

Sprognævnet har ogsaa lavet en anden Ændring. Der har nemlig
længe hersket Forvirring ved geografiske Navne som hidtil
stavedes med Bolle-aa. Det Bogstav hører nu ikke længere til
det danske Alfabet, og der er herefter ingen Tvivl om hvordan
f.eks. Grenaa, Blaavand og Aalbæk skal staves.

Så kan du se et par af de totegnskoder der står for de danske
bogstaver (æ og ø). En utf-editor vil læse "æ" og så skrive "æ"
på skærmen.


For lige at øge forvirringen: Der er tre ting der skal justeres
rigtigt hvis en hjemmeside skal vises korrekt.

1. Teksten skal være med en given encoding. Lad os kalde den X.
2. I headeren skal der være en metalinje der erklærer tegnsættet
som X.
3. Webserveren skal indstilles på at levere siden med encoding X.
--
/Bertel
Hans Henrik Hansen
2021-01-16 10:59:20 UTC
Permalink
Bertel Lund Hansen <***@lundhansen.dk> wrote:
...
Post by Bertel Lund Hansen
For lige at øge forvirringen: Der er tre ting der skal justeres
rigtigt hvis en hjemmeside skal vises korrekt.
1. Teksten skal være med en given encoding. Lad os kalde den X.
2. I headeren skal der være en metalinje der erklærer tegnsættet
som X.
3. Webserveren skal indstilles på at levere siden med encoding X.
Tusidn tak for superfin 'udredning'! :)

Kan du evt. 'antyde', hvorledes man i praksis implementerer '3.'??
--
med venlig hilsen,
Hans
Bertel Lund Hansen
2021-01-16 11:09:37 UTC
Permalink
Post by Hans Henrik Hansen
Kan du evt. 'antyde', hvorledes man i praksis implementerer '3.'??
På mit webhotel kan jeg logge ind og vælge et domæne (jeg har
flere samme sted). Derefter får jeg adgang til en boks hvor jeg
kan indstille flere ting, bl.a. hvilket tegnsæt der skal benyttes
på domænet.

Hvis man ikke har den adgang selv, må man kontakte adminen for
den server man benytter.
--
/Bertel
Kim Ludvigsen
2021-01-16 12:16:14 UTC
Permalink
Post by Hans Henrik Hansen
Kan du evt. 'antyde', hvorledes man i praksis implementerer '3.'??
Bertel har fortalt dig hvordan, men det er ikke noget, du behøver at
bekymre dig om, nu hvor du har fået ændret dine tekster til UTF-8 - din
webserver er allerede indstillet til at vise sider med UTF-8.
--
Mvh. Kim Ludvigsen
Hans Henrik Hansen
2021-01-16 13:24:27 UTC
Permalink
Kim Ludvigsen <***@kimsside.dk> wrote:
....
Post by Kim Ludvigsen
Bertel har fortalt dig hvordan, men det er ikke noget, du behøver at
bekymre dig om, nu hvor du har fået ændret dine tekster til UTF-8 - din
webserver er allerede indstillet til at vise sider med UTF-8.
Så er alt jo fint! Men det gælder så for hele domænet (jeg har kun ét),
kan jeg forså(?).

Af ren nysgerrighed: Hvad ville der så ske, _hvis_ jeg på samme domæne
placerede filer med anden 'indkodning'??
--
med venlig hilsen,
Hans
Jan Hansen
2021-01-16 13:36:26 UTC
Permalink
Post by Hans Henrik Hansen
Af ren nysgerrighed: Hvad ville der så ske, _hvis_ jeg på samme domæne
placerede filer med anden 'indkodning'??
Så ville det se forkert ud, med mindre du skriver den rette kodning i
filen, for eksempel <meta charset="iso-8859-1">
eller også sætter den kodning, du bruger i filen, som standard for
domænet, i en .htaccess fil med AddDefaultCharset iso-8859-1
--
mvh Jan.
Help Microsoft stamp out piracy. Give
Linux to a friend today!
Bertel Lund Hansen
2021-01-16 14:00:41 UTC
Permalink
Post by Jan Hansen
Post by Hans Henrik Hansen
Af ren nysgerrighed: Hvad ville der så ske, _hvis_ jeg på samme domæne
placerede filer med anden 'indkodning'??
Så ville det se forkert ud, med mindre du skriver den rette kodning i
filen, for eksempel <meta charset="iso-8859-1">
Det er ikke nok. Se eksempel her:

http://temp.lundhansen.dk/

Før upload kunne jeg se siden vist korrekt i browseren. Men
serveren er stillet til utf-8, og så går det galt.
--
/Bertel
Jan Hansen
2021-01-16 14:33:42 UTC
Permalink
Post by Bertel Lund Hansen
Post by Jan Hansen
Post by Hans Henrik Hansen
Af ren nysgerrighed: Hvad ville der så ske, _hvis_ jeg på samme domæne
placerede filer med anden 'indkodning'??
Så ville det se forkert ud, med mindre du skriver den rette kodning i
filen, for eksempel <meta charset="iso-8859-1">
http://temp.lundhansen.dk/
Før upload kunne jeg se siden vist korrekt i browseren. Men
serveren er stillet til utf-8, og så går det galt.
Du har ret, det kan ikke lade sig gøre hos gigahost, hvor man er tvangsindlagt
til at vælge et tegnsæt. Prøv at lave en .htaccess fil med linien
AddDefaultCharset off
og så genindlæs siden. Resultatet kan ses her, http://www.sniper-pistol.com/iso.html
og med utf8 her http://www.sniper-pistol.com/utf.html
--
mvh Jan.
Help Microsoft stamp out piracy. Give
Linux to a friend today!
Hans Henrik Hansen
2021-01-16 20:52:31 UTC
Permalink
Post by Kim Ludvigsen
Post by Hans Henrik Hansen
Kan du evt. 'antyde', hvorledes man i praksis implementerer '3.'??
Bertel har fortalt dig hvordan, men det er ikke noget, du behøver at
bekymre dig om, nu hvor du har fået ændret dine tekster til UTF-8 - din
webserver er allerede indstillet til at vise sider med UTF-8.
Jeg har kontaktet udbyderen ('one.com'), som bekræfter, at der ikke er
behor for ændringer på server-siden.
--
med venlig hilsen,
Hans
Loading...