Discussion:
Danske tegn vises ikke korrekt
(for gammel til at besvare)
Kurt Hansen
2019-11-15 13:47:08 UTC
Permalink
https://www.danacord.dk/artists/sjogren.html

Her er min HEAD-kode:
<head>
<title>Kim Sjøgren, Recording list</title>
<meta charset="UTF-8">
<link rel="stylesheet" href="../css/danacord.css" type="text/css">
<meta name="Description" content="Kim Sjøgren, violin">
<meta name="Author" content="Danacord Records / Kurt Hansen">
<meta name="Keywords" content="Danacord, Kim Sjøgren, classical,
music, classical music, violin, CD, records, Danacord Records">
<meta name="Title" content="Kim Sjøgren, Recording list">
</head>

Skulle det ikke være godt nok?
--
Venlig hilsen
Kurt Hansen
Kim Ludvigsen
2019-11-15 14:12:30 UTC
Permalink
Post by Kurt Hansen
https://www.danacord.dk/artists/sjogren.html
    <meta charset="UTF-8">
Skulle det ikke være godt nok?
Nej, ikke nødvendigvis. Det afhænger også af indstillingerne på serveren
og ikke mindst af, hvilket tegnsæt teksten er gemt med. Er teksten fra
en database, har det også betydning, hvilket tegnsæt databasen benytter,
og hvilket tegnsæt den er gemt i databasen med.

Response-headeren på siden fortæller ikke noget om tegnsæt (serverens
indstillinger), så mit gæt er, at du har gemt teksten i latin1 og så
vælger at få vist den med UFT-8 i din header.
--
Mvh. Kim Ludvigsen
Henning
2019-11-15 14:28:24 UTC
Permalink
Post by Kurt Hansen
https://www.danacord.dk/artists/sjogren.html
<head>
    <title>Kim Sjøgren, Recording list</title>
    <meta charset="UTF-8">
    <link rel="stylesheet" href="../css/danacord.css" type="text/css">
    <meta name="Description" content="Kim Sjøgren, violin">
    <meta name="Author" content="Danacord Records / Kurt Hansen">
    <meta name="Keywords" content="Danacord, Kim Sjøgren, classical,
music, classical music, violin, CD, records, Danacord Records">
    <meta name="Title" content="Kim Sjøgren, Recording list">
</head>
Skulle det ikke være god > <head>
<title>Kim Sj�gren, Recording list</title>
<meta charset="UTF-8">
t nok?

Nej, for serveren leveret ikke din fil som utf-8 men som latin1, så vil
"ø" selvfølgelig ikke vises korrekt.

Hvos du sidder med en linux-box kan du se at "curl -s -D -
https://www.danacord.dk/artists/sjogren.html | less" giver
Post by Kurt Hansen
<head>
<title>Kim Sjøgren, Recording list</title>
<meta charset="UTF-8">
Havde din fil været utf-8 havde de stået
Post by Kurt Hansen
<head>
<title>Kim Sjøgren, Recording list</title>
<meta charset="UTF-8">
/Henning
Kurt Hansen
2019-11-15 14:57:53 UTC
Permalink
Post by Kurt Hansen
https://www.danacord.dk/artists/sjogren.html
<head>
    <title>Kim Sjøgren, Recording list</title>
    <meta charset="UTF-8">
    <link rel="stylesheet" href="../css/danacord.css" type="text/css">
    <meta name="Description" content="Kim Sjøgren, violin">
    <meta name="Author" content="Danacord Records / Kurt Hansen">
    <meta name="Keywords" content="Danacord, Kim Sjøgren, classical,
music, classical music, violin, CD, records, Danacord Records">
    <meta name="Title" content="Kim Sjøgren, Recording list">
</head>
Skulle det ikke være godt nok?
Tak til begge. Ja, HTML-dokumentet var gemt i ISO-8859-1 ved en fejl. Nu
har jeg gemt den i UTF-8 og genuploaded den, men danske tegn vises
stadig ikke korrekt :-(
--
Venlig hilsen
Kurt Hansen
Kim Ludvigsen
2019-11-15 15:10:14 UTC
Permalink
Post by Kurt Hansen
Tak til begge. Ja, HTML-dokumentet var gemt i ISO-8859-1 ved en fejl. Nu
har jeg gemt den i UTF-8 og genuploaded den, men danske tegn vises
stadig ikke korrekt :-(
Enten har du ikke fået gemt eller uploaded korrekt, eller også er der en
cache-funktion, så den gamle version stadig vises. Hvis du i din browser
skifter tegnsæt for visningen til latin, vil ø'et blive vist korrekt,
hvilket indikerer, at teksten er gemt i latin eller lignende (fx
ISO-8859-1).
--
Mvh. Kim Ludvigsen
Kurt Hansen
2019-11-15 16:20:13 UTC
Permalink
Post by Kim Ludvigsen
Post by Kurt Hansen
Tak til begge. Ja, HTML-dokumentet var gemt i ISO-8859-1 ved en fejl.
Nu har jeg gemt den i UTF-8 og genuploaded den, men danske tegn vises
stadig ikke korrekt :-(
Enten har du ikke fået gemt eller uploaded korrekt, eller også er der en
cache-funktion, så den gamle version stadig vises. Hvis du i din browser
skifter tegnsæt for visningen til latin, vil ø'et blive vist korrekt,
hvilket indikerer, at teksten er gemt i latin eller lignende (fx
ISO-8859-1).
Jeg bruger Firefox 70.0.1 (64-bit) på Mac. Jeg har nu tømt cachen, men
det gør ingen forskel hos mig.

Jeg åbnede sjogren.html i en teksteditor (BBEdit). Den meddelte mig at
der var fejl i UTF-kodningen. Nu stod ø'et nemlig som en spørgsmålstegn
på hovedet. Jeg ændrede det til et rigtigt ø og så forsvandt
fejlmeddelelsen.

Linefeed (LF) står til Unix.

Jeg genuploadede filen, men det har ikke hjulpet.
https://www.danacord.dk/artists/sjogren.html
--
Venlig hilsen
Kurt Hansen
Kurt Hansen
2019-11-15 16:26:09 UTC
Permalink
Post by Kurt Hansen
Post by Kim Ludvigsen
Post by Kurt Hansen
Tak til begge. Ja, HTML-dokumentet var gemt i ISO-8859-1 ved en fejl.
Nu har jeg gemt den i UTF-8 og genuploaded den, men danske tegn vises
stadig ikke korrekt :-(
Enten har du ikke fået gemt eller uploaded korrekt, eller også er der
en cache-funktion, så den gamle version stadig vises. Hvis du i din
browser skifter tegnsæt for visningen til latin, vil ø'et blive vist
korrekt, hvilket indikerer, at teksten er gemt i latin eller lignende
(fx ISO-8859-1).
Jeg bruger Firefox 70.0.1 (64-bit) på Mac. Jeg har nu tømt cachen, men
det gør ingen forskel hos mig.
Jeg åbnede sjogren.html i en teksteditor (BBEdit). Den meddelte mig at
der var fejl i UTF-kodningen. Nu stod ø'et nemlig som en spørgsmålstegn
på hovedet. Jeg ændrede det til et rigtigt ø og så forsvandt
fejlmeddelelsen.
Linefeed (LF) står til Unix.
Jeg genuploadede filen, men det har ikke hjulpet.
https://www.danacord.dk/artists/sjogren.html
Nej, nu be'r jeg dem, fru Heilbundth. Det var åbenbart ikke godt nok at
ændre filen i BBEdit. Jeg åbnede den igen i min HTML-editor (Brackets)
og måtte konstatere at ø'et blev vist som en gnyf. Jeg rettede det til
et ø og genuploadede og NU vises det korrekt!!!
--
Venlig hilsen
Kurt Hansen
Kim Ludvigsen
2019-11-15 16:46:17 UTC
Permalink
Post by Kurt Hansen
Jeg bruger Firefox 70.0.1 (64-bit) på Mac. Jeg har nu tømt cachen, men
det gør ingen forskel hos mig.
Jeg mente en cache på serveren.
Post by Kurt Hansen
Jeg åbnede sjogren.html i en teksteditor (BBEdit). Den meddelte mig at
der var fejl i UTF-kodningen. Nu stod ø'et nemlig som en spørgsmålstegn
på hovedet. Jeg ændrede det til et rigtigt ø og så forsvandt
fejlmeddelelsen.
Linefeed (LF) står til Unix.
Linefeed er noget helt andet.
Post by Kurt Hansen
Jeg genuploadede filen, men det har ikke hjulpet.
Jeg kender ikke BBEdit, men jeg tror ikke, du har fået gemt i UTF-8. Du
skal sikkert ind og ændre en indstilling et sted, eller du skal vælge
det specifikt, når du gemmer filen. Men ellers kan du jo bruge Brackets,
som du efterfølgende har fundet ud af.
--
Mvh. Kim Ludvigsen
Kurt Hansen
2019-11-16 06:45:02 UTC
Permalink
Post by Kim Ludvigsen
Post by Kurt Hansen
Jeg bruger Firefox 70.0.1 (64-bit) på Mac. Jeg har nu tømt cachen, men
det gør ingen forskel hos mig.
Jeg mente en cache på serveren.
Aha, det ved jeg ikke hvordan man gør.
Post by Kim Ludvigsen
Post by Kurt Hansen
Jeg genuploadede filen, men det har ikke hjulpet.
Jeg kender ikke BBEdit, men jeg tror ikke, du har fået gemt i UTF-8. Du
skal sikkert ind og ændre en indstilling et sted, eller du skal vælge
det specifikt, når du gemmer filen. Men ellers kan du jo bruge Brackets,
som du efterfølgende har fundet ud af.
Jeg søgte og fandt en løsning. Lidt omstændigt, men da det kun er een
gang jeg skal gøre det, er det også okay.

Jeg har en mappe "Hjemmeside" med undermapper og i alt 3.184 html-filer.
Mange af dem er gamle og kodet i ISO-8859-1 fra dengang jeg kørte på
Windows.

"iconv -f original_charset -t utf-8 originalfile > newfile" gjorde
arbejdet i een mappe ad gangen, omend jeg måtte fifle lidt med syntaxen
og efterfølgende masseomdøbe alle de filer, der nu var kommet til at
hedde *.html2.
--
Venlig hilsen
Kurt Hansen
Kim Ludvigsen
2019-11-16 07:20:24 UTC
Permalink
Post by Kurt Hansen
Post by Kim Ludvigsen
Post by Kurt Hansen
Jeg bruger Firefox 70.0.1 (64-bit) på Mac. Jeg har nu tømt cachen,
men det gør ingen forskel hos mig.
Jeg mente en cache på serveren.
Aha, det ved jeg ikke hvordan man gør.
Det er noget webhotellet aktiverer. Nogle steder kan man få lov at slå
det fra, andre steder kan man ikke. Det kan være en drønirriterende
funktion, når man redigerer websider, fordi man ikke umiddelbart kan se
sine ændringer.
Post by Kurt Hansen
"iconv -f original_charset -t utf-8 originalfile > newfile" gjorde
arbejdet i een mappe ad gangen, omend jeg måtte fifle lidt med syntaxen
og efterfølgende masseomdøbe alle de filer, der nu var kommet til at
hedde *.html2.
OK, det gør det jo noget nemmere end at skulle lave ændringen manuelt,
og så kan du jo bare klare smutterne manuelt med Brackets, hvis der
skulle være flere.

Da jeg i sin tid skiftede til UFT-8 på mine sider, gjorde jeg det
manuelt ved at åbne filerne og så gemme dem i UFT-8, men der var
heldigvis ikke så mange sider, som du roder med.
--
Mvh. Kim Ludvigsen
Bertel Lund Hansen
2019-11-16 10:05:52 UTC
Permalink
Post by Kim Ludvigsen
Da jeg i sin tid skiftede til UFT-8 på mine sider, gjorde jeg det
manuelt ved at åbne filerne og så gemme dem i UFT-8, men der var
heldigvis ikke så mange sider, som du roder med.
Jeg brugte et program der gjorde det automatisk - blot for at
opdage at det filerne ikke var ægte utf-8. Så jeg måtte åbne dem
i Geany en ad gangen.
--
/Bertel
Kim Ludvigsen
2019-11-16 10:25:23 UTC
Permalink
Post by Bertel Lund Hansen
Post by Kim Ludvigsen
Da jeg i sin tid skiftede til UFT-8 på mine sider, gjorde jeg det
manuelt ved at åbne filerne og så gemme dem i UFT-8, men der var
heldigvis ikke så mange sider, som du roder med.
Jeg brugte et program der gjorde det automatisk - blot for at
opdage at det filerne ikke var ægte utf-8. Så jeg måtte åbne dem
i Geany en ad gangen.
Lyder som Kurts BBedit, der åbenbart også snyder. Jeg brugte også Geany
i sin tid. Det var nemt, fordi Geany automatisk lavede ændringen af
tegnene.

Det var straks værre i helt gamle dage, da man skulle ændre sine tekster
fra at bruge &aelig;
og &oslash;
og &aring; til æ, ø og å.
--
Mvh. Kim Ludvigsen
Bertel Lund Hansen
2019-11-16 10:42:47 UTC
Permalink
Post by Kim Ludvigsen
Det var straks værre i helt gamle dage, da man skulle ændre sine tekster
fra at bruge &aelig;
og &oslash;
og &aring; til æ, ø og å.
De koder har jeg aldrig brugt. Jeg gik direkte til de danske
bogstaver og har altid undret mig over at ikke alle gjorde det.

Selv &nbsp; brugte jeg sjældent. Det var kun når det var vigtigt
at man kunne se forskel fra mellemrum.
--
/Bertel
Kim Ludvigsen
2019-11-16 10:56:53 UTC
Permalink
Post by Bertel Lund Hansen
Post by Kim Ludvigsen
Det var straks værre i helt gamle dage, da man skulle ændre sine tekster
fra at bruge &aelig;
og &oslash;
og &aring; til æ, ø og å.
De koder har jeg aldrig brugt. Jeg gik direkte til de danske
bogstaver og har altid undret mig over at ikke alle gjorde det.
Problemet dengang var, at det så kun virkede korrekt på Windows. Jeg
brugte OS/2, så der blev man hurtigt klar over, at det var nødvendigt
med koderne - det samme var også gældende for Mac, så vidt jeg husker.
Post by Bertel Lund Hansen
Selv &nbsp; brugte jeg sjældent. Det var kun når det var vigtigt
at man kunne se forskel fra mellemrum.
Jeg bruger stadig &nbsp; nogle gange, når jeg vil undgå linjeombrydning
ved et mellemrum.
--
Mvh. Kim Ludvigsen
Bertel Lund Hansen
2019-11-16 11:24:09 UTC
Permalink
Post by Kim Ludvigsen
Post by Bertel Lund Hansen
Selv &nbsp; brugte jeg sjældent. Det var kun når det var vigtigt
at man kunne se forskel fra mellemrum.
Jeg bruger stadig &nbsp; nogle gange, når jeg vil undgå linjeombrydning
ved et mellemrum.
Jeg brugte skam hårdt mellemrum mange gange, men jeg skrev det
direkte. Det kan man desværre ikke i Geany. Der kan man slet ikke
skrive kodede tegn (Alt + num. tastatur).
--
/Bertel
Jan Hansen
2019-11-16 11:00:55 UTC
Permalink
Post by Kim Ludvigsen
Det var straks værre i helt gamle dage, da man skulle ændre sine tekster
fra at bruge &aelig;
og &oslash;
og &aring; til æ, ø og å.
Havde du ikke php dengang? Så er det vel ret simpelt.

$teksten = mb_convert_encoding($teksten,"UTF-8","HTML-ENTITIES");

Men bortset fra det så er det da ganske unødvendigt, &aelig; virker
stadigvæk i html5. Havde det været mere udbredt havde det ikke været
noget problem at fremvise gamle filer i nye smarte CMS.
--
mvh Jan.
Help Microsoft stamp out piracy. Give
Linux to a friend today!
Kim Ludvigsen
2019-11-16 11:23:19 UTC
Permalink
Post by Jan Hansen
Post by Kim Ludvigsen
Det var straks værre i helt gamle dage, da man skulle ændre sine tekster
fra at bruge &aelig;
og &oslash;
og &aring; til æ, ø og å.
Havde du ikke php dengang? Så er det vel ret simpelt.
Nej, det var flade HTML-filer.
Post by Jan Hansen
Men bortset fra det så er det da ganske unødvendigt, &aelig; virker
stadigvæk i html5. Havde det været mere udbredt havde det ikke været
noget problem at fremvise gamle filer i nye smarte CMS.
Måske, men det var ikke så kønt, når man selv skulle læse filerne lokalt
og evt. lave rettelser i dem. Jeg havde vist kun en enkelt hjemmeside
dengang, og det var ikke fordi, der var så forfærdeligt mange sider, så
det var en overskuelig opgave at ændre dem.
--
Mvh. Kim Ludvigsen
Loading...