🚀 go-pugleaf

RetroBBS NetNews Server

Inspired by RockSolid Light RIP Retro Guy

4 total messages Started by admirau Thu, 03 Jul 2008 02:31
deogonkizacja - tabele konwersji
#18632
Author: admirau
Date: Thu, 03 Jul 2008 02:31
17 lines
452 bytes
Witam!

Chcia³em sobie napisaæ programik, który obetnie z tekstu ogonki (znaki
inne ni¿ ASCII).
Ma zamieniaæ ± => a, á => a, ä => a, ê => e itd.

Jest jaka¶ prosta regu³a jak to zamieniaæ? Jest jaka¶ zale¿no¶æ
pomiêdzy tymi znakami?
Czy gdzie¶ s± ju¿ takie gotowe tabele, czy trzeba samemu? Na razie to
nawet nie wiem jakie ±gonki, haèki i inne ümlauty mog± siê trafiæ :)

--
takeshin

Re: deogonkizacja - tabele konwersji
#18633
Author: Marcin Frankowsk
Date: Thu, 03 Jul 2008 22:38
38 lines
1627 bytes
Thu, 3 Jul 2008 02:31:25 -0700 (PDT), admirau <admirau@gmail.com>
napisał(a):

> Witam!
>
> Chciałem sobie napisać programik, który obetnie z tekstu ogonki (znaki
> inne niż ASCII).
> Ma zamieniać ą => a, á => a, ä => a, ę => e itd.
>
> Jest jakaś prosta reguła jak to zamieniać? Jest jakaś zależność
> pomiędzy tymi znakami?

Generalnie: nie ma. Do tego dochodzi problem, w jakim kodowaniu są te
różne ogonki. Np. ą może być kodowane w unikodzie (znak nr 261),
ISO-8859-2 (znak nr 177), Windows-1250 (znak nr 185) i wielu innych.

BTW prawidłowa niemieckie umlauty na litery łacińskie konwertuje się
zastępując daną literę z umlautem dwuznakiem, w którym pierwsza litera
to bazowa litera łacińska, a druga to e (np. ä ⇒ ae). Fajnie by było,
gdyby istniała taka konwencja dla polskich liter (ale na to mamy za
dużo kryptopederastów, którzy za nic w świecie nie zrezygnują
dobrowolnie z proszenia kolegów o zrobienie im laski pod pozorem braku
polskich liter ;->).

> Czy gdzieś są już takie gotowe tabele, czy trzeba samemu? Na razie to
> nawet nie wiem jakie ągonki, hački i inne ümlauty mogą się trafić :)

O tabeli nie słyszałem. Komplet znaków znajdziesz na
<http://www.unicode.org/> i <http://www.eki.ee/letter/>, na
<http://www.babelstone.co.uk/Software/BabelMap.html> jest fajny program
dla Windows, może coś z tego Ci ułatwi zadanie.

--
                     Marcin Frankowski
   mail: http://www.cerbermail.com/?GwMBsEhHr8 NIE w HTML!
Na kłopoty z konfiguracją OE i z polskimi literami w poczcie,
        newsach i na www: http://konfiguracja.prv.pl/

Re: deogonkizacja - tabele konwersji
#18634
Author: Marcin Frankowsk
Date: Thu, 03 Jul 2008 23:06
44 lines
2114 bytes
Thu, 3 Jul 2008 02:31:25 -0700 (PDT), admirau <admirau@gmail.com>
napisał(a):

> Witam!
>
> Chciałem sobie napisać programik, który obetnie z tekstu ogonki (znaki
> inne niż ASCII).
> Ma zamieniać ą => a, á => a, ä => a, ę => e itd.
>
> Jest jakaś prosta reguła jak to zamieniać? Jest jakaś zależność
> pomiędzy tymi znakami?

Generalnie: nie ma. Do tego dochodzi problem, w jakim kodowaniu są te
różne ogonki. Np. ą może być kodowane w unikodzie (znak nr 261),
ISO-8859-2 (znak nr 177), Windows-1250 (znak nr 185) i wielu innych.

BTW prawidłowo niemieckie umlauty na litery łacińskie konwertuje się
zastępując daną literę z umlautem dwuznakiem, w którym pierwsza litera
to bazowa litera łacińska, a druga to e (np. ä ⇒ ae), zaś ß to ss.
Fajnie by było, gdyby istniała taka konwencja dla polskich liter (ale
na to mamy za dużo kryptopederastów, którzy za nic w świecie
dobrowolnie nie zrezygnują z proszenia kolegów o zrobienie im laski pod
pozorem braku polskich liter ;->). BTW2 w angielskim czasem używa się
ligatur æ i œ, które oczywiście konwertuje się na ae i oe (encyclopædia
⇒ encyclopaedia, œstrus ⇒ oestrus), z bidą można pominąć a lub o
(encyclopædia ⇒ encyclopedia, œstrus ⇒ estrus), wtedy zmieniasz
pisownię z brytyjskiej na amerykańską, ale spotykana czasem metoda
zamiany æ ⇒ a i œ ⇒ o jest całkowicie błędna (w wyniku dostalibyśmy
encyclopædia ⇒ encyclopadia, œstrus ⇒ ostrus - bez sensu).

> Czy gdzieś są już takie gotowe tabele, czy trzeba samemu? Na razie to
> nawet nie wiem jakie ągonki, hački i inne ümlauty mogą się trafić :)

O tabeli nie słyszałem. Komplet znaków znajdziesz na
<http://www.unicode.org/> i <http://www.eki.ee/letter/>, na
<http://www.babelstone.co.uk/Software/BabelMap.html> jest fajny program
dla Windows, może coś z tego Ci ułatwi zadanie.

--
                     Marcin Frankowski
   mail: http://www.cerbermail.com/?GwMBsEhHr8 NIE w HTML!
Na kłopoty z konfiguracją OE i z polskimi literami w poczcie,
        newsach i na www: http://konfiguracja.prv.pl/

Re: deogonkizacja - tabele konwersji
#18635
Author: admirau
Date: Fri, 04 Jul 2008 00:47
14 lines
276 bytes
On 3 Lip, 13:06, Marcin Frankowski <a...@anti.spam.com.invalid> wrote:

> Generalnie: nie ma.

tego siê spodziewa³em :)

> <http://www.eki.ee/letter/>
> <http://www.babelstone.co.uk/Software/BabelMap.html>

dziêki za linki, ciekawe rzeczy, a nie zna³em.

--
takeshin

Thread Navigation

This is a paginated view of messages in the thread with full content displayed inline.

Messages are displayed in chronological order, with the original post highlighted in green.

Use pagination controls to navigate through all messages in large threads.

Back to All Threads