Thread View: pl.comp.ogonki
4 messages
4 total messages
Started by admirau
Thu, 03 Jul 2008 02:31
deogonkizacja - tabele konwersji
Author: admirau
Date: Thu, 03 Jul 2008 02:31
Date: Thu, 03 Jul 2008 02:31
17 lines
452 bytes
452 bytes
Witam! Chcia³em sobie napisaæ programik, który obetnie z tekstu ogonki (znaki inne ni¿ ASCII). Ma zamieniaæ ± => a, á => a, ä => a, ê => e itd. Jest jaka¶ prosta regu³a jak to zamieniaæ? Jest jaka¶ zale¿no¶æ pomiêdzy tymi znakami? Czy gdzie¶ s± ju¿ takie gotowe tabele, czy trzeba samemu? Na razie to nawet nie wiem jakie ±gonki, haèki i inne ümlauty mog± siê trafiæ :) -- takeshin
Re: deogonkizacja - tabele konwersji
Author: Marcin Frankowsk
Date: Thu, 03 Jul 2008 22:38
Date: Thu, 03 Jul 2008 22:38
38 lines
1627 bytes
1627 bytes
Thu, 3 Jul 2008 02:31:25 -0700 (PDT), admirau <admirau@gmail.com> napisał(a): > Witam! > > Chciałem sobie napisać programik, który obetnie z tekstu ogonki (znaki > inne niż ASCII). > Ma zamieniać ą => a, á => a, ä => a, ę => e itd. > > Jest jakaś prosta reguła jak to zamieniać? Jest jakaś zależność > pomiędzy tymi znakami? Generalnie: nie ma. Do tego dochodzi problem, w jakim kodowaniu są te różne ogonki. Np. ą może być kodowane w unikodzie (znak nr 261), ISO-8859-2 (znak nr 177), Windows-1250 (znak nr 185) i wielu innych. BTW prawidłowa niemieckie umlauty na litery łacińskie konwertuje się zastępując daną literę z umlautem dwuznakiem, w którym pierwsza litera to bazowa litera łacińska, a druga to e (np. ä ⇒ ae). Fajnie by było, gdyby istniała taka konwencja dla polskich liter (ale na to mamy za dużo kryptopederastów, którzy za nic w świecie nie zrezygnują dobrowolnie z proszenia kolegów o zrobienie im laski pod pozorem braku polskich liter ;->). > Czy gdzieś są już takie gotowe tabele, czy trzeba samemu? Na razie to > nawet nie wiem jakie ągonki, hački i inne ümlauty mogą się trafić :) O tabeli nie słyszałem. Komplet znaków znajdziesz na <http://www.unicode.org/> i <http://www.eki.ee/letter/>, na <http://www.babelstone.co.uk/Software/BabelMap.html> jest fajny program dla Windows, może coś z tego Ci ułatwi zadanie. -- Marcin Frankowski mail: http://www.cerbermail.com/?GwMBsEhHr8 NIE w HTML! Na kłopoty z konfiguracją OE i z polskimi literami w poczcie, newsach i na www: http://konfiguracja.prv.pl/
Re: deogonkizacja - tabele konwersji
Author: Marcin Frankowsk
Date: Thu, 03 Jul 2008 23:06
Date: Thu, 03 Jul 2008 23:06
44 lines
2114 bytes
2114 bytes
Thu, 3 Jul 2008 02:31:25 -0700 (PDT), admirau <admirau@gmail.com> napisał(a): > Witam! > > Chciałem sobie napisać programik, który obetnie z tekstu ogonki (znaki > inne niż ASCII). > Ma zamieniać ą => a, á => a, ä => a, ę => e itd. > > Jest jakaś prosta reguła jak to zamieniać? Jest jakaś zależność > pomiędzy tymi znakami? Generalnie: nie ma. Do tego dochodzi problem, w jakim kodowaniu są te różne ogonki. Np. ą może być kodowane w unikodzie (znak nr 261), ISO-8859-2 (znak nr 177), Windows-1250 (znak nr 185) i wielu innych. BTW prawidłowo niemieckie umlauty na litery łacińskie konwertuje się zastępując daną literę z umlautem dwuznakiem, w którym pierwsza litera to bazowa litera łacińska, a druga to e (np. ä ⇒ ae), zaś ß to ss. Fajnie by było, gdyby istniała taka konwencja dla polskich liter (ale na to mamy za dużo kryptopederastów, którzy za nic w świecie dobrowolnie nie zrezygnują z proszenia kolegów o zrobienie im laski pod pozorem braku polskich liter ;->). BTW2 w angielskim czasem używa się ligatur æ i œ, które oczywiście konwertuje się na ae i oe (encyclopædia ⇒ encyclopaedia, œstrus ⇒ oestrus), z bidą można pominąć a lub o (encyclopædia ⇒ encyclopedia, œstrus ⇒ estrus), wtedy zmieniasz pisownię z brytyjskiej na amerykańską, ale spotykana czasem metoda zamiany æ ⇒ a i œ ⇒ o jest całkowicie błędna (w wyniku dostalibyśmy encyclopædia ⇒ encyclopadia, œstrus ⇒ ostrus - bez sensu). > Czy gdzieś są już takie gotowe tabele, czy trzeba samemu? Na razie to > nawet nie wiem jakie ągonki, hački i inne ümlauty mogą się trafić :) O tabeli nie słyszałem. Komplet znaków znajdziesz na <http://www.unicode.org/> i <http://www.eki.ee/letter/>, na <http://www.babelstone.co.uk/Software/BabelMap.html> jest fajny program dla Windows, może coś z tego Ci ułatwi zadanie. -- Marcin Frankowski mail: http://www.cerbermail.com/?GwMBsEhHr8 NIE w HTML! Na kłopoty z konfiguracją OE i z polskimi literami w poczcie, newsach i na www: http://konfiguracja.prv.pl/
Re: deogonkizacja - tabele konwersji
Author: admirau
Date: Fri, 04 Jul 2008 00:47
Date: Fri, 04 Jul 2008 00:47
14 lines
276 bytes
276 bytes
On 3 Lip, 13:06, Marcin Frankowski <a...@anti.spam.com.invalid> wrote: > Generalnie: nie ma. tego siê spodziewa³em :) > <http://www.eki.ee/letter/> > <http://www.babelstone.co.uk/Software/BabelMap.html> dziêki za linki, ciekawe rzeczy, a nie zna³em. -- takeshin
Thread Navigation
This is a paginated view of messages in the thread with full content displayed inline.
Messages are displayed in chronological order, with the original post highlighted in green.
Use pagination controls to navigate through all messages in large threads.
Back to All Threads