CP852


CP852 w encyklopedii

Z Wikipedii, wolnej encyklopedii Przejdź do nawigacji Przejdź do wyszukiwania

CP852 (Code page 852, CP 852, IBM 852, OEM 852, MS-DOS Latin 2, PC Latin 2, Slavic (Latin II)) – 8-bitowe kodowanie znaków stosowane w systemach operacyjnych MS-DOS, PC-DOS, DR-DOS i FreeDOS, w zamyśle mające zawierać znaki języków krajów Europy Wschodniej opartych na alfabecie łacińskim. Analogicznie jak w przypadku kodowania CP850, niektóre litery ze znakami diakrytycznymi zastąpiły niektóre istniejące w CP437 znaki semigrafiki i symbole matematyczne. Od czasu rozpowszechnienia się systemów operacyjnych Windows 3.x, a zwłaszcza Windows 95 i Windows NT 4.0, wykorzystujących kodowanie Windows-1250 i (w różnym stopniu) unikod, znaczenie kodowania CP852 zaczęło bardzo szybko maleć, choć nadal jest ono wykorzystywane w aplikacjach pisanych dla systemu operacyjnego DOS lub nieposiadających interfejsu graficznego (przeznaczonych do uruchamiania w oknie DOS względnie oknie konsoli), w tym programach księgowych, magazynowych itp.

Spis treści

Historia | edytuj kod

Strona kodowa CP852 po raz pierwszy pojawiła się w systemie MS-DOS w wersji 5.0, wydanej we wrześniu 1991 r.

Zestaw znaków | edytuj kod

Kodowanie CP852 zawiera litery ze znakami diakrytycznymi używane w następujących językach: albańskim, białoruskim (Łacinka), bośniackim, chorwackim, czeskim, irlandzkim, dolno- i górnołużyckim, niemieckim, polskim, rumuńskim (patrz poniżej), słowackim, słoweńskim, turkmeńskim i węgierskim.

Kodowanie to zostało zaprojektowane z myślą o możliwie najpełniejszym pokryciu języków dawnego bloku sowieckiego używających alfabetu łacińskiego. Wbrew jednej z nazw (kodowanie języków słowiańskich) zawiera litery używane w języku albańskim (należącym do grupy języków ilirskich), niemieckim (należącym do grupy języków germańskich), językiem rumuńskim (należącym do grupy języków romańskich) i węgierskim (należącym do grupy języków ugrofińskich), a nie pozwala na użycie z językami opartymi na cyrylicy. Nie zawiera wszystkich znaków używanych w poprawnej typografii języka rumuńskiego.

Braki znaków | edytuj kod

Kodowanie CP852 nie zawiera cudzysłowów używanych w typografii języków obsługiwanych przez to kodowanie (np. stosowanych w Polsce „ i ”). Brak również czterech znaków używanych w języku rumuńskim, pisanych z przecinkiem pod spodem:

  • 0x0218 LATIN CAPITAL LETTER S WITH COMMA BELOW
  • 0x0219 LATIN SMALL LETTER S WITH COMMA BELOW
  • 0x021A LATIN CAPITAL LETTER T WITH COMMA BELOW
  • 0x021B LATIN SMALL LETTER T WITH COMMA BELOW.

Przyjęto, że będą stosowane analogiczne litery z cedillą:

  • 0x015E LATIN CAPITAL LETTER S WITH CEDILLA
  • 0x015F LATIN SMALL LETTER S WITH CEDILLA
  • 0x0162 LATIN CAPITAL LETTER T WITH CEDILLA
  • 0x0163 LATIN SMALL LETTER T WITH CEDILLA

W czasach projektowania kodowania CP852 uznawano, że przecinek pod spodem jest typograficzną odmianą cedilli, nie osobnym znakiem diakrytycznym.

Tablica kodów | edytuj kod

ZK oznacza znak kontrolny

Mapowanie na unikod | edytuj kod

Poniższa tabela przedstawia kody Unicode znaków zawartych w stronie kodowej CP852. Tabela zawiera wyłącznie znaki z górnego zakresu (dolny zakres, czyli pozycje 0x00 ÷ 0x7F jest identyczny z ASCII. Wszystkie kody podane jako szesnastkowe.

Rozmieszczenie polskich znaków | edytuj kod

Różnice między kodowaniami MS-DOS CP852 a IBM CP852 | edytuj kod

Objaśnienia:

Bibliografia | edytuj kod

Na podstawie artykułu: "CP852" pochodzącego z Wikipedii
OryginałEdytujHistoria i autorzy