- Таблица URL кодов символов кодировки ASCII
- Кодирование URL
- URL-коды специальных (управляющих) символов
- Таблица URL-кодов специальных (управляющих) символов
- URL-коды символов ISO-Latin (диапазон 128-255)
- URL-коды символов ISO-Latin (диапазон 128-255)
- Зарезервированные символы
- Таблица URL-кодов зарезервированных символов
- Небезопасные символы
- ASCII
- Печатные символы ASCII
- HTML ASCII Reference
- The ASCII Character Set
- ASCII Printable Characters
- ASCII Device Control Characters
Таблица URL кодов символов кодировки ASCII
Кодирование URL конвертирует символы в формат, который можно безопасно передать в качестве URL-адреса ресурса через интернет.
URL — это Единый указатель ресурсов (англ. Uniform Resource Locator). Веб-браузеры запрашивают HTML-документы с сервера, используя URL-адрес.
URL — это адрес веб-страницы, например: http://www.wm-school.ru
Кодирование URL
URL-адрес ресурса отправляется в интернет в ASCII-кодировке.
Если в URL содержатся символы, не входящие в ASCII-кодировку, URL конвертируется. Перекодироваться должны буквы кириллицы, буквы с диакритическими знаками, лигатуры, иероглифы. Кодирование URL конвертирует этот адрес в ASCII формат.
Кодировщик URL заменяет небезопасные символы ASCII знаком (%), за которым следуют два шестнадцатиричных числа, которые соответствуют значениям символов из кодировки ISO-8859-1. URL не должен содержать пробелы. Кодировщик URL обычно заменяет пробелы знаком (%20).
URL-коды специальных (управляющих) символов
Первоначально управляющие символы таблицы ASCII (диапазон 00-31, плюс 127) были разработаны для того, чтобы управлять устройствами аппаратных средств, таких как телетайп, ввод данных на перфоленту и др.
Управляющие символы (кроме горизонтальной табуляции, перевода строки и возврата каретки) не используются в HTML-документах.
Таблица URL-кодов специальных (управляющих) символов
URL-коды символов ISO-Latin (диапазон 128-255)
Символы в диапазоне с 128 по 255 отводятся для специфических символов букв алфавитов западно-европейских языков, символов псевдографики, некоторых букв греческого алфавита, а также ряда математических и финансовых символов.
URL-коды символов ISO-Latin (диапазон 128-255)
Зарезервированные символы
Зарезервированные символы — это специальные символы, такие как знак доллара, амперсанд, плюс, слэш, двоеточие, точка с запятой, знак равенства, знак вопроса, знак эт (собака). Все они могут иметь различные значения в URL, поэтому должны быть закодированы.
Таблица URL-кодов зарезервированных символов
Небезопасные символы
Небезопасные символы — это пробел, кавычки, знак меньше, знак больше, знак диез, знак проценты, фигурные скобки, прямой слэш, обратный слэш, тильда, квдратные скобки, гравис. Эти символы также должны всегда быть закодированы.
ASCII
ASCII (American Standard Code for Information Interchange) — код обмена информацией между компьютерами, разработанный в США в 1963 году. Этот код используется для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов в виде чисел (каждой букве сопоставлено число от 0 до 127). Современные системы кодировки, такие как ISO-8859 и UTF-8, разработаны на основе ASCII.
Печатные символы ASCII
ASCII символ | HTML Entity Code | Описание |
---|---|---|
пробел | ||
! | ! | восклицательный знак |
« | " | кавычка |
# | # | знак номера |
$ | $ | знак доллара |
% | % | знак процента |
& | & | амперсанд |
‘ | ' | апостроф |
( | ( | левая скобка |
) | ) | правая скобка |
* | * | звездочка |
+ | + | знак плюс |
, | , | запятая |
— | - | тире |
. | . | точка |
/ | / | слеш/косая черта |
0 | 0 | цифра 0 |
1 | 1 | цифра 1 |
2 | 2 | цифра 2 |
3 | 3 | цифра 3 |
4 | 4 | цифра 4 |
5 | 5 | цифра 5 |
6 | 6 | цифра 6 |
7 | 7 | цифра 7 |
8 | 8 | цифра 8 |
9 | 9 | цифра 9 |
: | : | двоеточие |
; | ; | точка с запятой |
< | меньше | |
= | = | равно |
> | > | больше |
? | ? | вопросительный знак |
@ | @ | собачка |
A | A | заглавная A |
B | B | заглавная B |
C | C | заглавная C |
D | D | заглавная D |
E | E | заглавная E |
F | F | заглавная F |
G | G | заглавная G |
H | H | заглавная H |
I | I | заглавная I |
J | J | заглавная J |
K | K | заглавная K |
L | L | заглавная L |
M | M | заглавная M |
N | N | заглавная N |
O | O | заглавная O |
P | P | заглавная P |
Q | Q | заглавная Q |
R | R | заглавная R |
S | S | заглавная S |
T | T | заглавная T |
U | U | заглавная U |
V | V | заглавная V |
W | W | заглавная W |
X | X | заглавная X |
Y | Y | заглавная Y |
Z | Z | заглавная Z |
[ | [ | левая квадратная скобка |
\ | \ | обратная косая черта |
] | ] | правая квадратная скобка |
^ | ^ | каретка |
_ | _ | подчеркивание |
` | ` | гравис |
a | a | строчная a |
b | b | строчная b |
c | c | строчная c |
d | d | строчная d |
e | e | строчная e |
f | f | строчная f |
g | g | строчная g |
h | h | строчная h |
i | i | строчная i |
j | j | строчная j |
k | k | строчная k |
l | l | строчная l |
m | m | строчная m |
n | n | строчная n |
o | o | строчная o |
p | p | строчная p |
q | q | строчная q |
r | r | строчная r |
s | s | строчная s |
t | t | строчная t |
u | u | строчная u |
v | v | строчная v |
w | w | строчная w |
x | x | строчная x |
y | y | строчная y |
z | z | строчная z |
{ | левая фигурная скобка | |
| | | | вертикальная черта |
> | } | правая фигурная скобка |
~ | ~ | тильда |
Таблица кодов управляющих символов ASCII
ASCII Character | HTML Entity Code | Description |
---|---|---|
NUL | нуль | |
SOH | начало заголовка | |
STX | начало текста | |
ETX | конец текста | |
EOT | конец передачи | |
ENQ | запрос | |
ACK | подтверждение | |
BEL | сигнал (звонок) | |
BS | забой (шаг назад) | |
HT | горизонтальная табуляция | |
LF | перевод строки | |
VT | вертикальная табуляция | |
FF | новая страница | |
CR | возврат каретки | |
SO | включить сдвиг | |
SI | выключить сдвиг | |
DLE | ключ связи данных | |
DC1 | управление устройством 1 | |
DC2 | управление устройством 2 | |
DC3 | управление устройством 3 | |
DC4 | управление устройством 4 | |
NAK | отрицательное подтверждение | |
SYN | синхронизация | |
ETB | конец передаваемого блока | |
CAN | отказ | |
EM | конец среды | |
SUB | замена | |
ESC | ключ | |
FS | разделитель файлов | |
GS | разделитель группы | |
RS | разделитель записей | |
US | разделитель модулей | |
DEL | | удаление (rubout) |
HTML ASCII Reference
ASCII was the first character set (encoding standard) used between computers on the Internet.
Both ISO-8859-1 (default in HTML 4.01) and UTF-8 (default in HTML5), are built on ASCII.
The ASCII Character Set
ASCII stands for the «American Standard Code for Information Interchange».
It was designed in the early 60’s, as a standard character set for computers and electronic devices.
ASCII is a 7-bit character set containing 128 characters.
It contains the numbers from 0-9, the upper and lower case English letters from A to Z, and some special characters.
The character sets used in modern computers, in HTML, and on the Internet, are all based on ASCII.
The following tables list the 128 ASCII characters and their equivalent number.
ASCII Printable Characters
Char | Number | Description |
---|---|---|
0 — 31 | Control characters (see below) | |
32 | space | |
! | 33 | exclamation mark |
« | 34 | quotation mark |
# | 35 | number sign |
$ | 36 | dollar sign |
% | 37 | percent sign |
& | 38 | ampersand |
‘ | 39 | apostrophe |
( | 40 | left parenthesis |
) | 41 | right parenthesis |
* | 42 | asterisk |
+ | 43 | plus sign |
, | 44 | comma |
— | 45 | hyphen |
. | 46 | period |
/ | 47 | slash |
0 | 48 | digit 0 |
1 | 49 | digit 1 |
2 | 50 | digit 2 |
3 | 51 | digit 3 |
4 | 52 | digit 4 |
5 | 53 | digit 5 |
6 | 54 | digit 6 |
7 | 55 | digit 7 |
8 | 56 | digit 8 |
9 | 57 | digit 9 |
: | 58 | colon |
; | 59 | semicolon |
60 | less-than | |
= | 61 | equals-to |
> | 62 | greater-than |
? | 63 | question mark |
@ | 64 | at sign |
A | 65 | uppercase A |
B | 66 | uppercase B |
C | 67 | uppercase C |
D | 68 | uppercase D |
E | 69 | uppercase E |
F | 70 | uppercase F |
G | 71 | uppercase G |
H | 72 | uppercase H |
I | 73 | uppercase I |
J | 74 | uppercase J |
K | 75 | uppercase K |
L | 76 | uppercase L |
M | 77 | uppercase M |
N | 78 | uppercase N |
O | 79 | uppercase O |
P | 80 | uppercase P |
Q | 81 | uppercase Q |
R | 82 | uppercase R |
S | 83 | uppercase S |
T | 84 | uppercase T |
U | 85 | uppercase U |
V | 86 | uppercase V |
W | 87 | uppercase W |
X | 88 | uppercase X |
Y | 89 | uppercase Y |
Z | 90 | uppercase Z |
[ | 91 | left square bracket |
\ | 92 | backslash |
] | 93 | right square bracket |
^ | 94 | caret |
_ | 95 | underscore |
` | 96 | grave accent |
a | 97 | lowercase a |
b | 98 | lowercase b |
c | 99 | lowercase c |
d | 100 | lowercase d |
e | 101 | lowercase e |
f | 102 | lowercase f |
g | 103 | lowercase g |
h | 104 | lowercase h |
i | 105 | lowercase i |
j | 106 | lowercase j |
k | 107 | lowercase k |
l | 108 | lowercase l |
m | 109 | lowercase m |
n | 110 | lowercase n |
o | 111 | lowercase o |
p | 112 | lowercase p |
q | 113 | lowercase q |
r | 114 | lowercase r |
s | 115 | lowercase s |
t | 116 | lowercase t |
u | 117 | lowercase u |
v | 118 | lowercase v |
w | 119 | lowercase w |
x | 120 | lowercase x |
y | 121 | lowercase y |
z | 122 | lowercase z |
123 | left curly brace | |
| | 124 | vertical bar |
> | 125 | right curly brace |
~ | 126 | tilde |
ASCII Device Control Characters
The ASCII control characters (range 00-31, plus 127) were designed to control hardware devices.
Control characters (except horizontal tab, line feed, and carriage return) have nothing to do inside an HTML document.
Char | Number | Description |
---|---|---|
NUL | 00 | null character |
SOH | 01 | start of header |
STX | 02 | start of text |
ETX | 03 | end of text |
EOT | 04 | end of transmission |
ENQ | 05 | enquiry |
ACK | 06 | acknowledge |
BEL | 07 | bell (ring) |
BS | 08 | backspace |
HT | 09 | horizontal tab |
LF | 10 | line feed |
VT | 11 | vertical tab |
FF | 12 | form feed |
CR | 13 | carriage return |
SO | 14 | shift out |
SI | 15 | shift in |
DLE | 16 | data link escape |
DC1 | 17 | device control 1 |
DC2 | 18 | device control 2 |
DC3 | 19 | device control 3 |
DC4 | 20 | device control 4 |
NAK | 21 | negative acknowledge |
SYN | 22 | synchronize |
ETB | 23 | end transmission block |
CAN | 24 | cancel |
EM | 25 | end of medium |
SUB | 26 | substitute |
ESC | 27 | escape |
FS | 28 | file separator |
GS | 29 | group separator |
RS | 30 | record separator |
US | 31 | unit separator |
DEL | 127 | delete (rubout) |