Ascii коды символов html

Таблица URL кодов символов кодировки ASCII

Кодирование URL конвертирует символы в формат, который можно безопасно передать в качестве URL-адреса ресурса через интернет.

URL — это Единый указатель ресурсов (англ. Uniform Resource Locator). Веб-браузеры запрашивают HTML-документы с сервера, используя URL-адрес.

URL — это адрес веб-страницы, например: http://www.wm-school.ru

Кодирование URL

URL-адрес ресурса отправляется в интернет в ASCII-кодировке.
Если в URL содержатся символы, не входящие в ASCII-кодировку, URL конвертируется. Перекодироваться должны буквы кириллицы, буквы с диакритическими знаками, лигатуры, иероглифы. Кодирование URL конвертирует этот адрес в ASCII формат.
Кодировщик URL заменяет небезопасные символы ASCII знаком (%), за которым следуют два шестнадцатиричных числа, которые соответствуют значениям символов из кодировки ISO-8859-1. URL не должен содержать пробелы. Кодировщик URL обычно заменяет пробелы знаком (%20).

URL-коды специальных (управляющих) символов

Первоначально управляющие символы таблицы ASCII (диапазон 00-31, плюс 127) были разработаны для того, чтобы управлять устройствами аппаратных средств, таких как телетайп, ввод данных на перфоленту и др.
Управляющие символы (кроме горизонтальной табуляции, перевода строки и возврата каретки) не используются в HTML-документах.

Таблица URL-кодов специальных (управляющих) символов

URL-коды символов ISO-Latin (диапазон 128-255)

Символы в диапазоне с 128 по 255 отводятся для специфических символов букв алфавитов западно-европейских языков, символов псевдографики, некоторых букв греческого алфавита, а также ряда математических и финансовых символов.

Читайте также:  Вывод элементов массива в питоне

URL-коды символов ISO-Latin (диапазон 128-255)

Зарезервированные символы

Зарезервированные символы — это специальные символы, такие как знак доллара, амперсанд, плюс, слэш, двоеточие, точка с запятой, знак равенства, знак вопроса, знак эт (собака). Все они могут иметь различные значения в URL, поэтому должны быть закодированы.

Таблица URL-кодов зарезервированных символов

Небезопасные символы

Небезопасные символы — это пробел, кавычки, знак меньше, знак больше, знак диез, знак проценты, фигурные скобки, прямой слэш, обратный слэш, тильда, квдратные скобки, гравис. Эти символы также должны всегда быть закодированы.

Источник

ASCII

ASCII (American Standard Code for Information Interchange) — код обмена информацией между компьютерами, разработанный в США в 1963 году. Этот код используется для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов в виде чисел (каждой букве сопоставлено число от 0 до 127). Современные системы кодировки, такие как ISO-8859 и UTF-8, разработаны на основе ASCII.

Печатные символы ASCII

ASCII символ HTML Entity Code Описание
пробел
! ! восклицательный знак
« " кавычка
# # знак номера
$ $ знак доллара
% % знак процента
& & амперсанд
' апостроф
( ( левая скобка
) ) правая скобка
* * звездочка
+ + знак плюс
, , запятая
- тире
. . точка
/ / слеш/косая черта
0 0 цифра 0
1 1 цифра 1
2 2 цифра 2
3 3 цифра 3
4 4 цифра 4
5 5 цифра 5
6 6 цифра 6
7 7 цифра 7
8 8 цифра 8
9 9 цифра 9
: : двоеточие
; ; точка с запятой
< меньше
= = равно
> > больше
? ? вопросительный знак
@ @ собачка
A A заглавная A
B B заглавная B
C C заглавная C
D D заглавная D
E E заглавная E
F F заглавная F
G G заглавная G
H H заглавная H
I I заглавная I
J J заглавная J
K K заглавная K
L L заглавная L
M M заглавная M
N N заглавная N
O O заглавная O
P P заглавная P
Q Q заглавная Q
R R заглавная R
S S заглавная S
T T заглавная T
U U заглавная U
V V заглавная V
W W заглавная W
X X заглавная X
Y Y заглавная Y
Z Z заглавная Z
[ [ левая квадратная скобка
\ \ обратная косая черта
] ] правая квадратная скобка
^ ^ каретка
_ _ подчеркивание
` ` гравис
a a строчная a
b b строчная b
c c строчная c
d d строчная d
e e строчная e
f f строчная f
g g строчная g
h h строчная h
i i строчная i
j j строчная j
k k строчная k
l l строчная l
m m строчная m
n n строчная n
o o строчная o
p p строчная p
q q строчная q
r r строчная r
s s строчная s
t t строчная t
u u строчная u
v v строчная v
w w строчная w
x x строчная x
y y строчная y
z z строчная z
{ левая фигурная скобка
| | вертикальная черта
> } правая фигурная скобка
~ ~ тильда

Таблица кодов управляющих символов ASCII

ASCII Character HTML Entity Code Description
NUL нуль
SOH  начало заголовка
STX  начало текста
ETX  конец текста
EOT  конец передачи
ENQ  запрос
ACK  подтверждение
BEL  сигнал (звонок)
BS  забой (шаг назад)
HT горизонтальная табуляция
LF перевод строки
VT вертикальная табуляция
FF новая страница
CR возврат каретки
SO  включить сдвиг
SI  выключить сдвиг
DLE  ключ связи данных
DC1  управление устройством 1
DC2  управление устройством 2
DC3  управление устройством 3
DC4  управление устройством 4
NAK  отрицательное подтверждение
SYN  синхронизация
ETB  конец передаваемого блока
CAN  отказ
EM  конец среды
SUB  замена
ESC  ключ
FS  разделитель файлов
GS  разделитель группы
RS  разделитель записей
US  разделитель модулей
DEL  удаление (rubout)

Источник

HTML ASCII Reference

ASCII was the first character set (encoding standard) used between computers on the Internet.

Both ISO-8859-1 (default in HTML 4.01) and UTF-8 (default in HTML5), are built on ASCII.

The ASCII Character Set

ASCII stands for the «American Standard Code for Information Interchange».

It was designed in the early 60’s, as a standard character set for computers and electronic devices.

ASCII is a 7-bit character set containing 128 characters.

It contains the numbers from 0-9, the upper and lower case English letters from A to Z, and some special characters.

The character sets used in modern computers, in HTML, and on the Internet, are all based on ASCII.

The following tables list the 128 ASCII characters and their equivalent number.

ASCII Printable Characters

Char Number Description
0 — 31 Control characters (see below)
32 space
! 33 exclamation mark
« 34 quotation mark
# 35 number sign
$ 36 dollar sign
% 37 percent sign
& 38 ampersand
39 apostrophe
( 40 left parenthesis
) 41 right parenthesis
* 42 asterisk
+ 43 plus sign
, 44 comma
45 hyphen
. 46 period
/ 47 slash
0 48 digit 0
1 49 digit 1
2 50 digit 2
3 51 digit 3
4 52 digit 4
5 53 digit 5
6 54 digit 6
7 55 digit 7
8 56 digit 8
9 57 digit 9
: 58 colon
; 59 semicolon
60 less-than
= 61 equals-to
> 62 greater-than
? 63 question mark
@ 64 at sign
A 65 uppercase A
B 66 uppercase B
C 67 uppercase C
D 68 uppercase D
E 69 uppercase E
F 70 uppercase F
G 71 uppercase G
H 72 uppercase H
I 73 uppercase I
J 74 uppercase J
K 75 uppercase K
L 76 uppercase L
M 77 uppercase M
N 78 uppercase N
O 79 uppercase O
P 80 uppercase P
Q 81 uppercase Q
R 82 uppercase R
S 83 uppercase S
T 84 uppercase T
U 85 uppercase U
V 86 uppercase V
W 87 uppercase W
X 88 uppercase X
Y 89 uppercase Y
Z 90 uppercase Z
[ 91 left square bracket
\ 92 backslash
] 93 right square bracket
^ 94 caret
_ 95 underscore
` 96 grave accent
a 97 lowercase a
b 98 lowercase b
c 99 lowercase c
d 100 lowercase d
e 101 lowercase e
f 102 lowercase f
g 103 lowercase g
h 104 lowercase h
i 105 lowercase i
j 106 lowercase j
k 107 lowercase k
l 108 lowercase l
m 109 lowercase m
n 110 lowercase n
o 111 lowercase o
p 112 lowercase p
q 113 lowercase q
r 114 lowercase r
s 115 lowercase s
t 116 lowercase t
u 117 lowercase u
v 118 lowercase v
w 119 lowercase w
x 120 lowercase x
y 121 lowercase y
z 122 lowercase z
123 left curly brace
| 124 vertical bar
> 125 right curly brace
~ 126 tilde

ASCII Device Control Characters

The ASCII control characters (range 00-31, plus 127) were designed to control hardware devices.

Control characters (except horizontal tab, line feed, and carriage return) have nothing to do inside an HTML document.

Char Number Description
NUL 00 null character
SOH 01 start of header
STX 02 start of text
ETX 03 end of text
EOT 04 end of transmission
ENQ 05 enquiry
ACK 06 acknowledge
BEL 07 bell (ring)
BS 08 backspace
HT 09 horizontal tab
LF 10 line feed
VT 11 vertical tab
FF 12 form feed
CR 13 carriage return
SO 14 shift out
SI 15 shift in
DLE 16 data link escape
DC1 17 device control 1
DC2 18 device control 2
DC3 19 device control 3
DC4 20 device control 4
NAK 21 negative acknowledge
SYN 22 synchronize
ETB 23 end transmission block
CAN 24 cancel
EM 25 end of medium
SUB 26 substitute
ESC 27 escape
FS 28 file separator
GS 29 group separator
RS 30 record separator
US 31 unit separator
DEL 127 delete (rubout)

Источник

Оцените статью