Meta Charset= Utf-8 Là Gì, Sự Khác Biệt Giữa Utf | Bostonenglish.edu.vn

Meta charset= utf-8 là gì? Tại sao nó lại quan trọng?

Đã bao giờ bạn đã nghe tới cụm từ meta charset= utf-8? Nếu đang cần tìm hiểu meta charset= utf-8 cũng như tầm quan trọng của nó thì đừng bỏ qua bài viết sau nhé!

charset là gì

charset là gì

Bạn đang xem: Meta Charset= Utf-8 Là Gì?

1. Thẻ meta là gì?

Trước khi tìm hiểu về meta charset= utf-8, bạn cần hiểu rõ các khái niệm liên quan đến thẻ Meta.

Bạn đang xem: Meta charset= utf-8 là gì

Thẻ meta hiểu đơn giản là dòng mã đặt ở phần đầu trang html. Nhiệm vụ của thẻ meta là để trình duyệt, các công cụ tìm kiếm hiểu được nội dung trang. Các thẻ meta này có thể là thẻ meta tiêu đề, mô tả, ngôn ngữ, tác giả…

Chỉ các công cụ tìm kiếm, trình duyệt mới có thể đọc và hiểu được nội dung của thẻ meta. Và thẻ meta hoàn toàn không hiển thị lên màn hình cho người dùng thấy.

Thẻ meta có bốn thuộc tính cơ bản sau:

– Meta charset: Đây là thuộc tính giúp xác định kiểu mã hóa ký tự của trang web. Và meta charset= utf-8 thuộc nhóm này.

– Meta name: Đây là thuộc tính giúp xác định “tên của một loại thông tin” mà người dùng muốn cung cấp thêm cho trang web.

– Meta http-equiv: Đây là thuộc tính giúp xác định việc tải lại trang.

– Meta content: Đây là nhóm xác định nội dung của loại thông tin người dùng sẽ cung cấp cho các công cụ tìm kiếm và trình duyệt.

Ví dụ các thẻ meta sau:

Thẻ meta hiểu đơn giản là dòng mã đặt ở phần đầu trang html.

Bảng mã ký tự là gì? Charset là gì?

ASCII là bảng mã ký tự (còn gọi là charset) chuẩn đầu tiên trên thế giới. Nó bao gồm 127 ký tự chữ và số khác nhau có thể sử dụng được trên Internet.

ASCII bao gồm các số (0-9), ký tự Tiếng Anh (A-Z) và một số ký tự đặc biệt như: ! $ + – ( ) @ < > .

ANSI (Windows-1252) là bảng mã ký tự windows nguyên bản, hỗ trợ tới 256 mã ký tự khác nhau.

ISO-8859-1 là bảng mã ký tự mặc định cho HTML 4, hỗ trợ 256 mã ký tự khác nhau.

Bởi vì bảng mã ANSI và ISO bị giới hạn nên UTF-8 được lựa chọn là bảng mã mặc định trong HTML5.

UTF-8 (Unicode) bao gồm hầu như tất cả các ký tự và các ký hiệu trên thế giới.

Meta charset= utf-8 là gì?

Để nội dung trang HTML hiển thị đúng quy cách, trình duyệt web cần phải biết sử dụng bộ mã hóa ký tự nào. Để có thể xác định bộ việc trình duyệt hiển thị trang HTML bằng bộ ký tự nào, bạn sẽ cần xác định qua thẻ meta charset. Và nếu website có thì chứng tỏ kiểu mã hóa ký tự của trang chính là UTF8.

Định nghĩa chính xác hơn, UTF- 8 là một bộ mã hóa các ngôn ngữ về một chuẩn chung. Và UTF-8 được hiểu là một kiểu mã hóa ký tự của Unicode. Trong đó, Unicode là bảng mã chứa gần như toàn bộ các kí tự của hầu hết các ngôn ngữ trên toàn cầu.

Xem thêm: Dân Sự Là Gì

See also  Địa Chỉ Trung Tâm Bảo Hành Hp 37 Tú Xương, Hp Việt Nam Triển Khai Dịch Vụ Bảo Hành Toàn Diện | Bostonenglish.edu.vn

UTF-8 được thiết kế để tương thích ngược với chuẩn mã hóa ASCII*. Đồng thời, tránh những nhược điểm của UTF-16 và UTF-32. Hiện tại, UTF-8 đã trở thành kiểu mã hóa phổ biến nhất. Bằng chứng là hơn một nửa số trang web hiện tại sử dụng kiểu mã hóa UTF-8.

*ASCII thực tế là bộ ký tự và bộ mã ký tự dựa trên bảng chữ cái La Tinh. Mã hóa ASCII thường được dùng để hiển thị văn bản trong máy tính và các thiết bị thông tin khác. Bảng mã ASCII chuẩn có 128 ký tự, trong khi bảng mã ASCII mở rộng có 256 ký tự. Trong số 256 ký tự này có 128 ký tự trong mã ASCII chuẩn, số còn lại là các chữ có dấu, các phép toán, và các ký tự để trang trí.

Sự phát triển nhanh chóng của UTF-8 trong những năm gần đây.

Thuộc tính charset trong HTML

Để có thể hiển thị trang HTML một cách chuẩn xác, bạn phải cung cấp cho trình duyệt biết bảng mã ký tự mà bạn đang sử dụng bằng cách dùng thẻ <meta>.

Trong HTML4

Trong HTML5

Tại sao nó lại quan trọng?

Là một bộ mã ký tự có chiều rộng biến thiên dành cho Unicode, UTF-8 giúp biểu diễn tất cả các chữ cái trong bộ ký tự Unicode. Tuy nhiên, có một điểm đặc biệt ở UTF-8. Đó là nó có thể tương thích ngược với bộ mã hóa ASCII. Chính vì vậy, nó đóng vai trò quan trọng trong việc hiển thị thông tin.

Cúng chính vì lý do này mà UTF-8 trở thành bộ mã hóa thống trị trong hầu hết các tập tin, trang web, thư điện tử, phần mềm xử lý văn bản…

UTF-8 cũng vô cùng quan trọng bởi nhóm đặc trách kỹ thuật Inte(IETF) đã quy định nó phải có mặt trong bộ mã hóa dùng trong dữ liệu ký tự.

Ngoài ra, Liên minh Thư tín Inte( IMC) cũng đưa ra khuyến cáo rằng mọi chương trình thư điện tử phải hiển thị và tạo được thư bằng UTF-8.

Ngoài ra, việc tương thích với chuẩn ASCII khiến UTF-8 có nhiều lợi thế khi sử dụng hỗ trợ unicode dựa vào các phần mềm sẵn có.

Để tạo ra bộ mã hóa UTF-8, người ta dùng các hàm có sẵn trong ngôn ngữ lập trình. Điều này giúp tiết kiệm thời gian cũng như đơn giản trong cách thức thực hiện. Ngoài ra, với cách mã hóa của UTF-8, bạn sẽ không mất nhiều không gian để lưu trữ.

UTF-8 trở thành bộ mã hóa thống trị trong hầu hết các tập tin.

Sự khác nhau giữa các bảng mã

Bảng so sánh dưới đây sẽ cho bạn thấy sự khác biệt giữa các bảng mã đã được nêu tên ở trên:

Số ASCII ANSI 8859 UTF-8 Miêu tả
32 dấu cách
33 ! ! ! ! chấm than
34 nháy kép
35 # # # # thăng
36 $ $ $ $ dollar
37 % % % % phần trăm
38 & & & & dấu và
39 nháy đơn
40 ( ( ( ( ngoặc trái
41 ) ) ) ) ngoặc phải
42 * * * * hoa thị
43 + + + + dấu cộng
44 , , , , dấu phảy
45 dấu trừ
46 . . . . dấu chấm
47 / / / / gạch chéo
48 số 0
49 1 1 1 1 số 1
50 2 2 2 2 số 2
51 3 3 3 3 số 3
52 4 4 4 4 số 4
53 5 5 5 5 số 5
54 6 6 6 6 số 6
55 7 7 7 7 số 7
56 8 8 8 8 số 8
57 9 9 9 9 số 9
58 : : : : hai chấm
59 ; ; ; ; chấm phảy
60 < < < < nhỏ hơn
61 = = = = bằng
62 > > > > lớn hơn
63 ? ? ? ? hỏi chấm
64 @ @ @ @ tại
65 A A A A A hoa
66 B B B B B hoa
67 C C C C C hoa
68 D D D D D hoa
69 E E E E E hoa
70 F F F F F hoa
71 G G G G G hoa
72 H H H H H hoa
73 I I I I I hoa
74 J J J J J hoa
75 K K K K K hoa
76 L L L L L hoa
77 M M M M M hoa
78 N N N N N hoa
79 O O O O O hoa
80 P P P P P hoa
81 Q Q Q Q Q hoa
82 R R R R R hoa
83 S S S S S hoa
84 T T T T T hoa
85 U U U U U hoa
86 V V V V V hoa
87 W W W W W hoa
88 X X X X X hoa
89 Y Y Y Y Y hoa
90 Z Z Z Z Z hoa
91 [ [ [ [ ngoặc vuông trái
92 \ \ \ \ gạch ngược
93 ] ] ] ] ngoặc vuông phải
94 ^ ^ ^ ^ dấu mũ
95 _ _ _ _ gạch dưới
96 ` ` ` ` dấu huyền
97 a a a a a nhỏ
98 b b b b b nhỏ
99 c c c c c nhỏ
100 d d d d d nhỏ
101 e e e e e nhỏ
102 f f f f f nhỏ
103 g g g g g nhỏ
104 h h h h h nhỏ
105 i i i i i nhỏ
106 j j j j j nhỏ
107 k k k k k nhỏ
108 l l l l l nhỏ
109 m m m m m nhỏ
110 n n n n n nhỏ
111 o o o o o nhỏ
112 p p p p p nhỏ
113 q q q q q nhỏ
114 r r r r r nhỏ
115 s s s s s nhỏ
116 t t t t t nhỏ
117 u u u u u nhỏ
118 v v v v v nhỏ
119 w w w w w nhỏ
120 x x x x x nhỏ
121 y y y y y nhỏ
122 z z z z z nhỏ
123 { { { { ngoặc nhọn trái
124 | | | | gạch đứng
125 } } } } ngoặc nhọn phải
126 ~ ~ ~ ~ dấu ngã
127 DEL
128 euro
129 Không sử dụng
130 ngoặc đơn dưới
131 ƒ f nhỏ có móc
132 ngoặc kép dưới
133 chấm lửng
134 chữ thập
135 chữ thập kép
136 ˆ dấu mũ cách điệu
137 phần nghìn
138 Š S hoa có dấu mũ ngược
139 nháy đơn chỉ bên trái
140 Œ chữ OE ghép hoa
141 không sử dụng
142 Ž Z hoa có dấu mũ ngược
143 không sử dụng
144 không sử dụng
145 nháy đơn bên trái
146 nháy đơn bên phải
147 nháy kép bên trái
148 nháy kép bên phải
149 chấm giữa dòng
150 gạch ngang
151 gạch ngang dài
152 ˜ dấu ngã nhỏ
153 thương hiệu
154 š s nhỏ có dấu mũ ngược
155 nháy đơn chỉ bên phải
156 œ chữ OE ghép nhỏ
157 không sử dụng
158 ž z nhỏ có dấu mũ ngược
159 Ÿ Y hoa có dấu tách âm
160 dấu cách
161 ¡ ¡ ¡ dấu chấm than ngược
162 ¢ ¢ ¢ xu
163 £ £ £ Bảng Anh
164 ¤ ¤ ¤ tiền tệ
165 ¥ ¥ ¥ Yên Nhật
166 ¦ ¦ ¦ gạch đứng gãy
167 § § § mục
168 ¨ ¨ ¨ dấu tách âm
169 © © © bản quyền
170 ª ª ª chỉ số nữ giới
171 « « « nháy kép chỉ bên trái
172 ¬ ¬ ¬ dấu không
173 ­ ­ ­ gạch nối mềm
174 ® ® ® đã đăng ký bản quyền
175 ¯ ¯ ¯ gạch trên
176 ° ° ° độ
177 ± ± ± cộng-trừ
178 ² ² ² mũ hai
179 ³ ³ ³ mũ ba
180 ´ ´ ´ dấu sắc
181 µ µ µ dấu micro
182 đánh dấu đoạn
183 · · · chấm ngang dòng
184 ¸ ¸ ¸ dấu ngoặc dưới chữ c
185 ¹ ¹ ¹ mũ một
186 º º º chỉ số nam giới
187 » » » nháy kép chỉ bên phải
188 ¼ ¼ ¼ một phần tư
189 ½ ½ ½ một phần hai
190 ¾ ¾ ¾ ba phần tư
191 ¿ ¿ ¿ dấu hỏi ngược
192 À À À A hoa với dấu huyền
193 Á Á Á A hoa với dấu sắc
194 Â Â Â A hoa với dấu mũ
195 Ã Ã Ã A hoa với dấu ngã
196 Ä Ä Ä A hoa với dấu tách âm
197 Å Å Å A hoa với dấu tròn ở trên
198 Æ Æ Æ AE hoa
199 Ç Ç Ç C hoa với dấu ngoặc dưới
200 È È È E hoa với dấu huyền
201 É É É E hoa với dấu sắc
202 Ê Ê Ê E hoa với dấu mũ
203 Ë Ë Ë E hoa với dấu tách âm
204 Ì Ì Ì I hoa với dấu huyền
205 Í Í Í I hoa với dấu sắc
206 Î Î Î I hoa với dấu mũ
207 Ï Ï Ï I hoa với dấu tách âm
208 Ð Ð Ð Eth hoa
209 Ñ Ñ Ñ N hoa với dấu ngã
210 Ò Ò Ò O hoa với dấu huyền
211 Ó Ó Ó O hoa với dấu sắc
212 Ô Ô Ô O hoa với dấu mũ
213 Õ Õ Õ O hoa với dấu ngã
214 Ö Ö Ö O hoa với dấu tách âm
215 × × × nhân
216 Ø Ø Ø O hoa với dấu gạch chéo
217 Ù Ù Ù U hoa với dấu huyền
218 Ú Ú Ú U hoa với dấu sắc
219 Û Û Û U hoa với dấu mũ
220 Ü Ü Ü U hoa với dấu tách âm
221 Ý Ý Ý Y hoa với dấu sắc
222 Þ Þ Þ Thorn hoa
223 ß ß ß s nhỏ mạnh
224 à à à a nhỏ với dấu huyền
225 á á á a nhỏ với dấu sắc
226 â â â a nhỏ với dấu mũ
227 ã ã ã a nhỏ với dẫu ngã
228 ä ä ä a nhỏ với dấu tách âm
229 å å å a nhỏ với dấu tròn bên trên
230 æ æ æ ae nhỏ
231 ç ç ç c nhỏ với dấu ngoặc dưới
232 è è è e nhỏ với dấu huyền
233 é é é e nhỏ với dấu sắc
234 ê ê ê e nhỏ với dấu sắc
235 ë ë ë e nhỏ với dấu tách âm
236 ì ì ì i nhỏ với dấu huyền
237 í í í i nhỏ với dấu sắc
238 î î î i nhỏ với dấu mũ
239 ï ï ï i nhỏ với dấu tách âm
240 ð ð ð eth nhỏ
241 ñ ñ ñ n nhỏ với dấu ngã
242 ò ò ò o nhỏ với dấu huyền
243 ó ó ó o nhỏ với dấu sắc
244 ô ô ô o nhỏ với dấu mũ
245 õ õ õ o nhỏ với dấu ngã
246 ö ö ö o nhỏ với dấu tách âm
247 ÷ ÷ ÷ dấu chia
248 ø ø ø o nhỏ với dấu gạch chéo
249 ù ù ù u nhỏ với dấu huyền
250 ú ú ú u nhỏ với dấu sắc
251 û û û u nhỏ với dấu mũ
252 ü ü ü u nhỏ với dấu tách âm
253 ý ý ý y nhỏ với dấu sắc
254 þ þ þ thorn nhỏ
255 ÿ ÿ ÿ y nhỏ với dấu tách âm

Bảng mã ASCII

ASCII sử dụng giá trị từ 0 đến 31 (và giá trị số 127) cho các ký tự điều khiển.

ASCII sử dụng giá trị từ 32 đến 126 cho chữ, số và ký hiệu.

ASCII không sử dụng giá trị từ 128 đến 255.

Bảng mã ANSI (Windows-1252)

ANSI giống hệt ASCII với các giá trị từ 0 đến 127.

ANSI độc quyền sở hữu các ký tự từ 128 đến 159.

ANSI giống hệt UTF-8 với các giá trị từ 160 đến 255.

Bảng mã ISO-8859-1

8859-1 giống hệt ASCII với các giá trị từ 0 đến 127.

8859-1 không sử dụng các giá trị từ 128 đến 159.

8859-1 giống hệt UTF-8 với các giá trị từ 160 đến 255.

Bạn đang xem bài viết tại: https://bostonenglish.edu.vn/

Bảng mã UTF-8

UTF-8 giống hệt ASCII với các giá trị từ 0 đến 127.

UTF-8 không sử dụng các giá trị từ 128 đến 159.

UTF-8 giống hệt cả ANSI và 8859-1 với các giá trị từ 160 đến 255.

UTF-8 sử dụng các giá trị từ 256 trở lên với hơn 10 000 ký tự khác nhau.

Hy vọng những thông tin chi tiết vừa rồi đã giúp bạn tìm câu trả lời cho câu hỏi meta charset= utf-8 là gì? Chúc các bạn có một ngày làm việc thật vui vẻ!

Chuyên mục: Hỏi Đáp

Bostonenglish.edu.vn cũng giúp giải đáp những vấn đề sau đây:

See more articles in the category: Tiếng anh

Leave a Reply