Meta charset= utf-8 là gì? Tại sao nó lại quan trọng?
Đã bao giờ bạn đã nghe tới cụm từ meta charset= utf-8? Nếu đang cần tìm hiểu meta charset= utf-8 cũng như tầm quan trọng của nó thì đừng bỏ qua bài viết sau nhé!

charset là gì
Bạn đang xem: Meta Charset= Utf-8 Là Gì?
1. Thẻ meta là gì?
Trước khi tìm hiểu về meta charset= utf-8, bạn cần hiểu rõ các khái niệm liên quan đến thẻ Meta.
Bạn đang xem: Meta charset= utf-8 là gì
Thẻ meta hiểu đơn giản là dòng mã đặt ở phần đầu trang html. Nhiệm vụ của thẻ meta là để trình duyệt, các công cụ tìm kiếm hiểu được nội dung trang. Các thẻ meta này có thể là thẻ meta tiêu đề, mô tả, ngôn ngữ, tác giả…
Chỉ các công cụ tìm kiếm, trình duyệt mới có thể đọc và hiểu được nội dung của thẻ meta. Và thẻ meta hoàn toàn không hiển thị lên màn hình cho người dùng thấy.
Thẻ meta có bốn thuộc tính cơ bản sau:
– Meta charset: Đây là thuộc tính giúp xác định kiểu mã hóa ký tự của trang web. Và meta charset= utf-8 thuộc nhóm này.
– Meta name: Đây là thuộc tính giúp xác định “tên của một loại thông tin” mà người dùng muốn cung cấp thêm cho trang web.
– Meta http-equiv: Đây là thuộc tính giúp xác định việc tải lại trang.
– Meta content: Đây là nhóm xác định nội dung của loại thông tin người dùng sẽ cung cấp cho các công cụ tìm kiếm và trình duyệt.
Ví dụ các thẻ meta sau:
Thẻ meta hiểu đơn giản là dòng mã đặt ở phần đầu trang html.
Bảng mã ký tự là gì? Charset là gì?
ASCII là bảng mã ký tự (còn gọi là charset) chuẩn đầu tiên trên thế giới. Nó bao gồm 127 ký tự chữ và số khác nhau có thể sử dụng được trên Internet.
ASCII bao gồm các số (0-9), ký tự Tiếng Anh (A-Z) và một số ký tự đặc biệt như: ! $ + – ( ) @ < > .
ANSI (Windows-1252) là bảng mã ký tự windows nguyên bản, hỗ trợ tới 256 mã ký tự khác nhau.
ISO-8859-1 là bảng mã ký tự mặc định cho HTML 4, hỗ trợ 256 mã ký tự khác nhau.
Bởi vì bảng mã ANSI và ISO bị giới hạn nên UTF-8 được lựa chọn là bảng mã mặc định trong HTML5.
UTF-8 (Unicode) bao gồm hầu như tất cả các ký tự và các ký hiệu trên thế giới.
Meta charset= utf-8 là gì?
Để nội dung trang HTML hiển thị đúng quy cách, trình duyệt web cần phải biết sử dụng bộ mã hóa ký tự nào. Để có thể xác định bộ việc trình duyệt hiển thị trang HTML bằng bộ ký tự nào, bạn sẽ cần xác định qua thẻ meta charset. Và nếu website có thì chứng tỏ kiểu mã hóa ký tự của trang chính là UTF8.
Định nghĩa chính xác hơn, UTF- 8 là một bộ mã hóa các ngôn ngữ về một chuẩn chung. Và UTF-8 được hiểu là một kiểu mã hóa ký tự của Unicode. Trong đó, Unicode là bảng mã chứa gần như toàn bộ các kí tự của hầu hết các ngôn ngữ trên toàn cầu.
Xem thêm: Dân Sự Là Gì
UTF-8 được thiết kế để tương thích ngược với chuẩn mã hóa ASCII*. Đồng thời, tránh những nhược điểm của UTF-16 và UTF-32. Hiện tại, UTF-8 đã trở thành kiểu mã hóa phổ biến nhất. Bằng chứng là hơn một nửa số trang web hiện tại sử dụng kiểu mã hóa UTF-8.
*ASCII thực tế là bộ ký tự và bộ mã ký tự dựa trên bảng chữ cái La Tinh. Mã hóa ASCII thường được dùng để hiển thị văn bản trong máy tính và các thiết bị thông tin khác. Bảng mã ASCII chuẩn có 128 ký tự, trong khi bảng mã ASCII mở rộng có 256 ký tự. Trong số 256 ký tự này có 128 ký tự trong mã ASCII chuẩn, số còn lại là các chữ có dấu, các phép toán, và các ký tự để trang trí.
Sự phát triển nhanh chóng của UTF-8 trong những năm gần đây.
Thuộc tính charset trong HTML
Để có thể hiển thị trang HTML một cách chuẩn xác, bạn phải cung cấp cho trình duyệt biết bảng mã ký tự mà bạn đang sử dụng bằng cách dùng thẻ <meta>.
Trong HTML4
<meta http–equiv=“Content-Type” content=“text/html;charset=UTF-8”>
|
Trong HTML5
<meta charset=“UTF-8”>
|
Tại sao nó lại quan trọng?
Là một bộ mã ký tự có chiều rộng biến thiên dành cho Unicode, UTF-8 giúp biểu diễn tất cả các chữ cái trong bộ ký tự Unicode. Tuy nhiên, có một điểm đặc biệt ở UTF-8. Đó là nó có thể tương thích ngược với bộ mã hóa ASCII. Chính vì vậy, nó đóng vai trò quan trọng trong việc hiển thị thông tin.
Cúng chính vì lý do này mà UTF-8 trở thành bộ mã hóa thống trị trong hầu hết các tập tin, trang web, thư điện tử, phần mềm xử lý văn bản…
UTF-8 cũng vô cùng quan trọng bởi nhóm đặc trách kỹ thuật Inte(IETF) đã quy định nó phải có mặt trong bộ mã hóa dùng trong dữ liệu ký tự.
Ngoài ra, Liên minh Thư tín Inte( IMC) cũng đưa ra khuyến cáo rằng mọi chương trình thư điện tử phải hiển thị và tạo được thư bằng UTF-8.
Ngoài ra, việc tương thích với chuẩn ASCII khiến UTF-8 có nhiều lợi thế khi sử dụng hỗ trợ unicode dựa vào các phần mềm sẵn có.
Để tạo ra bộ mã hóa UTF-8, người ta dùng các hàm có sẵn trong ngôn ngữ lập trình. Điều này giúp tiết kiệm thời gian cũng như đơn giản trong cách thức thực hiện. Ngoài ra, với cách mã hóa của UTF-8, bạn sẽ không mất nhiều không gian để lưu trữ.
UTF-8 trở thành bộ mã hóa thống trị trong hầu hết các tập tin.
Sự khác nhau giữa các bảng mã
Bảng so sánh dưới đây sẽ cho bạn thấy sự khác biệt giữa các bảng mã đã được nêu tên ở trên:
Số | ASCII | ANSI | 8859 | UTF-8 | Miêu tả |
---|---|---|---|---|---|
32 | dấu cách | ||||
33 | ! | ! | ! | ! | chấm than |
34 | “ | “ | “ | “ | nháy kép |
35 | # | # | # | # | thăng |
36 | $ | $ | $ | $ | dollar |
37 | % | % | % | % | phần trăm |
38 | & | & | & | & | dấu và |
39 | ‘ | ‘ | ‘ | ‘ | nháy đơn |
40 | ( | ( | ( | ( | ngoặc trái |
41 | ) | ) | ) | ) | ngoặc phải |
42 | * | * | * | * | hoa thị |
43 | + | + | + | + | dấu cộng |
44 | , | , | , | , | dấu phảy |
45 | – | – | – | – | dấu trừ |
46 | . | . | . | . | dấu chấm |
47 | / | / | / | / | gạch chéo |
48 | số 0 | ||||
49 | 1 | 1 | 1 | 1 | số 1 |
50 | 2 | 2 | 2 | 2 | số 2 |
51 | 3 | 3 | 3 | 3 | số 3 |
52 | 4 | 4 | 4 | 4 | số 4 |
53 | 5 | 5 | 5 | 5 | số 5 |
54 | 6 | 6 | 6 | 6 | số 6 |
55 | 7 | 7 | 7 | 7 | số 7 |
56 | 8 | 8 | 8 | 8 | số 8 |
57 | 9 | 9 | 9 | 9 | số 9 |
58 | : | : | : | : | hai chấm |
59 | ; | ; | ; | ; | chấm phảy |
60 | < | < | < | < | nhỏ hơn |
61 | = | = | = | = | bằng |
62 | > | > | > | > | lớn hơn |
63 | ? | ? | ? | ? | hỏi chấm |
64 | @ | @ | @ | @ | tại |
65 | A | A | A | A | A hoa |
66 | B | B | B | B | B hoa |
67 | C | C | C | C | C hoa |
68 | D | D | D | D | D hoa |
69 | E | E | E | E | E hoa |
70 | F | F | F | F | F hoa |
71 | G | G | G | G | G hoa |
72 | H | H | H | H | H hoa |
73 | I | I | I | I | I hoa |
74 | J | J | J | J | J hoa |
75 | K | K | K | K | K hoa |
76 | L | L | L | L | L hoa |
77 | M | M | M | M | M hoa |
78 | N | N | N | N | N hoa |
79 | O | O | O | O | O hoa |
80 | P | P | P | P | P hoa |
81 | Q | Q | Q | Q | Q hoa |
82 | R | R | R | R | R hoa |
83 | S | S | S | S | S hoa |
84 | T | T | T | T | T hoa |
85 | U | U | U | U | U hoa |
86 | V | V | V | V | V hoa |
87 | W | W | W | W | W hoa |
88 | X | X | X | X | X hoa |
89 | Y | Y | Y | Y | Y hoa |
90 | Z | Z | Z | Z | Z hoa |
91 | [ | [ | [ | [ | ngoặc vuông trái |
92 | \ | \ | \ | \ | gạch ngược |
93 | ] | ] | ] | ] | ngoặc vuông phải |
94 | ^ | ^ | ^ | ^ | dấu mũ |
95 | _ | _ | _ | _ | gạch dưới |
96 | ` | ` | ` | ` | dấu huyền |
97 | a | a | a | a | a nhỏ |
98 | b | b | b | b | b nhỏ |
99 | c | c | c | c | c nhỏ |
100 | d | d | d | d | d nhỏ |
101 | e | e | e | e | e nhỏ |
102 | f | f | f | f | f nhỏ |
103 | g | g | g | g | g nhỏ |
104 | h | h | h | h | h nhỏ |
105 | i | i | i | i | i nhỏ |
106 | j | j | j | j | j nhỏ |
107 | k | k | k | k | k nhỏ |
108 | l | l | l | l | l nhỏ |
109 | m | m | m | m | m nhỏ |
110 | n | n | n | n | n nhỏ |
111 | o | o | o | o | o nhỏ |
112 | p | p | p | p | p nhỏ |
113 | q | q | q | q | q nhỏ |
114 | r | r | r | r | r nhỏ |
115 | s | s | s | s | s nhỏ |
116 | t | t | t | t | t nhỏ |
117 | u | u | u | u | u nhỏ |
118 | v | v | v | v | v nhỏ |
119 | w | w | w | w | w nhỏ |
120 | x | x | x | x | x nhỏ |
121 | y | y | y | y | y nhỏ |
122 | z | z | z | z | z nhỏ |
123 | { | { | { | { | ngoặc nhọn trái |
124 | | | | | | | | | gạch đứng |
125 | } | } | } | } | ngoặc nhọn phải |
126 | ~ | ~ | ~ | ~ | dấu ngã |
127 | DEL | ||||
128 | € | euro | |||
129 | Không sử dụng | ||||
130 | ‚ | ngoặc đơn dưới | |||
131 | ƒ | f nhỏ có móc | |||
132 | „ | ngoặc kép dưới | |||
133 | … | chấm lửng | |||
134 | † | chữ thập | |||
135 | ‡ | chữ thập kép | |||
136 | ˆ | dấu mũ cách điệu | |||
137 | ‰ | phần nghìn | |||
138 | Š | S hoa có dấu mũ ngược | |||
139 | ‹ | nháy đơn chỉ bên trái | |||
140 | Œ | chữ OE ghép hoa | |||
141 | không sử dụng | ||||
142 | Ž | Z hoa có dấu mũ ngược | |||
143 | không sử dụng | ||||
144 | không sử dụng | ||||
145 | ‘ | nháy đơn bên trái | |||
146 | ’ | nháy đơn bên phải | |||
147 | “ | nháy kép bên trái | |||
148 | ” | nháy kép bên phải | |||
149 | • | chấm giữa dòng | |||
150 | – | gạch ngang | |||
151 | — | gạch ngang dài | |||
152 | ˜ | dấu ngã nhỏ | |||
153 | ™ | thương hiệu | |||
154 | š | s nhỏ có dấu mũ ngược | |||
155 | › | nháy đơn chỉ bên phải | |||
156 | œ | chữ OE ghép nhỏ | |||
157 | không sử dụng | ||||
158 | ž | z nhỏ có dấu mũ ngược | |||
159 | Ÿ | Y hoa có dấu tách âm | |||
160 | dấu cách | ||||
161 | ¡ | ¡ | ¡ | dấu chấm than ngược | |
162 | ¢ | ¢ | ¢ | xu | |
163 | £ | £ | £ | Bảng Anh | |
164 | ¤ | ¤ | ¤ | tiền tệ | |
165 | ¥ | ¥ | ¥ | Yên Nhật | |
166 | ¦ | ¦ | ¦ | gạch đứng gãy | |
167 | § | § | § | mục | |
168 | ¨ | ¨ | ¨ | dấu tách âm | |
169 | © | © | © | bản quyền | |
170 | ª | ª | ª | chỉ số nữ giới | |
171 | « | « | « | nháy kép chỉ bên trái | |
172 | ¬ | ¬ | ¬ | dấu không | |
173 | | | | gạch nối mềm | |
174 | ® | ® | ® | đã đăng ký bản quyền | |
175 | ¯ | ¯ | ¯ | gạch trên | |
176 | ° | ° | ° | độ | |
177 | ± | ± | ± | cộng-trừ | |
178 | ² | ² | ² | mũ hai | |
179 | ³ | ³ | ³ | mũ ba | |
180 | ´ | ´ | ´ | dấu sắc | |
181 | µ | µ | µ | dấu micro | |
182 | ¶ | ¶ | ¶ | đánh dấu đoạn | |
183 | · | · | · | chấm ngang dòng | |
184 | ¸ | ¸ | ¸ | dấu ngoặc dưới chữ c | |
185 | ¹ | ¹ | ¹ | mũ một | |
186 | º | º | º | chỉ số nam giới | |
187 | » | » | » | nháy kép chỉ bên phải | |
188 | ¼ | ¼ | ¼ | một phần tư | |
189 | ½ | ½ | ½ | một phần hai | |
190 | ¾ | ¾ | ¾ | ba phần tư | |
191 | ¿ | ¿ | ¿ | dấu hỏi ngược | |
192 | À | À | À | A hoa với dấu huyền | |
193 | Á | Á | Á | A hoa với dấu sắc | |
194 | Â | Â | Â | A hoa với dấu mũ | |
195 | Ã | Ã | Ã | A hoa với dấu ngã | |
196 | Ä | Ä | Ä | A hoa với dấu tách âm | |
197 | Å | Å | Å | A hoa với dấu tròn ở trên | |
198 | Æ | Æ | Æ | AE hoa | |
199 | Ç | Ç | Ç | C hoa với dấu ngoặc dưới | |
200 | È | È | È | E hoa với dấu huyền | |
201 | É | É | É | E hoa với dấu sắc | |
202 | Ê | Ê | Ê | E hoa với dấu mũ | |
203 | Ë | Ë | Ë | E hoa với dấu tách âm | |
204 | Ì | Ì | Ì | I hoa với dấu huyền | |
205 | Í | Í | Í | I hoa với dấu sắc | |
206 | Î | Î | Î | I hoa với dấu mũ | |
207 | Ï | Ï | Ï | I hoa với dấu tách âm | |
208 | Ð | Ð | Ð | Eth hoa | |
209 | Ñ | Ñ | Ñ | N hoa với dấu ngã | |
210 | Ò | Ò | Ò | O hoa với dấu huyền | |
211 | Ó | Ó | Ó | O hoa với dấu sắc | |
212 | Ô | Ô | Ô | O hoa với dấu mũ | |
213 | Õ | Õ | Õ | O hoa với dấu ngã | |
214 | Ö | Ö | Ö | O hoa với dấu tách âm | |
215 | × | × | × | nhân | |
216 | Ø | Ø | Ø | O hoa với dấu gạch chéo | |
217 | Ù | Ù | Ù | U hoa với dấu huyền | |
218 | Ú | Ú | Ú | U hoa với dấu sắc | |
219 | Û | Û | Û | U hoa với dấu mũ | |
220 | Ü | Ü | Ü | U hoa với dấu tách âm | |
221 | Ý | Ý | Ý | Y hoa với dấu sắc | |
222 | Þ | Þ | Þ | Thorn hoa | |
223 | ß | ß | ß | s nhỏ mạnh | |
224 | à | à | à | a nhỏ với dấu huyền | |
225 | á | á | á | a nhỏ với dấu sắc | |
226 | â | â | â | a nhỏ với dấu mũ | |
227 | ã | ã | ã | a nhỏ với dẫu ngã | |
228 | ä | ä | ä | a nhỏ với dấu tách âm | |
229 | å | å | å | a nhỏ với dấu tròn bên trên | |
230 | æ | æ | æ | ae nhỏ | |
231 | ç | ç | ç | c nhỏ với dấu ngoặc dưới | |
232 | è | è | è | e nhỏ với dấu huyền | |
233 | é | é | é | e nhỏ với dấu sắc | |
234 | ê | ê | ê | e nhỏ với dấu sắc | |
235 | ë | ë | ë | e nhỏ với dấu tách âm | |
236 | ì | ì | ì | i nhỏ với dấu huyền | |
237 | í | í | í | i nhỏ với dấu sắc | |
238 | î | î | î | i nhỏ với dấu mũ | |
239 | ï | ï | ï | i nhỏ với dấu tách âm | |
240 | ð | ð | ð | eth nhỏ | |
241 | ñ | ñ | ñ | n nhỏ với dấu ngã | |
242 | ò | ò | ò | o nhỏ với dấu huyền | |
243 | ó | ó | ó | o nhỏ với dấu sắc | |
244 | ô | ô | ô | o nhỏ với dấu mũ | |
245 | õ | õ | õ | o nhỏ với dấu ngã | |
246 | ö | ö | ö | o nhỏ với dấu tách âm | |
247 | ÷ | ÷ | ÷ | dấu chia | |
248 | ø | ø | ø | o nhỏ với dấu gạch chéo | |
249 | ù | ù | ù | u nhỏ với dấu huyền | |
250 | ú | ú | ú | u nhỏ với dấu sắc | |
251 | û | û | û | u nhỏ với dấu mũ | |
252 | ü | ü | ü | u nhỏ với dấu tách âm | |
253 | ý | ý | ý | y nhỏ với dấu sắc | |
254 | þ | þ | þ | thorn nhỏ | |
255 | ÿ | ÿ | ÿ | y nhỏ với dấu tách âm |
Bạn đang xem bài viết tại: https://bostonenglish.edu.vn/
Bảng mã ASCII
ASCII sử dụng giá trị từ 0 đến 31 (và giá trị số 127) cho các ký tự điều khiển.
ASCII sử dụng giá trị từ 32 đến 126 cho chữ, số và ký hiệu.
ASCII không sử dụng giá trị từ 128 đến 255.
Bảng mã ANSI (Windows-1252)
ANSI giống hệt ASCII với các giá trị từ 0 đến 127.
ANSI độc quyền sở hữu các ký tự từ 128 đến 159.
ANSI giống hệt UTF-8 với các giá trị từ 160 đến 255.
Bảng mã ISO-8859-1
8859-1 giống hệt ASCII với các giá trị từ 0 đến 127.
8859-1 không sử dụng các giá trị từ 128 đến 159.
8859-1 giống hệt UTF-8 với các giá trị từ 160 đến 255.
Bạn đang xem bài viết tại: https://bostonenglish.edu.vn/
Bảng mã UTF-8
UTF-8 giống hệt ASCII với các giá trị từ 0 đến 127.
UTF-8 không sử dụng các giá trị từ 128 đến 159.
UTF-8 giống hệt cả ANSI và 8859-1 với các giá trị từ 160 đến 255.
UTF-8 sử dụng các giá trị từ 256 trở lên với hơn 10 000 ký tự khác nhau.
Hy vọng những thông tin chi tiết vừa rồi đã giúp bạn tìm câu trả lời cho câu hỏi meta charset= utf-8 là gì? Chúc các bạn có một ngày làm việc thật vui vẻ!
Chuyên mục: Hỏi Đáp
Bostonenglish.edu.vn cũng giúp giải đáp những vấn đề sau đây:
- charset=utf-8 là gì
- Meta charset là gì
- Character encoding là gì
- O gạch chéo là gì
- Số 0 gạch chéo bên trong
- HTML utf8
- encoding utf-8 python
- Font chữ có số 0 gạch chéo