এইচটিএমএল ক্যারেক্টারসেট (HTML Character Set)
ক্যারেক্টার এনকোডিং কি?
প্রথম ক্যারেক্টার এনকোডিং স্ট্যান্ডার্ড ছিল ASCII(এটিকে ক্যারেক্টার সেটও বলা হয়)। ASCII তে ১২৭টি আলফানিউমেরিক ক্যারেক্টার ছিল যা ইন্টারনেটে ব্যবহার করা হতঃ সংখ্যা (0-9), ইংরেজি (A-Z), এবং কিছু বিশেষ চিহ্ন। যেমনঃ ! $ + - ( ) @ < >
ANSI (Windows-1252) ছিল উইন্ডোজের প্রধান ক্যারেক্টার সেট। এতে ২৫৬টি ক্যারেক্টার কোড ব্যবহার করা যেত।
এইচটিএমএল(৪) এ ডিফল্ট ক্যারেক্টার সেট ছিল ISO-8859-1 এবং এখানেও ২৫৬টি ক্যারেক্টার কোড ব্যবহার করা যেত।
ANSI এবং ISO-8859-1 সীমিত থাকার কারণে এইচটিএমএল(৫) এ ডিফল্ট ক্যারেক্টার সেট পরিবর্তন করে UTF-8 করা হয়।
পৃথিবীর প্রায় সকল ক্যারেক্টার এবং চিহ্ন UTF-8 (Unicode) এ রয়েছে।
এইচটিএমএল charset এট্রিবিউট
ব্রাউজারের মাধ্যমে, একটি এইচটিএমএল পেজকে সঠিকভাবে প্রদর্শন করার জন্যে পেজের ক্যারেক্টারসেট ব্রাউজারকে জানিয়ে দিতে হয়।
এই বিষয়টি <meta> ট্যাগের মধ্যে উল্লেখ করতে হয়ঃ
এইচটিএমএল(৪)
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
এইচটিএমএল(৫)
<meta charset="UTF-8">
বিভিন্ন ক্যারেক্টার সেট
নিম্নলিখিত টেবিলে ক্যারেক্টার সেটগুলোর মধ্যে পার্থক্য দেয়া হলঃ
নম্বর | ASCII | ANSI | 8859 | UTF-8 | বর্ণনা |
---|---|---|---|---|---|
32 | স্পেস | ||||
33 | ! | ! | ! | ! | বিস্ময়বোধক চিহ্ন |
34 | " | " | " | " | উদ্ধৃতি চিহ্ন |
35 | # | # | # | # | নম্বর চিহ্ন |
36 | $ | $ | $ | $ | ডলার চিহ্ন |
37 | % | % | % | % | শতকরা চিহ্ন |
38 | & | & | & | & | এম্পারসেন্ড |
39 | ' | ' | ' | ' | ঊর্ধকমা |
40 | ( | ( | ( | ( | বাম প্রথম বন্ধনী |
41 | ) | ) | ) | ) | ডান প্রথম বন্ধনী |
42 | * | * | * | * | অ্যাসটেরিস্ক |
43 | + | + | + | + | যোগ চিহ্ন |
44 | , | , | , | , | কমা |
45 | - | - | - | - | হাইফেন-বিয়োগ |
46 | . | . | . | . | ফুলস্টপ |
47 | / | / | / | / | স্ল্যাশ |
48 | 0 | 0 | 0 | 0 | শূন্য |
49 | 1 | 1 | 1 | 1 | এক |
50 | 2 | 2 | 2 | 2 | দুই |
51 | 3 | 3 | 3 | 3 | তিন |
52 | 4 | 4 | 4 | 4 | চার |
53 | 5 | 5 | 5 | 5 | পাঁচ |
54 | 6 | 6 | 6 | 6 | ছয় |
55 | 7 | 7 | 7 | 7 | সাত |
56 | 8 | 8 | 8 | 8 | আট |
57 | 9 | 9 | 9 | 9 | নয় |
58 | : | : | : | : | কোলন |
59 | ; | ; | ; | ; | সেমিকোলন |
60 | < | < | < | < | ক্ষুদ্রতম চিহ্ন |
61 | = | = | = | = | সমান চিহ্ন |
62 | > | > | > | > | বৃহত্তর চিহ্ন |
63 | ? | ? | ? | ? | প্রশ্নবোধক চিহ্ন |
65 | A | A | A | A | ল্যাটিন বড় হাতের A |
66 | B | B | B | B | ল্যাটিন বড় হাতের B |
67 | C | C | C | C | ল্যাটিন বড় হাতের C |
68 | D | D | D | D | ল্যাটিন বড় হাতের D |
69 | E | E | E | E | ল্যাটিন বড় হাতের E |
70 | F | F | F | F | ল্যাটিন বড় হাতের F |
71 | G | G | G | G | ল্যাটিন বড় হাতের G |
72 | H | H | H | H | ল্যাটিন বড় হাতের H |
73 | I | I | I | I | ল্যাটিন বড় হাতের I |
74 | J | J | J | J | ল্যাটিন বড় হাতের J |
75 | K | K | K | K | ল্যাটিন বড় হাতের K |
76 | L | L | L | L | ল্যাটিন বড় হাতের L |
77 | M | M | M | M | ল্যাটিন বড় হাতের M |
78 | N | N | N | N | ল্যাটিন বড় হাতের N |
79 | O | O | O | O | ল্যাটিন বড় হাতের O |
80 | P | P | P | P | ল্যাটিন বড় হাতের P |
81 | Q | Q | Q | Q | ল্যাটিন বড় হাতের Q |
82 | R | R | R | R | ল্যাটিন বড় হাতের R |
83 | S | S | S | S | ল্যাটিন বড় হাতের S |
84 | T | T | T | T | ল্যাটিন বড় হাতের T |
85 | U | U | U | U | ল্যাটিন বড় হাতের U |
86 | V | V | V | V | ল্যাটিন বড় হাতের V |
87 | W | W | W | W | ল্যাটিন বড় হাতের W |
88 | X | X | X | X | ল্যাটিন বড় হাতের X |
89 | Y | Y | Y | Y | ল্যাটিন বড় হাতের Y |
90 | Z | Z | Z | Z | ল্যাটিন বড় হাতের Z |
91 | [ | [ | [ | [ | বাম স্কয়ার ব্রাকেট বা তৃতীয় বন্ধনী |
92 | \ | \ | \ | \ | ব্যাকওয়ার্ড স্ল্যাশ |
93 | ] | ] | ] | ] | ডান স্কয়ার ব্রাকেট বা তৃতীয় বন্ধনী |
94 | ^ | ^ | ^ | ^ | সারকামফ্লেক্স এসেন্ট |
95 | _ | _ | _ | _ | আন্ডারস্কোর |
96 | ` | ` | ` | ` | বর্ণের উচ্চারণ নির্দেশক চিহ্ন |
97 | a | a | a | a | ল্যাটিন ছোট হাতের a |
98 | b | b | b | b | ল্যাটিন ছোট হাতের b |
99 | c | c | c | c | ল্যাটিন ছোট হাতের c |
100 | d | d | d | d | ল্যাটিন ছোট হাতের d |
101 | e | e | e | e | ল্যাটিন ছোট হাতের e |
102 | f | f | f | f | ল্যাটিন ছোট হাতের f |
103 | g | g | g | g | ল্যাটিন ছোট হাতের g |
104 | h | h | h | h | ল্যাটিন ছোট হাতের h |
105 | i | i | i | i | ল্যাটিন ছোট হাতের i |
106 | j | j | j | j | ল্যাটিন ছোট হাতের j |
107 | k | k | k | k | ল্যাটিন ছোট হাতের k |
108 | l | l | l | l | ল্যাটিন ছোট হাতের l |
109 | m | m | m | m | ল্যাটিন ছোট হাতের m |
110 | n | n | n | n | ল্যাটিন ছোট হাতের n |
111 | o | o | o | o | ল্যাটিন ছোট হাতের o |
112 | p | p | p | p | ল্যাটিন ছোট হাতের p |
113 | q | q | q | q | ল্যাটিন ছোট হাতের q |
114 | r | r | r | r | ল্যাটিন ছোট হাতের r |
115 | s | s | s | s | ল্যাটিন ছোট হাতের s |
116 | t | t | t | t | ল্যাটিন ছোট হাতের t |
117 | u | u | u | u | ল্যাটিন ছোট হাতের u |
118 | v | v | v | v | ল্যাটিন ছোট হাতের v |
119 | w | w | w | w | ল্যাটিন ছোট হাতের w |
120 | x | x | x | x | ল্যাটিন ছোট হাতের x |
121 | y | y | y | y | ল্যাটিন ছোট হাতের y |
122 | z | z | z | z | ল্যাটিন ছোট হাতের z |
123 | { | { | { | { | বাম কার্লি ব্র্যাকেট বা দ্বিতীয় বন্ধনী |
124 | | | | | | | | | উল্লম্ব লাইন বা পাইপ |
125 | } | } | } | } | ডান কার্লি ব্র্যাকেট বা দ্বিতীয় বন্ধনী |
126 | ~ | ~ | ~ | ~ | টিল্ড |
127 | DEL | ||||
128 | | ইউরো চিহ্ন | |||
129 | | | | ব্যবহার করা হয় না | |
130 | | সিংগেল কোটেশান মার্ক | |||
131 | | ল্যাটিন ছোট হাতের f | |||
132 | | ডাবল কোটেশান মার্ক | |||
133 | অনুভূমিক উপবৃত্ত | ||||
134 | | ডেগার | |||
135 | | ডাবল ডেগার | |||
136 | | সারকামফ্লেক্স অ্যাসেন্ট | |||
137 | | পারমিলি চিহ্ন | |||
138 | | ক্যারোনযুক্ত ল্যাটিন বড় হাতের S | |||
139 | | সিংগেল লেফট অ্যাঙ্গেল কোটেশন চিহ্ন | |||
140 | | ল্যাটিন বড় হাতের OE এর সংযুক্ত বর্ণ | |||
141 | | | | ব্যবহার হয় না | |
142 | | ক্যারোনযুক্ত ল্যাটিন বড় হাতের Z | |||
143 | | | | ব্যবহার হয় না | |
144 | | | | ব্যবহার হয় না | |
145 | | লেফট সিঙ্গেল উদ্ধৃতি চিহ্ন | |||
146 | | রাইট সিঙ্গেল উদ্ধৃতি চিহ্ন | |||
147 | | বাম ডাবল উদ্ধৃতি চিহ্ন | |||
148 | | ডান ডাবল উদ্ধৃতি চিহ্ন | |||
149 | | বুলেট | |||
150 | | en ড্যাশ | |||
151 | | em ড্যাশ | |||
152 | | ছোট টিল্ড | |||
153 | | ট্রেড মার্ক চিহ্ন | |||
154 | | ক্যারোনযুক্ত ল্যাটিন ছোট হাতের s | |||
155 | | সিঙ্গেল রাইট অ্যাঙ্গেল উদ্ধৃতি চিহ্ন | |||
156 | | ল্যাটিন ছোট হাতের oe এর সংযুক্ত বর্ণ | |||
157 | | | | ব্যবহার করা হয় না | |
158 | | ক্যারোনযুক্ত ল্যাটিন ছোট হাতের z | |||
159 | | ডাইরেসিস যুক্ত ল্যাটিন বড় হাতে Y | |||
160 | নো-ব্রেক স্পেস | ||||
161 | ¡ | ¡ | ¡ | উল্টানো বিস্ময়বোধক চিহ্ন | |
162 | ¢ | ¢ | ¢ | সেন্ট চিহ্ন | |
163 | £ | £ | £ | পাউন্ড চিহ্ন | |
164 | ¤ | ¤ | ¤ | কারেন্সি চিহ্ন | |
165 | ¥ | ¥ | ¥ | ইয়েন চিহ্ন | |
166 | ¦ | ¦ | ¦ | ব্রোকেন বার | |
167 | § | § | § | সেকশন চিহ্ন | |
168 | ¨ | ¨ | ¨ | ডাইরেসিস | |
169 | © | © | © | কপিরাইট চিহ্ন | |
170 | ª | ª | ª | ফেমিনিন অর্ডিন্যাল ইন্ডিকেটর | |
171 | « | « | « | লেফট অ্যাংগেল ডাবল কোটেশন চিহ্ন | |
172 | ¬ | ¬ | ¬ | নট সাইন | |
173 | | | | সফট হাইফেন | |
174 | ® | ® | ® | রেজিস্টার চিহ্ন | |
175 | ¯ | ¯ | ¯ | ম্যাকরন | |
176 | ° | ° | ° | ডিগ্রী চিহ্ন | |
177 | ± | ± | ± | যোগ-বিয়োগ চিহ্ন | |
178 | ² | ² | ² | সুপারস্ক্রিপ্ট ২ | |
179 | ³ | ³ | ³ | সুপারস্ক্রিপ্ট ৩ | |
180 | ´ | ´ | ´ | একিউট এসেন্ট | |
181 | µ | µ | µ | মাইক্রো চিহ্ন | |
182 | ¶ | ¶ | ¶ | পিলক্রো চিহ্ন | |
183 | · | · | · | মাঝখানে ডট | |
184 | ¸ | ¸ | ¸ | চিহ্নবিশেষ | |
185 | ¹ | ¹ | ¹ | সুপারস্ক্রিপ্ট ১ | |
186 | º | º | º | মাসকুলাইন অর্ডিন্যাল ইন্ডিকেটর | |
187 | » | » | » | ডানদিক নির্দেশীয় ডাবল অ্যাঙ্গেল কোটেশান চিহ্ন | |
188 | ¼ | ¼ | ¼ | এক চতুর্থাংশ ভগ্নাংশ | |
189 | ½ | ½ | ½ | এক দ্বিতীয়াংশ ভগ্নাংশ | |
190 | ¾ | ¾ | ¾ | এক তৃতীয়াংশ ভগ্নাংশ | |
191 | ¿ | ¿ | ¿ | উল্টানো প্রশ্নবোধক চিহ্ন | |
192 | À | À | À | গ্রেভযুক্ত ল্যাটিন বড় হাতের A | |
193 | Á | Á | Á | একিউটযুক্ত ল্যাটিন বড় হাতের A | |
194 | Â | Â | Â | সারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের A | |
195 | Ã | Ã | Ã | টিল্ডযুক্ত ল্যাটিন বড় হাতের A | |
196 | Ä | Ä | Ä | ডাইরেসিস সঙ্গে ল্যাটিন বড় হাতের A | |
197 | Å | Å | Å | উপরে রিংযুক্ত ল্যাটিন বড় হাতের A | |
198 | Æ | Æ | Æ | ল্যাটিন বড় হাতের AE | |
199 | Ç | Ç | Ç | সেডিলাযুক্ত ল্যাটিন বড় হাতের C | |
200 | È | È | È | গ্রেভযুক্ত ল্যাটিন বড় হাতের E | |
201 | É | É | É | একিউটযুক্ত ল্যাটিন বড় হাতের E | |
202 | Ê | Ê | Ê | সারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের E | |
203 | Ë | Ë | Ë | ডাইরেসিসযুক্ত ল্যাটিন বড় হাতের E | |
204 | Ì | Ì | Ì | গ্রেভযুক্ত ল্যাটিন বড় হাতের I | |
205 | Í | Í | Í | একিউটযুক্ত ল্যাটিন বড় হাতের I | |
206 | Î | Î | Î | সারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের I | |
207 | Ï | Ï | Ï | ডাইরেসিসযুক্ত ল্যাটিন বড় হাতের I | |
208 | Ð | Ð | Ð | ল্যাটিন বড় হাতের Eth | |
209 | Ñ | Ñ | Ñ | টিল্ডযুক্ত ল্যাটিন বড় হাতের N | |
210 | Ò | Ò | Ò | গ্রেভযুক্ত ল্যাটিন বড় হাতের O | |
211 | Ó | Ó | Ó | একিউটযুক্ত ল্যাটিন বড় হাতের O | |
212 | Ô | Ô | Ô | সারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের O | |
213 | Õ | Õ | Õ | টিল্ডযুক্ত ল্যাটিন বড় হাতের O | |
214 | Ö | Ö | Ö | ডাইরেসিসযুক্ত ল্যাটিন বড় হাতের O | |
215 | × | × | × | গুণন চিহ্ন | |
216 | Ø | Ø | Ø | স্ট্রোকযুক্ত ল্যাটিন বড় হাতের O | |
217 | Ù | Ù | Ù | গ্রেভযুক্ত ল্যাটিন বড় হাতের U | |
218 | Ú | Ú | Ú | একিউটযুক্ত ল্যাটিন বড় হাতের U | |
219 | Û | Û | Û | সারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের U | |
220 | Ü | Ü | Ü | ডাইরেসিসযুক্ত ল্যাটিন বড় হাতের U | |
221 | Ý | Ý | Ý | একিউটযুক্ত ল্যাটিন বড় হাতের Y | |
222 | Þ | Þ | Þ | ল্যাটিন বড় হাতের থর্ন | |
223 | ß | ß | ß | ল্যাটিন ছোট হাতের সার্প s | |
224 | à | à | à | গ্রেভযুক্ত ল্যাটিন ছোট হাতের a | |
225 | á | á | á | একিউটযুক্ত ল্যাটিন ছোট হাতের a | |
226 | â | â | â | সারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের a | |
227 | ã | ã | ã | টিল্ডযুক্ত ল্যাটিন ছোট হাতের a | |
228 | ä | ä | ä | ডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের a | |
229 | å | å | å | উপরে রিংযুক্ত ল্যাটিন ছোট হাতের a | |
230 | æ | æ | æ | ল্যাটিন ছোট হাতের ae | |
231 | ç | ç | ç | ক্যাডিলাযুক্ত ল্যাটিন ছোট হাতের c | |
232 | è | è | è | গ্রেভযুক্ত ল্যাটিন ছোট হাতের e | |
233 | é | é | é | একিউটযুক্ত ল্যাটিন ছোট হাতের e | |
234 | ê | ê | ê | সারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের e | |
235 | ë | ë | ë | ডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের e | |
236 | ì | ì | ì | গ্রেভযুক্ত ল্যাটিন ছোট হাতের i | |
237 | í | í | í | একিউটযুক্ত ল্যাটিন ছোট হাতের i | |
238 | î | î | î | সারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের i | |
239 | ï | ï | ï | ডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের i | |
240 | ð | ð | ð | ল্যাটিন ছোট হাতের eth | |
241 | ñ | ñ | ñ | টিল্ডযুক্ত ল্যাটিন ছোট হাতের n | |
242 | ò | ò | ò | গ্রেভযুক্ত ল্যাটিন ছোট হাতের o | |
243 | ó | ó | ó | একিউটযুক্ত ল্যাটিন ছোট হাতের o | |
244 | ô | ô | ô | সারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের o | |
245 | õ | õ | õ | টিল্ডযুক্ত ল্যাটিন ছোট হাতের o | |
246 | ö | ö | ö | ডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের o | |
247 | ÷ | ÷ | ÷ | বিভাজন/ভাগ চিহ্ন | |
248 | ø | ø | ø | স্ট্রোকযুক্ত ল্যাটিন ছোট হাতের o | |
249 | ù | ù | ù | গ্রেভযুক্ত ল্যাটিন ছোট হাতের u | |
250 | ú | ú | ú | একিউটযুক্ত ল্যাটিন ছোট হাতের u | |
251 | û | û | û | সারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের u | |
252 | ü | ü | ü | ডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের u | |
253 | ý | ý | ý | একিউটযুক্ত ছোট হাতের y | |
254 | þ | þ | þ | ল্যাটিন ছোট বর্ণ থর্ন | |
255 | ÿ | ÿ | ÿ | ল্যাটিন ছোট বর্ণ y সাথে ডাইরেসিস |
ASCII ক্যারেক্টার সেট
ASCII ক্যারেক্টার নিয়ন্ত্রণের জন্য ০ থেকে ৩১(এবং ১২৭) পর্যন্ত মানগুলো ব্যবহার করে।
ASCII অক্ষর, সংখ্যা এবং চিহ্নের জন্য ৩২ থেকে ১২৬ পর্যন্ত মানগুলো ব্যবহার করে।
ASCII ১২৮ থেকে ২৫৫ পর্যন্ত ভ্যালু ব্যবহার করে না।
ANSI ক্যারেক্টার সেট(উইন্ডো-১২৫২)
ANSI সেটটি ০ থেকে ১২৭ পর্যন্ত ASCII এর মত।
ANSI ১২৮ থেকে ১৫৯ পর্যন্ত মানগুলোতে একটি নিজস্ব অক্ষরসেট রয়েছে।
ANSI সেটটিতে ১৬০ থেকে ২৫৫ পর্যন্ত মানগুলো UTF-8 এর মত।
ISO-8859-1 ক্যারেক্টার সেট
8859-1 সেটটি ০ থেকে ১২৭ পর্যন্ত মানগুলো ASCII এর মত।
১২৮ থেকে ১৫৯ এর মধ্যের মানগুলো 8859-1 তে ব্যবহার করা হয় না।
১৬০ থেকে ২৫৫ পর্যন্ত মানগুলো UTF-8 এর মত।
UTF-8 ক্যারেক্টার সেট
UTF-8 সেটটিতে ০ থেকে ১২৭ পর্যন্ত মানগুলো ASCII এর মত।
১২৮ থেকে ১৫৯ এই মানগুলো UTF-8 ব্যবহার করে না।
১৬০ থেকে ২৫৫ এই মানগুলো ANSI এবং 8859-1 এর মত।
UTF-8 এ ১০,০০০ এর বেশি ক্যারেক্টার রয়েছে যা ২৫৬ থেকে শুরু হয়।