یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق,کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت,یونیکۆد زیاتر لە ١٠٠,٠٠٠ ئامراز پێکهاتووە,وە لەلاین هەندێک ئامرازەوە وە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى The Unicode Standard
یونیکۆد چییە؟
کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى ئامرازەکان پێکهاتووە لە ژمارێک لەوانە,پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جێاوازى سیستەمى encoding هەبوو,وە بۆ جێبەجێ کردنى ئەو ژمارەیە,بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە encodingـێکى جیاواز هەبێت بۆ هەموو زمانەکان,وە بۆ زمانى ئینگلیزى,کە بە شێوەێکى دروست دەقەکان پێشان بدات,
هەروەها سیستەمى encoding بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا,بۆیە بیریتن لەوە کردووە کە ئەتوانى دوو encoding بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جێاواز یان بەکارهێنانى هەندێک ژمارەى جێاواز بۆ هەمان ئامراز,وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک encodingـى جێاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جێاوزا دروستکراوە,
مێژوى یونیکۆد
سەرەتا دروست بوونى یونیکۆد لە ساڵى ١٩٨٧ لەلاین Joe Becker لەXerox هەروەها لەگەڵ Lee Collins و Mark Davis لە Apple سەرەتاى دەستپێکردنەو وە جێبەجێکردنى کارەکان بوو,بۆ دروستکردنى UCS،لە مانگى ٨ـى ساڵى داهاتوو یەکەم پێشنیارى Joe Becker ئەمە بوو "international/multilingual text character encoding system, tentatively called Unicode" بۆ زانیارى زیاتر سەێرى ئەم بەڵگەنامەیە بکە،Unicode88 |
هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو,بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە RLG هەروەها لەگەڵ Glenn Wright لە Sun Microsystems وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan لە NeXT هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ ئامرازیێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،
هەموو وەشانە دەرچووەکانی یونیکۆد
ژمارە | ناوەکان | ڕێکەوتی وەشاندن |
---|---|---|
١ | یونیکۆد ١.٠ | تشرینی یەکەمى ١٩٩١ |
٢ | یونیکۆد ١.٠.١ | حوزرەیرانى ١٩٩٢ |
٣ | یونیکۆد ١.١ | حوزرەیرانى ١٩٩٣ |
٤ | یونیکۆد ٢.٠ | تەمموزى ١٩٩٦ |
٥ | یونیکۆد ٢.١ | ئایارى ١٩٩٨ |
٦ | یونیکۆد ٢.٢.١ | ئایارى ١٩٩٨ |
٧ | یونیکۆد ٣.٠ | تشرینى دووەمى ١٩٩٩ |
٨ | یونیکۆد ٣.١ | ئازارى ٢٠٠١ |
٩ | یونیکۆد ٣.٢ | ئازارى ٢٠٠٢ |
١٠ | یونیکۆد ٤.٠ | نیسانى ٢٠٠٣ |
11 | یونیکۆد ٤.٠.١ | ئازارى ٢٠٠٤ |
12 | یونیکۆد ٤.١ | ئازارى ٢٠٠٥ |
13 | یونیکۆد ٥.٠ | تەمموزى ٢٠٠٨ |
14 | یونیکۆد ٥.١ | نیسانى ٢٠٠٨ |
لە مانگى حوزەیرانى ٢٠٠٩ وەشانى بێتا یونیکۆدى ٥.٢ بڵاوکراوەتەوە,چالاک کراوە بۆ ڕێکخستنى یونیکۆد,بڕیارى وایە لە مانگى تشرینى یەکەمى ٢٠٠٩ بە تەواوەتى بڵاوبکرێتەوە،
زانستى زمانى یونیکۆد
یونیکۆد پێناسە دەکرێت بەCodespace لە 1,114,112 وە Codepoint لە نێوان 0hex بۆ 10FFFFhex ئەمە سەرچاوەێکى ئاسایی code pointـى یونیکۆد بەم شێوەێە دەنوسرێت "U+"
لە دواى ئەوە ژمارەى hexadecimal دێت،بۆ code points لە زمانە گرینگەکان Basic Multilingual Plane کە کورتکراوەى (BMP) بەکارهێنانى چوار ژمارە،(بۆ نموونە U+0058
بەکاردێت بۆ پیتى گەورەى لاتینى X)،بۆ code points لە دەرەوەى (BMP) دەبێت پێنچ یان شەش پیت بەکاربهێنیت،بەپێ پێویستى پیتەکان(بۆ نموونە U+E0001
بەکاردێت بۆ ئامرازى تاگى زمان لەگەڵ U+10FFFD
بۆ ئامرازیێکى تایبەتى-10FFFD
).بەکارهێنانى وەشانى کۆنى ستاندار لەڕووى هەڵسنگیاندانەوە لەیەک دەچن،بەڵام لە ڕووى یاساوە کەمێک جیاوازە،بۆ نموونە لە یونیکۆدى ٣.٠ بەکارهێنانى "U-"
دەبێت هەشت ژمارە بەکاربهێنیت لە دواى ئەم ئامرازە،هەروەها لەگەڵ "U+"
وە بەکارهێنانى تەنها لەگەڵ چوار ژمارە دەینێرێت بۆ code unit نەک بۆ code point،یونیکۆدى codespace دابەشدەکرێت بۆ ١٧ بەش,هەروەها ٦٥,٥٣٦ code points یان ٢٥٦ ڕیز پێک دێت،
نەخشە لەگەڵ یونیکۆد
UTF لەگەڵ UCS
یونیکۆد پێناسە و نەخشە دەکرێت بە دوو ڕێگا: Unicode Transformation Format کورتکراوەى(UTF)
encodings، لەگەڵ Universal Character Set کورتکراوەى (UCS)
encodings،وە لە encoding نەخشەکان(لەوانەیە لە کۆمەڵى ناوەڕاست بێت)لە نێوان code pointsـى یونیکۆد بۆ ڕیزکردنى گۆڕاوەکان لە هەندێک لە نێوانى جێگیرکردنى-قەبارە،ژمارەى ناوەکانى encoding دیارى دەکرێت بە ژمارەى بتەکانى هەر یەک دانەى code value،(بۆ UTF encodings) یان دیارى کردێن بە ژمارەى بایتەکانى code value (بۆ UCS encodings)
- UTF-1 |دەگونجێت لەگەڵ ISO 2022،بەشێکى زۆر نییە لە یونیکۆدى ستاندار.
- UTF-8 |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ ASCII
- UTF-EBCDIC |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ EBCDIC(بەڵام بەشێک نییە لە یونیکۆدى ستاندار)
- UTF-16 |١٦ بت،پانى گۆڕاوەکانى encoding.
- UTF-32 |٣٢ بت،پانى جێگیرکردنى encoding.
بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى code point,پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى encodingـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە Linux_distributions چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ encodings،چارەسەرکردنى دەقەکانى سەرەکى.
UCS-2 لەگەڵ UTF-16 encodings
دیاریکردنى یونیکۆد بە Byte Order Mark کورتکراوەى (BOM)
بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر encoding بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،code point U+FEFF
تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە encoding یونیکۆد بەکاردێت;U+FFFE
(ئەنجام گۆڕینى بایتى U+FEFF
) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ U+FEFF
هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى FE لەگەڵ FF هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک ئامراز بۆ UTF-8 دەبێت زەنجیرێک بایتى EF BB BF
لە UTF-32 لەگەڵ UCS-4
بەردەوامە!
گرێدان
بەکارهێنانى یونیکۆد
سیستەمى کارپێکردن
بە هاتنى یونیکۆد دیاریکردنى چارەسەرکردنى پاشەکەوتکردنى ناوەکى دەقەکان(هەروەها بە زۆرى دەقە پاشەکەتکراوەکان بە ئینکۆدین،وە بەکارهێنانى یونیکۆد لە پاشەکەوتکردنى دەقەێکى نوێ)وە بەکارهێنانى UCS-2 لەگەڵ دواى گواستنەوەى بۆ UTF-16(بە زۆرکردنى ڕێگاێک بۆ پاڵپشتیکردنى ئامرازى non-BMP
)،باشترین ناسراو وەک سیستەمى Windows NT(لەدواى ئەوە لەگەڵ Windows 2000, Windows XP لەگەڵ Windows Vista)وە بەکارهێنانى یونیکۆد بۆ ئینکۆدکردنى تەنها ئامرازە ناوەکیەکان.Java لەگەڵ NET ژینگەى بایتى دەقەکان
شێوازەکانى تێکردن
لەبەر ئەوەى جۆرەکانى تەختەکلیل ناتوانى هەموو کۆمەڵە ئامرازەکان لە خۆ بگرێت،بۆیە بیر لە هەندێک سیستهمی كارپێكردن وە دانانى ئەلتەرنتاتڤێک بۆ شێوازەکانى تێکردن وە ڕێگادان بۆ چونەژوورەوە بۆ تەواوکردنى هەموو کارە تەکنیکەکان،وە تەنها شێوازێکە بۆ چونەژوورەوە بۆ ئامرازەکانى یونیکۆ لە codepoint،بە تایبەتى بۆ شێوازەکان.لە شێوازەکانى بنچینەیی،لە سەرەتاى دەستپێکردنى زەنجیرەکە وە بە دوایدا hexadecimal دێت بۆ codepoint لە کۆتایی زەنجیرەکە،وە شێوازەکانى هەڵبژاردنى چونەژووەرەوى پەردەى دیاریکراو،هەروەها لیستى ئامرازەکانى خشتەى پەردە،بۆ نموونە لەگەڵ ئامرازى پڕۆگرامى نەخشە،
ئامرازەکانى گەڕۆک
بۆ ئەوەى هەموو جۆرى ئامرازەکان وە هەموو زمانێکەمان لەبەر دەستدا بێت وە بەکارى بهێنین،بۆ ئەوەى بە شێوەێکى ئاسان بەکارى بهێنین ئەم پێوەکراوە دابگرە کە بۆ وێبگەڕى FireFox دروستکراوە،
تەختەکلیلێک بۆ هەموو جۆرەو ئامرازەکانى یونیکۆد