یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق,کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت,یونیکۆد زیاتر لە ١٠٠,٠٠٠ نووسە پێکهاتووە,وە لەلاین هەندێک نووسەوە وە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى The Unicode Standard
یونیکۆد چییە؟
کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى نووسەکان پێکهاتووە لە ژمارێک لەوانە,پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جیاوازى سیستەمى encoding هەبوو,وە بۆ جێبەجێ کردنى ئەو ژمارەیە,بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە encodingـێکى جیاواز هەبێت بۆ هەموو زمانەکان,وە بۆ زمانى ئینگلیزى,کە بە شێوەێکى دروست دەقەکان پێشان بدات,
هەروەها سیستەمى encoding بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا,بۆیە بیریتن لەوە کردووە کە ئەتوانى دوو encoding بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جیاواز یان بەکارهێنانى هەندێک ژمارەى جیاواز بۆ هەمان نووسە,وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک encodingـى جیاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جیاوزا دروستکراوە,
مێژوى یونیکۆد
سەرەتا دروست بوونى یونیکۆد لە ساڵى ١٩٨٧ لەلاین Joe Becker لەXerox هەروەها لەگەڵ Lee Collins و Mark Davis لە Apple سەرەتاى دەستپێکردنەو وە جێبەجێکردنى کارەکان بوو,بۆ دروستکردنى UCS،لە مانگى ٨ـى ساڵى داهاتوو یەکەم پێشنیارى Joe Becker ئەمە بوو "international/multilingual text character encoding system, tentatively called Unicode" بۆ زانیارى زیاتر سەێرى ئەم بەڵگەنامەیە بکە،Unicode88 |
هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو,بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە RLG هەروەها لەگەڵ Glenn Wright لە Sun Microsystems وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan لە NeXT هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ نووسەێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،
هەموو وەشانە دەرچووەکانی یونیکۆد
ژمارە | ناوەکان | ڕێکەوتی وەشاندن |
---|---|---|
١ | یونیکۆد ١.٠ | تشرینی یەکەمى ١٩٩١ |
٢ | یونیکۆد ١.٠.١ | حوزرەیرانى ١٩٩٢ |
٣ | یونیکۆد ١.١ | حوزرەیرانى ١٩٩٣ |
٤ | یونیکۆد ٢.٠ | تەمموزى ١٩٩٦ |
٥ | یونیکۆد ٢.١ | ئایارى ١٩٩٨ |
٦ | یونیکۆد ٢.٢.١ | ئایارى ١٩٩٨ |
٧ | یونیکۆد ٣.٠ | تشرینى دووەمى ١٩٩٩ |
٨ | یونیکۆد ٣.١ | ئازارى ٢٠٠١ |
٩ | یونیکۆد ٣.٢ | ئازارى ٢٠٠٢ |
١٠ | یونیکۆد ٤.٠ | نیسانى ٢٠٠٣ |
11 | یونیکۆد ٤.٠.١ | ئازارى ٢٠٠٤ |
12 | یونیکۆد ٤.١ | ئازارى ٢٠٠٥ |
13 | یونیکۆد ٥.٠ | تەمموزى ٢٠٠٨ |
14 | یونیکۆد ٥.١ | نیسانى ٢٠٠٨ |
لە مانگى حوزەیرانى ٢٠٠٩ وەشانى بێتا یونیکۆدى ٥.٢ بڵاوکراوەتەوە,چالاک کراوە بۆ ڕێکخستنى یونیکۆد,بڕیارى وایە لە مانگى تشرینى یەکەمى ٢٠٠٩ بە تەواوەتى بڵاوبکرێتەوە،
زانستى زمانى یونیکۆد
یونیکۆد پێناسە دەکرێت بەCodespace لە 1,114,112 وە Codepoint لە نێوان 0hex بۆ 10FFFFhex ئەمە سەرچاوەێکى ئاسایی code pointـى یونیکۆد بەم شێوەێە دەنوسرێت "U+"
لە دواى ئەوە ژمارەى hexadecimal دێت،بۆ code points لە زمانە گرینگەکان Basic Multilingual Plane کە کورتکراوەى (BMP) بەکارهێنانى چوار ژمارە،(بۆ نموونە U+0058
بەکاردێت بۆ پیتى گەورەى لاتینى X)،بۆ code points لە دەرەوەى (BMP) دەبێت پێنچ یان شەش پیت بەکاربهێنیت،بەپێ پێویستى پیتەکان(بۆ نموونە U+E0001
بەکاردێت بۆ نووسەى تاگى زمان لەگەڵ U+10FFFD
بۆ نووسەێکى تایبەتى-10FFFD
).بەکارهێنانى وەشانى کۆنى ستاندار لەڕووى هەڵسنگیاندنەوە لەیەک دەچن،بەڵام لە ڕووى یاساوە کەمێک جیاوازە،بۆ نموونە لە یونیکۆدى ٣.٠ بەکارهێنانى "U-"
دەبێت لە دواى ئەمەوە هەشت ژمارە بەکاربهێنیت لە دواى ئەم نووسە،هەروەها لەگەڵ "U+"
وە بەکارهێنانى تەنها لەگەڵ چوار ژمارە دەینێرێت بۆ code unit نەک بۆ code point،یونیکۆدى codespace دابەشدەکرێت بۆ ١٧ بەش,هەروەها ٦٥,٥٣٦ code points یان ٢٥٦ ڕیز پێک دێت،
نەخشە لەگەڵ یونیکۆد
UTF لەگەڵ UCS
یونیکۆد پێناسە و نەخشە دەکرێت بە دوو ڕێگا: Unicode Transformation Format کورتکراوەى(UTF)
encodings، لەگەڵ Universal Character Set کورتکراوەى (UCS)
encodings،وە لە encoding نەخشەکان(لەوانەیە لە کۆمەڵى ناوەڕاست بێت)لە نێوان code pointsـى یونیکۆد بۆ ڕیزکردنى گۆڕاوەکان لە هەندێک لە نێوانى جێگیرکردنى-قەبارە،ژمارەى ناوەکانى encoding دیارى دەکرێت بە ژمارەى بتەکانى هەر یەک دانەى code value،(بۆ UTF encodings) یان دیارى کردێن بە ژمارەى بایتەکانى code value (بۆ UCS encodings)
- UTF-1 |دەگونجێت لەگەڵ ISO 2022،بەشێکى زۆر نییە لە یونیکۆدى ستاندار.
- UTF-8 |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ ASCII
- UTF-EBCDIC |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ EBCDIC(بەڵام بەشێک نییە لە یونیکۆدى ستاندار)
- UTF-16 |١٦ بت،پانى گۆڕاوەکانى encoding.
- UTF-32 |٣٢ بت،پانى جێگیرکردنى encoding.
بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى code point,پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى encodingـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە Linux_distributions چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ encodings،چارەسەرکردنى دەقەکانى سەرەکى.
UCS-2 لەگەڵ UTF-16 encodings
دیاریکردنى یونیکۆد بە Byte Order Mark کورتکراوەى (BOM)
بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر encoding بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،code point U+FEFF
تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە encoding یونیکۆد بەکاردێت;U+FFFE
(ئەنجام گۆڕینى بایتى U+FEFF
) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ U+FEFF
هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى FE لەگەڵ FF هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک نووسەکان بۆ UTF-8 دەبێت زەنجیرێک بایتى EF BB BF
لە UTF-32 لەگەڵ UCS-4
بەردەوامە!
گرێدان
بەکارهێنانى یونیکۆد
سیستەمى کارپێکردن
بە هاتنى یونیکۆد دیاریکردنى چارەسەرکردنى پاشەکەوتکردنى ناوەکى دەقەکان(هەروەها بە زۆرى دەقە پاشەکەتکراوەکان بە ئینکۆدین،وە بەکارهێنانى یونیکۆد لە پاشەکەوتکردنى دەقەێکى نوێ)وە بەکارهێنانى UCS-2 لەگەڵ دواى گواستنەوەى بۆ UTF-16(بە زۆرکردنى ڕێگاێک بۆ پاڵپشتیکردنى نووسەى non-BMP
)،باشترین ناسراو وەک سیستەمى Windows NT(لەدواى ئەوە لەگەڵ Windows 2000, Windows XP لەگەڵ Windows Vista)وە بەکارهێنانى یونیکۆد بۆ ئینکۆدکردنى تەنها نووسە ناوەکیەکان.Java لەگەڵ NET ژینگەى بایتى دەقەکان
شێوازەکانى تێکردن
لەبەر ئەوەى هەموو جۆرەکانى تەختەکلیل ناتوانى هەموو کۆمەڵە نووسەکان لە خۆ بگرێت،بۆیە بیر لە دابینکردنى سیستهمی كارپێكردن کردووە وە دانانى ئەلتەرنتاتڤێک بۆ شێوازەکانى تێکردن وە ڕێگادان بۆ چونەژوورەوە بۆ تەواوکردنى هەموو کارە تەکنیکەکان،وە تەنها شێوازێکە بۆ چونەژوورەوە بۆ نووسەکانى یونیکۆ لە codepoint،بە تایبەتى بۆ شێوازەکان.لە شێوازەکانى بنچینەیی،لە سەرەتاى دەستپێکردنى زەنجیرەکە وە بە دوایدا hexadecimal دێت بۆ codepoint لە کۆتایی زەنجیرەکە،وە شێوازەکانى هەڵبژاردنى چونەژووەرەوى پەردەى دیاریکراو،هەروەها لیستى نووسەکانى خشتەى پەردە،بۆ نموونە لەگەڵ نووسەى پڕۆگرامى نەخشە،
ئامرازەکانى گەڕۆک
بۆ ئەوەى هەموو جۆرى ئامرازەکان وە هەموو زمانێکەمان لەبەر دەستدا بێت وە بەکارى بهێنین،بۆ ئەوەى بە شێوەێکى ئاسان بەکارى بهێنین ئەم پێوەکراوە دابگرە کە بۆ وێبگەڕى FireFox دروستکراوە،
تەختەکلیلێک بۆ هەموو جۆرەو ئامرازەکانى یونیکۆد
پۆستى ئەلەکترۆنى
MIME کورتکراوەى Multipurpose Internet Mail Extensionsـە پێناسە دەکرێت بە دوو میکانیزمى جیاواز بۆ ئینکۆدین ئامرازى non-ASCII لە پۆستى ئەلەکترۆنى،وە گرینگى ئەدا بە نووسەى سەرپەڕەى سەرەکى پۆستى ئەلەکترۆنى بۆ نموونە "سەردێر" یان ڕووکارى دەقەکانى نامەکەت.لە دوو کات،کۆمەڵێک نووسەى بنەڕەتى زۆر گرینگ و زیادکردنى بۆ ئینکۆدکردنى گواستنەوە،بۆ ناردنى پۆستى ئەلەکترۆنى لە یونیکۆد UTF-8 وە هەندێک لە نووسەکان لەگەڵ
بەردەوامە!