یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق،کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت،یونیکۆد زیاتر لە ١٠٠,٠٠٠ نووسە پێکهاتووە،وە لەلاین هەندێک نووسەوە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى The Unicode Standard
یونیکۆد چییە؟
کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى نووسەکان پێکهاتووە لە ژمارێک لەوانە،پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جیاوازى سیستەمى ئینکۆدین هەبوو،وە بۆ جێبەجێ کردنى ئەو ژمارەیە،بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە ئینکۆدینـێکى جیاواز هەبێت بۆ هەموو زمانەکان،وە بۆ زمانى ئینگلیزى،کە بە شێوەێکى دروست دەقەکان پێشان بدات،
هەروەها سیستەمى ئینکۆدین بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا،بۆیە بیریان لەوە کردووە کە ئەتوانى دوو ئینکۆدین بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جیاواز یان بەکارهێنانى هەندێک ژمارەى جیاواز بۆ هەمان نووسە،وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک ئینکۆدینـى جیاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جیاواز دروستکراوە،
مێژوى یونیکۆد
سەرەتا دروست بوونى یونیکۆد لە ساڵى ١٩٨٧ لەلاین Joe Becker لەXerox هەروەها لەگەڵ Lee Collins و Mark Davis لە Apple سەرەتاى دەستپێکردنەو وە جێبەجێکردنى کارەکان بوو،بۆ دروستکردنى UCS،لە مانگى ٨ـى ساڵى داهاتوو یەکەم پێشنیارى Joe Becker ئەمە بوو "international/multilingual text character encoding system, tentatively called Unicode" بۆ زانیارى زیاتر سەێرى ئەم بەڵگەنامەیە بکە،Unicode88 |
هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو،بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە RLG هەروەها لەگەڵ Glenn Wright لە Sun Microsystems وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan لە NeXT هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ نووسەێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،
هەموو وەشانە دەرچووەکانی یونیکۆد
ژمارە | ناوەکان | ڕێکەوتی وەشاندن |
---|---|---|
١ | یونیکۆد ١.٠ | تشرینی یەکەمى ١٩٩١ |
٢ | یونیکۆد ١.٠.١ | حوزرەیرانى ١٩٩٢ |
٣ | یونیکۆد ١.١ | حوزرەیرانى ١٩٩٣ |
٤ | یونیکۆد ٢.٠ | تەمموزى ١٩٩٦ |
٥ | یونیکۆد ٢.١ | ئایارى ١٩٩٨ |
٦ | یونیکۆد ٢.٢.١ | ئایارى ١٩٩٨ |
٧ | یونیکۆد ٣.٠ | تشرینى دووەمى ١٩٩٩ |
٨ | یونیکۆد ٣.١ | ئازارى ٢٠٠١ |
٩ | یونیکۆد ٣.٢ | ئازارى ٢٠٠٢ |
١٠ | یونیکۆد ٤.٠ | نیسانى ٢٠٠٣ |
11 | یونیکۆد ٤.٠.١ | ئازارى ٢٠٠٤ |
12 | یونیکۆد ٤.١ | ئازارى ٢٠٠٥ |
13 | یونیکۆد ٥.٠ | تەمموزى ٢٠٠٨ |
14 | یونیکۆد ٥.١ | نیسانى ٢٠٠٨ |
لە مانگى حوزەیرانى ٢٠٠٩ وەشانى بێتا یونیکۆدى ٥.٢ بڵاوکراوەتەوە,چالاک کراوە بۆ ڕێکخستنى یونیکۆد,بڕیارى وایە لە مانگى تشرینى یەکەمى ٢٠٠٩ بە تەواوەتى بڵاوبکرێتەوە،
زانستى زمانى یونیکۆد
یونیکۆد پێناسە دەکرێت بەCodespace لە 1,114,112 وە Codepoint لە نێوان 0hex بۆ 10FFFFhex ئەمە سەرچاوەێکى ئاسایی code pointـى یونیکۆد بەم شێوەێە دەنوسرێت "U+"
لە دواى ئەوە ژمارەى hexadecimal دێت،بۆ code points لە زمانە گرینگەکان Basic Multilingual Plane کە کورتکراوەى (BMP) بەکارهێنانى چوار ژمارە،(بۆ نموونە U+0058
بەکاردێت بۆ پیتى گەورەى لاتینى X)،بۆ code points لە دەرەوەى (BMP) دەبێت پێنچ یان شەش پیت بەکاربهێنیت،بەپێ پێویستى پیتەکان(بۆ نموونە U+E0001
بەکاردێت بۆ نووسەى تاگى زمان لەگەڵ U+10FFFD
بۆ نووسەێکى تایبەتى-10FFFD
).بەکارهێنانى وەشانى کۆنى ستاندار لەڕووى هەڵسنگیاندنەوە لەیەک دەچن،بەڵام لە ڕووى یاساوە کەمێک جیاوازە،بۆ نموونە لە یونیکۆدى ٣.٠ بەکارهێنانى "U-"
دەبێت لە دواى ئەمەوە هەشت ژمارە بەکاربهێنیت لە دواى ئەم نووسە،هەروەها لەگەڵ "U+"
وە بەکارهێنانى تەنها لەگەڵ چوار ژمارە دەینێرێت بۆ code unit نەک بۆ code point،یونیکۆدى codespace دابەشدەکرێت بۆ ١٧ بەش,هەروەها ٦٥,٥٣٦ code points یان ٢٥٦ ڕیز پێک دێت،
نەخشە لەگەڵ یونیکۆد
UTF لەگەڵ UCS
یونیکۆد پێناسە و نەخشە دەکرێت بە دوو ڕێگا: Unicode Transformation Format کورتکراوەى(UTF)
encodings، لەگەڵ Universal Character Set کورتکراوەى (UCS)
encodings،وە لە ئینکۆدینى نەخشەکان(لەوانەیە لە کۆمەڵى ناوەڕاست بێت)لە نێوان code pointsـى یونیکۆد بۆ ڕیزکردنى گۆڕاوەکان لە هەندێک لە نێوانى جێگیرکردنى-قەبارە،ژمارەى ناوەکانى ئینکۆدین دیارى دەکرێت بە ژمارەى بتەکانى هەر یەک دانەى code value،(بۆ UTF ئینکۆدینەکان) یان دیارى کردێن بە ژمارەى بایتەکانى code value (بۆ UCS ئینکۆدینەکان)
- UTF-1 |دەگونجێت لەگەڵ ISO 2022،بەشێکى زۆر نییە لە یونیکۆدى ستاندار.
- UTF-8 |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ ASCII
- UTF-EBCDIC |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ EBCDIC(بەڵام بەشێک نییە لە یونیکۆدى ستاندار)
- UTF-16 |١٦ بت،پانى گۆڕاوەکانى ئینکۆدین.
- UTF-32 |٣٢ بت،پانى جێگیرکردنى ئینکۆدین.
بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى code point،پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى ئینکۆدینـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە Linux_distributions چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ ئینکۆدینەکان،چارەسەرکردنى دەقەکانى سەرەکى.
UCS-2 لەگەڵ UTF-16 encodings
دیاریکردنى یونیکۆد بە Byte Order Mark کورتکراوەى (BOM)
بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر ئینکۆدین بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،code point U+FEFF
تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە ئینکۆدین یونیکۆد بەکاردێت;U+FFFE
(ئەنجام گۆڕینى بایتى U+FEFF
) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ U+FEFF
هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى FE لەگەڵ FF هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک نووسەکان بۆ UTF-8 دەبێت زەنجیرێک بایتى EF BB BF
گرێدان
هەندێک لە پرۆگرامۆکەکان،وەک عەرەبى لەگەڵ Devanagari هەریەکەیان یاساى نوسینى تایبەتى بە خۆیان هەیە،وە بانگى دەکات لەلاین هەندێک پێکهاتەوە، شێوەى نامەى هەیە بۆ بەشداریکردن بە تایبەتى لە ligature forms ، یاساکان کۆنترۆڵى شێوازەى گرێدان دەکات وە ئەتوانى بە شێوەێکى زۆر ئاڵۆز بێت،پێویستیەکانى تەکنۆلۆژیاى شێوازەکانى پرۆگرامۆکەى تایبەت کە وەک ACE(Arabic Calligraphic Engine
لەلاین DecoType لە ساڵى ١٩٨٠ لەگەڵ بەکارهێنانى بەدیهێنانى هەموو نموونەکانى عەرەبى لە وەشانى دەرنووسەرکراو لە یونیکۆدى ستاندار)دەبێت هۆى سەلمانن وتێگەیشتنى بۆ OpenType (لەلاین Adobe لەگەڵ Microsoft)،Graphite(لەلاین SIL International)یان AAT (لەلاین Apple).فرمانکردن بە هەموو جێگیرکراوەکان وە بانگکردنى جۆرەپیتەکانى ناو سیستەمى کارپێکردن بۆ ئەوەى دەرەنجامى زەنجیرەى نووسە جیاوازەکان بە شێوەێکى دروست
بەکارهێنانى یونیکۆد
سیستەمى کارپێکردن
بە هاتنى یونیکۆد دیاریکردنى چارەسەرکردنى پاشەکەوتکردنى ناوەکى دەقەکان(هەروەها بە زۆرى دەقە پاشەکەتکراوەکان بە ئینکۆدین،وە بەکارهێنانى یونیکۆد لە پاشەکەوتکردنى دەقەێکى نوێ)وە بەکارهێنانى UCS-2 لەگەڵ دواى گواستنەوەى بۆ UTF-16(بە زۆرکردنى ڕێگاێک بۆ پاڵپشتیکردنى نووسەى non-BMP
)،باشترین ناسراو وەک سیستەمى Windows NT(لەدواى ئەوە لەگەڵ Windows 2000, Windows XP لەگەڵ Windows Vista)وە بەکارهێنانى یونیکۆد بۆ ئینکۆدکردنى تەنها نووسە ناوەکیەکان.Java لەگەڵ NET ژینگەى بایتى دەقەکان
شێوازەکانى تێکردن
لەبەر ئەوەى هەموو جۆرەکانى تەختەکلیل ناتوانى هەموو کۆمەڵە نووسەکان لە خۆ بگرێت،بۆیە بیر لە دابینکردنى سیستهمی كارپێكردن کردووە وە دانانى ئەلتەرنتاتڤێک بۆ شێوازەکانى تێکردن وە ڕێگادان بۆ چونەژوورەوە بۆ تەواوکردنى هەموو کارە تەکنیکەکان،وە تەنها شێوازێکە بۆ چونەژوورەوە بۆ نووسەکانى یونیکۆ لە codepoint،بە تایبەتى بۆ شێوازەکان.لە شێوازەکانى بنچینەیی،لە سەرەتاى دەستپێکردنى زەنجیرەکە وە بە دوایدا hexadecimal دێت بۆ codepoint لە کۆتایی زەنجیرەکە،وە شێوازەکانى هەڵبژاردنى چونەژووەرەوى پەردەى دیاریکراو،هەروەها لیستى نووسەکانى خشتەى پەردە،بۆ نموونە لەگەڵ نووسەى پڕۆگرامى نەخشە،
ئامرازەکانى گەڕۆک
بۆ ئەوەى هەموو جۆرى ئامرازەکان وە هەموو زمانێکەمان لەبەر دەستدا بێت وە بەکارى بهێنین،بۆ ئەوەى بە شێوەێکى ئاسان بەکارى بهێنین ئەم پێوەکراوە دابگرە کە بۆ وێبگەڕى FireFox دروستکراوە،
تەختەکلیلێک بۆ هەموو جۆرەو ئامرازەکانى یونیکۆد
پۆستى ئەلەکترۆنى
MIME کورتکراوەى Multipurpose Internet Mail Extensionsـە پێناسە دەکرێت بە دوو میکانیزمى جیاواز بۆ ئینکۆدین بەکارهێنانى نووسەى non-ASCII لە پۆستى ئەلەکترۆنى،وە گرینگى ئەدا بە نووسەى سەرپەڕەى سەرەکى پۆستى ئەلەکترۆنى بۆ نموونە "سەردێر" یان ڕووکارى دەقەکانى نامەکەت.لە دوو کات،کۆمەڵێک نووسەى بنەڕەتى زۆر گرینگ و زیادکردنى بۆ ئینکۆدکردنى گواستنەوە،بۆ ناردنى پۆستى ئەلەکترۆنى لە یونیکۆد UTF-8 وە هەندێک لە نووسەکان لەگەڵ Base64 یان Quoted-printable4 گواستنەوەو گەیاندن بە ئینکۆدین وە گرینگ زۆر ئەدا بە ناوەڕۆکى نامەکە وە نووسەى ASCII.دوو ڕوونکردنەوە و میکانیزمى جیاوازى دیاریکراو ئەدا بۆ MIME ستاندار لەگەڵ شاردنەوەى بە شێوەێکى سەرەکى لەلاین بەکارهێنانى کاڵانەرمەکانى پۆستى ئەلەکترۆنى،وە بەکارهێنانى یونیکۆد لە پۆستى ئەلەکترۆنى زۆر خاوە،هەندێک کات دەقەکانى زمانى East-Asian وە تا ئێستایش شاراوەتەوە لە ئینکۆدینەکان کە وەک ISO-2022 لەگەڵ هەندێک پارچە وەک موبایل،تا ئێستا نەتوانراوە چارەسەرى داتاکانى یونیکۆد بکرێت بە شێوەێکى ڕاست،پاڵپشتیکردنى و باشترکردنى هەر چۆنێک بێت،بەڵام لەلاین هەندێک مەێلى خۆڕاى سەرەکى وەک Yahoo, Google (gmail)
لەگەڵ Microsoft (Hotmail)
پاڵپشتیکراوە،
بەکارهێنانى یونیکۆد لە پۆستى جیاواز
زۆربەى کات سەێر دەکەین وێبگەڕەکەمان پاڵپشتى یونیکۆد ناکات وە دەقەکان بە شێوەێکى زۆر ناشرین پێشان ئەدا,بۆ ئەوەى بە شێوەێکى دروست ڕێکیبخەین بۆ یونیکۆد ئەم هەنگاوانەى خوارەوە جێبەجێ دەکەین،
گەشەکردن
View > Character Encoding > Unicode Tools > Settings > Mail Preferences and Composer Preferences > Check default Character Encoding to Unicode
Mozilla Thunderbird
View > Character Encoding > Unicode Tools > Options… > Fonts > Outgoing Mail / Incoming Mail (change to Unicode)
بۆ سیستەمى کارپێکردنى ماک
Preferences > Display > Formatting > Fonts… > Character Encoding
وێب
هەموو W3C ئامۆژگارێەکانى بەکاردێت لە یونیکۆد وە بەڵگەنامە و نووسەکان لە کاتى HTML 4.0.پاڵپشتیکردنى وێبگەڕەکان بۆ یونیکۆد،بە تایبەتىUTF-8،بۆ هەندێک ساڵ.لە ئەنجامدا کێشەى پێشاندانى سەرەکى لە جۆرەپیت لەگەڵ پەیوەندى کێشەکە هەبوو،بە شێوەێکى تایبەتى،وەشانى Internet Explorer مایکرۆسۆفت ناتوانى بە شێوەێکى زۆر code points بگەڕێنێتەوە،دەبێت بانگى بکات بە شێوەێکى ڕوون وە بەکارهێناى جۆرەپیتەکانى ناوەڕۆک
هەروەها یاساى syntax کاریگەرى هەیە لەسەر هەر فرمانێک لە هەر نووسەێکى ڕێگاپێدارەوە بۆ پێشاندان، HTML 4 لەگەڵ XML ( XHTML)
بەڵگەنامەکانى نەبێت،پێناسە دەکرێت،بە پەستانى نووسەکان وە لە بەزۆرى code pointsـەکانى یونیکۆد،جگە لەمانە:
- بە زۆرى C0 and C1 control codes
- code points D800–DFFF دیارینەکراوە هەموو کاتێک،
- هەر code point لە کۆتایی FFFE یان FFFF بێت،
ئەم نووسانە پێشاندەدرێت بە ڕاستەخۆ وە بایتەکانى ڕێگاپێدراو دەبێت بۆ ئینکۆدکردنى بەڵگەنامە،هەروەها پاڵپشتیکردنى ئینکۆدین دەکات یان بەکارهێنەرەکانى هەندێک نوسینى ژمارەى نووسەکانەوە، سەرچاوەى سەرەکى لە code pointـى یوینکۆدى نووسەکان،بۆ نموونەΔ
, Й
, ק
, م
, ๗
, あ
, 叶
, 葉
, لەگەڵ 말
(یان هەندێک ژمارەى گۆڕاو لە سەرەتاى hexadecimal،لەگەڵ &#x
هەر لە سەرەتاوە)پێویست دەکات لە هەموو وێبگەڕێک پێشانبدە،Δ, Й, ק, م, ๗, あ, 叶, 葉, لەگەڵ 말.