UNICODE: جیاوازیی نێوان پێداچوونەوەکان

لە چاوگ
No edit summary
ھێڵی ١: ھێڵی ١:
[[Image:The_Unicode_standard.jpg|left|thumb|200px|یونیکۆد ستاندار،وەشانى ٥.٠]]
[[Image:The_Unicode_standard.jpg|left|thumb|200px|یونیکۆد ستاندار،وەشانى ٥.٠]]
یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق,کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت,یونیکۆد زیاتر لە ١٠٠,٠٠٠ ئامراز پێکهاتووە,وە لەلاین هەندێک ئامرازەوە وە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى <tt>The Unicode Standard</tt>
یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق,کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت,یونیکۆد زیاتر لە ١٠٠,٠٠٠ نووسە پێکهاتووە,وە لەلاین هەندێک نووسەوە وە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى <tt>The Unicode Standard</tt>




== یونیکۆد چییە؟ ==
== یونیکۆد چییە؟ ==
کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى ئامرازەکان پێکهاتووە لە ژمارێک لەوانە,پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جێاوازى سیستەمى <tt>encoding</tt> هەبوو,وە بۆ جێبەجێ کردنى ئەو ژمارەیە,بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە <tt>encoding</tt>ـێکى جیاواز هەبێت بۆ هەموو زمانەکان,وە بۆ زمانى ئینگلیزى,کە بە شێوەێکى دروست دەقەکان پێشان بدات,
کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى نووسەکان پێکهاتووە لە ژمارێک لەوانە,پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جیاوازى سیستەمى <tt>encoding</tt> هەبوو,وە بۆ جێبەجێ کردنى ئەو ژمارەیە,بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە <tt>encoding</tt>ـێکى جیاواز هەبێت بۆ هەموو زمانەکان,وە بۆ زمانى ئینگلیزى,کە بە شێوەێکى دروست دەقەکان پێشان بدات,


هەروەها سیستەمى <tt>encoding</tt> بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا,بۆیە بیریتن لەوە کردووە کە ئەتوانى دوو <tt>encoding</tt> بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جێاواز یان بەکارهێنانى هەندێک ژمارەى جێاواز بۆ هەمان ئامراز,وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک encodingـى جێاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جێاوزا دروستکراوە,
هەروەها سیستەمى <tt>encoding</tt> بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا,بۆیە بیریتن لەوە کردووە کە ئەتوانى دوو <tt>encoding</tt> بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جیاواز یان بەکارهێنانى هەندێک ژمارەى جیاواز بۆ هەمان نووسە,وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک encodingـى جیاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جیاوزا دروستکراوە,




ھێڵی ١٣: ھێڵی ١٣:
|
|


هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو,بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە [http://en.wikipedia.org/wiki/Research_Libraries_Group RLG] هەروەها لەگەڵ Glenn Wright لە [http://en.wikipedia.org/wiki/Sun_Microsystems Sun Microsystems] وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan  لە [http://en.wikipedia.org/wiki/NeXT NeXT] هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ ئامرازیێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،
هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو,بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە [http://en.wikipedia.org/wiki/Research_Libraries_Group RLG] هەروەها لەگەڵ Glenn Wright لە [http://en.wikipedia.org/wiki/Sun_Microsystems Sun Microsystems] وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan  لە [http://en.wikipedia.org/wiki/NeXT NeXT] هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ نووسەێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،


== هەموو وەشانە دەرچووەکانی یونیکۆد ==
== هەموو وەشانە دەرچووەکانی یونیکۆد ==
ھێڵی ٨٣: ھێڵی ٨٣:


== زانستى زمانى یونیکۆد ==
== زانستى زمانى یونیکۆد ==
یونیکۆد پێناسە دەکرێت بە[http://en.wikipedia.org/wiki/Codespace Codespace] لە 1,114,112 وە [http://en.wikipedia.org/wiki/Code_points Codepoint] لە نێوان 0<sub>hex</sub> بۆ 10FFFF<sub>hex</sub> ئەمە سەرچاوەێکى ئاسایی <tt>code point</tt>ـى یونیکۆد بەم شێوەێە دەنوسرێت <code>"U+"</code> لە دواى ئەوە ژمارەى <tt>hexadecimal</tt> دێت،بۆ <tt>code points</tt> لە زمانە گرینگەکان [http://en.wikipedia.org/wiki/Basic_Multilingual_Plane Basic Multilingual Plane] کە کورتکراوەى <tt>(BMP)</tt> بەکارهێنانى چوار ژمارە،(بۆ نموونە <code>U+0058</code> بەکاردێت بۆ پیتى گەورەى لاتینى X)،بۆ <tt>code points</tt> لە دەرەوەى <tt>(BMP)</tt> دەبێت پێنچ یان شەش پیت بەکاربهێنیت،بەپێ پێویستى پیتەکان(بۆ نموونە <code>U+E0001</code> بەکاردێت بۆ ئامرازى تاگى زمان لەگەڵ <code>U+10FFFD</code> بۆ ئامرازیێکى تایبەتى-<code>10FFFD</code>).بەکارهێنانى وەشانى کۆنى ستاندار لەڕووى هەڵسنگیاندانەوە لەیەک دەچن،بەڵام لە ڕووى یاساوە کەمێک جیاوازە،بۆ نموونە لە یونیکۆدى ٣.٠ بەکارهێنانى <code>"U-"</code> دەبێت هەشت ژمارە بەکاربهێنیت لە دواى ئەم ئامرازە،هەروەها لەگەڵ <code>"U+"</code> وە بەکارهێنانى تەنها لەگەڵ چوار ژمارە دەینێرێت بۆ <tt>code unit</tt> نەک بۆ <tt>code point</tt>،یونیکۆدى <tt>codespace</tt> دابەشدەکرێت بۆ ١٧ بەش,هەروەها ٦٥,٥٣٦ <tt>code points</tt> یان ٢٥٦ ڕیز پێک دێت،
یونیکۆد پێناسە دەکرێت بە[http://en.wikipedia.org/wiki/Codespace Codespace] لە 1,114,112 وە [http://en.wikipedia.org/wiki/Code_points Codepoint] لە نێوان 0<sub>hex</sub> بۆ 10FFFF<sub>hex</sub> ئەمە سەرچاوەێکى ئاسایی <tt>code point</tt>ـى یونیکۆد بەم شێوەێە دەنوسرێت <code>"U+"</code> لە دواى ئەوە ژمارەى <tt>hexadecimal</tt> دێت،بۆ <tt>code points</tt> لە زمانە گرینگەکان [http://en.wikipedia.org/wiki/Basic_Multilingual_Plane Basic Multilingual Plane] کە کورتکراوەى <tt>(BMP)</tt> بەکارهێنانى چوار ژمارە،(بۆ نموونە <code>U+0058</code> بەکاردێت بۆ پیتى گەورەى لاتینى X)،بۆ <tt>code points</tt> لە دەرەوەى <tt>(BMP)</tt> دەبێت پێنچ یان شەش پیت بەکاربهێنیت،بەپێ پێویستى پیتەکان(بۆ نموونە <code>U+E0001</code> بەکاردێت بۆ نووسەى تاگى زمان لەگەڵ <code>U+10FFFD</code> بۆ نووسەێکى تایبەتى-<code>10FFFD</code>).بەکارهێنانى وەشانى کۆنى ستاندار لەڕووى هەڵسنگیاندنەوە لەیەک دەچن،بەڵام لە ڕووى یاساوە کەمێک جیاوازە،بۆ نموونە لە یونیکۆدى ٣.٠ بەکارهێنانى <code>"U-"</code> دەبێت لە دواى ئەمەوە هەشت ژمارە بەکاربهێنیت لە دواى ئەم نووسە،هەروەها لەگەڵ <code>"U+"</code> وە بەکارهێنانى تەنها لەگەڵ چوار ژمارە دەینێرێت بۆ <tt>code unit</tt> نەک بۆ <tt>code point</tt>،یونیکۆدى <tt>codespace</tt> دابەشدەکرێت بۆ ١٧ بەش,هەروەها ٦٥,٥٣٦ <tt>code points</tt> یان ٢٥٦ ڕیز پێک دێت،


== نەخشە لەگەڵ یونیکۆد ==
== نەخشە لەگەڵ یونیکۆد ==
ھێڵی ٩٩: ھێڵی ٩٩:
بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى code point,پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى encodingـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە [http://en.wikipedia.org/wiki/Linux_distributions Linux_distributions] چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ encodings،چارەسەرکردنى دەقەکانى سەرەکى.
بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى code point,پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى encodingـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە [http://en.wikipedia.org/wiki/Linux_distributions Linux_distributions] چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ encodings،چارەسەرکردنى دەقەکانى سەرەکى.


UCS-2 لەگەڵ UTF-16 <code>encodings</code> دیاریکردنى یونیکۆد بە [http://en.wikipedia.org/wiki/Byte_Order_Mark Byte Order Mark] کورتکراوەى <code>(BOM)</code> بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر encoding بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،<code>code point U+FEFF</code> تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە encoding یونیکۆد بەکاردێت;<code>U+FFFE</code> (ئەنجام گۆڕینى بایتى <code>U+FEFF</code>) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ <code>U+FEFF</code> هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى <tt>FE</tt> لەگەڵ <tt>FF</tt> هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک ئامراز بۆ UTF-8 دەبێت زەنجیرێک بایتى  <tt>EF BB BF</tt>
UCS-2 لەگەڵ UTF-16 <code>encodings</code> دیاریکردنى یونیکۆد بە [http://en.wikipedia.org/wiki/Byte_Order_Mark Byte Order Mark] کورتکراوەى <code>(BOM)</code> بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر encoding بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،<code>code point U+FEFF</code> تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە encoding یونیکۆد بەکاردێت;<code>U+FFFE</code> (ئەنجام گۆڕینى بایتى <code>U+FEFF</code>) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ <code>U+FEFF</code> هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى <tt>FE</tt> لەگەڵ <tt>FF</tt> هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک نووسەکان بۆ UTF-8 دەبێت زەنجیرێک بایتى  <tt>EF BB BF</tt>


لە UTF-32 لەگەڵ UCS-4
لە UTF-32 لەگەڵ UCS-4
ھێڵی ١١١: ھێڵی ١١١:


===سیستەمى کارپێکردن===
===سیستەمى کارپێکردن===
بە هاتنى یونیکۆد دیاریکردنى چارەسەرکردنى پاشەکەوتکردنى ناوەکى دەقەکان(هەروەها بە زۆرى دەقە پاشەکەتکراوەکان بە ئینکۆدین،وە بەکارهێنانى یونیکۆد لە پاشەکەوتکردنى دەقەێکى نوێ)وە بەکارهێنانى <tt>UCS-2</tt> لەگەڵ دواى گواستنەوەى بۆ <tt>UTF-16</tt>(بە زۆرکردنى ڕێگاێک بۆ پاڵپشتیکردنى ئامرازى <code>non-BMP</code>)،باشترین ناسراو وەک سیستەمى <tt>Windows NT</tt>(لەدواى ئەوە لەگەڵ  <tt>Windows 2000, Windows XP</tt> لەگەڵ <tt>Windows Vista</tt>)وە بەکارهێنانى یونیکۆد بۆ ئینکۆدکردنى تەنها ئامرازە ناوەکیەکان.[http://en.wikipedia.org/wiki/Java_virtual_machine Java] لەگەڵ [http://en.wikipedia.org/wiki/.NET_Framework NET] ژینگەى بایتى دەقەکان
بە هاتنى یونیکۆد دیاریکردنى چارەسەرکردنى پاشەکەوتکردنى ناوەکى دەقەکان(هەروەها بە زۆرى دەقە پاشەکەتکراوەکان بە ئینکۆدین،وە بەکارهێنانى یونیکۆد لە پاشەکەوتکردنى دەقەێکى نوێ)وە بەکارهێنانى <tt>UCS-2</tt> لەگەڵ دواى گواستنەوەى بۆ <tt>UTF-16</tt>(بە زۆرکردنى ڕێگاێک بۆ پاڵپشتیکردنى نووسەى <code>non-BMP</code>)،باشترین ناسراو وەک سیستەمى <tt>Windows NT</tt>(لەدواى ئەوە لەگەڵ  <tt>Windows 2000, Windows XP</tt> لەگەڵ <tt>Windows Vista</tt>)وە بەکارهێنانى یونیکۆد بۆ ئینکۆدکردنى تەنها نووسە ناوەکیەکان.[http://en.wikipedia.org/wiki/Java_virtual_machine Java] لەگەڵ [http://en.wikipedia.org/wiki/.NET_Framework NET] ژینگەى بایتى دەقەکان


===شێوازەکانى تێکردن===
===شێوازەکانى تێکردن===
لەبەر ئەوەى جۆرەکانى تەختەکلیل ناتوانى هەموو کۆمەڵە ئامرازەکان لە خۆ بگرێت،بۆیە بیر لە هەندێک سیسته‌می كارپێكردن وە دانانى ئەلتەرنتاتڤێک بۆ شێوازەکانى تێکردن وە ڕێگادان بۆ چونەژوورەوە بۆ تەواوکردنى هەموو کارە تەکنیکەکان،وە تەنها شێوازێکە بۆ چونەژوورەوە بۆ ئامرازەکانى یونیکۆ لە <tt>codepoint</tt>،بە تایبەتى بۆ شێوازەکان.لە شێوازەکانى بنچینەیی،لە سەرەتاى دەستپێکردنى زەنجیرەکە وە بە دوایدا <tt>hexadecimal</tt> دێت بۆ <tt>codepoint</tt> لە کۆتایی زەنجیرەکە،وە شێوازەکانى هەڵبژاردنى چونەژووەرەوى پەردەى دیاریکراو،هەروەها لیستى ئامرازەکانى خشتەى پەردە،بۆ نموونە لەگەڵ ئامرازى پڕۆگرامى نەخشە،
لەبەر ئەوەى هەموو جۆرەکانى تەختەکلیل ناتوانى هەموو کۆمەڵە نووسەکان لە خۆ بگرێت،بۆیە بیر لە دابینکردنى سیسته‌می كارپێكردن کردووە وە دانانى ئەلتەرنتاتڤێک بۆ شێوازەکانى تێکردن وە ڕێگادان بۆ چونەژوورەوە بۆ تەواوکردنى هەموو کارە تەکنیکەکان،وە تەنها شێوازێکە بۆ چونەژوورەوە بۆ نووسەکانى یونیکۆ لە <tt>codepoint</tt>،بە تایبەتى بۆ شێوازەکان.لە شێوازەکانى بنچینەیی،لە سەرەتاى دەستپێکردنى زەنجیرەکە وە بە دوایدا <tt>hexadecimal</tt> دێت بۆ <tt>codepoint</tt> لە کۆتایی زەنجیرەکە،وە شێوازەکانى هەڵبژاردنى چونەژووەرەوى پەردەى دیاریکراو،هەروەها لیستى نووسەکانى خشتەى پەردە،بۆ نموونە لەگەڵ نووسەى پڕۆگرامى نەخشە،


====ئامرازەکانى گەڕۆک====
====ئامرازەکانى گەڕۆک====
ھێڵی ١٢٢: ھێڵی ١٢٢:


===پۆستى ئەلەکترۆنى===
===پۆستى ئەلەکترۆنى===
MIME کورتکراوەى <tt>Multipurpose Internet Mail Extensions</tt>ـە پێناسە دەکرێت بە دوو میکانیزمى جیاواز بۆ ئینکۆدین ئامرازى <tt>non-ASCII</tt> لە پۆستى ئەلەکترۆنى،وە گرینگى ئەدا بە ئامرازى سەرپەڕەى سەرەکى پۆستى ئەلەکترۆنى بۆ نموونە "سەردێر" یان ڕووکارى دەقەکانى نامەکەت.لە دوو کات،کۆمەڵێک ئامرازى بنەڕەتى زۆر گرینگ و زیادکردنى بۆ ئینکۆدکردنى گواستنەوە،بۆ ناردنى پۆستى ئەلەکترۆنى لە یونیکۆد UTF-8 وە هەندێک لە نووسەکان لەگەڵ  
MIME کورتکراوەى <tt>Multipurpose Internet Mail Extensions</tt>ـە پێناسە دەکرێت بە دوو میکانیزمى جیاواز بۆ ئینکۆدین ئامرازى <tt>non-ASCII</tt> لە پۆستى ئەلەکترۆنى،وە گرینگى ئەدا بە نووسەى سەرپەڕەى سەرەکى پۆستى ئەلەکترۆنى بۆ نموونە "سەردێر" یان ڕووکارى دەقەکانى نامەکەت.لە دوو کات،کۆمەڵێک نووسەى بنەڕەتى زۆر گرینگ و زیادکردنى بۆ ئینکۆدکردنى گواستنەوە،بۆ ناردنى پۆستى ئەلەکترۆنى لە یونیکۆد UTF-8 وە هەندێک لە نووسەکان لەگەڵ  





وەک پێداچوونەوەی ‏١١:٣١، ٢١ی تەممووزی ٢٠٠٩

یونیکۆد ستاندار،وەشانى ٥.٠

یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق,کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت,یونیکۆد زیاتر لە ١٠٠,٠٠٠ نووسە پێکهاتووە,وە لەلاین هەندێک نووسەوە وە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى The Unicode Standard


یونیکۆد چییە؟

کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى نووسەکان پێکهاتووە لە ژمارێک لەوانە,پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جیاوازى سیستەمى encoding هەبوو,وە بۆ جێبەجێ کردنى ئەو ژمارەیە,بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە encodingـێکى جیاواز هەبێت بۆ هەموو زمانەکان,وە بۆ زمانى ئینگلیزى,کە بە شێوەێکى دروست دەقەکان پێشان بدات,

هەروەها سیستەمى encoding بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا,بۆیە بیریتن لەوە کردووە کە ئەتوانى دوو encoding بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جیاواز یان بەکارهێنانى هەندێک ژمارەى جیاواز بۆ هەمان نووسە,وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک encodingـى جیاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جیاوزا دروستکراوە,


مێژوى یونیکۆد

سەرەتا دروست بوونى یونیکۆد لە ساڵى ١٩٨٧ لەلاین Joe Becker لەXerox هەروەها لەگەڵ Lee Collins و Mark Davis لە Apple سەرەتاى دەستپێکردنەو وە جێبەجێکردنى کارەکان بوو,بۆ دروستکردنى UCS،لە مانگى ٨ـى ساڵى داهاتوو یەکەم پێشنیارى Joe Becker ئەمە بوو "international/multilingual text character encoding system, tentatively called Unicode" بۆ زانیارى زیاتر سەێرى ئەم بەڵگەنامەیە بکە،Unicode88 |

هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو,بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە RLG هەروەها لەگەڵ Glenn Wright لە Sun Microsystems وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan لە NeXT هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ نووسەێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،

هەموو وەشانە دەرچووەکانی یونیکۆد

ژمارە ناوەکان ڕێکەوتی وەشاندن
١ یونیکۆد ١.٠ تشرینی یەکەمى ١٩٩١
٢ یونیکۆد ١.٠.١ حوزرەیرانى ١٩٩٢
٣ یونیکۆد ١.١ حوزرەیرانى ١٩٩٣
٤ یونیکۆد ٢.٠ تەمموزى ١٩٩٦
٥ یونیکۆد ٢.١ ئایارى ١٩٩٨
٦ یونیکۆد ٢.٢.١ ئایارى ١٩٩٨
٧ یونیکۆد ٣.٠ تشرینى دووەمى ١٩٩٩
٨ یونیکۆد ٣.١ ئازارى ٢٠٠١
٩ یونیکۆد ٣.٢ ئازارى ٢٠٠٢
١٠ یونیکۆد ٤.٠ نیسانى ٢٠٠٣
11 یونیکۆد ٤.٠.١ ئازارى ٢٠٠٤
12 یونیکۆد ٤.١ ئازارى ٢٠٠٥
13 یونیکۆد ٥.٠ تەمموزى ٢٠٠٨
14 یونیکۆد ٥.١ نیسانى ٢٠٠٨

لە مانگى حوزەیرانى ٢٠٠٩ وەشانى بێتا یونیکۆدى ٥.٢ بڵاوکراوەتەوە,چالاک کراوە بۆ ڕێکخستنى یونیکۆد,بڕیارى وایە لە مانگى تشرینى یەکەمى ٢٠٠٩ بە تەواوەتى بڵاوبکرێتەوە،

زانستى زمانى یونیکۆد

یونیکۆد پێناسە دەکرێت بەCodespace لە 1,114,112 وە Codepoint لە نێوان 0hex بۆ 10FFFFhex ئەمە سەرچاوەێکى ئاسایی code pointـى یونیکۆد بەم شێوەێە دەنوسرێت "U+" لە دواى ئەوە ژمارەى hexadecimal دێت،بۆ code points لە زمانە گرینگەکان Basic Multilingual Plane کە کورتکراوەى (BMP) بەکارهێنانى چوار ژمارە،(بۆ نموونە U+0058 بەکاردێت بۆ پیتى گەورەى لاتینى X)،بۆ code points لە دەرەوەى (BMP) دەبێت پێنچ یان شەش پیت بەکاربهێنیت،بەپێ پێویستى پیتەکان(بۆ نموونە U+E0001 بەکاردێت بۆ نووسەى تاگى زمان لەگەڵ U+10FFFD بۆ نووسەێکى تایبەتى-10FFFD).بەکارهێنانى وەشانى کۆنى ستاندار لەڕووى هەڵسنگیاندنەوە لەیەک دەچن،بەڵام لە ڕووى یاساوە کەمێک جیاوازە،بۆ نموونە لە یونیکۆدى ٣.٠ بەکارهێنانى "U-" دەبێت لە دواى ئەمەوە هەشت ژمارە بەکاربهێنیت لە دواى ئەم نووسە،هەروەها لەگەڵ "U+" وە بەکارهێنانى تەنها لەگەڵ چوار ژمارە دەینێرێت بۆ code unit نەک بۆ code point،یونیکۆدى codespace دابەشدەکرێت بۆ ١٧ بەش,هەروەها ٦٥,٥٣٦ code points یان ٢٥٦ ڕیز پێک دێت،

نەخشە لەگەڵ یونیکۆد

UTF لەگەڵ UCS

یونیکۆد پێناسە و نەخشە دەکرێت بە دوو ڕێگا: Unicode Transformation Format کورتکراوەى(UTF) encodings، لەگەڵ Universal Character Set کورتکراوەى (UCS)encodings،وە لە encoding نەخشەکان(لەوانەیە لە کۆمەڵى ناوەڕاست بێت)لە نێوان code pointsـى یونیکۆد بۆ ڕیزکردنى گۆڕاوەکان لە هەندێک لە نێوانى جێگیرکردنى-قەبارە،ژمارەى ناوەکانى encoding دیارى دەکرێت بە ژمارەى بتەکانى هەر یەک دانەى code value،(بۆ UTF encodings) یان دیارى کردێن بە ژمارەى بایتەکانى code value (بۆ UCS encodings)

  • UTF-1 |دەگونجێت لەگەڵ ISO 2022،بەشێکى زۆر نییە لە یونیکۆدى ستاندار.
  • UTF-8 |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ ASCII
  • UTF-EBCDIC |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ EBCDIC(بەڵام بەشێک نییە لە یونیکۆدى ستاندار)
  • UTF-16 |١٦ بت،پانى گۆڕاوەکانى encoding.
  • UTF-32 |٣٢ بت،پانى جێگیرکردنى encoding.

بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى code point,پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى encodingـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە Linux_distributions چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ encodings،چارەسەرکردنى دەقەکانى سەرەکى.

UCS-2 لەگەڵ UTF-16 encodings دیاریکردنى یونیکۆد بە Byte Order Mark کورتکراوەى (BOM) بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر encoding بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،code point U+FEFF تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە encoding یونیکۆد بەکاردێت;U+FFFE (ئەنجام گۆڕینى بایتى U+FEFF) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ U+FEFF هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى FE لەگەڵ FF هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک نووسەکان بۆ UTF-8 دەبێت زەنجیرێک بایتى EF BB BF

لە UTF-32 لەگەڵ UCS-4

بەردەوامە!

گرێدان

بەکارهێنانى یونیکۆد

سیستەمى کارپێکردن

بە هاتنى یونیکۆد دیاریکردنى چارەسەرکردنى پاشەکەوتکردنى ناوەکى دەقەکان(هەروەها بە زۆرى دەقە پاشەکەتکراوەکان بە ئینکۆدین،وە بەکارهێنانى یونیکۆد لە پاشەکەوتکردنى دەقەێکى نوێ)وە بەکارهێنانى UCS-2 لەگەڵ دواى گواستنەوەى بۆ UTF-16(بە زۆرکردنى ڕێگاێک بۆ پاڵپشتیکردنى نووسەى non-BMP)،باشترین ناسراو وەک سیستەمى Windows NT(لەدواى ئەوە لەگەڵ Windows 2000, Windows XP لەگەڵ Windows Vista)وە بەکارهێنانى یونیکۆد بۆ ئینکۆدکردنى تەنها نووسە ناوەکیەکان.Java لەگەڵ NET ژینگەى بایتى دەقەکان

شێوازەکانى تێکردن

لەبەر ئەوەى هەموو جۆرەکانى تەختەکلیل ناتوانى هەموو کۆمەڵە نووسەکان لە خۆ بگرێت،بۆیە بیر لە دابینکردنى سیسته‌می كارپێكردن کردووە وە دانانى ئەلتەرنتاتڤێک بۆ شێوازەکانى تێکردن وە ڕێگادان بۆ چونەژوورەوە بۆ تەواوکردنى هەموو کارە تەکنیکەکان،وە تەنها شێوازێکە بۆ چونەژوورەوە بۆ نووسەکانى یونیکۆ لە codepoint،بە تایبەتى بۆ شێوازەکان.لە شێوازەکانى بنچینەیی،لە سەرەتاى دەستپێکردنى زەنجیرەکە وە بە دوایدا hexadecimal دێت بۆ codepoint لە کۆتایی زەنجیرەکە،وە شێوازەکانى هەڵبژاردنى چونەژووەرەوى پەردەى دیاریکراو،هەروەها لیستى نووسەکانى خشتەى پەردە،بۆ نموونە لەگەڵ نووسەى پڕۆگرامى نەخشە،

ئامرازەکانى گەڕۆک

بۆ ئەوەى هەموو جۆرى ئامرازەکان وە هەموو زمانێکەمان لەبەر دەستدا بێت وە بەکارى بهێنین،بۆ ئەوەى بە شێوەێکى ئاسان بەکارى بهێنین ئەم پێوەکراوە دابگرە کە بۆ وێبگەڕى FireFox دروستکراوە،

تەختەکلیلێک بۆ هەموو جۆرەو ئامرازەکانى یونیکۆد

پۆستى ئەلەکترۆنى

MIME کورتکراوەى Multipurpose Internet Mail Extensionsـە پێناسە دەکرێت بە دوو میکانیزمى جیاواز بۆ ئینکۆدین ئامرازى non-ASCII لە پۆستى ئەلەکترۆنى،وە گرینگى ئەدا بە نووسەى سەرپەڕەى سەرەکى پۆستى ئەلەکترۆنى بۆ نموونە "سەردێر" یان ڕووکارى دەقەکانى نامەکەت.لە دوو کات،کۆمەڵێک نووسەى بنەڕەتى زۆر گرینگ و زیادکردنى بۆ ئینکۆدکردنى گواستنەوە،بۆ ناردنى پۆستى ئەلەکترۆنى لە یونیکۆد UTF-8 وە هەندێک لە نووسەکان لەگەڵ


بەردەوامە!

وێب

جۆرەپیتەکان

دێڕى تازە