جیاوازیی نێوان پێداچوونەوەکانی «UNICODE»

لە چاوگ
Share/Save/Bookmark
(پۆستى ئەلەکترۆنى)
 
(٥ دەستکاری لەلایەن {بەکارھێنەرێکەوە} بیشاننادرێت)
ھێڵی ١: ھێڵی ١:
 
[[Image:The_Unicode_standard.jpg|left|thumb|200px|یونیکۆد ستاندار،وەشانى ٥.٠]]
 
[[Image:The_Unicode_standard.jpg|left|thumb|200px|یونیکۆد ستاندار،وەشانى ٥.٠]]
یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق,کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت,یونیکۆد زیاتر لە ١٠٠,٠٠٠ نووسە پێکهاتووە,وە لەلاین هەندێک نووسەوە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى <tt>The Unicode Standard</tt>
+
یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق،کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت،یونیکۆد زیاتر لە ١٠٠,٠٠٠ نووسە پێکهاتووە،وە لەلاین هەندێک نووسەوە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى <tt>The Unicode Standard</tt>
  
  
 
== یونیکۆد چییە؟ ==
 
== یونیکۆد چییە؟ ==
کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى نووسەکان پێکهاتووە لە ژمارێک لەوانە,پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جیاوازى سیستەمى <tt>encoding</tt> هەبوو,وە بۆ جێبەجێ کردنى ئەو ژمارەیە,بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە <tt>encoding</tt>ـێکى جیاواز هەبێت بۆ هەموو زمانەکان,وە بۆ زمانى ئینگلیزى,کە بە شێوەێکى دروست دەقەکان پێشان بدات,
+
کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى نووسەکان پێکهاتووە لە ژمارێک لەوانە،پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جیاوازى سیستەمى ئینکۆدین هەبوو،وە بۆ جێبەجێ کردنى ئەو ژمارەیە،بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە ئینکۆدینـێکى جیاواز هەبێت بۆ هەموو زمانەکان،وە بۆ زمانى ئینگلیزى،کە بە شێوەێکى دروست دەقەکان پێشان بدات،
  
هەروەها سیستەمى <tt>encoding</tt> بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا,بۆیە بیریتن لەوە کردووە کە ئەتوانى دوو <tt>encoding</tt> بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جیاواز یان بەکارهێنانى هەندێک ژمارەى جیاواز بۆ هەمان نووسە,وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک encodingـى جیاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جیاوزا دروستکراوە,
+
هەروەها سیستەمى ئینکۆدین بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا،بۆیە بیریان لەوە کردووە کە ئەتوانى دوو ئینکۆدین بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جیاواز یان بەکارهێنانى هەندێک ژمارەى جیاواز بۆ هەمان نووسە،وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک ئینکۆدینـى جیاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جیاواز دروستکراوە،
  
  
 
== مێژوى یونیکۆد ==
 
== مێژوى یونیکۆد ==
سەرەتا دروست بوونى یونیکۆد لە ساڵى ١٩٨٧ لەلاین Joe Becker لە[http://en.wikipedia.org/wiki/Xerox Xerox] هەروەها لەگەڵ Lee Collins و  Mark Davis لە [http://en.wikipedia.org/wiki/Apple_Inc. Apple] سەرەتاى دەستپێکردنەو وە جێبەجێکردنى کارەکان بوو,بۆ دروستکردنى UCS،لە مانگى ٨ـى ساڵى داهاتوو یەکەم پێشنیارى Joe Becker ئەمە بوو <tt>"international/multilingual text character encoding system, tentatively called Unicode"</tt> بۆ زانیارى زیاتر سەێرى ئەم بەڵگەنامەیە بکە،[http://www.unicode.org/history/unicode88.pdf Unicode88]
+
سەرەتا دروست بوونى یونیکۆد لە ساڵى ١٩٨٧ لەلاین Joe Becker لە[http://en.wikipedia.org/wiki/Xerox Xerox] هەروەها لەگەڵ Lee Collins و  Mark Davis لە [http://en.wikipedia.org/wiki/Apple_Inc. Apple] سەرەتاى دەستپێکردنەو وە جێبەجێکردنى کارەکان بوو،بۆ دروستکردنى UCS،لە مانگى ٨ـى ساڵى داهاتوو یەکەم پێشنیارى Joe Becker ئەمە بوو <tt>"international/multilingual text character encoding system, tentatively called Unicode"</tt> بۆ زانیارى زیاتر سەێرى ئەم بەڵگەنامەیە بکە،[http://www.unicode.org/history/unicode88.pdf Unicode88]
 
|
 
|
  
هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو,بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە [http://en.wikipedia.org/wiki/Research_Libraries_Group RLG] هەروەها لەگەڵ Glenn Wright لە [http://en.wikipedia.org/wiki/Sun_Microsystems Sun Microsystems] وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan  لە [http://en.wikipedia.org/wiki/NeXT NeXT] هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ نووسەێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،
+
هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو،بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە [http://en.wikipedia.org/wiki/Research_Libraries_Group RLG] هەروەها لەگەڵ Glenn Wright لە [http://en.wikipedia.org/wiki/Sun_Microsystems Sun Microsystems] وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan  لە [http://en.wikipedia.org/wiki/NeXT NeXT] هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ نووسەێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،
  
 
== هەموو وەشانە دەرچووەکانی یونیکۆد ==
 
== هەموو وەشانە دەرچووەکانی یونیکۆد ==
ھێڵی ٨٩: ھێڵی ٨٩:
  
 
===UTF لەگەڵ UCS===
 
===UTF لەگەڵ UCS===
یونیکۆد پێناسە و نەخشە دەکرێت بە دوو ڕێگا: <tt>Unicode Transformation Format</tt> کورتکراوەى<code>(UTF)</code> encodings، لەگەڵ <tt>Universal Character Set</tt> کورتکراوەى <code>(UCS)</code>encodings،وە لە <tt>encoding</tt> نەخشەکان(لەوانەیە لە کۆمەڵى ناوەڕاست بێت)لە نێوان <tt>code points</tt>ـى یونیکۆد بۆ ڕیزکردنى گۆڕاوەکان لە هەندێک لە نێوانى  جێگیرکردنى-قەبارە،ژمارەى ناوەکانى <tt>encoding</tt> دیارى دەکرێت بە ژمارەى بتەکانى هەر یەک دانەى <tt>code value</tt>،(بۆ UTF encodings) یان دیارى کردێن بە ژمارەى بایتەکانى <tt>code value</tt> (بۆ UCS encodings)
+
یونیکۆد پێناسە و نەخشە دەکرێت بە دوو ڕێگا: <tt>Unicode Transformation Format</tt> کورتکراوەى<code>(UTF)</code> encodings، لەگەڵ <tt>Universal Character Set</tt> کورتکراوەى <code>(UCS)</code>encodings،وە لە ئینکۆدینى نەخشەکان(لەوانەیە لە کۆمەڵى ناوەڕاست بێت)لە نێوان <tt>code points</tt>ـى یونیکۆد بۆ ڕیزکردنى گۆڕاوەکان لە هەندێک لە نێوانى  جێگیرکردنى-قەبارە،ژمارەى ناوەکانى ئینکۆدین دیارى دەکرێت بە ژمارەى بتەکانى هەر یەک دانەى <tt>code value</tt>،(بۆ UTF ئینکۆدینەکان) یان دیارى کردێن بە ژمارەى بایتەکانى <tt>code value</tt> (بۆ UCS ئینکۆدینەکان)
  
 
*UTF-1 |دەگونجێت لەگەڵ [http://en.wikipedia.org/wiki/ISO/IEC_2022 ISO 2022]،بەشێکى زۆر نییە لە یونیکۆدى ستاندار.
 
*UTF-1 |دەگونجێت لەگەڵ [http://en.wikipedia.org/wiki/ISO/IEC_2022 ISO 2022]،بەشێکى زۆر نییە لە یونیکۆدى ستاندار.
 
*UTF-8 |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ [http://en.wikipedia.org/wiki/ASCII ASCII]
 
*UTF-8 |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ [http://en.wikipedia.org/wiki/ASCII ASCII]
 
*UTF-EBCDIC |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ [http://en.wikipedia.org/wiki/EBCDIC EBCDIC](بەڵام بەشێک نییە لە یونیکۆدى ستاندار)
 
*UTF-EBCDIC |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ [http://en.wikipedia.org/wiki/EBCDIC EBCDIC](بەڵام بەشێک نییە لە یونیکۆدى ستاندار)
*UTF-16 |١٦ بت،پانى گۆڕاوەکانى encoding.  
+
*UTF-16 |١٦ بت،پانى گۆڕاوەکانى ئینکۆدین.  
*UTF-32 |٣٢ بت،پانى جێگیرکردنى encoding.
+
*UTF-32 |٣٢ بت،پانى جێگیرکردنى ئینکۆدین.
  
بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى code point,پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى encodingـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە [http://en.wikipedia.org/wiki/Linux_distributions Linux_distributions] چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ encodings،چارەسەرکردنى دەقەکانى سەرەکى.
+
بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى <tt>code point</tt>،پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى ئینکۆدینـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە [http://en.wikipedia.org/wiki/Linux_distributions Linux_distributions] چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ ئینکۆدینەکان،چارەسەرکردنى دەقەکانى سەرەکى.
  
UCS-2 لەگەڵ UTF-16 <code>encodings</code> دیاریکردنى یونیکۆد بە [http://en.wikipedia.org/wiki/Byte_Order_Mark Byte Order Mark] کورتکراوەى <code>(BOM)</code> بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر encoding بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،<code>code point U+FEFF</code> تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە encoding یونیکۆد بەکاردێت;<code>U+FFFE</code> (ئەنجام گۆڕینى بایتى <code>U+FEFF</code>) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ <code>U+FEFF</code> هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى <tt>FE</tt> لەگەڵ <tt>FF</tt> هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک نووسەکان بۆ UTF-8 دەبێت زەنجیرێک بایتى  <tt>EF BB BF</tt>
+
UCS-2 لەگەڵ UTF-16 <code>encodings</code> دیاریکردنى یونیکۆد بە [http://en.wikipedia.org/wiki/Byte_Order_Mark Byte Order Mark] کورتکراوەى <code>(BOM)</code> بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر ئینکۆدین بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،<code>code point U+FEFF</code> تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە ئینکۆدین یونیکۆد بەکاردێت;<code>U+FFFE</code> (ئەنجام گۆڕینى بایتى <code>U+FEFF</code>) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ <code>U+FEFF</code> هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى <tt>FE</tt> لەگەڵ <tt>FF</tt> هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک نووسەکان بۆ UTF-8 دەبێت زەنجیرێک بایتى  <tt>EF BB BF</tt>
  
لە UTF-32 لەگەڵ UCS-4
 
  
بەردەوامە!
 
  
 
===گرێدان===
 
===گرێدان===
 
+
هەندێک لە پرۆگرامۆکەکان،وەک عەرەبى لەگەڵ <tt>Devanagari</tt> هەریەکەیان یاساى نوسینى تایبەتى بە خۆیان هەیە،وە بانگى دەکات لەلاین هەندێک پێکهاتەوە، شێوەى نامەى هەیە بۆ بەشداریکردن بە تایبەتى لە [http://en.wikipedia.org/wiki/Ligature_(typography) ligature forms] ، یاساکان کۆنترۆڵى شێوازەى گرێدان دەکات وە ئەتوانى بە شێوەێکى زۆر ئاڵۆز بێت،پێویستیەکانى تەکنۆلۆژیاى شێوازەکانى پرۆگرامۆکەى تایبەت کە وەک <tt>ACE</tt>(<code>Arabic Calligraphic Engine</code> لەلاین DecoType لە ساڵى ١٩٨٠ لەگەڵ بەکارهێنانى بەدیهێنانى هەموو نموونەکانى عەرەبى لە وەشانى دەرنووسەرکراو لە یونیکۆدى ستاندار)دەبێت هۆى سەلمانن وتێگەیشتنى بۆ [http://en.wikipedia.org/wiki/OpenType OpenType] (لەلاین Adobe لەگەڵ Microsoft)،[http://en.wikipedia.org/wiki/Graphite_(SIL) Graphite](لەلاین [http://en.wikipedia.org/wiki/SIL_International  SIL International])یان [http://en.wikipedia.org/wiki/Apple_Advanced_Typography AAT] (لەلاین Apple).فرمانکردن بە هەموو جێگیرکراوەکان وە بانگکردنى جۆرەپیتەکانى ناو سیستەمى کارپێکردن بۆ ئەوەى دەرەنجامى زەنجیرەى نووسە جیاوازەکان بە شێوەێکى دروست
  
 
== بەکارهێنانى یونیکۆد ==
 
== بەکارهێنانى یونیکۆد ==
ھێڵی ١٢٢: ھێڵی ١٢٠:
  
 
===پۆستى ئەلەکترۆنى===
 
===پۆستى ئەلەکترۆنى===
MIME کورتکراوەى <tt>Multipurpose Internet Mail Extensions</tt>ـە پێناسە دەکرێت بە دوو میکانیزمى جیاواز بۆ ئینکۆدین ئامرازى <tt>non-ASCII</tt> لە پۆستى ئەلەکترۆنى،وە گرینگى ئەدا بە نووسەى سەرپەڕەى سەرەکى پۆستى ئەلەکترۆنى بۆ نموونە "سەردێر" یان ڕووکارى دەقەکانى نامەکەت.لە دوو کات،کۆمەڵێک نووسەى بنەڕەتى زۆر گرینگ و زیادکردنى بۆ ئینکۆدکردنى گواستنەوە،بۆ ناردنى پۆستى ئەلەکترۆنى لە یونیکۆد UTF-8 وە هەندێک لە نووسەکان لەگەڵ [http://en.wikipedia.org/wiki/Base64 Base64] یان [http://en.wikipedia.org/wiki/Quoted-printable Quoted-printable4] گواستنەوەو گەیاندن بە <tt>encoding</tt> وە گرینگ زۆر ئەدا بە ناوەڕۆکى نامەکە وە نووسەى ASCII.دوو ڕوونکردنەوەو میکانیزمى جیاوازى دیاریکراو ئەدا بۆ MIME ستاندار لەگەڵ شاردنەوەى بە شێوەێکى سەرەکى لەلاین بەکارهێنانى کاڵانەرمەکانى پۆستى ئەلەکترۆنى،وە بەکارهێنانى یەنیکۆد لە پۆستى ئەلەکترۆنى زۆر خاوە،هەندێک کات دەقەکانى زمانى <tt>East-Asian</tt> وە تا ئێستایش شاراوەتەوە لە <tt>encodings</tt> کە وەک [http://en.wikipedia.org/wiki/ISO-2022 ISO-2022] لەگەڵ هەندێک پارچە وەک موبایل،تا ئێستا نەتوانراوە چارەسەرى داتاکانى یونیکۆد بکرێت بە شێوەێکى ڕاست،پاڵپشتیکردنى و باشترکردنى هەر چۆنێک بێت،لەلاین هەندێک مەێلى خۆڕاى سەرەکى وەک <code>Yahoo, Google (gmail)</code> لەگەڵ <code>Microsoft (Hotmail)</code> پاڵپشتیکراوە،  
+
MIME کورتکراوەى <tt>Multipurpose Internet Mail Extensions</tt>ـە پێناسە دەکرێت بە دوو میکانیزمى جیاواز بۆ ئینکۆدین بەکارهێنانى نووسەى <tt>non-ASCII</tt> لە پۆستى ئەلەکترۆنى،وە گرینگى ئەدا بە نووسەى سەرپەڕەى سەرەکى پۆستى ئەلەکترۆنى بۆ نموونە "سەردێر" یان ڕووکارى دەقەکانى نامەکەت.لە دوو کات،کۆمەڵێک نووسەى بنەڕەتى زۆر گرینگ و زیادکردنى بۆ ئینکۆدکردنى گواستنەوە،بۆ ناردنى پۆستى ئەلەکترۆنى لە یونیکۆد UTF-8 وە هەندێک لە نووسەکان لەگەڵ [http://en.wikipedia.org/wiki/Base64 Base64] یان [http://en.wikipedia.org/wiki/Quoted-printable Quoted-printable4] گواستنەوەو گەیاندن بە ئینکۆدین وە گرینگ زۆر ئەدا بە ناوەڕۆکى نامەکە وە نووسەى ASCII.دوو ڕوونکردنەوە و میکانیزمى جیاوازى دیاریکراو ئەدا بۆ MIME ستاندار لەگەڵ شاردنەوەى بە شێوەێکى سەرەکى لەلاین بەکارهێنانى کاڵانەرمەکانى پۆستى ئەلەکترۆنى،وە بەکارهێنانى یونیکۆد لە پۆستى ئەلەکترۆنى زۆر خاوە،هەندێک کات دەقەکانى زمانى <tt>East-Asian</tt> وە تا ئێستایش شاراوەتەوە لە ئینکۆدینەکان کە وەک [http://en.wikipedia.org/wiki/ISO-2022 ISO-2022] لەگەڵ هەندێک پارچە وەک موبایل،تا ئێستا نەتوانراوە چارەسەرى داتاکانى یونیکۆد بکرێت بە شێوەێکى ڕاست،پاڵپشتیکردنى و باشترکردنى هەر چۆنێک بێت،بەڵام لەلاین هەندێک مەێلى خۆڕاى سەرەکى وەک <code>Yahoo, Google (gmail)</code> لەگەڵ <code>Microsoft (Hotmail)</code> پاڵپشتیکراوە،  
 
      
 
      
 
====بەکارهێنانى یونیکۆد لە پۆستى جیاواز====  
 
====بەکارهێنانى یونیکۆد لە پۆستى جیاواز====  
 
زۆربەى کات سەێر دەکەین وێبگەڕەکەمان پاڵپشتى یونیکۆد ناکات وە دەقەکان بە شێوەێکى زۆر ناشرین پێشان ئەدا,بۆ ئەوەى بە شێوەێکى دروست  ڕێکیبخەین بۆ یونیکۆد ئەم هەنگاوانەى خوارەوە جێبەجێ دەکەین،   
 
زۆربەى کات سەێر دەکەین وێبگەڕەکەمان پاڵپشتى یونیکۆد ناکات وە دەقەکان بە شێوەێکى زۆر ناشرین پێشان ئەدا,بۆ ئەوەى بە شێوەێکى دروست  ڕێکیبخەین بۆ یونیکۆد ئەم هەنگاوانەى خوارەوە جێبەجێ دەکەین،   
 
      
 
      
====گەشەکردن====  
+
====Evolution ====  
 
<pre>  
 
<pre>  
 
View > Character Encoding > Unicode  
 
View > Character Encoding > Unicode  
 
Tools > Settings > Mail Preferences and Composer Preferences > Check default Character Encoding to Unicode  
 
Tools > Settings > Mail Preferences and Composer Preferences > Check default Character Encoding to Unicode  
</pre>  
+
</pre>
   
+
 
 
====Mozilla Thunderbird====  
 
====Mozilla Thunderbird====  
 
<pre>  
 
<pre>  
ھێڵی ١٤٥: ھێڵی ١٤٣:
  
 
===وێب===
 
===وێب===
 +
هەموو <tt>W3C</tt> ئامۆژگارێەکانى بەکاردێت لە یونیکۆد وە بەڵگەنامە و نووسەکان لە کاتى <tt>HTML 4.0</tt>.پاڵپشتیکردنى وێبگەڕەکان بۆ یونیکۆد،بە تایبەتى<tt>UTF-8</tt>،بۆ هەندێک ساڵ.لە ئەنجامدا کێشەى پێشاندانى سەرەکى لە جۆرەپیت لەگەڵ پەیوەندى کێشەکە هەبوو،بە شێوەێکى تایبەتى،وەشانى <tt>Internet Explorer</tt> مایکرۆسۆفت ناتوانى بە شێوەێکى زۆر <tt>code points</tt> بگەڕێنێتەوە،دەبێت بانگى بکات  بە شێوەێکى ڕوون وە بەکارهێناى جۆرەپیتەکانى ناوەڕۆک
 +
 +
هەروەها یاساى syntax کاریگەرى هەیە لەسەر هەر فرمانێک لە هەر نووسەێکى ڕێگاپێدارەوە بۆ پێشاندان، <tt>HTML 4</tt> لەگەڵ <code>XML ( XHTML)</code> بەڵگەنامەکانى نەبێت،پێناسە دەکرێت،بە پەستانى نووسەکان وە لە بەزۆرى <tt>code points</tt>ـەکانى یونیکۆد،جگە لەمانە:
 +
 +
*بە زۆرى [http://en.wikipedia.org/wiki/C0_and_C1_control_codes C0 and C1 control codes]
 +
*<tt>code points D800–DFFF</tt> دیارینەکراوە هەموو کاتێک،
 +
*هەر <tt>code point</tt> لە کۆتایی FFFE یان FFFF بێت،
 +
 +
ئەم نووسانە پێشاندەدرێت بە ڕاستەخۆ وە بایتەکانى ڕێگاپێدراو دەبێت بۆ ئینکۆدکردنى بەڵگەنامە،هەروەها پاڵپشتیکردنى ئینکۆدین دەکات یان بەکارهێنەرەکانى هەندێک نوسینى ژمارەى نووسەکانەوە، سەرچاوەى سەرەکى لە <tt>code point</tt>ـى یوینکۆدى نووسەکان،بۆ نموونە<code>&amp;#916;</code>, <code>&amp;#1049;</code>, <code>&amp;#1511;</code>, <code>&amp;#1605;</code>, <code>&amp;#3671;</code>, <code>&amp;#12354;</code>, <code>&amp;#21494;</code>, <code>&amp;#33865;</code>, لەگەڵ <code>&amp;#47568;</code> (یان هەندێک ژمارەى گۆڕاو لە سەرەتاى <tt>hexadecimal</tt>،لەگەڵ <code>&amp;#x</code> هەر لە سەرەتاوە)پێویست دەکات لە هەموو وێبگەڕێک پێشانبدە،Δ, Й, ק, ‎ م, ๗, あ, 叶, 葉, لەگەڵ 말.
  
 
===جۆرەپیتەکان===
 
===جۆرەپیتەکان===
  
===دێڕى تازە===
 
  
  
 +
 +
 +
 +
 +
 +
 +
 +
[[Category:Others]]
  
  
 
{{DISPLAYTITLE:دەربارەى یونیکۆد بە زمانى کوردى}}
 
{{DISPLAYTITLE:دەربارەى یونیکۆد بە زمانى کوردى}}

دوایین پێداچوونەوەی ‏٠٠:١٩، ٥ی ئەیلوولی ٢٠٠٩

یونیکۆد ستاندار،وەشانى ٥.٠

یونیکۆد لە کۆمپیوتەر پێوەرێکى ستاندارە کە بۆ پێشاندانى دەقەکانى هەر زمانێک بێت,هەروەها کۆمپیوتەرەکان پێک هاتوو لە کۆمەڵێک دەق،کە بە هەر پڕۆگرامێکى نوسینى سیستەمەوە نوسرا بێت،یونیکۆد زیاتر لە ١٠٠,٠٠٠ نووسە پێکهاتووە،وە لەلاین هەندێک نووسەوە بە شێوەێکى ستاندار وە جێگیر کرا بۆ وەشانێکى نوێ لە کتێبى The Unicode Standard


یونیکۆد چییە؟

کۆمپیوتەر تەنها لەگەڵ ژمارە کار دەکات,هەموو ئەوانەى کە بۆ پاشەکەوتکردنى نووسەکان پێکهاتووە لە ژمارێک لەوانە،پێش ئەوەى یونیکۆد دروست بێت ١٠٠ جۆرەى جیاوازى سیستەمى ئینکۆدین هەبوو،وە بۆ جێبەجێ کردنى ئەو ژمارەیە،بۆ نموونە یەکێتى ئەوروپا داوایان کرد کە پێویستە ئینکۆدینـێکى جیاواز هەبێت بۆ هەموو زمانەکان،وە بۆ زمانى ئینگلیزى،کە بە شێوەێکى دروست دەقەکان پێشان بدات،

هەروەها سیستەمى ئینکۆدین بەکاردێن لەلاین چەند کەسێکەوە بۆیە بەیەکدانێک روو ئەدا،بۆیە بیریان لەوە کردووە کە ئەتوانى دوو ئینکۆدین بەکاربهێنیت لە هەمان کات بۆ دوو کەسى جیاواز یان بەکارهێنانى هەندێک ژمارەى جیاواز بۆ هەمان نووسە،وە هەر کۆمپیوتەرەێک(بە تایبەتى ڕاژە)پێویستە پاڵپشتیکردنى هەندێک ئینکۆدینـى جیاواز بکات بۆ پێشاندانى هەموو ئەو ماڵپەڕانەى کە لەسەر ڕاژەییە کە بە چەند زمانێکى جیاواز دروستکراوە،


مێژوى یونیکۆد

سەرەتا دروست بوونى یونیکۆد لە ساڵى ١٩٨٧ لەلاین Joe Becker لەXerox هەروەها لەگەڵ Lee Collins و Mark Davis لە Apple سەرەتاى دەستپێکردنەو وە جێبەجێکردنى کارەکان بوو،بۆ دروستکردنى UCS،لە مانگى ٨ـى ساڵى داهاتوو یەکەم پێشنیارى Joe Becker ئەمە بوو "international/multilingual text character encoding system, tentatively called Unicode" بۆ زانیارى زیاتر سەێرى ئەم بەڵگەنامەیە بکە،Unicode88 |

هەروەها لە سەرەتا ١٩٨٩ گرووپێکى یونیکۆد دروست بوو،بۆ جێبەجێکردنى کارەکانیان پێکهاتبوو لە Ken Whistler لەگەڵ Mike Kernaghan لە وەرگرتن،Karen Smith-Yoshimura لەگەڵ Joan Aliprand لە RLG هەروەها لەگەڵ Glenn Wright لە Sun Microsystems وە لە ساڵى ١٩٩٠ Michel Suignard لەگەڵ Asmus Freytag لە مایکرۆسۆفت وە لەگەڵ Rick McGowan لە NeXT هەموو ئەمانە هاتنە ناو ئەم گرووپەوە،وە لە کۆتایی ١٩٩٠ دەستیان کرد بە ئیشکردن وە بۆ دانانى نەخشەێک بۆ نووسەێکى encodingـێکى ستاندار بە تەواوەتى،هەروەها بۆ دووبارەکردنەوەى لە کۆتایی بۆ ئامادەکردن،بۆ یەکگرتنەوەى ڕێکخستنەکانى یونیکۆد لە ٣/١/١٩٩١ لە کالیفۆرنیا هەروەها لە مانگى ١٠ـى ١٩٩١ یەکەم وەشانى دەرچوو بەشێوەێکى ستاندار,سەێرى ئەم خشتەى خوارەوە بکە،هەموو وەشانەکانى یونیکۆدە،

هەموو وەشانە دەرچووەکانی یونیکۆد

ژمارە ناوەکان ڕێکەوتی وەشاندن
١ یونیکۆد ١.٠ تشرینی یەکەمى ١٩٩١
٢ یونیکۆد ١.٠.١ حوزرەیرانى ١٩٩٢
٣ یونیکۆد ١.١ حوزرەیرانى ١٩٩٣
٤ یونیکۆد ٢.٠ تەمموزى ١٩٩٦
٥ یونیکۆد ٢.١ ئایارى ١٩٩٨
٦ یونیکۆد ٢.٢.١ ئایارى ١٩٩٨
٧ یونیکۆد ٣.٠ تشرینى دووەمى ١٩٩٩
٨ یونیکۆد ٣.١ ئازارى ٢٠٠١
٩ یونیکۆد ٣.٢ ئازارى ٢٠٠٢
١٠ یونیکۆد ٤.٠ نیسانى ٢٠٠٣
11 یونیکۆد ٤.٠.١ ئازارى ٢٠٠٤
12 یونیکۆد ٤.١ ئازارى ٢٠٠٥
13 یونیکۆد ٥.٠ تەمموزى ٢٠٠٨
14 یونیکۆد ٥.١ نیسانى ٢٠٠٨

لە مانگى حوزەیرانى ٢٠٠٩ وەشانى بێتا یونیکۆدى ٥.٢ بڵاوکراوەتەوە,چالاک کراوە بۆ ڕێکخستنى یونیکۆد,بڕیارى وایە لە مانگى تشرینى یەکەمى ٢٠٠٩ بە تەواوەتى بڵاوبکرێتەوە،

زانستى زمانى یونیکۆد

یونیکۆد پێناسە دەکرێت بەCodespace لە 1,114,112 وە Codepoint لە نێوان 0hex بۆ 10FFFFhex ئەمە سەرچاوەێکى ئاسایی code pointـى یونیکۆد بەم شێوەێە دەنوسرێت "U+" لە دواى ئەوە ژمارەى hexadecimal دێت،بۆ code points لە زمانە گرینگەکان Basic Multilingual Plane کە کورتکراوەى (BMP) بەکارهێنانى چوار ژمارە،(بۆ نموونە U+0058 بەکاردێت بۆ پیتى گەورەى لاتینى X)،بۆ code points لە دەرەوەى (BMP) دەبێت پێنچ یان شەش پیت بەکاربهێنیت،بەپێ پێویستى پیتەکان(بۆ نموونە U+E0001 بەکاردێت بۆ نووسەى تاگى زمان لەگەڵ U+10FFFD بۆ نووسەێکى تایبەتى-10FFFD).بەکارهێنانى وەشانى کۆنى ستاندار لەڕووى هەڵسنگیاندنەوە لەیەک دەچن،بەڵام لە ڕووى یاساوە کەمێک جیاوازە،بۆ نموونە لە یونیکۆدى ٣.٠ بەکارهێنانى "U-" دەبێت لە دواى ئەمەوە هەشت ژمارە بەکاربهێنیت لە دواى ئەم نووسە،هەروەها لەگەڵ "U+" وە بەکارهێنانى تەنها لەگەڵ چوار ژمارە دەینێرێت بۆ code unit نەک بۆ code point،یونیکۆدى codespace دابەشدەکرێت بۆ ١٧ بەش,هەروەها ٦٥,٥٣٦ code points یان ٢٥٦ ڕیز پێک دێت،

نەخشە لەگەڵ یونیکۆد

UTF لەگەڵ UCS

یونیکۆد پێناسە و نەخشە دەکرێت بە دوو ڕێگا: Unicode Transformation Format کورتکراوەى(UTF) encodings، لەگەڵ Universal Character Set کورتکراوەى (UCS)encodings،وە لە ئینکۆدینى نەخشەکان(لەوانەیە لە کۆمەڵى ناوەڕاست بێت)لە نێوان code pointsـى یونیکۆد بۆ ڕیزکردنى گۆڕاوەکان لە هەندێک لە نێوانى جێگیرکردنى-قەبارە،ژمارەى ناوەکانى ئینکۆدین دیارى دەکرێت بە ژمارەى بتەکانى هەر یەک دانەى code value،(بۆ UTF ئینکۆدینەکان) یان دیارى کردێن بە ژمارەى بایتەکانى code value (بۆ UCS ئینکۆدینەکان)

  • UTF-1 |دەگونجێت لەگەڵ ISO 2022،بەشێکى زۆر نییە لە یونیکۆدى ستاندار.
  • UTF-8 |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ ASCII
  • UTF-EBCDIC |٨ بت،پانى گۆڕاوەکانى encoding،دەگونجێت لەگەڵ EBCDIC(بەڵام بەشێک نییە لە یونیکۆدى ستاندار)
  • UTF-16 |١٦ بت،پانى گۆڕاوەکانى ئینکۆدین.
  • UTF-32 |٣٢ بت،پانى جێگیرکردنى ئینکۆدین.

بەکارهێنانى UTF-8 لە هەر یەک بۆ چوار بایتەکانى code point،پتەو دەبێت بۆ پڕۆگرامۆکەى لاتینى لەگەڵ ASCII-دەگونجێت،گەڕانەوەى ڕاستى ئینکۆدینـى ستاندار بۆ گۆڕینەوەى دەقى یونیکۆد،هەروەها بەکارهێنانى پێشتر لە Linux_distributions چارەسەرکردنى ڕاستەخۆ و گۆڕینى بۆ ئینکۆدینەکان،چارەسەرکردنى دەقەکانى سەرەکى.

UCS-2 لەگەڵ UTF-16 encodings دیاریکردنى یونیکۆد بە Byte Order Mark کورتکراوەى (BOM) بەکاردێت لەسەرەتاى پاشەکەوتکردنى دەقەکان پەڕگە،بەکارهێنانى فرمانى بایت وە دۆرزینەوەى هەندێک پڕۆگرام پەرەى پێدەدرێت بۆ ئەوەى بگونجێت لەگەڵ هەر ئینکۆدین بێت،بەکارهێنانى UTF-8 هیچ کات پێویستى بە نیشانى فرمانى بایتەوە نییە.لە هەندێک کات هەوڵ دەدرێت بۆ دیاریکردنى پەڕگەکەو ناوەڕۆکى دەقە بە یونیکۆد بەBOM،code point U+FEFF تایبەتمەندى و گرینگى دیار نییە بە دووبارەکردنەوەى فرمانى بایت،بە پێ گوێدانە لە ئینکۆدین یونیکۆد بەکاردێت;U+FFFE (ئەنجام گۆڕینى بایتى U+FEFF) یەکسان نییە بە ئامرازە یاسایەکان،لەگەڵ U+FEFF هەر شوێنێک وە لە هەر سەرەتا دەقێکەوە بێت،هەروەها یەکەى FE لەگەڵ FF هەرگیز بەکارناهێت لە UTF-8.وە گۆڕینى هەندێک نووسەکان بۆ UTF-8 دەبێت زەنجیرێک بایتى EF BB BF


گرێدان

هەندێک لە پرۆگرامۆکەکان،وەک عەرەبى لەگەڵ Devanagari هەریەکەیان یاساى نوسینى تایبەتى بە خۆیان هەیە،وە بانگى دەکات لەلاین هەندێک پێکهاتەوە، شێوەى نامەى هەیە بۆ بەشداریکردن بە تایبەتى لە ligature forms ، یاساکان کۆنترۆڵى شێوازەى گرێدان دەکات وە ئەتوانى بە شێوەێکى زۆر ئاڵۆز بێت،پێویستیەکانى تەکنۆلۆژیاى شێوازەکانى پرۆگرامۆکەى تایبەت کە وەک ACE(Arabic Calligraphic Engine لەلاین DecoType لە ساڵى ١٩٨٠ لەگەڵ بەکارهێنانى بەدیهێنانى هەموو نموونەکانى عەرەبى لە وەشانى دەرنووسەرکراو لە یونیکۆدى ستاندار)دەبێت هۆى سەلمانن وتێگەیشتنى بۆ OpenType (لەلاین Adobe لەگەڵ Microsoft)،Graphite(لەلاین SIL International)یان AAT (لەلاین Apple).فرمانکردن بە هەموو جێگیرکراوەکان وە بانگکردنى جۆرەپیتەکانى ناو سیستەمى کارپێکردن بۆ ئەوەى دەرەنجامى زەنجیرەى نووسە جیاوازەکان بە شێوەێکى دروست

بەکارهێنانى یونیکۆد

سیستەمى کارپێکردن

بە هاتنى یونیکۆد دیاریکردنى چارەسەرکردنى پاشەکەوتکردنى ناوەکى دەقەکان(هەروەها بە زۆرى دەقە پاشەکەتکراوەکان بە ئینکۆدین،وە بەکارهێنانى یونیکۆد لە پاشەکەوتکردنى دەقەێکى نوێ)وە بەکارهێنانى UCS-2 لەگەڵ دواى گواستنەوەى بۆ UTF-16(بە زۆرکردنى ڕێگاێک بۆ پاڵپشتیکردنى نووسەى non-BMP)،باشترین ناسراو وەک سیستەمى Windows NT(لەدواى ئەوە لەگەڵ Windows 2000, Windows XP لەگەڵ Windows Vista)وە بەکارهێنانى یونیکۆد بۆ ئینکۆدکردنى تەنها نووسە ناوەکیەکان.Java لەگەڵ NET ژینگەى بایتى دەقەکان

شێوازەکانى تێکردن

لەبەر ئەوەى هەموو جۆرەکانى تەختەکلیل ناتوانى هەموو کۆمەڵە نووسەکان لە خۆ بگرێت،بۆیە بیر لە دابینکردنى سیسته‌می كارپێكردن کردووە وە دانانى ئەلتەرنتاتڤێک بۆ شێوازەکانى تێکردن وە ڕێگادان بۆ چونەژوورەوە بۆ تەواوکردنى هەموو کارە تەکنیکەکان،وە تەنها شێوازێکە بۆ چونەژوورەوە بۆ نووسەکانى یونیکۆ لە codepoint،بە تایبەتى بۆ شێوازەکان.لە شێوازەکانى بنچینەیی،لە سەرەتاى دەستپێکردنى زەنجیرەکە وە بە دوایدا hexadecimal دێت بۆ codepoint لە کۆتایی زەنجیرەکە،وە شێوازەکانى هەڵبژاردنى چونەژووەرەوى پەردەى دیاریکراو،هەروەها لیستى نووسەکانى خشتەى پەردە،بۆ نموونە لەگەڵ نووسەى پڕۆگرامى نەخشە،

ئامرازەکانى گەڕۆک

بۆ ئەوەى هەموو جۆرى ئامرازەکان وە هەموو زمانێکەمان لەبەر دەستدا بێت وە بەکارى بهێنین،بۆ ئەوەى بە شێوەێکى ئاسان بەکارى بهێنین ئەم پێوەکراوە دابگرە کە بۆ وێبگەڕى FireFox دروستکراوە،

تەختەکلیلێک بۆ هەموو جۆرەو ئامرازەکانى یونیکۆد

پۆستى ئەلەکترۆنى

MIME کورتکراوەى Multipurpose Internet Mail Extensionsـە پێناسە دەکرێت بە دوو میکانیزمى جیاواز بۆ ئینکۆدین بەکارهێنانى نووسەى non-ASCII لە پۆستى ئەلەکترۆنى،وە گرینگى ئەدا بە نووسەى سەرپەڕەى سەرەکى پۆستى ئەلەکترۆنى بۆ نموونە "سەردێر" یان ڕووکارى دەقەکانى نامەکەت.لە دوو کات،کۆمەڵێک نووسەى بنەڕەتى زۆر گرینگ و زیادکردنى بۆ ئینکۆدکردنى گواستنەوە،بۆ ناردنى پۆستى ئەلەکترۆنى لە یونیکۆد UTF-8 وە هەندێک لە نووسەکان لەگەڵ Base64 یان Quoted-printable4 گواستنەوەو گەیاندن بە ئینکۆدین وە گرینگ زۆر ئەدا بە ناوەڕۆکى نامەکە وە نووسەى ASCII.دوو ڕوونکردنەوە و میکانیزمى جیاوازى دیاریکراو ئەدا بۆ MIME ستاندار لەگەڵ شاردنەوەى بە شێوەێکى سەرەکى لەلاین بەکارهێنانى کاڵانەرمەکانى پۆستى ئەلەکترۆنى،وە بەکارهێنانى یونیکۆد لە پۆستى ئەلەکترۆنى زۆر خاوە،هەندێک کات دەقەکانى زمانى East-Asian وە تا ئێستایش شاراوەتەوە لە ئینکۆدینەکان کە وەک ISO-2022 لەگەڵ هەندێک پارچە وەک موبایل،تا ئێستا نەتوانراوە چارەسەرى داتاکانى یونیکۆد بکرێت بە شێوەێکى ڕاست،پاڵپشتیکردنى و باشترکردنى هەر چۆنێک بێت،بەڵام لەلاین هەندێک مەێلى خۆڕاى سەرەکى وەک Yahoo, Google (gmail) لەگەڵ Microsoft (Hotmail) پاڵپشتیکراوە،

بەکارهێنانى یونیکۆد لە پۆستى جیاواز

زۆربەى کات سەێر دەکەین وێبگەڕەکەمان پاڵپشتى یونیکۆد ناکات وە دەقەکان بە شێوەێکى زۆر ناشرین پێشان ئەدا,بۆ ئەوەى بە شێوەێکى دروست ڕێکیبخەین بۆ یونیکۆد ئەم هەنگاوانەى خوارەوە جێبەجێ دەکەین،

Evolution

 
View > Character Encoding > Unicode 
Tools > Settings > Mail Preferences and Composer Preferences > Check default Character Encoding to Unicode 

Mozilla Thunderbird

 
View > Character Encoding > Unicode 
Tools > Options… > Fonts > Outgoing Mail / Incoming Mail (change to Unicode) 

بۆ سیستەمى کارپێکردنى ماک

 
Preferences > Display > Formatting > Fonts… > Character Encoding  

وێب

هەموو W3C ئامۆژگارێەکانى بەکاردێت لە یونیکۆد وە بەڵگەنامە و نووسەکان لە کاتى HTML 4.0.پاڵپشتیکردنى وێبگەڕەکان بۆ یونیکۆد،بە تایبەتىUTF-8،بۆ هەندێک ساڵ.لە ئەنجامدا کێشەى پێشاندانى سەرەکى لە جۆرەپیت لەگەڵ پەیوەندى کێشەکە هەبوو،بە شێوەێکى تایبەتى،وەشانى Internet Explorer مایکرۆسۆفت ناتوانى بە شێوەێکى زۆر code points بگەڕێنێتەوە،دەبێت بانگى بکات بە شێوەێکى ڕوون وە بەکارهێناى جۆرەپیتەکانى ناوەڕۆک

هەروەها یاساى syntax کاریگەرى هەیە لەسەر هەر فرمانێک لە هەر نووسەێکى ڕێگاپێدارەوە بۆ پێشاندان، HTML 4 لەگەڵ XML ( XHTML) بەڵگەنامەکانى نەبێت،پێناسە دەکرێت،بە پەستانى نووسەکان وە لە بەزۆرى code pointsـەکانى یونیکۆد،جگە لەمانە:

  • بە زۆرى C0 and C1 control codes
  • code points D800–DFFF دیارینەکراوە هەموو کاتێک،
  • هەر code point لە کۆتایی FFFE یان FFFF بێت،

ئەم نووسانە پێشاندەدرێت بە ڕاستەخۆ وە بایتەکانى ڕێگاپێدراو دەبێت بۆ ئینکۆدکردنى بەڵگەنامە،هەروەها پاڵپشتیکردنى ئینکۆدین دەکات یان بەکارهێنەرەکانى هەندێک نوسینى ژمارەى نووسەکانەوە، سەرچاوەى سەرەکى لە code pointـى یوینکۆدى نووسەکان،بۆ نموونە&#916;, &#1049;, &#1511;, &#1605;, &#3671;, &#12354;, &#21494;, &#33865;, لەگەڵ &#47568; (یان هەندێک ژمارەى گۆڕاو لە سەرەتاى hexadecimal،لەگەڵ &#x هەر لە سەرەتاوە)پێویست دەکات لە هەموو وێبگەڕێک پێشانبدە،Δ, Й, ק, ‎ م, ๗, あ, 叶, 葉, لەگەڵ 말.

جۆرەپیتەکان