کدبندی ایران‌سیستم

کدبندی ایران‌سیستم نام یک کدبندی نویسهٔ قدیمی ۸ بیتی برای زبان فارسی است که توسط شرکت ایران‌سیستم معرفی شد. این کدبندی در ایران و در برنامه‌های مبتنی بر سیستم‌عامل داس کاربرد گسترده‌ای یافت به طوری که پرکاربردترین قالب برای تبادل متن فارسی بود و در تمامی برنامه‌های فارسی پشتیبانی می‌شد و در سکوهای وب نیز مورد استفاده قرار می‌گرفت.[1] اما بعدها با معرفی ویندوز-۱۲۵۶ و ایزیری ۶۲۱۹ رفته‌رفته کنار گذاشته شد. امروزه برخی برنامه‌ها و اسناد تحت ویندوز و داسی که از این کدبندی استفاده می‌کنند همچنان یافت می‌شود و قلم‌هایی که برای این کدبندی ساخته شده‌اند نیز وجود دارند ولی بیشتر برنامه‌ها از کدپیج ۱۲۵۶ ویندوز یا یونی‌کد استفاده می‌کنند.

این کدبندی دارای چندین نسخهٔ محلی‌شده است و برای آن مبدل‌هایی جهت تبدیل به یونیکد نوشته‌شده.[1] در هنگام تبدیل کدبندی ایران‌سیستم به یونیکید باید به مسئلهٔ نیاز/عدم نیاز به استفاده از فاصلهٔ مجازی و اتصال مجازی دقت داشت؛ برای نمونه واژهٔ «خانه‌ها» که در کدبندی ایران‌سیستم (به علت استفاده از شکل پایانی حرف «ه») بدون نیاز به فاصلهٔ مجازی نوشته می‌شود (0xA1 0x91 0xF7 0xF9 0xFA 0x91) در یونی‌کد باید به 0x062E 0x0627 0x0646 0x0647 0x200C 0x0647 0x0627 تبدیل شود.[2]

مشکلات

این قالب محدودیت‌ها و مشکلات بسیاری دارد از جمله:[1]

  • ذخیره‌سازی دیداری (بر اساس ترتیب نمایش چپ به راست) به‌جای ذخیره‌سازی مفهومی (بر اساس ترتیب خواندن)
  • چندنمادی بودن (اختصاص دو، سه، یا چهار کد به اشکال مختلف حروف فارسی) به جای تک‌نمادی بودن (اختصاص فقط یک کد به هر حرف فارسی)
  • کمبود برخی نویسه‌ها (نمادهای متداولی چون همزهٔ روی حروف، گیومه و نقطه‌ویرگول)
  • نداشتن کد گریز مورد تأیید ایزو برای ترکیب متن‌هایی غیر از فارسی و انگلیسی
  • گسترش‌ناپذیری

جانمایی کدپیج

در جدول زیر نیمهٔ بالای کدبندی (۱۲۸–۲۵۵) نمایش داده شده است، نویسه‌های ۰–۱۲۷ مشابه اَسکی هستند. همانطور که مشاهده می‌شود برخی از اشکال حروف (جدا و چسبیده) در این کدبندی دارای کدپوینت جداگانه هستند.

IRAN SYSTEM
_0_1 _2_3 _4_5 _6_7 _8_9 _A_B _C_D _E_F
 
8_
 
۰
06F0
۱۲۸
۱
06F1
۱۲۹
۲
06F2
۱۳۰
۳
06F3
۱۳۱
۴
06F4
۱۳۲
۵
06F5
۱۳۳
۶
06F6
۱۳۴
۷
06F7
۱۳۵
۸
06F8
۱۳۶
۹
06F9
۱۳۷
،
060C
۱۳۸
ـ
0640
۱۳۹
؟
061F
۱۴۰

FE81
۱۴۱

FE8B
142*
ء
0621
۱۴۳
 
9_
 

FE8D
144

FE8E
145

FE8F
146*

FE91
۱۴۷**

FB56
۱۴۸*

FB58
۱۴۹**

FE95
۱۵۰*

FE97
۱۵۱**

FE99
۱۵۲*

FE9B
153**

FE9D
154*

FE9F
155**

FB7A
156*

FB7C
157**

FEA1
۱۵۸*

FEA3
۱۵۹**
 
A_
 

FEA5
۱۶۰*

FEA7
۱۶۱**
د
062F
۱۶۲
ذ
0630
۱۶۳
ر
0631
۱۶۴
ز
0632
۱۶۵
ژ
0698
۱۶۶

FEB1
۱۶۷

FEB3
۱۶۸

FEB5
۱۶۹

FEB7
۱۷۰

FEB9
۱۷۱

FEBB
172

FEBD
173
ﺿ
FEBF
174
ط
0637
۱۷۵
 
B_
 

2591
۱۷۶

2592
۱۷۷

2593
۱۷۸

2502
۱۷۹

2524
۱۸۰

2561
۱۸۱

2562
۱۸۲

2556
۱۸۳

2555
۱۸۴

2563
۱۸۵

2551
۱۸۶

2557
۱۸۷

255D
۱۸۸

255C
۱۸۹

255B
۱۹۰

2510
۱۹۱
 
C_
 

2514
۱۹۲

2534
۱۹۳

252C
۱۹۴

251C
۱۹۵

2500
۱۹۶

253C
۱۹۷

255E
۱۹۸

255F
۱۹۹

255A
۲۰۰

2554
۲۰۱

2569
۲۰۲

2566
۲۰۳

2560
۲۰۴

2550
۲۰۵

256C
۲۰۶

2567
۲۰۷
 
D_
 

2568
۲۰۸

2564
۲۰۹

2565
۲۱۰

2559
۲۱۱

2558
۲۱۲

2552
۲۱۳

2553
۲۱۴

256B
۲۱۵

256A
۲۱۶

2518
۲۱۷

250C
۲۱۸

2588
۲۱۹

2584
۲۲۰

258C
۲۲۱

2590
۲۲۲

2580
۲۲۳
 
E_
 
ظ
0638
۲۲۴

FEC9
۲۲۵*

FECA
226**

FECC
227*

FECB
228**

FECD
229*

FECE
230**

FED0
۲۳۱*

FECF
232**

FED1
۲۳۳*

FED3
۲۳۴**

FED5
۲۳۵*

FED7
۲۳۶**

FB8E
237*

FB90
۲۳۸**

FB92
۲۳۹*
 
F_
 

FB94
۲۴۰**

FEDD
241*

FEFB
242*

FEDF
243**

FEE1
۲۴۴*

FEE3
۲۴۵**

FEE5
۲۴۶*

FEE7
۲۴۷**
و
0648
۲۴۸

FEE9
۲۴۹*

FEEC
250

FEEB
251

FBFD
252

FBFC
253

FBFE
254**
NBSP
00A0
۲۵۵
_0_1 _2_3 _4_5 _6_7 _8_9 _A_B _C_D _E_F

*کدپوینت داده‌شده متعلق به شکل جدا است، شکل پایانی این حرف دارای کدپوینتی جداگانه است.
**کدپوینت داده‌شده برای شکل آغازین حرف است، شکل میانی این حرف دارای کدپوینتی جداگانه است.

منابع

  1. «پروژهٔ استاندارد خط فارسی در یونی‌کد». فارسی‌وب. دی ماه ۱۳۷۹. بایگانی‌شده از روی نسخه اصلی در ۱۶ نوامبر ۲۰۱۳. دریافت‌شده در ۱۶ نوامبر ۲۰۱۳. تاریخ وارد شده در |تاریخ= را بررسی کنید (کمک)
  2. Roozbeh Pournader (۲۱ ژانویه ۲۰۰۰). «IRAN SYSTEM to Unicode». New Mexico State University - Department of Mathematical Sciences. بایگانی‌شده از اصلی در ۲۶ ژوئن ۲۰۱۳.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.