யுனிகோடில் தமிழ்


கணினியில் பயன்படுத்துகிற தமிழ் எழுத்துருக்கள் - ஒவ்வொருவராலும் ஒவ்வொரு வகையாக உருவாக்கப்பட்டு தற்பொழுது பயன்பாட்டில் உள்ளன. TAM, TAB, TSC, DYNAMIC, UNICODE என்பவை நாம் காணுகிற "எழுத்துருக்களின் அடிப்படைகள்". இவைகளின் அடிப்படையில் உருவான - திரு, ஆதமி, மயிலை, அவரங்கள், பாமினி, அபார்னர், யிகலப்பை, குறள், வள்ளுவர், பாரதி, இளங்கோ, அமுதம், அழகி, லதா, எனப் பல்வேறு வகையான எழுத்துருக்களும் உள்ளன. இவைகளைத் தட்டச்சு செய்ய - TYPEWRITER NEW, OLD, PHONETIC, TAMIL 99 என வேறு வேறு வகையான தட்டச்சு முறைகளும் உள்ளன. புதிய புதிய எழுத்துருக்களை உருவாக்க Fontographer என்கிற மென்பொருளும் இலவயமாகக் கிடைக்கின்றன. இது இன்றைய நிலை.

தமிழைப் பொருத்தவரை அவரவர்களுக்குக் கிடைக்கும் மென்பொருள்களை வைத்து, அவரவர்களுக்குத் தெரிந்த முறையில் தட்டச்சு செய்து - தமிழ்ப் பக்கங்களாக வடிவமைக்கிறார்கள். தட்டச்சு செய்ததை அச்சு வடிவாக்கிப் பிறருக்கு அனுப்பும் பொழுது எந்தப் பிரச்சனையும் எழுவதில்லை.

ஆனால் தட்டச்சு செய்து உருவாக்கிய பக்கங்களைப் பிறருக்கு அனுப்ப வேண்டும் என்கிற தேவை ஏற்படும் பொழுதுதான் பிரச்சனை உருவாகுகிறது. ஒருவர் தட்டச்சு செய்த எழுத்துருக்கள் அதைப் பெறுபவரிடம் இருந்தால் தான் தமிழ் எழுத்துகளாகத் தெரியும் இல்லையேல் கிறுக்கல்களாகத்தான் தெரியும். பெறுபவருக்கு தட்டச்சு செய்த எழுத்துருக்களை அனுப்பி வைத்தால் அவர் அதைத் தன் கணினியில் பொருத்திக் கொண்டால் தமிழ் எழுத்து தெரியும். ஆக எழுத்துருக்கள் என்பது இடைச் செயலியாக இருந்து தமிழ் எழுத்துகளைக் காட்டுகிறது.

இணையதளத்தின் வழியாகப் பரப்பும் பொழுதும் இதே பிரச்சனை உருவாகுகிறது. இணையதளத்தில் எழுத்துருக்களை வைத்து வலையிறக்கம் செய்யக் கேட்டு பிறகு இணையதளத்தைப் பார்க்கலாம் என்ற நிலையே பரவலாக இருந்து வந்தது. எழுத்துருக்களை வலையிறக்குவது என்பது சிக்கலானது. நேர விரையம் ஆக்குவது. அதுவும் காசு கொடுத்து இணையதளமையங்களில் பார்க்கச் செல்லுபவர் எழுத்துகளை வலையிறக்க நேரமாவதால் அந்த இணையதளங்களை விட்டு விட்டு வேறு இணையதளங்களுக்குச் சென்று விடுவார்கள்.

இதனை வென்றெடுக்க - Dynamic Font - என்பது உருவாக்கப்பட்டு இணைதளத்தில் வைக்கப்பட்டது. இணையதளத்தைக் காணுவதற்காக முகவரியைத் தட்டச்சு செய்து சொடுக்கும் பொழுதே எழுத்துருக்கள் இயல்பாக இறங்கி - இணையதளப் பக்கங்களைக் காட்டும். இணையதளப்பக்கத்தைக் காண, எழுத்துருக்களை வலையிறக்கம் செய்ய வேண்டும் என்ற தேவை இல்லை. இதனால் பிரச்சனை ஒரளவுக்குக் குறைந்தது. ஆனால் இந்த வகையான எழுத்துருக்களும் ஒரு சில இணையதளக்காட்டிகளில் (Internet browsers) இயங்குவதில்லை.

எனவே உலகத்திலுள்ள அனைத்து வகையான இணையதளக் காட்டிகளிலும் எழுத்துருக்கள் தெரிவதற்காகப் பல்வேறு முயற்சிகள் எடுக்கப்பட்டன. அதன் முதிர்ச்சிதான் இந்த யுனிகோட் முறை.

உலகத்திலுள்ள அனைத்து மொழிகளுக்கும், அந்த மொழிகளிலுள்ள எழுத்துகளின் எண்ணிக்கைக்குத் தகுந்தவாறு - ஒவ்வொரு எழுத்துக்கும் ஒரு எண்ணானது கொடுக்கப்பட்டுள்ளது. இந்த எண் அச்சாகும் இடத்தில், அந்த எண்ணுக்காக வடிவமைக்கப்பட்டுள்ள எழுத்துருக்களைக் கணினி காட்டும். இதுதான் யுனிகோட் முறையின் அடிப்படை.

கணினிக்கு எந்த எழுத்தும் தெரியாது. எண்மட்டுமே தெரியும். அதுவும் இரட்டை எண்ணாக - 0,1 - என்ற இரண்டு எண்ணாக மட்டுமே தெரியும். இதை இணைப்பு இல்லை, இணைப்பு உண்டு என்கிற அடிப்படையில், மின்சுற்று வடிவில் சொல்லலாம். ஆக ஒரு எண்ணை உருவாக்க இந்த அடிப்படையே கணினியில் பயன்படுத்தப் படுகிறது.

யுனிகோட் வகை என்பது உலகத்திலுள்ள எந்தவகைக் கணினியிலும் உலகத்திலுள்ள எந்தவகை எழுத்துருக்களையும் காணவழி வகை செய்கிற உயரிய முறையாகும். உலகத்திலுள்ள அனைத்து மொழிகளுக்கும் குறிப்பிட்ட எண்கள் கொடுக்கப்பட்டுள்ளன.

தமிழுக்காக 2046 OB82 லிருந்து 3066 OB82 வரை எண்களானது தரப்பட்டுள்ளது. பட்டியல் கீழே தரப்பட்டுள்ளது. பட்டிலைப் பார்த்து எழுத்துக்குரிய எண்களைப் புரிந்து கொள்ளவும்.

யுனிகோடுக்காக எந்தவகையான எழுத்துருக்களையும் வடிவமைக்கலாம். வடிவமைக்கிற எழுத்துருக்களை கீழே கொடுக்கப்பட்டுள்ள எண் வந்தால் அதற்குரிய எழுத்துவருமாறு வடிவமைத்தால் போதும். யுனிகோடில் தமிழ் வரும்.

UYIR, AAIDHAM MEY, VADA,
AGARAM
THUNAI NUMBERS
. - 2946 OB82
ஃ - 2947 OB83
அ - 2949 OB85
ஆ - 2950 OB86
இ - 2951 OB87
ஈ - 2952 OB88
உ - 2953 OB89
ஊ - 2954 OB8A
எ - 2958 OB8E
ஏ - 2959 OB8F
ஐ - 2960 OB90
ஒ - 2962 OB92
ஓ - 2963 OB93
ஔ - 2964 OB94


க - 2965 OB95
ங - 2969 OB99
ச - 2970 OB9A
ஜ - 2972 OB9C
ஞ - 2974 OB9E
ட - 2975 OB9F
ண - 2979 OBA3
த - 2980 OBA4
ந - 2984 OBA8
ன - 2985 OBA9
ப - 2986 OBAA
ம - 2990 OBAE
ய - 2991 OBAF
ர - 2992 OBBO
ற - 2993 OBB1
ல - 2994 OBB2
ள - 2995 OBB3
ழ - 2996 OBB4
வ - 2997 OBB5
- 2998 OBB6
ஷ - 2999 OBB7
ஸ - 3000 OBB8
ஹ - 3001 OBB9


ா - 3006 OBBE
ி - 3007 OBBF
ீ - 3008 OBCO
ு - 3009 OBC1
ூ - 3010 OBC2
ெ - 3014 OBC6
ே - 3015 OBC7
ை - 3016 OBC8
ெ ா - 3018 OBCA
ே ா - 3019 OBCB
ெ ள - 3020 OBCC
o - 3021 OBCD
ள - 3031 OBD7


௧ - 3047 OBE7
௨ - 3048 OBE8
ங - 3049 OBE9
௪ - 3050 OBEA
௫ - 3051 OBEB
௬ - 3052 OBEC
எ - 3053 OBED
அ - 3054 OBEE
௯ - 3055 OBEF
ய - 3056 OBFO
- 3057 OBF1
- 3058 OBF2
- 3059 OB82
- 3060 OB82
- 3061 OB82
- 3062 OB82
- 3063 OB82
- 3064 OB82
- 3065 OB82
- 3066 OB82




கணினிக்குக் "க" எழுத்து தெரியாது. 2965 OB95 என்று கணினியில் தோன்றினால் "க" எழுத்தைக் காட்டு என எழுத்துருக்களுக்கான மென் பொருளை வடிவமைத்தால் போதும். கணினியில் யுனிகோடு "க" வரும்.



தொடர்புக்கு : pollachinasan@gmail.com - 9788552061,