3.2 : පරිගණක වල භාවිත කරන කේත ක්‍රම (Coding methods) - උසස්පෙළ තොරතුරු හා සන්නිවේදන තාක්ෂණය

3.2 : පරිගණක වල භාවිත කරන කේත ක්‍රම (Coding methods)

පරිගණක වල භාවිත කරන කේත ක්‍රම (Coding methods)

පරිගණකයට ඇතුළු කරන ඕනෑම දත්තයක් හෝ විධානයක්, ද්වීමය සංඛ්‍යා (1 සහ 0) බවට පත් කළ යුතුවේ. මන්දයත් පරිගණක ක්‍රියාකරනුයේ යාන්ත්‍ර භාෂාවෙනි (Machine Language). මේ සඳහා විවිධ කේත ක්‍රම යොදා ගනු ලබයි. ඒවායින් සමහරක් පහත දැක්වේ.


01. ද්වීමය කේතක දශම (BCD – Binary Coded Decimal)
02. විස්තෘත ද්වීමය කේතක දශම හුවමාරු කේත (EBCDIC – Extended Binary Coded Decimal Interchange Code)
03. තොරතුරු හුවමාරුව සඳහා වූ ඇමෙරිකානු සම්මත කේතය (ASCII – American Standard Code for Information Interchange)
04. යුනිකේත / ඒකකේත ක්‍රමය (Unicode)


ද්වීමය කේතක දශම (BCD – Binary Coded Decimal)

BCD කේත ක්‍රමය මගින් එක් අනුලක්ෂණයක් (Character) නිරූපනය කිරීම සඳහා බිටු 4 (4 Bits) ක් වෙන් කරයි. එමගින් අනුලක්ෂණ 16 (24) ක් නිරූපනය කළ හැකි වුවද දශමය සංඛ්‍යාංක නිරූපනයට පමණක් යොදා ගනියි.


BCD
      Decimal


0000      0
0001      1
0010      2
0011      3
0100      4
0101      5
0110      6
0111      7

උදාහරණ: 1310 යන සංඛ්‍යාව BCD  නිරූපනයක් ලෙස දැක්වීම.

1      3   ->    0001     0011


එවිට 1310 යන සංඛ්‍යාව BCD  නිරූපනයක් ලෙස 00010011 1310 යන සංඛ්‍යාව BCD  නිරූපනයක් ලෙස දැක්වීම.


විස්තෘත ද්වීමය කේතක දශම හුවමාරු කේත (EBCDIC – Extended Binary Coded Decimal Interchange Code)

EBCDIC හිදී අනුලක්ෂණයක් නිරූපනය කිරීමට බිටු 8 (8bits) ක් වෙන් කරයි. එනම් මින් අනුලක්ෂණ 256 (28) ක් නිරූපනය වේ. මෙම කේත ක්‍රමය IBM සමාගම විසින් නිපදවන ලද මහ පරිගණක (Mainframe Computers) වල භාවිතා කරයි.




තොරතුරු හුවමාරුව සඳහා වූ ඇමෙරිකානු සම්මත කේතය (ASCII – American Standard Code for Information Interchange)

දත්ත ලෙස පරිගණකයට ඇතුළු කරනු ලබන අක්ෂර, සංඛ්‍යා, විශේෂ අනුලක්ෂණ ආදී දේ පරිගණකයට තේරුම් ගත හැකි යාන්ත්‍රික හාෂාවකට පරිවර්තනය විය යුතුවේ. මෙම දත්ත ද්වීමය සංඛ්‍යා  (1, 0 ) බවට පරිවර්තනය කිරීමේ දී ජාත්‍යන්තර වශයෙන් පිළිගත් සම්මතයකට අනුව සකසනු ලැබේ. එම සම්මතය ඇස්කි (ASCII – American Standard Code for Information Interchange) කේත ක්‍රමය නම් වේ. මෙම කේත ක්‍රමයට අනුව ඕනෑම අකුරකට හෝ සංඛේතයකට අදාළ සම්මත දශමය අගයක් ඇත. එය ඇස්කි අගය ලෙස හැඳින්වේ. ඇස්කි ක්‍රමයේදී අනුලක්ෂණයක් නිරූපනය කිරීම සඳහා බිටු 7 (7 bits) ක් වෙන් කර ඇත. මෙමගින් අනුලක්ෂණ 128 (27) ක් නිරූපනය කළ හැකිවේ. ඇස්කි කේත ක්‍රමය යෝජනා කරන ලද්දේ ANSI (American National Standard Institute)ආයතනයයි.


යුනිකේත / ඒකකේත ක්‍රමය (Unicode)

මුල් යුග වලදී පරිගණක යන්ත්‍ර වල භාවිත වූ ASCII හා EBCDIC යනාදී කේත ක්‍රමයන්හි ප්‍රධාන අවාසිය වූයේ ඒවා බිටු 8 කට සීමා වීමයි. බිටු 8 කින් දැක්විය හැකි උපරිම අනුලක්ෂණ ගණන 256 ක් නිසා එය වර්තමාන අවශ්‍යතාවන්ට ප්‍රමාණවත් නොවේ. අන්තර්ජාලය බිහිවීමත් සමගම නිර්මාණය වු විශ්ව ගම්මාන සංකල්පයත් , ගෝලීයකරණයට භාජනය වෙමින් පවතින සමාජ ක්‍රමයත් නිසා විශ්ව දැනුම බෙදා ගැනීම, ජාත්‍යන්තර වෙළඳාම වැනි එදිනෙදා කාර්යයන් සඳහා විවිධ අනුලක්ෂණ සහ සංකේත විශාල ලෙස යොදාගත යුතුය.

විශේෂයෙන්ම ඉංග්‍රීසි භාෂාවට අමතරව විවිධ ජාතීන් විසින් භාවිත කරනු ලබන ඒ ඒ භාෂාවන්ට ආවේණික වූ අනුලක්ෂණ පරිගණකයන්හි භාවිත වීම ඒ ඒ භාෂාවන්ට ආවේණික වූ අනුලක්ෂණයන් සඳහා කේත වෙන් කළ යුතු විය. මේ අනුව මෙසේ නිරූපනය කිරීම සඳහා අවම වශයෙන් බිටු 16 ක කේත ක්‍රමයක අවශ්‍යතාවය මතුවිය. ඒ අනුව 1991 ඔක්තෝම්බර් මාසයේ දී බිටු 16 කින් එකිනෙකට වෙනස් සංකේත 65,536 ක් නිරූපනය කළ හැකි ජාත්‍යන්තර ප්‍රමිතියකට අනුව සකසන ලද යුනිකේත (Unicode) ක්‍රමය හඳුන්වාදුනි.

යුනිකේත ප්‍රමිතිය නමින් ප්‍රකාශිත විශ්ව අනුලක්ෂණ කුලක වශයෙන් හඳුන්වන සම්මත අනුලක්ෂණ කුලකය (Universal Character Set)  මෙහි දී භාවිත වේ. 2009 ඔක්තෝම්බර් මස ප්‍රකාශයට පත් කරන ලද යුනිකේත ප්‍රමිති මාදිලි 5.2 මගින් ලොව භාවිත වන අක්ෂර මාලා 90 ක් සඳහා අනුලක්ෂණ 107,361 ක් පමණ නිරූපණය වන බව වාර්තා වී ඇත. ශ්‍රී ලංකාවේ භාවිත වන සිංහල (Sinhala) සහ දමිළ (Tamil) භාෂාවන්හි අක්ෂර මාලාවන් ද මේ වනවිට යුනිකේත සම්මතයන්ට ඇතුළත් කර ඇත. (Source: Grade 10 ICT Text book – NIE, Page 85)