SFNസാ­യാ­ഹ്ന ഫൌ­ണ്ടേ­ഷൻ
images/ancient_fountain.jpg
Persian water-​wheel, a painting by David Roberts (1796–1864).
ജി­പി­ടി—നിർ­മ്മി­ത ബു­ദ്ധി­യി­ലെ പുതിയ താരം
ഡോ. ജിജോ പി. ഉ­ല­ഹ­ന്നാൻ, ഡോ. സുനിൽ തോമസ് തോ­ണി­ക്കു­ഴി­യിൽ

നിർ­മി­ത ബു­ദ്ധി പ­രി­ശീ­ല­നം ല­ഭി­ച്ച ചാ­റ്റ്ജി­പി­ടി (ChatGPT) എന്ന ഒരു ചാ­റ്റ് ബോ­ട്ട്, ആ­ശ­യ­ങ്ങ­ളെ ചി­ത്ര­ങ്ങ­ളാ­ക്കി മാ­റ്റു­ന്ന എ­ഞ്ചി­നു­ക­ളാ­യ ഡീ­പ്എ­ഐ (DeepAI), മി­ഡ്ജേ­ണി (Midjourney), ഡാൾ-ഇ (DALL-​E), അ­തി­ശ­യ­ക­ര­മാ­യ സെൽഫി ചി­ത്ര­ങ്ങൾ സൃ­ഷ്ടി­ക്കു­ന്ന ലെൻസ (Lensa) പോ­ലു­ള്ള ആ­പ്പു­കൾ, എ­ന്നി­വ­യെ­ല്ലാം അ­ടു­ത്ത കാ­ല­ത്താ­യി വലിയ വാർ­ത്ത പ്രാ­ധാ­ന്യം നേ­ടി­യി­ട്ടു­ണ്ടു്. ഡീപ് ലേ­ണിം­ഗ് (Deep Learning) എന്ന മെഷീൻ ലേ­ണി­ങ് സാ­ങ്കേ­തി­ക­വി­ദ്യ ഉ­പ­യോ­ഗി­ച്ചാ­ണു് ഇ­വ­യെ­ല്ലാം പ്ര­വർ­ത്തി­ക്കു­ന്ന­തു്. സ്വാ­ഭാ­വി­ക ഭാ­ഷ­യിൽ ചോ­ദ്യ­ങ്ങൾ ചോ­ദി­ക്കാൻ ന­മ്മ­ളെ അ­നു­വ­ദി­ക്കു­ന്ന ഒരു സം­ഭാ­ഷ­ണ ഇ­ന്റർ­ഫേ­സ് നൽ­കു­ന്ന ഒരു നിർ­മി­ത ബു­ദ്ധി ഉ­പ­ക­ര­ണ­മാ­ണു് ചാ­റ്റ്ജി­പി­ടി (ChatGPT). ജ­ന­റേ­റ്റീ­വ് പ്രീ-​ട്രെയിൻഡ് ട്രാൻ­സ്ഫോർ­മർ (GPT) എന്ന ഒരു ഭാഷാ മാതൃക ഉ­പ­യോ­ഗി­ച്ചി­ട്ടു­ള്ള ചാ­റ്റ് ഇ­ന്റർ­ഫേ­സ് ആണു് ചാ­റ്റ്ജി­പി­ടി. സാ­ങ്കേ­തി­ക­വി­ദ്യ പ­രി­ജ്ഞാ­നം ഇ­ല്ലാ­ത്ത­വർ­ക്കു് പോലും ഉ­പ­യോ­ഗി­ക്കാ­വു­ന്ന രീ­തി­യി­ലാ­ണു് ഇതു് ക്ര­മീ­ക­രി­ച്ചി­രി­ക്കു­ന്ന­തു്. 2022 ന­വം­ബ­റിൽ അ­വ­ത­രി­പ്പി­ച്ച ഇതു് 5 ദി­വ­സ­ത്തി­നു് ശേഷം 1 ദ­ശ­ല­ക്ഷം ഉ­പ­യോ­ക്താ­ക്ക­ളിൽ എ­ത്തു­ക­യു­ണ്ടാ­യി. അലക് റാ­ഡ്ഫോർ­ഡും സ­ഹ­പ്ര­വർ­ത്ത­ക­രും എഴുതി, 2018 ജൂൺ 11-നു് പ്ര­സി­ദ്ധീ­ക­രി­ച്ച സ്വാ­ഭാ­വി­ക ഭാഷാ മോ­ഡ­ലി­നെ­ക്കു­റി­ച്ചു­ള്ള ഒരു പ്ര­ബ­ന്ധം ഒരു ഭാഷാ മോ­ഡ­ലി­നു് (language model) എ­ങ്ങി­നെ സാ­മാ­ന്യ വി­ജ്ഞാ­നം നേടാൻ ക­ഴി­യു­മെ­ന്നു് വെ­ളി­പ്പെ­ടു­ത്തി. ഒരു വാ­ച­ക­ത്തി­ലെ വാ­ക്കു­കൾ എ­ങ്ങി­നെ­യാ­ണു് പ­ര­സ്പ­രം ബ­ന്ധ­പ്പെ­ട്ടി­രി­ക്കു­ന്ന­തെ­ന്നു് മഷീൻ ലേ­ണിം­ഗ് ഉ­പ­യോ­ഗി­ച്ചു­ള്ള പ­രി­ശീ­ല­ന­ത്തി­ലൂ­ടെ മ­ന­സ്സി­ലാ­ക്കാൻ സാ­ധി­ക്കു­മെ­ന്നു് ഈ പ്ര­ബ­ന്ധം വി­ശ­ദീ­ക­രി­ക്കു­ന്നു. മേൽ­നോ­ട്ട­മി­ല്ലാ­തെ (unsupervised) പ­രി­ശീ­ലി­പ്പി­ക്കു­ന്ന മഷീൻ ലേ­ണിം­ഗ് ഭാഷാ മാ­തൃ­ക­യാ­ണു് ഇ­തി­നാ­യി ഉ­പ­യോ­ഗി­ക്കു­ന്ന­തു്. ഈ പ്ര­ബ­ന്ധ­ത്തി­ന്റെ ചു­വ­ടു് പി­ടി­ച്ചാ­ണു് ഓ­പ്പൺ­എ­ഐ ല­ബോ­റ­ട്ട­റി വിവിധ ജി­പി­ടി (GPT) മാ­തൃ­ക­കൾ നിർ­മ്മി­ച്ചി­രി­ക്കു­ന്ന­തു്. ലാ­ഭേ­ച്ഛ­യി­ല്ലാ­തെ പ്ര­വർ­ത്തി­ക്കു­ന്ന ഓ­പ്പൺ­എ­ഐ­യു­ടെ (OpenAI) ഗവേഷണ ല­ബോ­റ­ട്ട­റി­യാ­ണു് ഇ­തി­ന്റെ പി­ന്നിൽ. ജി­പി­ടി മാ­തൃ­ക­ക­ളു­ടെ പ്ര­വർ­ത്ത­നം എ­ങ്ങി­നെ­യെ­ന്നു് ന­മു­ക്കൊ­ന്നു് പ­രി­ശോ­ധി­ക്കാം.

ഭാ­ഷ­യും നിർ­മി­ത­ബു­ദ്ധി­യും

പ­ര­സ്പ­രം ആ­ശ­യ­വി­നി­മ­യം ന­ട­ത്താ­നു­ള്ള ക­ഴി­വു് മ­നു­ഷ്യ കു­ല­ത്തി­ന്റെ പു­രോ­ഗ­തി­യിൽ ചെറിയ പ­ങ്ക­ല്ല വ­ഹി­ച്ചി­രി­ക്കു­ന്ന­തു്. മ­റ്റു് പല ജീ­വി­വർ­ഗ­ങ്ങൾ­ക്കും ഇ­ത്ത­രം ക­ഴി­വു് ഉ­ണ്ടെ­ങ്കിൽ തന്നെ അവ വളരെ പ­രി­മി­ത­മാ­ണു്. ഭൂ­മു­ഖ­ത്തു് ആ­ക­മാ­നം ഏ­ക­ദേ­ശം ഏ­ഴാ­യി­ര­ത്തിൽ പരം ഭാഷകൾ ഉ­ണ്ടു് എ­ന്നാ­ണു് ക­രു­ത­പ്പെ­ടു­ന്ന­തു്. ഒരു കു­ട്ടി ജ­നി­ക്കു­മ്പോൾ ഭാഷ ഉ­പ­യോ­ഗി­ക്കു­ന്ന­തിൽ അ­വ­ന്റെ പ­രി­ശീ­ല­നം ആ­രം­ഭി­ക്കു­ന്നു. തു­ടർ­ന്ന­ങ്ങോ­ട്ടു് എ­ഴു­തു­ന്ന­തി­നും, വാ­യി­ക്കു­ന്ന­തി­നും, കല, സാ­ഹി­ത്യം, സം­സ്കാ­രം എ­ന്നി­വ മ­ന­സ്സി­ലാ­ക്കു­ന്ന­തി­നും, പ്ര­യോ­ഗ­ത്തിൽ വ­രു­ത്തു­ന്ന­തി­നും ഭാഷാ സ്വാ­ധീ­നം വലിയ പ­ങ്കു് വ­ഹി­ക്കു­ന്നു­ണ്ടു്.

നിർ­മി­ത ബു­ദ്ധി (ആർ­ട്ടി­ഫി­ഷ്യൽ ഇൻ­റ­ലി­ജൻ­സ്) ഗ­വേ­ഷ­ണ­ങ്ങൾ തു­ട­ങ്ങി­യ കാലം മു­ത­ലു­ള്ള ശ്ര­മ­മാ­ണു് ക­മ്പ്യൂ­ട്ട­റു­കൾ­ക്കു് മ­നു­ഷ്യ­രെ പോ­ലെ­യു­ള്ള ഭാഷാ സ്വാ­ധീ­നം നൽകാൻ സാ­ധി­ക്കു­മോ എ­ന്ന­തു്. ഇ­തി­നാ­യി, വി­വി­ധ­ത­രം ഭാഷ മാ­തൃ­ക­ക­ളെ­പ്പ­റ്റി പ­ഠി­ക്കു­ന്ന നാ­ച്ചു­റൽ ലാം­ഗ്വേ­ജ് പ്രോ­സ­സിം­ഗ് (NLP) എന്ന ഒരു ഉപശാഖ തന്നെ ഈ വി­ഷ­യ­ത്തിൽ ഉ­രു­ത്തി­രി­ഞ്ഞു വ­ന്നി­ട്ടു­ണ്ടു്. ഒരു മ­നു­ഷ്യ ഭാഷയെ ക­മ്പ്യൂ­ട്ടർ മോ­ഡ­ലു­കൾ ആക്കി മാ­റ്റു­ക എ­ന്ന­തു് വളരെ സ­ങ്കീർ­ണ­മാ­യ ഒരു പ്ര­ശ്ന­മാ­ണു്. നമ്മൾ പ­റ­യു­ന്ന ഓരോ വാ­ക്കും അ­തി­നു് മുൻ­പു­ള്ള­തും പി­ന്നീ­ടു് വ­രു­ന്ന­തു­മാ­യ വാ­ക്കു­ക­ളോ­ടു് ചേർ­ത്തു­വ­ച്ചാ­ണു് ഒരു ആ­ശ­യ­മാ­യി നാം ആ­വി­ഷ്ക­രി­ക്കു­ന്ന­തു്. ഉ­ദാ­ഹ­ര­ണ­ത്തി­നു് ഒരാൾ “ഞാൻ” എ­ന്നു് പ­റ­ഞ്ഞാൽ അതിനു പി­ന്നാ­ലെ അയാൾ ആ സ­മ­യ­ത്തു് ചെ­യ്യാൻ ഉ­ദ്ദേ­ശി­ക്കു­ന്ന­തോ, ചെ­യ്തു ക­ഴി­ഞ്ഞ­തോ ആയ ഒരു പ്ര­വർ­ത്തി­യെ പ­റ്റി­യാ­കാം പ­രാ­മർ­ശി­ക്കാൻ പോ­കു­ന്ന­തു്.

സ­ന്ദർ­ഭ­ത്തി­ന­നു­സ­രി­ച്ചു് വ­രു­ന്ന വാ­ക്കു­കൾ കൃ­ത്യ­മാ­യി ഉ­പ­യോ­ഗി­ക്കു­ന്ന­തി­നു് സ­ഹാ­യി­ക്കു­ന്ന ഒരു ഭാഷാ മാതൃക ന­മ്മു­ടെ ത­ല­ച്ചോ­റി­നു­ള്ളിൽ പ­രി­ശീ­ലി­പ്പി­ച്ചു് വെ­ച്ചി­ട്ടു­ണ്ടു്. ത­ല­ച്ചോ­റി­നു­ള്ളിൽ ല­ഭ്യ­മാ­യ വലിയ ഒരു പ­ദ­സ­ഞ്ച­യ­ത്തിൽ നി­ന്നും ഏ­റ്റ­വും ഉ­ചി­ത­മാ­യ ഒരു വാ­ക്കാ­യി­രി­ക്കും ഒരാൾ പറയുക. ഓരോ ത­വ­ണ­യും നമ്മൾ സം­സാ­രി­ക്കു­മ്പോൾ ആ മോ­ഡ­ലി­നു­ള്ളിൽ നി­ന്നു് ഉ­ചി­ത­മാ­യ പ­ദ­ങ്ങൾ സ­ന്ദർ­ഭ­ത്തി­ന­നു­സ­രി­ച്ചു് തി­ര­ഞ്ഞെ­ടു­ത്തു് ഉ­പ­യോ­ഗി­ക്കാ­നു­ള്ള ക­ഴി­വാ­ണു് ഒ­രാ­ളു­ടെ ഭാഷാ സ്വാ­ധീ­നം. ക­വി­കൾ­ക്കും എ­ഴു­ത്തു­കാർ­ക്കും പ്രാ­സം­ഗി­കർ­ക്കും ഒക്കെ ഈ ക­ഴി­വു് കൂ­ടു­ത­ലാ­യി­രി­ക്കും.

ഭാഷാ മോ­ഡ­ലു­ക­ളു­ടെ പി­ന്നിൽ

ഭാഷാ മാ­തൃ­ക­കൾ എ­ന്നാൽ മു­ന്നേ നൽകിയ പ­ദ­ങ്ങ­ളു­ടെ ക്ര­മ­ത്തിൽ നി­ന്നു് അ­ടു­ത്ത വാ­ക്കു് പ്ര­വ­ചി­ക്കാൻ ക­ഴി­യു­ന്ന പ്രോ­ബ­ബി­ലി­സ്റ്റി­ക് മോ­ഡ­ലു­ക­ളാ­ണു്. മെഷീൻ വി­വർ­ത്ത­നം, ചോ­ദ്യോ­ത്ത­രം, ആ­ശ­യ­ങ്ങ­ളെ സം­ഗ്ര­ഹി­ക്കു­ക, ചി­ത്ര­ങ്ങ­ളു­ടെ അ­ടി­ക്കു­റി­പ്പു് ത­യ്യാ­റാ­ക്കു­ക പോ­ലു­ള്ള നി­ര­വ­ധി കാ­ര്യ­ങ്ങൾ അ­നാ­യാ­സം ചെ­യ്യാൻ ഇ­വ­യ്ക്കു് ക­ഴി­യും. ക­മ്പ്യൂ­ട്ട­റു­ക­ളെ കൊ­ണ്ടു് ഇ­ത്ത­രം മോ­ഡ­ലു­ക­ളെ ഉ­ണ്ടാ­ക്കു­ന്ന­തി­നു് വ്യ­ത്യ­സ്ത നിർ­മി­ത ബു­ദ്ധി സ­ങ്കേ­ത­ങ്ങൾ ഉ­പ­യോ­ഗി­ക്കാം. മ­നു­ഷ്യ­ന്റെ ഭാഷയെ വി­ശ­ക­ല­നം ചെ­യ്തു് ആ­ശ­യ­ങ്ങ­ളെ മാ­ത്രം ക­ണ്ടെ­ത്തി പ­ല­ത­ര­ത്തി­ലു­ള്ള പ്രോ­സ­സി­ങ്ങു­ക­ളും ന­ട­ത്താൻ ക­ഴി­വു­ള്ള സാ­ങ്കേ­തി­ക­വി­ദ്യ­കൾ ഗ­വേ­ഷ­കർ ആ­വി­ഷ്ക­രി­ച്ചി­ട്ടു­ണ്ടു്. ഇ­തി­ന്റെ സ­ഹാ­യ­ത്താ­ലാ­ണു് പ­ല­പ്പോ­ഴും ന­മു­ക്കു് തർ­ജ്ജ­മ, ടെക്സ്റ്റ്-​ടു-സ്പീച്ച്, സ്പീച്-​ടു-ടെക്സ്റ്റ് തു­ട­ങ്ങി­യ സൗ­ക­ര്യ­ങ്ങൾ മൊബൈൽ ഫോ­ണി­ലും മ­റ്റും ല­ഭി­ക്കു­ന്ന­തു്. ഇ­ത്ത­രം ഒരു ഭാഷാ മാ­തൃ­ക­യാ­ണു് ജി­പി­ടി അഥവാ ജെ­ന­റേ­റ്റി­വ് പ്രീ­ട്രെ­യിൻ­ഡ് ട്രാൻ­സ്ഫോ­മർ (Generative Pre-​trained Transformer). ന­മു­ക്കു് ഇതിലെ ഓരോ ഘ­ട­ക­വും എ­ന്താ­ണെ­ന്നു് നോ­ക്കാം:

മെഷീൻ ലേ­ണിം­ഗ് മോ­ഡ­ലു­കൾ

വ­സ്തു­ക്ക­ളെ ത­രം­തി­രി­ക്കാൻ സ്റ്റാ­റ്റി­സ്റ്റി­ക്സിൽ പൊ­തു­വെ ര­ണ്ടു് തരം മോ­ഡ­ലു­കൾ ഉ­പ­യോ­ഗി­ക്കു­ന്നു. ഡി­സ്ക്രി­മി­നേ­റ്റീ­വ് (discriminative) എ­ന്നും, ജ­ന­റേ­റ്റീ­വ് (generative) എ­ന്നും വി­ളി­ക്കു­ന്ന ഈ മോ­ഡ­ലു­ക­ളിൽ ആ­ദ്യ­ത്തേ­തു് ടാർ­ഗെ­റ്റ് വേ­രി­യ­ബി­ളു­ക­ളു­ടെ സോ­പാ­ധി­ക പ്രോ­ബ­ബി­ലി­റ്റി­യും (conditional probability), ജ­ന­റേ­റ്റീ­വ് മോ­ഡ­ലു­കൾ സം­യു­ക്ത പ്രോ­ബ­ബി­ലി­റ്റി­യും (joint probability) ക­ണ­ക്കാ­ക്കു­ന്നു. ജ­ന­റേ­റ്റീ­വ് മോ­ഡ­ലു­കൾ­ക്കു് നി­ല­വി­ലു­ള്ള ഡാ­റ്റ­യ്ക്കു് സ­മാ­ന­മാ­യി പുതിയ ഡാറ്റ സൃ­ഷ്ടി­ക്കാൻ ക­ഴി­യും.

ഡി­സ്ക്രി­മി­നേ­റ്റീ­വ് മോഡൽ:
കാ­റു­ക­ളു­ടെ­യും ബ­സു­ക­ളു­ടെ­യും ചി­ത്ര­ങ്ങൾ ക­ണ്ടാൽ തി­രി­ച്ച­റി­യാൻ ക­ഴി­വു­ള്ള ഒരു നിർ­മ്മി­ത ബു­ദ്ധി സം­വി­ധ­നം ഉ­ണ്ടാ­ക്ക­ണം എ­ന്നി­രി­ക്ക­ട്ടെ. കാ­റു­ക­ളു­ടെ­യും ബ­സ്സു­ക­ളു­ടെ­യും ആ­യി­ര­ക്ക­ണ­ക്കി­നു് ചി­ത്ര­ങ്ങൾ കാ­ണി­ച്ചു് ഇ­തി­നു­ള്ള മോ­ഡ­ലി­നെ പ­രി­ശീ­ലി­പ്പി­ക്കു­ന്ന­തു് വഴി ഇ­തു­വ­രെ ക­ണ്ടി­ട്ടി­ല്ലാ­ത്ത പുതിയ ഒരു കാ­റി­ന്റെ­യൊ ബ­സി­ന്റെ ചി­ത്രം ക­ണ്ടാൽ ക­മ്പ്യൂ­ട്ട­റി­ന­വ­യെ കൃ­ത്യ­മാ­യി തി­രി­ച്ച­റി­യാൻ ക­ഴി­യും. എ­ന്നാൽ ഈ മോ­ഡ­ലി­നെ ഒരു പൂ­ച്ച­യു­ടെ ചി­ത്ര­മാ­ണു് കാ­ണി­ക്കു­ന്ന­തു് എ­ങ്കിൽ ഈ സം­വി­ധാ­നം അ­തി­നെ­യും ഒരു കാറോ ബസോ ആയി മാ­ത്ര­മേ തി­രി­ച്ച­റി­യു­ക­യു­ള്ളൂ. നമ്മൾ കാ­ണി­ക്കു­ന്ന ചി­ത്ര­ത്തി­നു് ഏ­റ്റ­വും കൂ­ടു­തൽ സാ­മ്യ­മു­ള്ള­തു് കാ­റി­നോ­ടാ­ണോ ബ­സി­നോ­ടാ­ണോ എ­ന്നാ­ണു് ഈ ഡി­സ്ക്രി­മി­നേ­റ്റീ­വ് മോഡൽ പ­രി­ശോ­ധി­ക്കു­ന്ന­തു് കാരണം ഈ മോഡൽ കാ­റി­നെ­യും ബ­സ്സി­നെ­യും മാ­ത്രം തി­രി­ച്ച­റി­യാ­നു­ള്ള പ­രി­ശീ­ല­ന­മാ­ണു് നേ­ടി­യി­ട്ടു­ള്ള­തു്. അതു് ഇ­തു­വ­രെ പൂ­ച്ച­യെ ചി­ത്ര­ങ്ങൾ തി­രി­ച്ച­റി­യാ­നു­ള്ള പ­രി­ശീ­ല­നം നേ­ടി­യി­ട്ടി­ല്ല. ന­മ്മു­ടെ ത­ല­ച്ചോ­റ് ഒരു ഒ­ന്നാ­ന്ത­രം ഡി­സ്ക്രി­മി­നെ­റ്റി­വ് മോ­ഡ­ലാ­ണു്. ഒറ്റ തവണ ക­ണ്ടാൽ തന്നെ ന­മു­ക്കു് പി­ന്നീ­ടു് വ­സ്തു­ക്ക­ളെ തി­രി­ച്ച­റി­യാ­നാ­കും. ഇ­ക്കാ­ര്യ­ത്തിൽ ഇ­പ്പോ­ഴ­ത്തെ നിർ­മ്മി­ത ബു­ദ്ധി സം­വി­ധാ­ന­ങ്ങൾ ഒ­ന്നും തന്നെ ത­ല­ച്ചോ­റി­നു് അ­ടു­ത്തെ­ങ്ങും എ­ത്തി­യി­ട്ടി­ല്ല. ഇ­ത്ത­രം മോ­ഡ­ലു­ക­ളെ നിർ­മി­ക്കാൻ നൂറൽ ശൃം­ഖ­ല­കൾ (neural network) പോ­ലെ­യു­ള്ള നി­ര­വ­ധി സ­ങ്കേ­ത­ങ്ങൾ ആ­വ­ശ്യ­മാ­ണു്.
images/jijosunil-gpt-01.jpg
ചി­ത്രം 1.
ജ­ന­റേ­റ്റീ­വ് മോ­ഡ­ലു­കൾ:
കൃ­ത്രി­മ­മാ­യി മു­ഖ­ങ്ങ­ളു­ടെ ചി­ത്ര­ങ്ങൾ ഉ­ണ്ടാ­ക്കു­ന്ന ഒരു മോഡൽ ന­മു­ക്കു് ആ­വ­ശ്യ­മു­ണ്ടെ­ന്നു് ഇ­രി­ക്ക­ട്ടെ. (ഇ­ത്ത­രം ചില വെ­ബ്സൈ­റ്റു­കൾ ഇ­പ്പോൾ ല­ഭ്യ­മാ­ണു് https://thispersondoesnotexist.com/). മു­ഖ­ങ്ങ­ളു­ടെ കൃ­ത്രി­മ­വും, യ­ഥാർ­ത്ഥ­വു­മാ­യ ചി­ത്ര­ങ്ങൾ ഒരു കൂ­ട്ടം റാൻഡം വേ­രി­യ­ബി­ളു­ക­ളു­ടെ ഒരു പ്ര­ത്യേ­ക കോ­മ്പി­നേ­ഷ­നാ­ണു്. ഓരോ മു­ഖ­ത്തി­ന്റെ­യും സ­വി­ശേ­ഷ­മാ­യ പ്ര­ത്യേ­ക­ത­കൾ ഇ­ത്ത­ര­ത്തി­ലു­ള്ള റാൻഡം വേ­രി­യ­ബിൾ­ക­ളു­ടെ വ്യ­തി­യാ­ന­ങ്ങൾ­ക്കു് അ­നു­സ­രി­ച്ചാ­ണു് ഉ­ണ്ടാ­കു­ന്ന­തു്. ഈ വേ­രി­യ­ബിൾ എ­ല്ലാം കൂടി മു­ഖ­ത്തി­ന്റെ ആ­കൃ­തി­യിൽ ചേർ­ന്നു വ­രു­ന്ന­തി­നു് ഒരു പ്രോ­ബ­ബി­ലി­റ്റി ഉ­ണ്ടു്. ഇ­ങ്ങ­നെ മു­ഖ­ത്തി­ന്റെ ആ­കൃ­തി­യിൽ ഇ­വ­യെ­ല്ലാം കൂടി ചേർ­ന്നു് വ­രു­ന്ന­തി­നു വേ­ണ്ടി­യു­ള്ള ജോ­യി­ന്റ് പ്രോ­ബ­ബി­ലി­റ്റി ഡി­സ്ട്രി­ബ്യൂ­ഷൻ എ­സ്റ്റി­മേ­റ്റ് ചെ­യ്യു­ക­യാ­ണു് എ­ങ്കിൽ ന­മു­ക്കു് കൃ­ത്രി­മ­മാ­യി മു­ഖ­ങ്ങ­ളു­ടെ ചി­ത്ര­ങ്ങൾ ഉ­ണ്ടാ­ക്കി­യെ­ടു­ക്കാ­നാ­കും. ഇ­ത്ത­രം പ്രോ­ബ­ബി­ലി­റ്റി ഡി­സ്ട്രി­ബ്യൂ­ഷ­നി­ലെ ഓരോ ബി­ന്ദു­വും ഒരു പുതിയ മു­ഖ­മാ­യി മാ­പ്പ് ചെ­യ്യാ­നാ­കും. ഇ­ത്ത­ര­ത്തിൽ പ്രോ­ബ­ബി­ലി­റ്റി ഡി­സ്ട്രി­ബ്യൂ­ഷൻ ക­ണ്ടെ­ത്തി അതിൽ നി­ന്നു് ഒരു പോ­യി­ന്റ് തെ­ര­ഞ്ഞെ­ടു­ത്താൽ ആ ബി­ന്ദു­വിൽ എ­ത്തി­ച്ചേ­രാൻ ഉ­പ­യോ­ഗി­ച്ച റാൻഡം വേ­രി­യ­ബി­ളു­ക­ളു­ടെ പ്രോ­ബ­ബി­ലി­റ്റി­യു­ടെ കോ­മ്പി­നേ­ഷ­നിൽ നി­ന്നു് ഒരു മു­ഖ­ത്തി­ന്റെ ചി­ത്രം നിർ­മ്മി­ക്കാം. ന­മു­ക്കു് ല­ഭ്യ­മാ­യ ഡേറ്റ ഉ­പ­യോ­ഗി­ച്ചു് ഇ­ത്ത­ര­ത്തി­ലു­ള്ള പ്രോ­ബ­ബി­ലി­റ്റി ഡി­സ്ട്രി­ബ്യൂ­ഷ­നു­ക­ളെ എ­സ്റ്റി­മേ­റ്റ് ചെ­യ്യു­ക എ­ന്ന­താ­ണു് ജ­ന­റേ­റ്റീ­വ് മോ­ഡ­ലു­കൾ ചെ­യ്യു­ന്ന­തു്. ഇ­ത്ത­ര­ത്തിൽ ഡി­സ്ട്രി­ബ്യൂ­ഷ­നു­കൾ എ­സ്റ്റി­മേ­റ്റ് ചെ­യ്യാൻ അതീവ സ­ങ്കീർ­ണ­മാ­യ മോ­ഡ­ലു­കൾ ഉ­ണ്ടാ­ക്കി ല­ക്ഷ­ക്ക­ണ­ക്കി­നു് ചി­ത്ര­ങ്ങൾ ഉ­പ­യോ­ഗി­ച്ചു് മോ­ഡ­ലി­നെ പ­രി­ശീ­ലി­പ്പി­ക്ക­ണം. ഇ­ങ്ങ­നെ മുൻ­കൂ­ട്ടി പ­രി­ശീ­ലി­പ്പി­ക്ക­പ്പെ­ട്ടി­ട്ടു­ള്ള ഒരു വലിയ മോ­ഡ­ലാ­ണു് ജി­പി­ടി. മോഡൽ ചെ­യ്യു­ന്ന ഡാ­റ്റ­യിൽ നി­ന്നു് എല്ലാ രീ­തി­യി­ലു­ള്ള സാ­ധ്യ­ത­ക­ളും പ്ര­വ­ചി­ക്കാൻ ഈ മാതൃക ഉ­പ­യോ­ഗി­ക്കാം. ഈ ജ­ന­റേ­റ്റീ­വ് മോ­ഡ­ലിൽ ഇനി വരാൻ പോ­കു­ന്ന വാ­ക്കു­ക­ളു­ടെ പ്രോ­ബ­ബി­ലി­റ്റി ക­ണ്ടു­പി­ടി­ക്കാ­നാ­യി സെൽഫ്-​അറ്റൻഷൻ മെ­ക്കാ­നി­സം (self-​attention mechanism) എന്ന സ­ങ്കേ­ത­വും ഉ­പ­യോ­ഗി­ക്കു­ന്നു. ഇ­വ­യ്ക്കു് പി­ന്നിൽ സ­ങ്കീർ­ണ­മാ­യ ഗണിത ശാ­സ്ത്ര­നിർ­ദ്ധാ­ര­ണ­ങ്ങൾ ഉ­പ­യോ­ഗി­ക്ക­പ്പെ­ടു­ന്നു. ഇ­ത്ത­രം മാ­തൃ­ക­കൾ ഭാ­വി­യിൽ ധാ­രാ­ള­മാ­യി വ­രു­മെ­ന്നു് ക­രു­ത­പ്പെ­ടു­ന്നു.
ട്രാൻ­സ്ഫോ­മ­റു­കൾ:
ട്രാൻ­സ്ഫോർ­മർ എ­ന്ന­തു് ഭാഷാ വി­വർ­ത്ത­നം, ടെ­ക്സ്റ്റ് സൃ­ഷ്ടി­ക്കൽ തു­ട­ങ്ങി­യ സ്വാ­ഭാ­വി­ക ഭാഷാ പ്രോ­സ­സ്സിം­ഗ് ജോ­ലി­കൾ­ക്കാ­യി ഉ­പ­യോ­ഗി­ക്കു­ന്ന ഒരു തരം ന്യൂ­റൽ നെ­റ്റ്വർ­ക്ക് ആർ­ക്കി­ടെ­ക്ച­റാ­ണു്. “attention is all you need” എന്ന പേ­പ്പ­റിൽ ഗൂഗിൾ ഗ­വേ­ഷ­കർ 2017-ൽ ഇ­തി­ന്റെ ആശയം അ­വ­ത­രി­പ്പി­ച്ചു. ഒരു പ്ര­വ­ച­നം ന­ട­ത്തു­മ്പോൾ ഇൻ­പു­ട്ടി­ന്റെ വിവിധ ഭാ­ഗ­ങ്ങ­ളു­ടെ പ്രാ­ധാ­ന്യം ക­ണ­ക്കാ­ക്കാൻ മോ­ഡ­ലി­നെ അ­നു­വ­ദി­ക്കു­ന്ന self-​attention മെ­ക്കാ­നി­സ­ങ്ങ­ളു­ടെ ഉ­പ­യോ­ഗ­മാ­ണു് ട്രാൻ­സ്ഫോർ­മ­റി­ന്റെ പ്ര­ധാ­ന സ­വി­ശേ­ഷ­ത. ഇൻ­പു­ട്ട് തു­ടർ­ച്ച­യാ­യി പ്രോ­സ­സ്സ് ചെ­യ്യു­ന്ന റെ­ക­രെ­ന്റ് ന്യൂ­റൽ നെ­റ്റ്വർ­ക്കു­ക­ളിൽ (RNN) നി­ന്നു് ഇതു് വ്യ­ത്യ­സ്ത­മാ­ണു്. ട്രാൻ­സ്ഫോർ­മർ ആർ­ക്കി­ടെ­ക്ച­റിൽ ഒരു എൻ­കോ­ഡ­റും ഡീ­കോ­ഡ­റും അ­ട­ങ്ങി­യി­രി­ക്കു­ന്നു. ഇവ ര­ണ്ടും self-​attention ഉള്ള ഫീ­ഡ്ഫോർ­വേ­ഡ് ന്യൂ­റൽ നെ­റ്റ്വർ­ക്കു­ക­ളു­ടെ ഒ­ന്നി­ല­ധി­കം പാ­ളി­കൾ ചേർ­ന്ന­താ­ണു്. എൻ­കോ­ഡർ ഇൻ­പു­ട്ട് സീ­ക്വൻ­സ് എ­ടു­ക്കു­ക­യും ഒരു കൂ­ട്ടം മ­റ­ഞ്ഞി­രി­ക്കു­ന്ന അ­വ­സ്ഥ­കൾ സൃ­ഷ്ടി­ക്കു­ക­യും ചെ­യ്യു­ന്നു, അതു് ഔ­ട്ട്പു­ട്ട് സീ­ക്വൻ­സ് സൃ­ഷ്ടി­ക്കാൻ ഡീ­കോ­ഡർ ഉ­പ­യോ­ഗി­ക്കു­ന്നു. നമ്മൾ ട്രാൻ­സ്ഫോ­മ­റി­നു് കൊ­ടു­ക്കു­ന്ന ഒരു വാചകം അ­തി­നു് മ­റ്റൊ­രു ഭാ­ഷ­യി­ലേ­ക്ക് വി­വർ­ത്ത­നം ചെ­യ്യാ­നാ­വും. ഇ­തി­നാ­യി ചി­ത്രം ഒ­ന്നിൽ കാ­ണി­ച്ചി­രി­ക്കു­ന്ന ഉ­ദാ­ഹ­ര­ണം ശ്ര­ദ്ധി­ക്കു­ക.
images/jijosunil-gpt-02.jpg
ചി­ത്രം 2.

ഇ­തി­ന്റെ പ്ര­വർ­ത്ത­നം കു­റ­ച്ചു­കൂ­ടി വി­ശ­ദ­മാ­യി സൂ­ചി­പ്പി­ക്കു­ന്ന ചി­ത്രം ര­ണ്ടു് കാണുക.

images/jijosunil-gpt-03.jpg
ചി­ത്രം 3.

എൻ­കോ­ഡർ അ­തി­നു് ല­ഭി­ച്ച വാ­ച­ക­ത്തിൽ നി­ന്നും ആ­ശ­യ­ത്തെ മ­ന­സ്സി­ലാ­ക്കി ഡി­കോ­ഡ­റു­കൾ­ക്കു് മ­ന­സ്സി­ലാ­ക്കു­ന്ന ഫീ­ച്ച­റു­കൾ ആയി ആ­ശ­യ­ത്തെ രൂ­പാ­ന്ത­ര­പ്പെ­ടു­ത്തി എ­ടു­ക്കും. ഇ­ങ്ങ­നെ രൂ­പാ­ന്ത­രീ­ക­ര­ണം വന്ന ആ­ശ­യ­ത്തെ മ­റ്റൊ­രു ഭാ­ഷ­യിൽ പ്ര­ക­ടി­പ്പി­ക്കു­ക എ­ന്ന­താ­ണു് ജോലി.

അ­റ്റൻ­ഷൻ മെ­ക്കാ­നി­സം:
മ­നു­ഷ്യൻ ഭാഷ ഉ­ഉ­പ­യോ­ഗി­ച്ചാ­ണ്പ­യോ­ഗി­ക്കു­ന്ന­തു് വിവിധ പ­ദ­ങ്ങൾ ഉ­പ­യോ­ഗി­ച്ചാ­ണു്. ഭാ­ഷ­യു­ടെ വ്യാ­ക­ര­ണ നി­യ­മ­ങ്ങൾ അ­നു­സ­രി­ച്ചു് വാ­ക്കു­കൾ ചേർ­ത്തു് വാ­ച­ക­ങ്ങ­ളാ­ക്കും. ഇ­ങ്ങ­നെ ഉ­ണ്ടാ­ക്കു­ന്ന വാ­ച­ക­ങ്ങ­ളിൽ ആണു് ആ­ശ­യ­ങ്ങൾ അ­ട­ങ്ങി­യി­രി­ക്കു­ന്ന­തു്. ഒരു വാ­ച­ക­ത്തി­ലെ വിവിധ വാ­ക്കു­കൾ ത­മ്മി­ലു­ള്ള ബ­ന്ധ­ങ്ങ­ളും ഓരോ വാ­ക്കി­നു­മു­ള്ള പ്രാ­ധാ­ന്യ­വും ക­ണ്ടെ­ത്താ­നാ­ണു് അ­റ്റൻ­ഷൻ മോ­ഡ­ലു­കൾ ഉ­പ­യോ­ഗി­ക്കു­ന്ന­തു്.
images/jijosunil-gpt-04.jpg
ചി­ത്രം 4.

“ടോമി ഒരു നാ­യ്ക്കു­ട്ടി ആണു്, അവനു് കു­ര­യ്ക്കാൻ ആകും” എന്ന ഒരു വാചകം ഉ­ണ്ടെ­ന്നി­രി­ക്ക­ട്ടെ. ഈ വാ­ച­ക­ത്തി­ലെ വാ­ക്കു­കൾ ത­മ്മി­ലു­ള്ള പ­ര­സ്പ­ര­ബ­ന്ധം ചി­ത്ര­ത്തിൽ കാ­ണി­ച്ചി­രി­ക്കു­ന്നു. ഈ വാ­ച­ക­ത്തി­ലെ “ടോമി” ത­ന്നെ­യാ­ണു് “അവൻ.” “ടോമി,“ “നാ­യ്ക്കു­ട്ടി,” “കു­ര­യ്ക്കാൻ, എന്നീ വാ­ക്കു­കൾ പ­ര­സ്പ­രം ബ­ന്ധ­പ്പെ­ട്ടി­രി­ക്കു­ന്നു ഈ ബ­ന്ധ­മാ­ണു് മേൽ വാ­ച­ക­ത്തി­നു് അർ­ത്ഥം നൽ­കു­ന്ന­തു്. ജി­പി­ടി ഇ­ത്ത­രം ബ­ന്ധ­ങ്ങ­ളെ പ­രി­ഗ­ണി­ച്ചാ­ണു് ഭാ­ഷ­യു­ടെ മോഡൽ നിർ­മ്മി­ച്ചി­രി­ക്കു­ന്ന­തു്.

പ്രീ-​ട്രെയിനിംഗ്:
ജി­പി­ടി­യി­ലെ പ്രീ-​ട്രെയിനിംഗ് എന്ന പദം ഒരു വലിയ ഭാഷാ മോ­ഡ­ലി­നെ ഒരു പ്ര­ത്യേ­ക പ്ര­വർ­ത്തി­ക്കാ­യി പ­രു­വ­പ്പെ­ടു­ത്തു­ന്ന­തി­നു മു­ന്നേ ഒരു വലിയ അ­ള­വി­ലു­ള്ള ടെ­ക്സ്റ്റ് ഡാ­റ്റ­യിൽ പ­രി­ശീ­ലി­പ്പി­ക്കു­ന്ന പ്ര­ക്രി­യ­യെ സൂ­ചി­പ്പി­ക്കു­ന്നു. നാ­ച്ചു­റൽ ലാം­ഗ്വേ­ജ് പ്രോ­സ­സ്സിം­ഗ് ജോ­ലി­ക­ളു­ടെ പ്രാ­രം­ഭ­മാ­യി ഉ­പ­യോ­ഗി­ക്കാ­വു­ന്ന പൊ­തു­വാ­യ ഭാഷാ പ്രാ­തി­നി­ധ്യ­ങ്ങൾ (language representation) പ­ഠി­ക്കു­ക എ­ന്ന­താ­ണു് പ്രീ-​ട്രെയിനിംഗിന്റെ ല­ക്ഷ്യം. പ്രീ-​ട്രെയിനിംഗ് സ­മ­യ­ത്തു്, വാ­ക്യ­ത്തി­ലെ മുൻ വാ­ക്കു­കൾ നൽകി ഒരു വാ­ക്യ­ത്തി­ലെ അ­ടു­ത്ത വാ­ക്കു് പ്ര­വ­ചി­ക്കാൻ ജി­പി­ടി പ­രി­ശീ­ലി­പ്പി­ക്ക­പ്പെ­ടു­ന്നു. പ്രീ-​ട്രെയിനിംഗ് പൂർ­ത്തി­യാ­യി­ക്ക­ഴി­ഞ്ഞാൽ, മ­റ്റു് ഡാ­റ്റാ­സെ­റ്റു­ക­ളിൽ പ­രി­ശീ­ല­നം നൽകി ഭാഷാ വി­വർ­ത്ത­നം, ചോ­ദ്യ­ത്തി­നു് ഉ­ത്ത­രം നൽകൽ, അ­ല്ലെ­ങ്കിൽ വാ­ക്കു­ക­ളു­ടെ സം­ഗ്ര­ഹം എ­ന്നി­വ പോ­ലു­ള്ള നിർ­ദ്ദി­ഷ്ട ജോ­ലി­കൾ­ക്കാ­യി ഈ മോഡൽ മി­ക­ച്ച­താ­ക്കാൻ ക­ഴി­യും. ഇതിനെ ഫൈൻ ട്യൂ­ണിം­ഗ് എ­ന്നാ­ണു് വി­ളി­ക്കു­ന്ന­തു്. മേൽ­നോ­ട്ട­മി­ല്ലാ­ത്ത (unsupervised) പ്രീ-​ട്രെയിനിംഗും, സൂ­പ്പർ­വൈ­സ്ഡ് ഫൈൻ ട്യൂ­ണി­ങ്ങും സം­യോ­ജി­പ്പി­ക്കു­ന്ന ഒരു പ­രി­ശീ­ല­ന മാ­തൃ­ക­യാ­ണു് ജി­പി­ടി­യിൽ ഉ­പ­യോ­ഗി­ക്കു­ന്ന­തു്. ഈ മാതൃക ര­ണ്ടു് പ്ര­ശ്ന­ങ്ങൾ പ­രി­ഹ­രി­ക്കു­ന്നു: ഒ­ന്നാ­മ­തു് ചെ­ല­വേ­റി­യ ലേബൽ ചെയ്ത ഡേറ്റ ആ­വ­ശ്യ­മി­ല്ല, ര­ണ്ടാ­മ­തു് വലിയ ഡേ­റ്റാ­സെ­റ്റു­ക­ളി­ല്ലാ­തെ തന്നെ പ്ര­വർ­ത്തി­കൾ ചെ­യ്യാൻ ക­ഴി­യും. ചു­വ­ടെ­യു­ള്ള ചി­ത്രം കാണുക:
images/jijosunil-gpt-05.jpg
ചി­ത്രം 5.
ഡേ­റ്റാ­സെ­റ്റ്:
GPT-3-യിൽ ഏ­താ­ണ്ടു് 30,000 കോടി വാ­ക്കു­കൾ (ടോ­ക്ക­ണു­കൾ) ഉ­പ­യോ­ഗി­ച്ചു് പ­രി­ശീ­ല­നം നൽ­കി­യി­രി­ക്കു­ന്നു. നമ്മൾ നൽ­കു­ന്ന വാ­ക്കു­ക­ളിൽ നി­ന്നും ന­മ്മ­ളു­മാ­യി സം­വ­ദി­ക്കാൻ ആ­വ­ശ്യ­മാ­യ വാ­ക്കു­കൾ പ്ര­വ­ചി­ക്കു­ക എന്ന പ്ര­വർ­ത്തി­ക്കു­ള്ള പ­രി­ശീ­ല­ന­മാ­ണു് ഇ­തി­നു് നൽ­കി­യി­ട്ടു­ള്ള­തു്. ഉ­ദാ­ഹ­ര­ണ­ത്തി­നു്:
നമ്മൾ:
“സാധനം ക­യ്യിൽ?”
ജി­പി­ടി:
“സാധനം ക­യ്യിൽ ഉണ്ടോ?”
ഇ­തെ­ങ്ങ­നെ­യാ­ണു് ന­ട­ക്കു­ന്ന­തെ­ന്നു് നോ­ക്കാം. “സാധനം” + “ക­യ്യിൽ” എന്നീ ടോ­ക്ക­ണു­കൾ വ­ച്ചു് അ­ടു­ത്ത­താ­യി വ­രേ­ണ്ട 2048 ടോ­ക്ക­ണു­ക­ളു­ടെ ഒരു വിൻ­ഡോ­യി­ലൂ­ടെ ജി­പി­ടി ഒരു പ­ര്യ­ട­നം ന­ട­ത്തി, അതിൽ ഏ­റ്റ­വും സാ­ധ്യ­ത­യു­ള്ള വാ­ക്കു് തെ­ര­ഞ്ഞെ­ടു­ക്കു­ന്നു. ഓരോ വാ­ക്കു­ക­ളെ­യും ഒരു വെ­ക്ടർ ആയി എ­ടു­ത്തു് അ­വ­യു­ടെ അർ­ത്ഥം വെ­ളി­വാ­ക്കു­ന്ന 96 ട്രാൻ­സ്ഫോ­മർ ഡീ­ക്കോ­ഡർ ലേ­യ­റു­ക­ളി­ലൂ­ടെ ക­ട­ത്തി വി­ട്ടാ­ണു് ഇതു് സാ­ധി­ക്കു­ന്ന­തെ­ന്നു് വേ­ണ­മെ­ങ്കിൽ ല­ളി­ത­മാ­യി പറയാം. അ­ത­ല്ലാ­തെ “സാധനം ക­യ്യിൽ ഉണ്ടോ?” എന്ന വാചകം ഇ­ന്റർ­നെ­റ്റിൽ പരതി നൽ­കു­ക­യോ, അ­ത­ല്ലെ­ങ്കിൽ ഓർ­ത്തു് വ­ച്ചു് പ­റ­യു­ക­യോ അല്ല. അ­തി­നാ­ലാ­ണു് ചാ­റ്റ്ജി­പി­ടി പോ­ലു­ള്ള സാ­ങ്കേ­തി­ക­വി­ദ്യ­കൾ മ­നു­ഷ്യ­രെ­പ്പോ­ലെ പ്ര­വർ­ത്തി­ക്കു­ന്നു എ­ന്നു് പ­റ­യു­ന്ന­തു്.
ചാ­റ്റ്ജി­പി­ടി­യു­ടെ സാ­ധ്യ­ത­കൾ

ഒരു ആശയം നൽ­കി­യാൽ അതിനു യോ­ജി­ച്ച വെ­ബ്സൈ­റ്റ് ഉ­ണ്ടാ­ക്കാ­നു­ള്ള കോഡ് സൃ­ഷ്ടി­ക്കു­ക, സ്പ്രെ­ഡ്ഷീ­റ്റു­ക­ളിൽ പ്ര­വർ­ത്തി­ച്ച് പ്ര­വ­ച­ന­ങ്ങൾ ന­ട­ത്തു­ക, ന­മു­ക്കാ­വ­ശ്യ­മു­ള്ള ഒരു വിവരം ക്രോ­ഡീ­ക­രി­ച്ചു് നൽകുക, വിവിധ ഭാ­ഷ­ക­ളി­ലേ­ക്കു് തർ­ജ്ജ­മ ന­ട­ത്തു­ക, ഇ­ത്യാ­ദി­യെ­ല്ലാം ചെ­യ്യു­ന്ന ഒരു ട്രാൻ­സ്ഫോ­മർ മാ­തൃ­ക­യിൽ പ്ര­വർ­ത്തി­ക്കു­ന്ന ചാ­റ്റ്ബോ­ട്ടാ­ണു് ഇതു്. പ­ര­സ്പ­ര­ബ­ന്ധ­മി­ല്ലാ­ത്ത മ­റു­പ­ടി­കൾ ചി­ല­പ്പോൾ ത­രു­മെ­ങ്കി­ലും ചാ­റ്റ്ജി­പി­ടി­യു­ടെ ക­ഴി­വി­നെ അ­ക്കാ­ദ­മി­ക സമൂഹം ക­രു­ത­ലോ­ടെ­യാ­ണു് സ­മീ­പി­ക്കു­ന്ന­തു്. ഇ­ന്റർ­നെ­റ്റിൽ ല­ഭ്യ­മാ­യ എല്ലാ അ­റി­വു­ക­ളും, ആ­ശ­യ­വി­നി­മ­യ­ങ്ങ­ളും നൽകി പ­രി­ശീ­ലി­പ്പി­ച്ചി­രി­ക്കു­ന്ന ഈ സ­ങ്കേ­ത­ത്തി­നു് മ­നു­ഷ്യ­നേ­ക്കാൾ മെ­ച്ച­മാ­യ കൃ­തി­കൾ സൃ­ഷ്ടി­ക്കാ­നാ­വു­ന്ന­തിൽ അ­ത്ഭു­ത­മി­ല്ല. ഒരു കോ­ളേ­ജ് വി­ദ്യാർ­ത്ഥി­യെ­ക്കാൾ മെ­ച്ച­മാ­യി ഇ­തി­നു് എ­ഴു­താ­നാ­വും. ക­ലാ­സാ­ഹി­ത്യ ലോകം മാ­ത്ര­മേ പേ­ടി­ക്കേ­ണ്ട­തു­ള്ളൂ എ­ന്നു് ക­രു­താൻ വ­ര­ട്ടെ. ഒരു ശ­രാ­ശ­രി ക­മ്പ്യൂ­ട്ടർ പ്രോ­ഗ്രാ­മ­റെ­ക്കാൾ ന­ന്നാ­യി പ്രോ­ഗ്രാ­മു­കൾ എ­ഴു­താ­നും അ­തി­നു് സാ­ധി­ക്കും. ഉ­ദാ­ഹ­ര­ണ­ത്തി­നു് ഒരു സം­ഖ്യ­യു­ടെ ഫാ­ക്ടോ­റി­യൽ ക­ണ്ടു് പി­ടി­ക്കാ­നു­ള്ള പൈതൺ പ്രോ­ഗ്രാം എ­ഴു­താ­മോ എന്ന ചോ­ദ്യ­ത്തി­നു് ആ പ്രോ­ഗ്രാം മാ­ത്ര­മ­ല്ല, അ­തി­ന്റെ അൽ­ഗോ­രി­തം, അ­തു­പ­യോ­ഗി­ച്ചു­ള്ള ഒരു ഉ­പ­യോ­ഗം എ­ന്നി­വ സോ­ദാ­ഹ­ര­ണ സഹിതം നൽകാൻ ചാ­റ്റ്ജി­പി­ടി­യ്ക്ക് ഇ­രു­പ­തു് സെ­ക്ക­ന്റു­ക­ളേ വേ­ണ്ടി വ­ന്നു­ള്ളൂ.

ഇം­ഗ്ലീ­ഷിൽ ന­ട­ത്തു­ന്ന സം­ഭാ­ഷ­ണ­ങ്ങൾ­ക്കു് വളരെ വേ­ഗ­ത്തി­ലും കൃ­ത്യ­വു­മാ­യ പ്ര­തി­ക­ര­ണ­ങ്ങൾ ചാ­റ്റ്ജി­പി­ടി നൽ­കു­ന്നു­ണ്ടെ­ങ്കി­ലും മ­ല­യാ­ളം പോ­ലു­ള്ള ഭാ­ഷ­ക­ളിൽ ഉള്ളവ അല്പം സാ­വ­ധാ­ന­ത്തിൽ ആ­ണെ­ന്നു് മാ­ത്ര­മ­ല്ല പ്ര­ത്യേ­കി­ച്ചു് യാ­തൊ­രു അർ­ത്ഥ­വു­മി­ല്ലാ­ത്ത­വ­യു­മാ­ണു്. ലേ­ഖ­ന­ങ്ങൾ­ക്കു് വലിയ തെ­റ്റു് പറയാൻ പ­റ്റി­ല്ലെ­ങ്കി­ലും മ­ല­യാ­ള­ത്തിൽ എ­ഴു­തു­ന്ന ക­വി­ത­യൊ­ക്കെ ശുദ്ധ അ­ബ­ദ്ധ­മാ­ണു്. ഒരു മൂ­ന്നാം തലമുറ ചാ­റ്റ് എ­ഞ്ചി­നാ­യ ജിപിടി-​3 ഏ­ക­ദേ­ശം 17500 കോടി ഘ­ട­ക­ങ്ങൾ ഉ­പ­യോ­ഗി­ച്ചു് പ­രി­ശീ­ല­നം ന­ല്ക­പ്പെ­ട്ട­താ­ണു്. വിവിധ ഭാ­ഷ­ക­ളി­ലേ­ക്കു് വി­വർ­ത്ത­ന­ങ്ങൾ അ­നാ­യാ­സം ചെ­യ്യാൻ ക­ഴി­യു­ന്ന ഇ­തി­നു്, വാ­ക്യ­ഘ­ട­ന മ­ന­സ്സി­ലാ­ക്കു­ക, ജീ­വ­ച­രി­ത്ര­പ­ര­മാ­യ ഉ­പ­ന്യാ­സ­ങ്ങ­ളും കാ­ല്പ­നി­ക ക­വി­ത­ക­ളും രാ­ഷ്ട്രീ­യ വി­മർ­ശ­ന­ങ്ങ­ളും എ­ഴു­തു­ക, ഗണിത സ­മ­വാ­ക്യ­ങ്ങൾ ക്രി­യാ­ത്മ­ക­മാ­യി പ­രി­ഹ­രി­ക്കു­ക എന്നീ ക്രി­യ­ക­ളും ചെ­യ്യാൻ ക­ഴി­യും. കു­മാ­ര­നാ­ശാ­ന്റെ ക­വി­ക­ളെ­ക്കു­റി­ച്ചു് ഏ­താ­നും വാ­ച­ക­ങ്ങൾ എ­ഴു­താൻ ആ­വ­ശ്യ­പ്പെ­ട്ട­പ്പോൾ താ­ഴെ­ക്കൊ­ടു­ത്ത പ്ര­തി­ക­ര­ണം ല­ഭി­ക്കാൻ പ­ത്തു് നി­മി­ഷ­ങ്ങ­ളേ വേ­ണ്ടി­വ­ന്നു­ള്ളൂ (ചാ­റ്റ്ജി­പി­ടി­യു­ടെ തർ­ജ്ജ­മ മോ­ശ­മാ­യ­തി­നാ­ലും, അതു് മ­ല­യാ­ള­ത്തിൽ നൽ­കു­ന്ന വാ­ക്യ­ങ്ങ­ളു­ടെ വ്യാ­ക­ര­ണം ശ­രി­യ­ല്ലാ­ത്ത­തി­നാ­ലും ഇം­ഗ്ലീ­ഷിൽ സൃ­ഷ്ടി­ച്ചു് ഗൂഗിൾ തർ­ജ്ജ­മ ചെ­യ്ത­തു്):

“കു­മാ­ര­നാ­ശാൻ (ആശാൻ എ­ന്നും അ­റി­യ­പ്പെ­ടു­ന്നു) ഇ­ന്ത്യ­യി­ലെ പ്ര­ശ­സ്ത­നാ­യ ക­വി­യും ത­ത്ത്വ­ചി­ന്ത­ക­നു­മാ­യി­രു­ന്നു. വ­ള്ള­ത്തോൾ നാ­രാ­യ­ണ മേനോൻ, ഉ­ള്ളൂർ എസ്. പ­ര­മേ­ശ്വ­ര അയ്യർ എ­ന്നി­വ­രോ­ടൊ­പ്പം ആ­ധു­നി­ക മലയാള സാ­ഹി­ത്യ­ത്തി­ലെ ത്രി­മൂർ­ത്തി­ക­ളി­ലൊ­രാ­ളാ­യി അ­ദ്ദേ­ഹം ക­ണ­ക്കാ­ക്ക­പ്പെ­ടു­ന്നു. കു­മാ­ര­നാ­ശാ­ന്റെ ക­വി­ത­കൾ പ്ര­ണ­യം, പ്ര­കൃ­തി, ആ­ത്മീ­യ വി­മോ­ച­നം എ­ന്നി­വ­യു­ടെ പ്ര­മേ­യ­ങ്ങൾ പ­ര്യ­വേ­ക്ഷ­ണം ചെ­യ്യു­ന്നു. ”വീണ പൂവ്”, ”ആ ദിവ്യ ച­രി­ത്രം”, ”കരുണ”, ”ആ­ത്മോ­പ­ദേ­ശ ശതകം” എ­ന്നി­വ അ­ദ്ദേ­ഹ­ത്തി­ന്റെ പ്ര­ശ­സ്ത­മാ­യ ക­വി­ത­ക­ളിൽ ചി­ല­താ­ണു്. ഭഗവദ് ഗീത മ­ല­യാ­ള­ത്തി­ലേ­ക്ക് വി­വർ­ത്ത­നം ചെ­യ്ത­തി­ലും അ­ദ്ദേ­ഹം പ്ര­ശ­സ്ത­നാ­ണു്.”

മേൽ­പ്പ­റ­ഞ്ഞ കാ­ര്യം എ­ല്ലാം സ­ത്യ­മാ­ണോ എ­ന്ന­തു് ആ വി­ഷ­യ­ത്തിൽ അ­റി­വു­ള്ള ഒ­രാൾ­ക്കേ മ­ന­സ്സി­ലാ­ക്കാ­നാ­വൂ എ­ങ്കി­ലും ഈ പ്ര­തി­ക­ര­ണം അ­വി­ശ്വ­സ­നീ­യ­മാ­ണു്. ഇ­ത്ത­രം കാ­ര്യ­ങ്ങ­ളിൽ പ്ര­തി­ക­ര­ണം വലിയ മോ­ശ­മ­ല്ലെ­ങ്കി­ലും വിവിധ ഭാ­ഷ­ക­ളി­ലു­ള്ള സാ­ഹി­ത്യ കൃ­തി­ക­ളൊ­ക്കെ സൃ­ഷ്ടി­ക്കാൻ ഇ­തി­നു് ഇ­നി­യും ക­ഴി­വു് വേ­ണ്ട­വി­ധം ആർ­ജ്ജി­ക്കാ­നാ­യി­ട്ടി­ല്ല. 2022 ആ­ദ്യ­ത്തോ­ടെ പ­രി­ശീ­ല­നം പൂർ­ത്തി­യാ­യ ചാറ്റ്ജിപിടി-​3നു പകരം 2023 ആദ്യം പു­റ­ത്തി­റ­ങ്ങു­ന്ന ചാറ്റ്ജിപിടി-​4 ഇ­ത്ത­രം പോ­രാ­യ്മ­കൾ മ­റി­ക­ട­ന്നേ­ക്കാം.

ജിപിടി-​4

ഒരു ലക്ഷം കോടി ഘ­ട­ക­ങ്ങൾ (1 trillion parameters) ഉ­പ­യോ­ഗി­ച്ചു് പ­രി­ശീ­ല­നം നൽ­കി­ക്കൊ­ണ്ടി­രി­ക്കു­ന്ന GPT-4നു് ഒരു മ­നു­ഷ്യ മ­സ്തി­ഷ്ക്ക­ത്തി­നു് സ­മാ­ന­മാ­യ ചി­ന്താ­ശേ­ഷി ഉ­ണ്ടാ­വും. ക­മ്പ്യൂ­ട്ടർ ഹാർ­ഡ്വെ­യർ മേ­ഖ­ല­യി­ലു­ണ്ടാ­യ വ­ളർ­ച്ച­യാ­ണു് ഇതിനു പി­ന്നിൽ. മ­നു­ഷ്യ മ­സ്തി­ഷ്ക്ക­ത്തിൽ ശ­രാ­ശ­രി 8600 കോടി ന്യൂ­റോ­ണു­കൾ ഉ­ള്ള­പ്പോൾ ജിപിടി-​4നു് ഒരു ലക്ഷം കോടി ന്യൂ­റൽ നെ­റ്റ്വർ­ക്കു­കൾ ല­ഭ്യ­മാ­ണു്. നി­ല­വിൽ വാ­ക്കു­കൾ ടൈ­പ്പ് ചെ­യ്തു് കൊ­ടു­ക്കു­ന്ന അ­വ­സ്ഥ­യ്ക്കു് പകരം ഓഡിയോ, വീ­ഡി­യോ ഇൻ­പു­ട്ടു­കൾ സ്വീ­ക­രി­ക്കാൻ ചാറ്റ്ജിപിടി-​4ക്കു് ക­ഴി­യും. മൾ­ട്ടി­മോ­ഡൽ ഇൻപുട്ട്-​ഔട്ട്പുട്ട് മോഡൽ എ­ന്ന­റി­യ­പ്പെ­ടു­ന്ന ഇ­തി­നു് മുൻ­പേ­യു­ള്ള മോ­ഡ­ലു­ക­ളെ­ക്കാൾ പ­രി­ശീ­ല­ന ചെ­ല­വു് കു­റ­വു­മാ­ണു്. കോ­പ്പി­യെ­ഴു­ത്തു്, ക­സ്റ്റ­മർ സ­പ്പോർ­ട്ട്, ക­മ്പ്യൂ­ട്ടർ പ്രോ­ഗ്രാ­മിം­ഗ് തു­ട­ങ്ങി­യ മേ­ഖ­ല­ക­ളിൽ ഇതു് മ­നു­ഷ്യ­രു­ടെ ജോലി ഇ­ല്ലാ­താ­ക്കി­യേ­ക്കാം. ഭാ­വി­യിൽ ഒരു പി­എ­ച്ച്ഡി പ്ര­ബ­ന്ധ­മൊ­ക്കെ എ­ളു­പ്പ­ത്തിൽ എ­ഴു­തി­യു­ണ്ടാ­ക്കാൻ ഇതിനു അ­നാ­യാ­സം സാ­ധി­ച്ചേ­ക്കാം എ­ന്നു് ക­രു­ത­പ്പെ­ടു­ന്നു.

കൃ­ത്യ­ത­യും ഭാ­വി­യും

നി­ല­വിൽ ചാറ്റ്ജിപിടി-​3 ഉ­പ­യോ­ഗി­ച്ച് ന­ട­ത്തി­യ ഒരു പ­രീ­ക്ഷ­ണ­ത്തിൽ ഒരു ശാ­സ്ത്ര വി­ഷ­യ­ത്തിൽ സൂ­ചി­ക­കൾ സഹിതം ഒരു ലേഖനം എ­ഴു­താൻ അതിനു സാ­ധി­ച്ചെ­ങ്കി­ലും എല്ലാ സൂ­ചി­ക­ക­ളും കൃ­ത്യ­മാ­യി­രു­ന്നി­ല്ല. പക്ഷെ ഈ ലേഖനം കോ­പ്പി­യ­ടി ടെ­സ്റ്റി­നു വി­ധേ­യ­മാ­ക്കി­യ­പ്പോൾ ഒരു വിധ കോ­പ്പി­യ­ടി­യും ഇല്ലാ എ­ന്നാ­ണു് സോ­ഫ്ട്വെ­യർ കാ­ണി­ച്ച­തു്. ഇതു് മ­നു­ഷ്യർ എ­ഴു­തു­ന്ന ലേ­ഖ­ന­ങ്ങ­ളിൽ വ­രി­ക­യെ­ന്ന­തു് വളരെ വിഷമം പി­ടി­ച്ച കാ­ര്യ­മാ­ണു്. എ­ന്നാൽ ഇ­ത്ത­രം സാ­ങ്കേ­തി­വി­ദ്യ വി­ദ്യാർ­ത്ഥി­കൾ സ്വ­പ്ര­യ­ത്ന­മി­ല്ലാ­തെ സൃ­ഷ്ടി­കൾ ന­ട­ത്തി ക­ബ­ളി­പ്പി­ക്കു­മെ­ന്ന ആശങ്ക അ­സ്ഥാ­ന­ത്താ­ണു്. കാരണം, അതു് ക­ണ്ടു് പി­ടി­ക്കു­ന്ന സോ­ഫ്റ്റ്വെ­യർ ഇ­റ­ങ്ങി­ക്ക­ഴി­ഞ്ഞു. എ­ന്നി­രു­ന്നാ­ലും ന­മ്മു­ടെ വി­ദ്യാ­ഭ്യാ­സ സ­മ്പ്ര­ദാ­യ­ത്തി­ന്റെ ഘടന മാ­റ്റി­മ­റി­ച്ചേ­ക്കാ­വു­ന്ന ഒരു ക­ണ്ടു­പി­ടി­ത്ത­മാ­ണി­തെ­ന്ന­തിൽ സംശയം വേണ്ട. വി­ദ്യാർ­ത്ഥി­ക­ളെ സം­ബ­ന്ധി­ച്ചി­ട­ത്തോ­ളം ഇ­ന്റർ­നെ­റ്റിൽ തെ­ര­യ­ലും, തർ­ജ്ജ­മ­യ്ക്കു­മൊ­ക്കെ അ­പ്പു­റം അ­വർ­ക്ക് പ­ഠി­ക്കേ­ണ്ട വി­ഷ­യ­ങ്ങ­ളെ­പ്പ­റ്റി ചർച്ച ന­ട­ത്താ­നും ആ­വ­ശ്യ­മാ­യ ഉ­ത്ത­ര­ങ്ങൾ നൽ­കാ­നും ഉള്ള ഒരു സ­ഹാ­യി­യാ­യി മാറാൻ ചാ­റ്റ്ജി­പി­ടി­യ്ക്കു് ക­ഴി­യു­മെ­ന്ന­തു് ഒരു വലിയ മാ­റ്റ­മാ­ണു്. നി­ര­വ­ധി ലി­ങ്കു­കൾ പരതി സമയം മെ­ന­ക്കെ­ടു­ത്താ­തെ കൃ­ത്യ­മാ­യ ഉ­ത്ത­ര­ങ്ങൾ നി­മി­ഷ­ങ്ങൾ­ക്കു­ള്ളിൽ ന­ല്കു­മെ­ന്ന­തു് വളരെ സൗ­ക­ര്യ­പ്ര­ദ­മാ­യ കാ­ര്യ­മാ­ണു്.

ഇ­തൊ­ക്കെ­യാ­ണെ­ങ്കി­ലും ഇ­ത്ത­രം സാ­ങ്കേ­തി­ക­വി­ദ്യ­യിൽ ഇ­പ്പോ­ഴും മു­ന്നിൽ നിൽ­ക്കു­ന്ന­തു് ഗൂ­ഗി­ളാ­ണു്. പാം (PaLM–പാ­ത്വെ­യ്സ് ലാം­ഗ്വേ­ജ് മോഡൽ) എന്ന ന്യൂ­റൽ നെ­റ്റ്വർ­ക്ക് അ­ധി­ഷ്ഠി­ത മാതൃക 54,000 കോടി ഘ­ട­ക­ങ്ങൾ ഉ­പ­യോ­ഗി­ക്കു­ന്ന­തും ഈ മേ­ഖ­ല­യിൽ ഏ­റ്റ­വും മു­ന്നിൽ നിൽ­ക്കു­ന്ന­തു­മാ­ണു്. ഗൂഗിൾ, മെ­റ്റാ, ആ­പ്പിൾ തു­ട­ങ്ങി­യ ക­മ്പ­നി­കൾ ചാ­റ്റ്ജി­പി­ടി­യെ വെ­ല്ലു­ന്ന സാ­ങ്കേ­തി­ക­വി­ദ്യ സൃ­ഷ്ടി­ക്കാ­നു­ള്ള പ­ണി­പ്പു­ര­യി­ലാ­ണു്. ആൻ­ഡ്രോ­യ്ഡ് ഉ­പ­ക­ര­ണ­ങ്ങ­ളി­ലു­ള്ള ഗൂഗിൾ അ­സി­സ്റ്റ­ന്റ്, ഗൂഗിൾ ട്രാൻ­സ്ലേ­റ്റ്, അ­തു­പോ­ലെ ഗൂഗിൾ ക്ളൗ­ഡിൽ പ്ര­വർ­ത്തി­ക്കു­ന്ന ഡോ­ക്സ്, ഷീ­റ്റ് തു­ട­ങ്ങി­യ ആ­പ്പു­ക­ളൊ­ക്കെ നിർ­മി­ത­ബു­ദ്ധി സേ­വ­ന­ങ്ങൾ നൽ­കു­ന്ന­വ­യാ­ണു്. ബെർ­ട്ട് (BERT–Bidirectional Encoder Representations from Transformers) എന്ന മോഡൽ കാ­ല­ങ്ങ­ളാ­യി അ­വ­രു­ടെ സെർ­ച്ചി­നെ സ­ഹാ­യി­ക്കു­ന്നു­ണ്ടു്. ഗൂഗിൾ ചാ­റ്റിൽ ഉ­പ­യോ­ഗി­ക്കു­ന്ന ലാംഡ (LaMDA) ചാ­റ്റ്ബോ­ട്ടും നിർ­മി­ത­ബു­ദ്ധി അ­ധി­ഷ്ടി­ത­മാ­ണു്.

പൊ­തു­വേ, GPT-4 പോ­ലെ­യു­ള്ള ഭാഷാ മോ­ഡ­ലു­കൾ­ക്കു് മ­നു­ഷ്യ­നെ­പ്പോ­ലെ വാ­ക്കു­കൾ സൃ­ഷ്ടി­ക്കാ­നും മ­നു­ഷ്യ­ന്റേ­തിൽ നി­ന്നു് വേർ­തി­രി­ച്ച­റി­യാൻ പ്ര­യാ­സ­മു­ള്ള സം­ഭാ­ഷ­ണ­ങ്ങൾ തു­ട­രാ­നും ക­ഴി­യും. എ­ന്നി­രു­ന്നാ­ലും, ഒരു മ­നു­ഷ്യ­നെ­പ്പോ­ലെ അ­വ­രു­ടെ പ്ര­തി­ക­ര­ണ­ങ്ങ­ളു­ടെ ഉ­ള്ള­ട­ക്കം മ­ന­സ്സി­ലാ­ക്കാ­നോ ന്യാ­യ­വാ­ദം ചെ­യ്യാ­നോ ഉള്ള ക­ഴി­വു് നി­ല­വിൽ അ­വ­യ്ക്കി­ല്ല. അ­തി­വേ­ഗം പു­രോ­ഗ­മി­ച്ചു കൊ­ണ്ടി­രി­ക്കു­ന്ന നിർ­മ്മി­ത ബു­ദ്ധി ഗ­വേ­ഷ­ണ­ങ്ങ­ളു­ടെ ഭാവി പ്ര­വ­ചി­ക്കു­ക എ­ന്ന­തു് അത്ര എ­ളു­പ്പ­മ­ല്ല. അ­തോ­ടൊ­പ്പം ഓരോ ദി­വ­സ­വും പുതിയ പുതിയ ഉ­പ­യോ­ഗ­ങ്ങൾ ക­ണ്ടെ­ത്തി­ക്കൊ­ണ്ടു് ഇ­രി­ക്കു­ന്ന­തി­നാൽ വരും കാലം ആ­വേ­ശ­ക­ര­മാ­യി­രി­ക്കു­മെ­ന്നു് തീർ­ച്ച.

റെ­ഫ­റൻ­സു­കൾ
  1. https://papers.neurips.cc/paper/7181-​attention-is-allyou-need.pdf
  2. https://jalammar.github.io/illustrated-​transformer/
  3. റെ­ഡ്ഡി­റ്റി­ന്റെ ഓപ്പൺ എ ഐ ത്രെ­ഡിൽ നി­ന്നു­ള്ള പോ­സ്റ്റു­കൾ https://www.reddit.com/r/OpenAI/
  4. https://openai.com/blog/chatgpt/

Dr. Jijo P. Ulahannan
images/jijo-pic.jpg

Associate Professor of Physics, Govt. College, Kassargod, Senior Member of ieee and ted Fellow.

Masters in Physics and Ph. D. from cusat. Computational Physicist by training and current interests are Data Science, and Science Communication.

Email: paul.jijo@gmail.com

Dr. Sunil Thomas Thonikuzhiyil
images/sunil-thomas-pic.jpg

Principal, College of Engineering, Attingal.

Masters in Computer Science from Cochin University of Science and Technology, Ph. D. from Department of Electrical Engineering from Indian Institute of Technology, Bombay. Present interests are in machine learning, artificial intelligence, communication systems and free software.

Email: vu2swx@gmail.com

Colophon

Title: GPT—Nirmitha Budhiyile Puthiya Tharam (ml: ജി­പി­ടി—നിർ­മ്മി­ത ബു­ദ്ധി­യി­ലെ പുതിയ താരം).

Author(s): Dr. Jijo P. Ulahannan, Dr. Sunil Thomas Thonikkuzhiyil.

First publication details: luca; (Online science portal in Malayalam by Kerala Sasthrasahithya Parishad). Link: https://luca.co.in/gpt-​ai/;

Deafult language: ml, Malayalam.

Keywords: Article, Dr. Jijo P. Ulahannan, Dr. Sunil Thomas Thonikkuzhiyil, GPT—Nirmitha Budhiyile Puthiya Tharam, ഡോ. ജിജോ പി. ഉ­ല­ഹ­ന്നാൻ, ഡോ. സുനിൽ തോമസ് തോ­ണി­ക്കു­ഴി­യിൽ, ജി­പി­ടി—നിർ­മ്മി­ത ബു­ദ്ധി­യി­ലെ പുതിയ താരം, Open Access Publishing, Malayalam, Sayahna Foundation, Free Software, XML.

Digital Publisher: Sayahna Foundation; JWRA 34, Jagthy; Trivandrum 695014; India.

Date: January 26, 2023.

Credits: The text of the original item is copyrighted to the author. The text encoding and editorial notes were created and​/or prepared by the Sayahna Foundation and are licensed under a Creative Commons Attribution By NonCommercial ShareAlike 4​.0 International License (CC BY-​NC-SA 4​.0). Commercial use of the content is prohibited. Any reuse of the material should credit the Sayahna Foundation and must be shared under the same terms.

Cover: Persian water-​wheel, a painting by David Roberts (1796–1864). The image is taken from Wikimedia Commons and is gratefully acknowledged.

Production history: Data entry: the author; Typesetter: JN Jamuna; Editor: PK Ashok; Encoding: JN Jamuna.

Production notes: The entire document processing has been done in a computer running GNU/Linux operating system and TeX and friends. The PDF has been generated using XeLaTeX from TeXLive distribution 2021 using Ithal (ഇതൾ), an online framework for text formatting. The TEI (P5) encoded XML has been generated from the same LaTeX sources using LuaLaTeX. HTML version has been generated from XML using XSLT stylesheet (sfn-​tei-html.xsl) developed by CV Radhakrkishnan.

Fonts: The basefont used in PDF and HTML versions is RIT Rachana authored by KH Hussain, et al., and maintained by the Rachana Institute of Typography. The font used for Latin script is Linux Libertine developed by Phillip Poll.

Web site: Maintained by KV Rajeesh.

Download document sources in TEI encoded XML format.

Download Phone PDF.