سنڌي ورڊنيٽ سرشتو

ھڪ آئيندي ساز رٿا

تمھيد: دنيا جي سگهارين ٻولين ۾ ورڊ نيٽ (WordNet) هڪ جامع لغوي وسيلي طور سڃاتو ويندو آهي جيڪو ان ٻوليءَ جي لفظن، انهن جي معنائن ۽ ٻولن جا ھڪٻئي سان لاڳاپا ڏيکاريندو آھي. ورڊنيٽ سرشتو ان ٻوليءَ جي لفظن، انهن جي ھم معنائن، ضدن، ۽ تصوراتي لاڳاپن کي ھڪ ھنڌ ڪٺو ڪرڻ ۽ ترتيب ڏيڻ ۾ مدد ڪندو آھي. يعني هي سرشتو لغوي وسيلن جي تخليق ۾ مددگار ٿيندو آهي. جيئن جسماني طور ھن ڪائنات ۾ سڀ شيون ھڪٻئي سان ڪنھن نہ ڪنھن ناتي ڳنڍيل آھن ائين ئي ٻولين جا لفظ پڻ ساڳي نسبت سان ھڪ نيٽورڪ جيان ڳنڍيل ٿيندا آھن ۽ ھي سرشتو ان ئي ڳانڍاپي کي عملي روپ ۾ ڏيکاريندو آھي.

ورڊنيٽ جو مرحليوار تعارف ۽ طريقيڪار:

  1. ٻوليءَ جا وياڪرڻي سڌارا: ورڊ نيٽ ذريعي ٻوليءَ جي نرالن ٻولن جي بيھڪن، اچارن ۽ گرامر آڌار وڏين چُڪن جو سڌارو ممڪن ٿي ويندو آھي. جيئن ڪو ٻول اُچار آڌار نار (مادي) جنس جو تصور رکي ٿو پر ان جي فعلن کي نر وارن لفظن سان لکيو وڃي تہ ھي سرشتو خودڪار نموني سان ليکڪ کي ٻڌائيندو تہ ھتي فعل ڪھڙا استعمال ٿيندا. مثال: ڪو ماڻهو ائين چوي يا لکي تہ: ”پٽڙيءَ تي ريل اچي رھيو آھي.“ ھاڻي اھو جملو جيئن ئي ورڊنيٽ سرشتي مان گذرندو تہ اھو نشاندھي ڪري سگهندو تہ ھن جملي ۾ لفظ ”ريل“ مونث جنس وارو ٻول آھي انڪري مٿيان فعل ”رھيو آھي“ نہ پر ”رھي آھي“ درست ٻول آھن.

    جملن جي درست جوڙجڪ: اسان وٽ جديد ميڊيا جھڙوڪ ايف ايم، اليڪٽرانڪ ميڊيا کان ويندي سوشل ميڊيا ۾ پڻ گرامر آڌار سنڌي ٻوليءَ جي ضميري ٻولن کي بي تڪي نموني سان ورجايو پيو وڃي جھڙوڪ: ”اسان سندن جي خوشين ۾ شرڪت ڪئي“ ھاڻي ھن جملي ۾ گرامر جي ترڪيب ”ضمير + ضمير + ضمير + حرف جر + اسم + فعل“ ٿئي ٿي، جيڪا گرامر آڌار بلڪل درست ناھي. ھاڻي مٿيون جملو درست ڪري لکبو تہ: ”اسان سندن خوشيءَ ۾ شرڪت ڪئي“. ان درست ٿيل جملي جي ترڪيب ٿيندي: ”ضمير + ضمير + اسم + حرف جر + فعل“. ھاڻي ھي جملو گرامر جي نيمن ۽ اصولن آڌار بلڪل درست ٿيندو. سنڌي ورڊنيٽ ۾ درست ٿيل ھزارين جملن کي ”ھڪ ماڊل“ يا مثالي نمونا ڪري مشين کي اھڙي قسم جي تربيت ڏني ويندي جو اھا گرامر جي اصولن کي پڪو ڪندي ھڪ پختو ”ماڊل“ ٺاھي رکندي آھي. جنھن سان اھا پروگرامنگ پوءِ متن جي چُڪن کي پڪڙي ٻڌائيندي آھي تہ اھو جملو ڪھڙي نموني سان درست لکبو. مائڪروسوفٽ جي ”ايم ايس ورڊ“ يا جڳ مشھور پروگرام ”گرامرلِي“ ۾ اوھان جيڪڏھن انگريزي متن لکندي درست گرامر سان جملو نہ لکيو تہ اوھان جي لکيل جملي ھيٺان ھڪ سائي رنگ جي لڪير اچي ايندي آھي، دراصل اھا اوھان کي ٻڌائيندي آھي تہ اوھان جملو درست ناھي لکيو، رڳو ايترو ئي نہ پر اوھان جي ڏنل جملي کي مختلف نمونن سان درست ڪري پڻ اھو پروگرام ٻڌائيندو آھي تہ گرامر آڌار ھيئن جملا درست ٿيندا. سنڌي ورڊنيٽ سرشتو بلڪل ساڳي ئي نموني سان اوھان جي ڏنل جملن ۾ گرامر جي درستگي پڻ ڪري سگهندو.

  2. ٻوليءَ جي خودڪار سمجهہ: مصنوعي ذهانت ۽ قدرتي ٻولين جي مشيني سرشتن (نيچرل لئنگئيج پروسيسنگ) جي شعبن ۾، انساني ٻولين جي وسيلن جھڙوڪ ٻول، ٻولن جا قانون، آوازي صورتون، لکت جي سمورين شڪلين وغيرہ جي موجودگي ضروري ھوندي آهي. ورڊ نيٽ سنڌي ٻوليءَ جي ٻولن ۽ جملن جي سمجهڻ ۾ مدد ڪندو، جيڪو عمل اڳتي ھلي مشيني خودڪار ترجمن اندر ٻولن جي لکت وارين درستگين سميت سنئون سڌو انگريزيءَ کان سواءِ ٻين ٻولين جي بڻياد ۾ ساڳيو تاڃي پيٽو ڏسي سنڌي ٻوليءَ کي ٻين ٻولين ۾ ترجمو ڪرڻ لائق بڻائيندو. اھو ائين سمجهجي تہ جيئن اڄ جي زماني ۾ اوھان سعودي ريال کي پاڪستاني رپئي سان سنئون سڌو ڀيٽي نہ ٿا سگهو پر ڊالر کي وچ ۾ آڻڻو پوندو آھي، بلڪل ائين ئي اڄوڪي مشيني ترجمن ۾ سنڌي ٻوليءَ کي اردو ٻوليءَ ۾ سنئون سڌو ترجمو ڪري ڏسو تہ اوھان کي ان ڪيل ترجمي ۾ گهڻيون ئي چُڪون ملنديون پر جيڪڏھن سنڌيءَ کي انگريزي ۽ وري بعد ۾ ان ترجمي ڪيل انگريزي متن کي اردوءَ ۾ ترجمو ڪري ڏسبو آھي تہ گهڻو ڪري سنڌيءَ کان اردوءَ ۾ سنئين سڌي ڪيل ترجمي کان بھتر ترجمو ملندو آھي. ان جو سبب اھو بہ آھي تہ انگريزي ٻوليءَ جو ورڊنيٽ سرشتو مضبوط نموني سان 1986 ۾ ٺاھيو ويو ھئو جنھن مان اڄ پوري دنيا لاڀ وٺي رھي آھي ۽ ھيڏانھن وري اردو ٻوليءَ جو ھڪ ورڊنيٽ سرشتو لاھور جي اداري ”سينٽر آف لئنگئيج انجنيئرنگ“ ٺاھيو تہ آھي پر انتھائي محدود يعني رڳو ڇھ ھزار لفظن تي مشتمل سو بہ مفت ۾ ناھي رکيو جڏھن تہ سنڌيءَ جو ورڊنيٽ سرشتو اجهو ھاڻي ٺھي رھيو آھي. سو ھاڻي ٺھندڙ سنڌي ورڊ نيٽ اوھان جي ڏنل متن کي مصنوعي ذھانت آڌار بلڪل انساني دماغ جيان تجزيو پڻ ڪري سگهندو ۽ پنھنجي ٻين ڪمپيوٽيشنل ۽ روباٽڪ سرشتن کي پڻ ھٿي ڏيندو.

  3. دنيا جھان ۾ سنڌي ٻوليءَ جي موجودگي: ورڊ نيٽ جي ٺھڻ سان سنڌي ٻوليءَ جا لفظ ۽ انهن جا هم معنا لفظ ڊجيٽل دنيا جي مختلف سرشتن ۾ پنھنجي قد ڪاٺ سان موجود هوندا، جنھن ڪري سنڌي ٻوليءَ جي تعليم ۽ تحقيق ۾ بھتر نموني سان مدد ملندي. هيءُ وسيلو ٻوليءَ تي ڪم ڪندڙ محققن لاءِ ئي نہ پر ھڙني شعبن جي اسڪالرن، استادن، ۽ شاگردن لاءِ دنيا جي ھر ھنڌ ۽ ھر وقت دستياب ٿيندو، جنھن سان ٻوليءَ جي تعليم ۽ واڌارن ۾ نواڻ اچي سگهندي.

سنڌي ورڊ نيٽ جوڙڻ جو پس منظر:

سن 1987ع ۾ جڏھن سنڌي ڪمپيوٽنگ جي بانيڪار عبدالماجد ڀرڳڙيءَ ڪمپيوٽر کي ان لائق بڻايو جو اھو سنڌي اکرن کي پنھنجي سرشتي ۾ آڻي اکرن، لفظن ۽ جملن کي ساڳي ئي شڪل جيان پرنٽر مان پرنٽ ڪري سگهيو ۽ اِھا سنڌي ڪمپوزنگ، پرنٽنگ ۽ ڊگهن ۽ ڏکين ڪوڊن تي ٻڌل سنڌي لکت وري انٽرنيٽ جي برائوزرن تي ڏسي سگهبي ھئي جو ڪجهہ ئي سالن کانپوءِ سڄي دنيا جي اکر پٽين (الفابيٽ) کي جدا جدا ڪوڊ ڏئي سڃاڻپ ڏيندڙ ”يونيڪوڊ“ اداري سنڌي ٻوليءَ جي انهن اکرن جيڪي عربيءَ جي الفابيت ۾ نہ ھئا جھڙوڪ ڇ، ڏ، ڱ وغيرہ تن کي بہ جدا ڪوڊ ڏئي ڇڏيو، وري ھوڏانھن انٽرنيشنل اسٽينڊرڊ آرگنائيزيشن (ISO) ۾ سنڌي ٻوليءَ کي ھنن ٻن اکرن سان (sd) ۽ ٽن اکرن تي مشتمل (snd) تعارفي ڪوڊ الاٽ ڪيو ويو. يعني ھاڻي پوري دنيا ۾ ٻولين جي ڪمپيوٽيشنل سرشتن ۾ جتي جتي ”ايس ڊِي يا ايسِ اينِ ڊِي“ اچي تہ ڪمپيوٽنگ جي سافٽويئر يا پروگرام کان ويندي جديد دؤر ۾ راڄ ڪندڙ روباٽڪس ۽ مصنوعي ذھانت وارا ھڙئي سرشتا سمجهي ويندا تہ اھي ڪوڊ ’سنڌي‘ ٻوليءَ کي پڌرو ڪن ٿا. يونيڪوڊ ۾ جيئن ئي سنڌي ٻولي آئي تہ پوري دنيا جي ڪمپيوٽرن وارن آپريٽنگ سرشتن ۾ سنڌي ٻوليءَ جي ھاڪ ٿيڻ لڳي. مٿان وري جو سمارٽ فونن جن جي اسڪرين ۾ ئي ڪيبورڊ ھلڻ لڳو تہ اڃا ھڪ وڏو انقلاب اچي ويو. ھاڻي دنيا جي ھڙني ٻولين جن جون لکتون ھيون سي سمارٽ ٽيڪنالاجيءَ ۾ ظاھر ٿيڻ لڳيون. 2015ع ۾ وري موبائل ٽيڪنالاجيءَ ۾ ”سُويفٽ ڪِي“ نالي سان ھڪ جڳ مشھور ڪيبورڊ پڌرو ٿيو، جنھن جي ھڪ اھم خاصيت اھا ھوندي ھئي جو ڪيبورڊ ھلائيندڙ انگريزيءَ جو ھڪ لفظ لکندو ھئو تہ ڪيبورڊ جي مٿين پٽيءَ ۾ ٻيا اڳڪٿيا لفظ پاڻمرادو اچي ويندا ھئا. مثال جيڪڏھن ڪيبورڊ ۾ انگريزي لفظ ”ھائُو“ يعني ”ايڇ او ڊبليو“ ٽائيپ ڪري، جيئن ئي وِٿي ڏني ويندي ھُئِي تہ مٿين پٽيءَ تي اھڙا ٽي ٻول پاڻمرادو اچڻ شروع ٿي ويندا ھئا، جيڪي اِن ”ھائُو“ کان پوءِ گهڻو ڪري انگريزي ٻوليءَ ۾ استعمال ٿيندا آھن جھڙوڪ: ”آر“ ٻيو ”ٽُو“ ۽ ٽيون ”مينِي“. ساڳيءَ ئي ريت وري ان ڪيبورڊ ۾ انگريزي ٻوليءَ جو بھترين ”ھِجي تپاسڻو“ (اسپيل چيڪر) پڻ اڳواٽ رکيل ھئو جو ٽائيپ ڪندڙ جيڪڏھن ڪنھن لفظ جي ھِجي (اسپيل) غلط ٽائيپ ڪندو ھئو تہ اھو ڪيبورڊ کيس درست ھِجي ٻڌائيندو ھو.

ھي اُھي ئي ڏينھن ھئا جڏھن اسان سنڌي ٻولي اختياريءَ ۾ ٽن- ٽن مھينن جي ڪانٽريڪٽ تي ڪم ڪنداھئاسين ۽ ڪم اھو ئي ھوندو ھو تہ سنڌي ٻوليءَ کي جديد ٽيڪنالاجيءَ جي مختلف سرشتن ۾ ڪيئن آڻي سگهجي ٿو. ان ئي سلسلي ۾ اسان ان جڳ مشھور جادوئي ڪيبورڊ ٺاھڻ واري اداري سان لھ وچڙ ڪري، کين سندن اڳڪٿ سرشتي ۾ سنڌي ٻولي آڻڻ لاءِ پنھنجون خدمتون آڇي ڇڏيون. ڪجهہ ئي مھينن ۾ ان اداري پنھنجي رضا ڏيکاري، جنھن کانپوءِ اسان سنڌي ٻوليءَ جي لکت جو تاڃي پيٽو، ٻٽن ٻولن جي ڊگهي قطار، گهڻي کان گهڻا استعمال ٿيندڙ لفظ ڪٺو ڪري سنڌي ٻوليءَ جو ھڪ ننڍڙو لفظي ڀنڊار/ڪارپس ٺاھي کين موڪليو ويو، جيڪو ڪافي تجربن بعد آخرڪار ان جادوئي ڪيبورڊ ”سُويفٽ ڪِي“ ۾ سنڌي ٻوليءَ کي داخل ڪرڻ ۾ اھم سنگ ميل ثابت ٿيو. ان ڪارپس ۾ جيڪو سنڌي مواد اسان سھيڙيو ھئوسين ان جي ترتيب ڪجهہ ھن طرح ھئي:

  1. لاڪنائن (اعرابن) سميت سنڌي الفابيٽ
  2. سنڌي ٻولي اختياريءَ پاران شايع ڪيل اٺ لغتون
  3. لياڻ آڏواڻيءَ جو ترتيب ڏنل شاه جو رسالو (اعرابن ۽ بغير اعرابن سان جدا جدا ڪري)
  4. سنڌي چوڻيون، پھاڪا جيڪي ڦلواڙي ڪتاب مان مليا.
  5. سنڌي ٻوليءَ جو ڪارپس (هڪ لک پنج هزار لفظن تي مشتمل، جنھن ۾ مشھور شخصيتن جا نالا ۽ ذاتيون پڻ موجود ھيون.)
  6. سنڌي مشھور شخصيتن جا ھڪ ھزار کان مٿي نالا
  7. سنڌي ٻٽن لفظن جو ذخيرو
سنڌي ورڊنيٽ منصوبو ـ فائل تصوير

سنڌي ٻوليءَ جي ھن ڪارپس کي اھڙي نموني سان جوڙي ان بين الاقوامي اداري ڏانھن موڪليو ويو ھو جو جڏھن سنڌي ٻولي ان جادوئي ڪيبورڊ ۾ اچي وئي تڏھن ان جي مکيہ مينيجر جولين بالِيءَ پنھنجي اي ميل ۾ ٻڌايو تہ سنڌي ٻوليءَ جي بيھڪ دنيا جي ٻين وڏين ٻولين جي ڀيٽ ۾ ڪنھن بہ ريت ڪا ھيڻي نہ آھي.

ھُن صاحب وڌيڪ اڳڀرو ٿي دنيا تي راڄ ڪندڙ مصنوعي ذھانت جي ايندڙ سرشتن ۾ داخل ٿيڻ لاءِ صلاح ڏني تہ جيترو بہ جلد ممڪن ٿي سگهي، سنڌي ٻوليءَ جي ”ورڊنيٽ“ سرشتي تي ڪم ڪريو، جيڪو سنڌي ٻوليءَ جي آئيندي کي مڪمل طور محفوظ ڪري ڇڏيندو.

ساڳئي ئي سلسلي جي ھڪ ڪڙيءَ آڌار، ”الخوارزمي انسٽيٽيوٽ آف ڪمپيوٽر سائنس، يونيورسٽي آف انجنيئرنگ اينڊ ٽيڪنالاجي لاھور اندر قائم اداري ”سينٽر آف لئنگئيج انجنيئرنگ“ پاران 2017 ۾ پاڪستاني ٻولين جي ڊجيٽل دنيا ۾ موجودگيءَ تي ھڪ اھم ڪانفرنس ٿي ھئي، جنھن ۾ ان اداري جي سربراھ ڊاڪٽر سرمد حسين سان ھڪ علمي ويھڪ ڪري اهو محسوس ڪيو ويو تہ سنڌي ٻوليءَ جي آئيندي ۽ ان کي مصنوعي ذھانت جي پروگرامن ۾ پنھنجي قد، بت ۽ پوري سگهہ سان داخل ڪرڻ لاءِ تمام ڳوڙهي حڪمت عملي ڪرڻي پوندي جنھن ۾ وڏي لاڳت ۽ بي لوڀ ساٿين جي ضرورت آھي جيڪي نہ صرف سنڌي ٻوليءَ جي نزاڪت جا واقف ھجن پر ٿورو گهڻو ڪمپيوٽنگ جي باري ۾ بہ ڄاڻ رکندڙ ھجن. ھتي اھا بہ ڳالهہ ضروري آھي تہ اسان جي يونيورسٽين مان سنڌي ڪمپيوٽنگ يا ٻوليءَ جي انجڻڪاريءَ تي ڪا به اهڙي جامع رٿا نہ ملي، جيڪا عام لوڪ تائين پھچي ڪو لاڀ ڏئي سگهي ھجي. ھيڪڙ ٻيڪڙ ڪو پروجيڪٽ شروع بہ ٿيو ته اھو پراڻي مدي خارج پروگرام تي ٿيو، جيڪو ان وقت 18-2017جي جديد گهرجن آڌار تي پورو نه پئي لٿو. ڏئي وٺي سنڌي ٻولي اختياريءَ کان سواءِ سنڌ سلامت فورم پاران ڪجهه پروجيڪٽ متعارف ڪرايا ھئا پر اھي به ٻوليءَ جي انجڻڪاريءَ کان وڌيڪ سنڌي مواد کي آن لائين دستيابيءَ تي ٻڌل ھئا. سنڌي ٻولي اختياريءَ پاران اسان نہ صرف سويفٽ ڪيبورڊ ۾ سنڌي آڻڻ لاءِ ٽيڪنيڪل مواد جي سھيڙ ۽ ان جي پروگرامنگ ڪري رھيا ھئاسين پر اٽي ۾ لوڻ برابر سيڙپ تي سنڌي ٻوليءَ ۾ پھريون ڀيرو سنڌي اکر شناس جنھن کي ”آپٽيڪل ڪريڪٽر رڪگنائيزر“ (او سِي آر) پڻ عام لوڪ جي استعمال ڪرڻ لاءِ آن لائين ڪرڻ ۾ مصروف ھئاسين جو مائڪروسوفٽ ۽ سنڌي ڪمپيوٽنگ جي بانيڪار عبدالماجد ڀرڳڙي صاحب پاران سنڌي ٻوليءَ جي پوري ڪارپس جي گُهر ٿي. جنھن تي ٽن سالن کان پوءِ اسان ڪم ڪرڻ شروع ڪيو. دير سان ڪم ڪرڻ جو سبب سنڌ حڪومت جي ثقافت ۽ سياحت کاتي پاران نئين اداري ”عبدالماجد ڀرڳڙي انسٽيٽيوٽ آف لئنگئيج انجنيئرنگ“ جو قيام ۽ دفتري مامرا وچ ۾ اچي ويا ھئا، ٻيو سبب تہ سنڌي ڪارپس تي سنجيدہ ۽ ثابت قدم ڪارڪنن جي کوٽ پڻ ھئي. اھو ڪارپس جيڪو اڳتي ھلي ”سنڌي ورڊنيٽ“ جو ٻج ثابت پئي ٿيو، تنھن جي سھيڙ 2021 کان باقاعدہ نموني سان شروع ٿي.

ھاڻي سڀ کان پھريون تہ ھي سنڌي ٻولياتي ڳنڍڻي وارو سرشتو ”سنڌي ورڊنيٽ“ جيڪو انگريزي ٻوليءَ جي ٻن لفظن ”ورڊ“ معنا لفظ ۽ ”نيٽ“ جيڪو نيٽورڪ لفظ جو اڌ کنيل لفظ آھي ان کي سمجهڻ گهرجي تہ ھي سرشتو ڇا آھي ۽ ان جي ٺھڻ سان سنڌي ٻوليءَ جي جديد گهرجن آڌار ڪھڙا فائدا ٿي سگهندا؟ انگريزي ورڊنيٽ جو ھڪ ماڊل

(شڪل: انگريزي ورڊنيٽ جو ھڪ ماڊل)

سو اچو تہ ھن انتھائي تڪنيڪي ۽ ڳوڙهي سرشتي ۽ ان جي طريقيڪار کي سمجهون تہ آخر ڊيٽا سان ڳُتيل ھن سرشتي جنھن کي ٺيٺ سنڌيءَ ۾ ”سنڌي ٻوليءَ جي ڪمپيوٽيشنل ترقيءَ لاءِ سنڌي ٻولياتي ڳنڍڻو يعني (سنڌي ورڊنيٽ) جو نالو ئي ڏِجي ٿو، سو ان جي ڪيتري اهميت ۽ ڪھڙي ضرورت آھي؟ انهن سوالن جي جوابن لاءِ اسان مرحليوار بحث ڪنداسين:

سنڌي ورڊ نيٽ جُڙڻ ڇو ضروري آهي:

سنڌي ورڊنيٽ سرشتي کي ٺاھڻ، دنيا جي ٻين ٻولين جيان رڳو اھم ئي نہ پر تمام گهڻو ضروري انڪري آھي جو سنڌي ٻوليءَ ۾ ڪي خاصيتون اھڙيون آھن جيڪي ھتي ايشيائي ٻولين ۾ ورلي ملن پيون. جھڙوڪ سنڌي ٻوليءَ جا سڀ آواز متحرڪ ٿيندا آھن. ھر لفظ جو آخري آواز متحرڪ ڪري ان ٻول جو نہ صرف انگ ٻڌايو ويندو آھي پر ان جي جنس پڻ پڌري ٿيندي آھي...

مستقبل جي رٿابندي:

سنڌي ورڊنيٽ کي وسيع ڪرڻ: سنڌي ورڊنيٽ کي وڌيڪ جامع ۽ تفصيل سان وسعت ڏيڻ، نون لفظن ۽ معنائن جي اضافي سان گڏوگڏ مختلف موضوعاتي شعبن جي لغات کي شامل ڪرڻ.

سنڌي ورڊنيٽ سرشتي کي ٺاھڻ، دنيا جي ٻين ٻولين جيان رڳو اھم ئي نہ پر تمام گهڻو ضروري انڪري به آھي جو سنڌي ٻوليءَ ۾ ڪي خاصيتون اھڙيون آھن جيڪي ھتي ايشيائي ٻولين ۾ ورلي ملن پيون...