নির্ভুল তথ্যের ‘সিধুজ্যাঠা’ এনসাইক্লোপিডিয়া এবার চ্যাটবটে, কেন গুগলের চেয়েও বেশি ভরসাযোগ্য এটি?
Encyclopedia Britannica Chatbot: এনসাইক্লোপেডিয়া ব্রিটানিকায় এ যাবৎ যত তথ্য জমা করা হয়েছে, সেই সমস্ত তথ্য শেখানো হয়েছে এই চ্যাটবটটিকে। যাকে প্রযুক্তির ভাষায় বলে ‘মেশিন লার্নিং’।
সত্যি বলতে আপামর জ্ঞানসন্ধিৎসু মানুষের কাছে এনসাইক্লোপিডিয়া ব্রিটানিকা হল সিধুজ্যাঠা। গুগল কিংবা উইকিপিডিয়া যখন আম জনতার হাতে এসে পৌঁছয়নি, প্রতিটা বাড়িতে না হলেও কাছাকাছি একটু ভালো মানের লাইব্রেরিতে এনসাইক্লোপিডিয়া ব্রিটানিকার দেখা মিলত। এখন যেমন হাতে ইন্টারনেট আর স্মার্ট ফোন পেয়ে কথায় কথায় মানুষ প্রয়োজনীয়-অপ্রয়োজনীয় তথ্য জানতে কোনো সার্চ ইঞ্জিনের আশ্রয় নেয়, আজ থেকে এই পনেরো বছর আগে পিছিয়ে গেলেও ভরসাযোগ্য তথ্যের জন্যে এনসাইক্লোপেডিয়া ব্রিটানিকার উপর নির্ভর করত মানুষ ।
তবে যে কোনো এনসাইক্লোপেডিয়া নিয়ে একটা সমস্যা অনেকদিন ধরেই ছিল। তা হল পাতার পর পাতা উল্টে কোনও জরুরি তথ্য খুঁজে পেতে হিমশিম খেতে হত। যা বেশ সময়সাপেক্ষও বটে। কিন্তু যদি এমন হত, এনসাক্লোপিডিয়া ব্রিটানিকার একটা চ্যাটবটই আপনার প্রয়োজনীয় প্রশ্নের উত্তর আপনাকে দিয়ে দিত? তা-ও আবার বেশ জটিল কিংবা ঘুরিয়ে করা প্রশ্নের? খুব সম্প্রতি মেশিন লার্নিং আর আর্টিফিশিয়াল ইন্টেলিজেন্সের সাহায্যে এনসাইক্লোপেডিয়া ব্রিটানিকার আন্তজার্তিক মুখ্য তথ্য আধিকারিক ড. কুনাল সেন ও তাঁর সঙ্গীরা বানিয়েছেন এই চ্যাটবট। কোনও প্রয়োজনীয় তথ্য জানতে চাইলেই নিমেষে তার উত্তর দিয়ে দিচ্ছে এই চ্যাটবট। চ্যাটবট এমন একটি ‘টুল’, যেখানে আপনার অপর প্রান্তে মানুষের বদলে ‘ভার্চুয়ালি’ থাকা একটি রোবটের মতো প্রযুক্তি আপনাকে প্রশ্নের উত্তরের কাছে নিয়ে যাবে।
ড. সেন ফেসবুকে সাম্প্রতিক একটি পোস্টে লিখেছেন, “এই চ্যাটবট আমাদের সেই কাকা বা জ্যাঠা, যে পুরো এনসাইক্লোপেডিয়া ব্রিটানিকা পড়ে ফেলেছে। যখনই জরুরি কিছু তোমার জানার দরকার, তখনই তুমি সেই কাকা বা জ্যাঠার কাছে ছুটে যাও নিজের প্রশ্নের উত্তর পেতে।” তবে ব্রিটানিকা চ্যাটবট অবশ্যই কেবল সেই প্রশ্নের উত্তরই দিতে পারবে, যেগুলো ইতিমধ্যেই এনসাইক্লোপেডিয়া ব্রিটানিকাতে সংগ্রহ করা রয়েছে। জ্ঞান বিস্তৃত। মানুষের জ্ঞানের সমস্ত পরিসরকে ব্রিটানিকা এখনও আয়ত্তে আনেনি। ড. সেন বিষয়টি আরও ভালো করে বুঝিয়ে বলেছেন— “ধরুন, এই মুহুর্তে আপনার শহরে তাপমাত্রা কত কিংবা আপনি আপনার হন্ডা ইঞ্জিনে কীভাবে তেল ভরবেন, সেই উত্তর কিন্তু এনসাইক্লোপেডিয়া ব্রিটানিকা চ্যাটবট দেবে না।”
আরও পড়ুন: চ্যাটজিপিটির পর ক্যাওয়াসজিপিটি! মানুষকে ধ্বংস করতে এসে গিয়েছে ‘রাক্ষুসে’ চ্যাটবট
এখন সাধারণ মানুষের এই প্রশ্ন থাকতেই পারে যে গুগুল বা অন্যান্য সার্চ ইঞ্জিন থাকতে থাকতে আমরা কেন এনসাইক্লোপেডিয়া ব্রিটানিকা এবং এর চ্যাটবটের সাহায্য নেব? তাছাড়া চ্যাটজিপিটিই তো আছে! বিষয়টা হল, এত তথ্যের মহাসমুদ্রে বা বলা ভালো ‘ইনফোডেমিকের’ মাঝে, গুগল বা যে কোনো সার্চ ইঞ্জিনের সাহায্যে খুঁজে পাওয়া তথ্য সত্যি না মিথ্যে, ভুল না ঠিক, সেই নিয়ে প্রশ্ন থেকেই যায়। কারণ গুগলে সুবিধা কিংবা অসুবিধা যাই বলুন না কেন, এখানে যে কেউ যা কিছু লিখে বৈদ্যুতিন মাধ্যমে প্রকাশ করতে পারে।
এনসাইক্লোপেডিয়া ব্রিটানিকায় কিন্তু সেরকমটা হয় না। এখানে সত্যতা যাচাই করে তবেই তা বই হিসেবে প্রকাশ করা হয়েছে। পরবর্তীতে যা বইয়ের পাশাপাশি ধীরে ধীরে বৈদ্যুতিন মাধ্যমেও উত্তীর্ণ হয়েছে। সময়ের সঙ্গে পাল্লা দিয়ে সেই তথ্যেরও ‘আপগ্রেডেশন’ হয় এনসাইক্লোপেডিয়া ব্রিটানিকাতে। ইন্টারনেটের বিস্তীর্ণ জমির মতো অপ্রয়োজনীয় তথ্য দিয়ে অযথা এনসাইক্লোপেডিয়া ব্রিটানিকাকে ভরিয়ে তোলার কোনও প্রচেষ্টা এখানে নেই। যদিও ব্রিটানিকা বৈদ্যুতিন প্ল্যাটফর্মে পাওয়া যাওয়ার পর ‘সার্চ অপশন’ দিয়ে জরুরি তথ্য খোঁজাই যেত। কিন্তু সেই উপায়ে একটু জটিল বা ঘুরিয়ে করা প্রশ্নের উত্তর মিলতো না। সে সব ভেবেই তৈরি এই চ্যাটবট।
ড. সেন ইনস্ক্রিপ্টকে ইমেইল মারফৎ জানিয়েছেন, তিনি ও তাঁর সঙ্গীরা অনেকদিন ধরেই একটি প্রশ্ন-উত্তরের ‘টুল’ বানানোর চেষ্টা করছিলেন। এমনকি সেটা পাঁচ বছরেরও বেশি আগে সাধারণ মানুষের ব্যবহারের জন্যে প্রকাশিত করেছিলেন তাঁরা। “তবে সেই প্রযুক্তি তখন ঠিক মতো ব্যবহারের উপযুক্ত হয়ে ওঠেনি”, বলছেন ড. সেন। “কিন্তু যখনই বাজারে চ্যাটজিপিটির মতো অসাধারণ একটা অস্ত্র সাধারণ মানুষের হাতে এলো, আমরা বুঝে গেছিলাম আমাদের আরও অনেক চেষ্টা করতে হবে এরকম একটা চ্যাটবট বানানোর জন্যে।”
এনসাইক্লোপেডিয়া ব্রিটানিকায় এ যাবৎ যত তথ্য জমা করা হয়েছে, সেই সমস্ত তথ্য শেখানো হয়েছে এই চ্যাটবটটিকে। যাকে প্রযুক্তির ভাষায় বলে ‘মেশিন লার্নিং’। খুব সরল ভাবে যদি বোঝানো হয়, তাহলে একটি শিশুকে যে ভাবে অ-আ-ক-খ শেখানো হয়, নতুন জ্ঞান তার মনে গেঁথে দেওয়া হয়, একদম সে ভাবেই এই চ্যাটবটকে শিখিয়ে-পড়িয়ে তৈরি করেছেন ড. সেন ও তাঁর সহকর্মীরা।
ড. সেন ইনস্ক্রিপ্টকে জানিয়েছেন, এই চ্যাটবট তৈরি করতে ‘রিট্রিভাল অগমেন্টেড জেনারেশন’ পদ্ধতিকে কাজে লাগানো হয়েছে। যখনই কোনও প্রশ্ন করা হবে, এই সিস্টেমটি প্রথমেই বোঝার চেষ্টা করবে সেই প্রশ্নের উদ্দেশ্য কী। ধরুন আপনি জিজ্ঞাসা করলেন, আপেল কেন গাছ থেকে নীচে পড়ে, সে ক্ষেত্রে সেই প্রশ্নের আসল উদ্দেশ্যই হল মাধ্যাকর্ষণ শক্তি সম্পর্কে জানা।
প্রশ্ন করার ঠিক পরের ধাপে, সিস্টেমটি বোঝার চেষ্টা করে এই প্রশ্নের উত্তর এনসাইক্লোপেডিয়া ব্রিটানিকায় নথিভুক্ত করা রয়েছে কিনা। এরপর সিস্টেমটি দেখে, এই প্রশ্নগুলির উত্তর দেওয়া নিরাপদ কিনা। “আমরা কাউকে ডাক্তারি উপদেশও দিতে চাই না কিংবা কীভাবে বোমা বানাতে হয়, এই চ্যাটবটের সাহায্যে সেই তথ্যও দিতে চাই না! তাই একবার সিস্টেমটি যদি বুঝে যায় প্রশ্নের উত্তর দেওয়া নিরাপদ, তখনই খুব সূক্ষ ও সুচারু ভাবে সে এনসাইক্লোপেডিয়া ব্রিটানিকার তথ্যের সমুদ্রে আপনার প্রশ্নের উত্তরটি খুঁজতে রীতিমত চিরুনি তল্লাশি করবে। একদম সব শেষে আমরা সবথেকে গুরুত্বপূর্ণ উত্তরগুলিকে ‘লার্জ ল্যাঙ্গুয়েজ মডেল’-এর কাছে পাঠাই, যাতে আপনি আপনার করা প্রশ্নের উত্তর পেতে পারেন”, জানাচ্ছেন তিনি।
কিন্তু এত বড় একটা তথ্যের সমুদ্র থেকে খুঁজে আমাদের জিজ্ঞাস্য নির্দিষ্ট প্রশ্নের উত্তর দেবে, এমন একটা চ্যাটবট বানাতে সমস্যা হয়নি? “বরং উল্টোটা!”, জানাচ্ছেন ড. সেন। ‘লার্জ ল্যাঙ্গুয়েজ মডেল’ যেহেতু ইন্টারনেটের বিভিন্ন অংশ থেকে তথ্য জোগাড় করে, তাই সে বাস্তবিক অর্থেই প্রায় সমস্ত প্রশ্নের উত্তর দিতে পারে। স্বাভাবিক ভাবেই সেই প্রশ্নের উত্তর ঠিক নাকি ভুল তার কোনও ঠিক-ঠিকানা নেই। তাই সে ভুল করে এনসাইক্লোপেডিয়া ব্রিটানিকার তথ্যভান্ডারের বাইরের তথ্যও ভুল করে দিয়ে ফেলে। কিন্তু ব্রিটানিকা চ্যাটবট নির্মাতাদের উদ্দেশ্য তা নয়। তাঁরা চান, এই চ্যাটবট কেবল ব্রিটানিকার অন্তর্ভুক্ত তথ্যের জোগান দিক এবং নির্ভুল উত্তর দিক। তাই প্রযুক্তিবিদদের কাছে একটা বড় চ্যালেঞ্জ ছিল ‘লার্জ ল্যাঙ্গুয়েজ মডেল’-এর তথ্য খোঁজার কাজ কেবল ব্রিটানিকার মধ্যেই সীমিত রাখা। “এখন অবস্থা আগের থেকে অনেকটা ভালো হলেও, কখনও-সখনও ব্রিটানিকার বাইরেথেকে তথ্য ঢুকে পড়ে।”
আরও পড়ুন: ভয়াবহ! সারা দিন-রাত দীর্ঘ কথাবার্তা, ব্যক্তিকে যেভাবে আত্মহত্যায় বাধ্য করল AI চ্যাটবট!
মানুষ পাতার পর পাতা উলটে বই পড়বে, সেই দিন গেছে। মানুষের পড়ার ধরণও বদলেছে। তাই ইনস্ক্রিপ্ট জিজ্ঞাসা করেছিল, এই ধরণের চ্যাটবটের উপর বেশি নির্ভরশীল হতে হতে কি মানুষের বই পড়ার অভ্যেস নষ্ট হয়ে যাবে কিনা? ড. সেনের মতে, “এখন যখন যা জানার দরকার তা আমরা সরাসরি খুঁজে নিই ইন্টারনেট থেকে। পাতার পর পাতা উল্টে খুঁজে বের করি না। আমাদের ধৈর্য্য কমেছে। একাধিক কিংবা বড় প্রতিবেদন পড়ার সদিচ্ছা এখন আর আমাদের নেই। চ্যাটবটও তেমন নানান প্রতিবেদনকে সংক্ষিপ্ত করে পাঠকের সামনে হাজির করে। তবে এ কথা সত্যি, কারওর যদি একটা বিশেষ তারিখ বা মানুষের নাম জানার থাকে, সে চ্যাটবটের কাছে জেনে সেটুকুই মনে রাখবে। এটুকুর বেশি আর কিছু পড়বে না হয়তো।” — জানালেন ড. সেন।
ফলে যে সিধুজ্যাঠার খোঁজ আমরা অহরহ করে বেড়াই ইন্টারনেট জুড়ে, জেনে নিতে চাই আসল-সঠিক তথ্য, তেমন বাছাই কিছু প্রশ্নের নির্ভুল উত্তর পাওয়ার ক্ষেত্রে আমাদের আস্থাভাজন বন্ধু কিন্তু হয়ে উঠতেই পারে এই এনসাইক্লোপিডিয়া ব্রিটানিকার চ্যাটবটটি।