মেশিন লার্নিংয়ের বাঁক বদল! গণিতে নয়, পদার্থবিদ্যায় কেন নোবেল পেলেন হিন্টন?

Nobel Prize in Physics 2024: পদার্থবিদ্যায় কেন নোবেল পেলেন হিন্টন? গণিতে কেন নয়? কম্পিউটার বিজ্ঞানের জয়রথকে ভৌতবিজ্ঞান কীভাবে ধারণ করতে পারে?

নোবেল কমিটি ফোন করেছে জফরি হিন্টনকে। ফোনেই নোবেল প্রাপ্তির সুখবরটি জানাবে কমিটি। হিন্টন তখন ক্যালিফোর্নিয়ার এক ‘সস্তা’ হোটেলে (তাঁর কথাতেই) উঠেছেন। এমআরআই করানোর কথা। এ কথা শুনে নোবেল কমিটির পক্ষ থেকে যে ভদ্রলোক ফোন করেছিলেন তিনি খানিক অপ্রস্তুত হলেও, হিন্টন একদম স্বাভাবিক! কথা শুনে মনে হয়েছিল, এমনতা যে ঘটবে তা জানাই ছিল তাঁর। কোনও না কোনওদিন এই ফোন তিনি পাবেনই, বিশ্বাস ছিল। কিন্তু ফোনটি তিনি পেলেন পদার্থবিদ্যায় নোবেল পুরস্কার পেয়ে। এই নিয়ে বেশ চর্চা চলছে অনলাইন-অফলাইন সব মাধ্যমেই। যে প্রশ্নটি চারদিকে ঘুরপাক খাচ্ছে তা হলো, পদার্থবিদ্যায় কেন নোবেল পেলেন হিন্টন? গণিতে কেন নয়? কম্পিউটার বিজ্ঞানের জয়রথকে ভৌতবিজ্ঞান কীভাবে ধারণ করতে পারে? এই বিতর্ক ঘনীভূত হওয়ার আগেই দেখা গেল, নোবেল কমিটি রসায়নবিদ্যাতেও দু'জন প্রথিতযশা কম্পিউটার প্রকৌশলীকে (হ্যাসাবিস ও জাম্পার) পুরস্কৃত করেছে। এই দু'জনই আর্টিফিশিয়াল ইন্টেলিজেন্সের উপরেই কাজ করেছেন। এটুকু অন্তত স্পষ্ট যে, আর্টিফিশিয়াল ইন্টেলিজেন্স বিষয়ে জনমানসে প্রচণ্ড এক আগ্রহ লক্ষ্য করা যাচ্ছে।

আর্টিফিশিয়াল ইন্টেলিজেন্সের এই যুগে হিন্টন হলেন জীবন্ত কিংবদন্তি; অতএব, তাঁকে নিয়ে বা তাঁর কাজ নিয়ে চর্চা হবে এটাই স্বাভাবিক। কিন্তু তাঁর যে কাজের জন্য পুরস্কার দেওয়া হলো তা নিয়ে আমজনতার মধ্যে খানিক সচেতনতার অভাব রয়েছে। যারা দৈনন্দিন আর্টিফিশিয়াল ইন্টেলিজেন্সের গবেষণা করেন তাঁরা ব্যতীত অন্যদের মধ্যে হিন্টন আর হপফিল্ডের কাজটি চট করে বুঝতে না পারা অস্বাভাবিক কিছু নয়। ফলশ্রুতিতে হিন্টনের অন্য কাজগুলোর সঙ্গে এটিকে গুলিয়ে ফেলাও খুবই স্বাভাবিক ব্যাপার।

নোবেল কমিটি হিন্টন-হপফিল্ড যুগলকে পুরস্কার দেওয়ার কারণ হিসেবে লিখেছে যে "সেই সব মৌলিক গবেষণা ও উদ্ভাবন যা আর্টিফিশিয়াল নিউরাল নেটওয়ার্কের মাধ্যমে মেশিন লার্নিংকে সম্ভব করেছে"। এখানে যে 'আর্টিফিশিয়াল নিউরাল নেটওয়ার্কের' কথা বলা হচ্ছে তা এক ধরনের নিউরন দিয়ে তৈরি যার জন্ম, বিচরণ কম্পিউটারের মধ্যেই সীমাবদ্ধ। এই নিউরনগুলো প্রোগ্রামিং করে বানানো হয় এবং নানা ধরনের ডেটা দিয়ে তার প্রশিক্ষণ হয়। যেকোনও সমস্যা সমাধানে এরা অসম্ভব শক্তিশালী। এদের হাত ধরেই বহুল প্রচলিত চ্যাটজিপিটির উদ্ভব হয়েছে।

আরও পড়ুন- মেশিন লার্নিং! কৃত্রিম বুদ্ধিমত্তাকে ধারালো করার যে আবিষ্কারে নোবেল জয় বিজ্ঞানীদের

একটু পিছনের গল্পে যাওয়া যাক। হিন্টন ও সেজনোস্কি ১৯৮৫ সালে বোল্টজম্যান মেশিন নামে এক ধরনের নিউরন প্রস্তাব করেন। বিখ্যাত অস্ট্রিয়ান বিজ্ঞানী লুডভিগ বোল্টজম্যানের নামানুসারে এই মেশিনগুলোকে বোল্টজম্যান মেশিন নাম দেওয়া হয়। লুডভিগ বোল্টজম্যান 'বোল্টজম্যান ডিস্ট্রিবিউশন' তথা গিবস ডিস্ট্রিবিউশন নামে এক ধারণার প্রবক্তা যা ব্যবহার করে তাপগতিবিদ্যার এনট্রপি, তাপমাত্রা এসব মৌলিক বিষয় ব্যাখ্যা করা যায়। বোল্টজম্যান মেশিন তাপগতিবিদ্যা থেকে ধারণা নিয়ে তৈরি হওয়ায় হিন্টন ও সেজনোস্কি একে বোল্টজম্যান মেশিন নাম দেন। তাঁরা তাঁদের মৌলিক গবেষণায় দেখান, একাধিক বোল্টজম্যান মেশিন একসঙ্গে যুক্ত করে এক ধরনের নেটওয়ার্ক তৈরি করা সম্ভব যা ব্যবহার করে মাল্টি-অবজেক্টিভ অপটিমাইজেশন সম্পর্কিত সমস্যাগুলির সমাধান সম্ভব। এক্ষেত্রে অবজেক্টিভগুলো শক্তিশালী কিংবা দুর্বল দু-ধরনেরই হতে পারে। দুর্বল অবজেক্টিভগুলো সন্তুষ্ট করার ক্ষেত্রে কিছুটা নমনীয়তার অনুমতি দেয়।

এই বোল্টজম্যান মেশিনগুলি হপফিল্ড নেটওয়ার্কের ধারণার উপর ভিত্তি করে তৈরি যার প্রস্তাব দিয়েছিলেন জন হপফিল্ড, ১৯৮২ সালে। বোল্টজম্যান মেশিনগুলি কন্ডেন্সড ফিজিক্সের স্পিন-গ্লাস মডেল অনুসরণ করে। হপফিল্ড পদার্থবিদ্যায় তাঁর দক্ষতার দরুন এসবের মেকানিক্স ব্যাখ্যা করেছিলেন। তিনি তাঁর নিউরাল নেটওয়ার্কের সংস্করণও উপস্থাপন করেছিলেন কিন্তু তাঁর নিউরাল নেটওয়ার্কটি একটি একক স্তর নিয়ে গঠিত। এটি কোনও স্ব-সংযুক্ত 'লুপ' ছাড়াই একটি জালের মতো গঠন তৈরি করে। এই নেটওয়ার্কগুলো গঠনের দিক থেকে অনমনীয় ছিললে এগুলো ব্যবহার করে ডেটা থেকে প্যাটার্ন খুঁজে বের করা কঠিন ছিল। অন্যদিকে হিন্টনের সংস্করণটি নেটওয়ার্ক তৈরি করার জন্য অনেক বেশি সহজ পদ্ধতিতে কাজ করছিল, যা ডেটা থেকে আরও ভালোভাবে শিখতে পারে।

হিন্টন-হপফিল্ডের আবিষ্কারে পদার্থবিদ্যার এই সংযোগের কারণেই তাঁদের পদার্থবিদ্যার বিভাগে পুরস্কৃত করা হলো। সুতরাং এক অর্থে, আমরা তাঁদের 'ফলিত পদার্থবিদ' বলতেই পারি। তবে আমার মতে, হিন্টনকে বা আর্টিফিশিয়াল ইন্টেলিজেন্সকে যদি পুরস্কৃত করতেই  হয় তাহলে তা গণিত বিভাগেই করা উচিত এবং তার ভিত্তি হওয়া উচিত ব্যাকপ্রোপাগেশন অ্যালগরিদম। গণিতে কেন? কারণ ডেটা থেকে শেখা বা প্রদত্ত ডেটার প্যাটার্নগুলি বোঝা মূলত একটি গাণিতিক সমস্যা। হিন্টন-হপফিল্ড তাপগতিবিদ্যার কন্ডেন্সড ফিজিক্স ব্যবহার না করলে পদার্থবিদ্যার সঙ্গে এর সম্পর্ক খুঁজে পাওয়া যেত না। পাশাপাশি হিন্টনের আর্টিফিশিয়াল ইন্টেলিজেন্স সম্পর্কিত অন্য গবেষণা থেকে এ কথা প্রমাণিত যে, নিউরাল নেটওয়ার্কের জন্য পদার্থবিদ্যার জ্ঞান আবশ্যক নয়।

ব্যাকপ্রোপাগেশন তাহলে কী? এটি এক ধরনের অ্যালগরিদম যা মেশিন লার্নিংয়ে নবদিগন্তের সূচনা করেছে। এটি অত্যন্ত সফলভাবে মেশিন লার্নিংকে 'ডেমোক্রেটাইজ' করেছে যার প্রমাণ এ বছরের রসায়নের নোবেল পুরস্কার। হ্যাসাবিস ও জাম্পারের আবিষ্কারের মূল চালিকাশক্তি এই ব্যাকপ্রপাগেশন অ্যালগরিদম। একথা বললে অত্যুক্তি হবে না যে, এই অ্যালগরিদমটি আধুনিক এআই বিপ্লবের মূল ভিত্তি তৈরি করে দিয়েছে।

ব্যাকপ্রোপাগেশন কী তা সহজভাবে বলতে গেলে,  মেশিন লার্নিংয়ের বড় বড় মডেলদের প্রশিক্ষণ দেওয়ার সময় এই পদ্ধতিটি ব্যবহার করা হয়। আগেই বলেছি, এই মডেলগুলির জন্য পদার্থবিজ্ঞানের জটিল পটভূমির দরকার নেই। গাণিতিক অপটিমাইজেশন ব্যবহার করে একটি 'লস ফাংশন'-কে ভিত্তি হিসেবে ধরে মডেলদের প্রশিক্ষণ দেওয়া হয়। এই মডেল তথা আর্টিফিশিয়াল নিউরাল নেটওয়ার্কগুলো ফ্রাঙ্ক রোজেনব্ল্যাটের পারসেপ্ট্রন মডেল দ্বারা অনুপ্রাণিত নিউরন থেকে প্রস্তুত করা হয়। এই নিউরনগুলোতে ডেটা ইনপুট ও আউটপুটের ব্যবস্থা থাকেডেটার ওপর ভিত্তি করে কানেকশনের 'ওয়েট' বৃদ্ধির সুযোগও থাকে। আমরা যখন কৃত্রিম নিউরাল নেটওয়ার্ক বলি, তখন মূলত এই নেটওয়ার্কগুলিকে বোঝাই, বোল্টজম্যান মেশিনের নেটওয়ার্ককে নয়।

আরও পড়ুন- AI-ই বিজ্ঞানীদের শেষ ভরসা? কী বলছেন রসায়নে নোবেলজয়ী হ্যাসাবিস?

এভাবে তৈরি আর্টিফিশিয়াল নিউরাল নেটওয়ার্কগুলো বিভিন্ন মাধ্যমে থাকা ডেটা বিশ্লেষণ করতে সক্ষম, যাকে আমরা মাল্টি-মোডাল মডেল বলি। মূলত এই নেটওয়ার্কগুলোর জন্য ডেটা কোন ফরম্যাটে আছে তা কোনও প্রতিবন্ধকতাই সৃষ্টি করে না। ফলে আমাদের মস্তিষ্কের মতো করেই শিখতে পারে এই মডেলগুলো। এই শেখার শিক্ষক হিসেবে ব্যাকপ্রোপাগেশন কাজ করে। উদাহরণস্বরূপ, ২০২৪ সালে রসায়নে নোবেলজয়ী হ্যাসাবিস ও জাম্পারের বলা যেতে পারে। তাঁরা আলফাফোল্ড২ নামের এক সিস্টেমের জন্য এ বছর নোবেল পুরস্কার অর্জন করেছেন। এই আলফাফোল্ড সিস্টেমটি প্রোটিনের গঠন অনুমান করার ক্ষেত্রে অবাক করা সাফল্য দেখিয়েছে। এ সিস্টেমটির মূল কাঠামো ট্রান্সফর্মার নামে এক ধরনের আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক কাঠামো দিয়ে তৈরি যাকে প্রশিক্ষণ দেওয়ার জন্য ব্যাকপ্রোপগেশন ব্যবহার করার প্রয়োজন হয়।

দেখা যাচ্ছে, আধুনিক মেশিন লার্নিং-এর অবিচ্ছেদ্য অংশ হয়ে উঠেছে এই ব্যাকপ্রোপাগেশন অ্যালগরিদম। ফলশ্রুতিতে ব্যাকপ্রোপাগেশনের প্রবক্তা হিন্টন হয়ে উঠেছেন ‘গডফাদার অফ এআই’। ইন্ডাস্ট্রি ও আকাডেমিয়া দুই ক্ষেত্রেই মারাত্মকভাবে সফল হিন্টনের এই 'ম্যাগনাম অপাস'-কে এড়িয়ে গিয়ে তাঁকে নোবেল পুরস্কার দেওয়া আইনস্টাইনকে সাধারণ আপেক্ষিকতার পরিবর্তে ফটোইলেক্ট্রিক এফেক্ট ব্যাখ্যার জন্য নোবেল পুরস্কার দেয়ার শামিল বলেই গণ্য করা যায়। এমনটা করা না হলে এবং গণিতে নোবেলের প্রচলন থাকলে, হিন্টনকে গণিতেই নোবেল দেওয়া সম্ভব হত। তাতে কম্পিউটার বিজ্ঞানকে ফলিত গণিতের একটি শাখা হিসেবেও সুপ্রতিষ্ঠিত করা যেত।

More Articles