स्वायत्त वाहनों को उनके सामने आने वाली वस्तुओं की त्वरित और सटीक पहचान करने में सक्षम होना चाहिए, जैसे कि कोनों के आसपास खड़े डिलीवरी ट्रक या चौराहों पर आने वाले साइकिल चालक। इसे प्राप्त करने के लिए, स्वायत्त कारें उच्च-रिज़ॉल्यूशन दृश्य छवियों में प्रत्येक पिक्सेल को वर्गीकृत करने के लिए एक शक्तिशाली कंप्यूटर विज़न मॉडल का उपयोग कर सकती हैं, यह सुनिश्चित करते हुए कि वे उन वस्तुओं को नज़रअंदाज़ न करें जो कम-गुणवत्ता वाली छवियों में अस्पष्ट हो सकती हैं। हालाँकि, यह कार्य, जिसे सिमेंटिक सेगमेंटेशन के रूप में जाना जाता है, अत्यधिक जटिल है, जिसके लिए व्यापक गणना की आवश्यकता होती है, विशेष रूप से उच्च-रिज़ॉल्यूशन छवियों के साथ।

अंतर्राष्ट्रीय मीडिया रिपोर्टों के अनुसार, मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (एमआईटी), एमआईटी-आईबीएम वॉटसन एआई लैब और अन्य संस्थानों के शोधकर्ताओं ने एक अधिक कुशल कंप्यूटर विज़न मॉडल विकसित करने के लिए सहयोग किया है, जो उपरोक्त कार्य की कम्प्यूटेशनल जटिलता को काफी कम करता है। यह मॉडल ऑन-बोर्ड वाहन कंप्यूटर जैसे सीमित हार्डवेयर संसाधनों वाले उपकरणों पर वास्तविक समय, सटीक अर्थ विभाजन कर सकता है, जिससे स्वायत्त कारों को तत्काल निर्णय लेने में सक्षम बनाया जा सकता है।
वर्तमान अत्याधुनिक सिमेंटिक सेगमेंटेशन मॉडल किसी छवि में पिक्सेल की प्रत्येक जोड़ी के बीच की बातचीत को सीधे सीख सकते हैं, जिसका अर्थ है कि छवि रिज़ॉल्यूशन बढ़ने पर उनकी गणना चतुर्भुज रूप से बढ़ती है। हालांकि ऐसे मॉडल बहुत सटीक होते हैं, लेकिन सेंसर या स्मार्टफोन जैसे किनारे वाले उपकरणों पर वास्तविक समय में उच्च-रिज़ॉल्यूशन छवियों को संभालने के लिए उनकी प्रसंस्करण गति बहुत धीमी होती है।

एमआईटी के शोधकर्ताओं ने सिमेंटिक सेगमेंटेशन मॉडल के लिए एक नया घटक डिजाइन किया है, जो अपनी तरह के सबसे उन्नत मॉडल के बराबर क्षमताओं का दावा करता है, लेकिन केवल रैखिक कम्प्यूटेशनल जटिलता को प्राप्त करता है और कुशल हार्डवेयर संचालन की सुविधा प्रदान करता है।
शोधकर्ताओं के काम का परिणाम उच्च-रिज़ॉल्यूशन कंप्यूटर विज़न के लिए मॉडलों की एक नवीन श्रृंखला है। मोबाइल उपकरणों पर तैनात किए जाने पर, ये मॉडल अपने पूर्ववर्तियों की तुलना में 9 गुना तेजी से काम करते हैं। महत्वपूर्ण बात यह है कि वैकल्पिक समाधानों की तुलना में, यह नया मॉडल समान, यदि बेहतर नहीं तो, सटीकता प्राप्त करता है।
यह तकनीक न केवल वास्तविक समय में निर्णय लेने में स्वायत्त कारों की सहायता कर सकती है, बल्कि यह चिकित्सा छवि विभाजन जैसे अन्य उच्च-रिज़ॉल्यूशन कंप्यूटर विज़न कार्यों की दक्षता को भी बढ़ा सकती है।





