एएमयू के छात्र ने किया शोध, आवाज को समझने में कंफ्यूज नहीं होगा गूगल

गूगल पर स्पीकर से किसी शब्द को सर्च करना हो या वाट्सएप पर बोलकर कुछ लिखना, अक्सर शोर-शराबे में यह संभव नहीं हो पाता है। वह सही शब्द को सर्च नहीं कर पाता, मगर अब ऐसा नहीं होगा। अलीगढ़ मुस्लिम विश्वविद्यालय के शोध छात्र ने ऐसा सॉफ्टवेयर तैयार किया है, जिसके जरिये गूगल पर किसी भी शब्द को बोलकर भी शोर शराबे में सर्च किया जा सकेगा। छात्र का शोधपत्र इंटरनेशनल जर्नल ऑफ स्पीच टेक्नोलॉजी व अर्काइव ऑफ अर्कास्टिक्स में प्रकाशित हो चुका है ।

विपरीत परिस्थिति में पहचानेगा व्यक्ति का आवाज
होलीगेट (मथुरा) निवासी यशवर्धन वाष्र्णेय ने एएमयू के इलेक्ट्रॉनिक इंजीनियङ्क्षरग डिपार्टमेंट से ‘सिग्नल चैनल मिक्स स्पीच रिकॉगनाइजेशनÓ में पीएचडी की है। उन्होंने उस सॉफ्टवेयर पर काम किया है, जो विपरीत परिस्थिति में भी व्यक्ति की आवाज को पहचान ले।

चार साल बाद मिली कामयाबी
यशवर्धन के अनुसार अभी तक ऐसा नहीं था। गूगल के स्पीकर पर अगर दो व्यक्ति एक साथ बोल दें तो सही शब्द सर्च नहीं होता था। चार साल पहले उन्होंने ऐसे सॉफ्टवेयर पर काम शुरू किया, जो शोर-शराबे में भी टारगेट स्पीच को पहचान ले।

ये तकनीक बनाई
यशवर्धन ने बताया कि उन्होंने नॉन निगेटिव मैट्रिक्स फैक्टराइजेशन (एनएफएफ) सॉफ्टवेयर तैयार किया है, जो किसी भी स्पीच सिग्नल को टाइम फ्रीक्वेंसी कंपोनेंट में बदलकर आधार वेक्टर को अलग कर लेता है। एक से अधिक बोलने वाले लोगों की आवाज के सिग्नल को अलग कर सर्च कर सकता है। छात्र का दावा है कि कई घुली हुई आवाजों को भी मशीन इस सॉफ्टवेयर से अलग कर सर्च कर सकती है।

बैठक की रिकार्डिंग करने में होगी आसानी
कई बैठकों में हर वक्ता के विचार महत्वपूर्ण होते हैं। कुछ का रिकार्ड रखना भी जरूरी होता है। इस तकनीक से बैठक में होने वाली हर वक्ता की बात को लिखित रूप में रिकॉर्ड किया जा सकेगा। छात्र का दावा है कि माइक्रोफोन के जरिए ही एक साथ बोल रहे सभी व्यक्तियों की बात अलग-अलग करके पहचानी जा सकती है।

चैटिंग करने का अनुभव आसान होगा
इस तकनीक के आने से आवाज को पहचान कर टाइप करने वाले सॉफ्टवेयर की क्षमता बढ़ेगी। यूजर्स का भीड़ वाले इलाके में बिना मोबाइल में टाइप किए चैटिंग करने का अनुभव आसान होगा। यह शोध उन्होंने प्रो. जिया अहमद अब्बासी व प्रो. एमआर आबिदी की देखरेख में पूरा किया है।

शोध को कराया जाएगा पेटेंट
इलेक्ट्रॉनिक्स इंजीनियङ्क्षरग विभाग के प्रो. जिया अहमद अब्बासी का कहना है कि यह सॉफ्टवेयर आवाजों को अलग-अलग पहचान लेता है। गूगल के स्पीकर किसी शब्द को सर्च करने में अतिरिक्त शोर बाधा डालता है। अब ऐसा नहीं हो सकेगा। शोध को पेटेंट भी कराया जाएगा।

September 24, 2018, 11:38 AM