लैंग्वेज टेक्नोलॉजी को लेकर एक अच्छी खबर है. टेक्स्ट को यूजर अब अपनी आवाज में ट्रांसलेट कर सकेंगे. टेक्नोलॉजी कंपनी गूगल ने हाल ही में अपने नए लैंग्वेज मॉडल AudioPaLM पर से पर्दा उठा दिया है. गूगल के शोधकर्ताओं की तरफ से डेवलप किया यह प्लेटफॉर्म यूजर्स को एक नई सुविधा उपलब्ध कराएगा. यह लैंग्वेज मॉडल सुनने, बोलने और ट्रांसलेट करने में अच्छा परफॉर्मेंस कर सकता है. techlusive.in की खबर के मुताबिक, AudioPaLM एक मल्टीमॉडल आर्किटेक्चर है जो दो मौजूदा मॉडलों- PaLM-2 और AudioLM के फायदों को जोड़ता है.


कैसे काम करता है यह मॉडल


खबर के मुताबिक, PaLM-2 एक टेक्स्ट-बेस्ड भाषा मॉडल है जो टेक्स्ट आधारित विशेष भाषायी ज्ञान को समझने में कुशल है. AudioLM स्पीकर की पहचान और टोन जैसी जानकारी को बनाए रखने में माहिर है. इन दो मॉडलों को मिलाकर, AudioPaLM PaLM-2 की भाषाई क्षमता और AudioLM की पारिभाषिक सूचना संरक्षण का उपयोग करता है, जिसकी मदद से टेक्स्ट और स्पीच दोनों की ज्यादा गहराई से समझ और निर्माण होता है.


कई भाषाओं में वॉयस ट्रांसफर करने की क्षमता


लैंग्वेज मॉडल AudioPaLM कई भाषाओं के लिए शून्य-शॉट वाक-टू-टेक्स्ट ट्रांसलेट भी कर सकता है, यहां तक कि उन स्पीच कॉम्बिनेशन के लिए भी जो उसने ट्रेनिंग के दौरान नहीं देखे थे. यह क्षमता वास्तविक दुनिया के एप्लीकेशंस जैसे रीयल टाइम मल्टीलैंगुअल कम्यूनिकेशन के लिए उपयोगी हो सकती है.AudioPaLM कम बोले गए संकेतों के आधार पर विभिन्न भाषाओं में आवाजें स्थानांतरित कर सकता है, और यह विभिन्न भाषाओं में अलग-अलग आवाजों को पकड़ और पुन: उत्पन्न कर सकता है.


Google सर्च का Perspectives फ़िल्टर


Google ने पिछले महीने अपने एनुअल डेवलपर्स कॉन्फ्रेंस, Google I/O 2023 में Google सर्च के लिए Perspectives नामक एक नए फ़िल्टर की घोषणा की थी. अब, लगभग डेढ़ महीने बाद, कंपनी ने वैश्विक स्तर पर सभी Google सर्च यूजर्स के लिए नया पर्सपेक्टिव फ़िल्टर जारी करना शुरू कर दिया है. Google ने अपने सोशल मीडिया हैंडल पर एक पोस्ट के जरिए यह घोषणा की.


यह भी पढ़ें


GPS Technology क्या है, कैसे करती है काम? जानिए क्या मिलते हैं इसके फायदे