Alibaba EMO AI Model: फोटो को चुटकियों में बना सकता है वीडियो, OpenAI को टक्कर देने के लिए अलीबाबा ने तैयार किया ये खास वीडियो मॉडल
Alibaba Brings EMO Model: फोटो से बने वीडियो की अधिकतम लंबाई 1 मिनट 30 सेकंड की है, जिसमें पोर्ट्रेट गा भी सकते हैं, बोल भी सकते हैं और इधर से उधर मूव भी कर सकते हैं...
Alibaba EMO Video Model: आर्टिफिशल इंटेलिजेंस के क्षेत्र में कॉम्पिटिशन लगातार बढ़ता ही जा रहा है. ओपन एआई के सोरा मॉडल को टक्कर देने के लिए चाइनीज कंपनी अलीबाबा ने एक नया वीडियो एआई मॉडल EMO पेश किया है. अलीबाबा के इंस्टीट्यूट फॉर इंटेलिजेंट कंप्यूटिंग रिसर्च ने हाल ही में इस मॉडल को पेश किया, जो एक ऑडियो संचालित पोर्ट्रेट वीडियो बनाने में एक्सपर्ट है.
चाइनीज कंपनी अलीबाबा का ईएमओ वीडियो मॉडल OpenAI के सोरा से मिलता-जुलता है. ईएमओ को इमोट पोर्ट्रेट अलाइव के रूप में परिभाषित किया जा सकता है, जो कि एक फोटो और ऑडियो फाइल से शॉर्ट वीडियो बनाने का काम करता है. इस वीडियो की अधिकतम लंबाई 1 मिनट 30 सेकंड की है, जिसमें पोर्ट्रेट गा भी सकते हैं, बोल भी सकते हैं और इधर से उधर मूव भी कर सकते हैं.
उदाहरण के तौर पर देखें तो EMO की सहायता से लिओनार्दो दा विंची की फेमस पेंटिंग मोनालिसा भी बात कर सकती है. इतना ही नहीं मोनालिसा गाना भी गा सकती है, इधर-उधर देख भी सकती है.
ईएमओ कैसे करता है काम?
ईएमओ का एक बेस्ट पार्ट है कि यह फोटो में मौजूद शख्स के फेशियल एक्सप्रेशन्स को बदल सकता है. इतना ही नहीं उसके होंठों को रियल ऑडियो के साथ सिंक कर सकता है, जिससे लगता है कि वाकई यह एक रियल वीडियो है. यह प्रयोग फोटोग्राफ, पेंटिंग, एनीमे-शैली कार्टून सभी के साथ किया जा सकता है.
OpenAI के सोरा मॉडल की बात करें तो यह टेक्स्ट के अनुसार ही पूरी वीडियो तैयार कर देता है. यह टेक्स्ट प्रॉम्प्ट से HD वीडियो तैयार कर सकता है. हालांकि इसका एक्सेस अभी सबके लिए नहीं है. कंपनी ने इसे रिसर्च फील्ड में काम करने वाले कुछ चुनिंदा यूजर्स के लिए जारी किया है. इसको लेकर OpenAI के CEO सैम ऑल्टमैन ने सोशल मीडिया प्लैटफॉर्म X पर भी पोस्ट शेयर की थी, जिसमें कंपनी ने एक वीडियो पोस्ट के जरिए बताया था कि यह कैसे काम करता है.
यह भी पढ़ें:-
5 Best Swimming Watches: स्वीमिंग के लिए बेस्ट हैं ये 5 स्मार्टवॉच, जानें कीमत और सारे फीचर