OpenAI लाया ‘वॉयस क्लोनिंग’ एआई मॉडल, 15 सेकंड के सैंपल का है पूरा खेल
OpenAI ने नए टेक्स्ट-टू-वॉयस जनरेशन प्लेटफॉर्म Voice Engine से पर्दा उठाया है। यहाँ आप एआई वॉयस क्लोनिंग के कुछ नमूने सुन सकते हैं।
टेक न्यूज: ओपनएआई (OpenAI) का नाम आज के समय अधिकांश इंटरनेट यूजर्स से सुन रखा होगा। ये वही कंपनी है, जिसका एआई चैटबॉट चैटजीपीटी (ChatGPT) और टेक्स्ट-टू-वीडियो मॉडल सोरा एआई (Sora AI) काफी चर्चा में रहते हैं। और अब माइक्रोसॉफ्ट समर्थित ओपनएआई ने नया सिंथेटिक ऑडियो जनरेशन एआई मॉडल (OpenAI Voice Cloning AI Model) पेश किया है। बात OpenAI के नए टेक्स्ट-टू-वॉयस जनरेशन प्लेटफॉर्म Voice Engine की हो रही है।
इस नए एआई मॉडल की मदद से उपयोगकर्ता टेक्स्ट प्रॉम्प्ट डाल कर वॉयस जनरेट कर सकते हैं। इतना ही नहीं बल्कि किसी आवाज की 15-सेकंड की सैंपल क्लिप का इस्तेमाल करके एक सिंथेटिक वॉयस भी बना सकते हैं। ये एआई-जनरेटेड वॉयस, प्रदान किए गए सैंपल की आवाज में कोई भी टेक्स्ट प्रॉम्प्ट पढ़ सकती है। इससे सैंपल वॉयस की भाषा के अलावा अन्य भाषाओं में भी आउटपुट प्राप्त किया जा सकता है।
ये भी पढ़ें:
- OpenAI Sora कैसे करता है काम? टेक्स्ट से वीडियो बनाने का तरीका
- Instagram Pong Game: इंस्टा पर ये सीक्रेट गेम ट्रिक, खेलनें का तरीका
OpenAI Voice Cloning AI Model
☛ कैसे और कौन कर सकता है इस्तेमाल?
OpenAI ने बताया कि फिलहाल Voice Engine को सीमित उपयोगकर्ताओं के लिए उपलब्ध करवाया गया है। इसमें विभिन्न उद्योग जगत से जुड़े कुछ संस्थान शामिल हैं। इसका उद्देश्य परीक्षण का है, ताकि इस वॉयस जनरेशन एआई मॉडल को लेकर सुरक्षा उपायों समेत अन्य कई अहम पहलुओं का आंकलन किया जा सके।
फिलहाल इन कंपनियों को OpenAI Voice Engine का एक्सेस दिया गया है:
- Age of Learning (एडटेक कंपनी)
- HeyGen (विजुअल स्टोरीटेलिंग प्लेटफॉर्म)
- Dimagi (हेल्थ सॉफ्टवेयर निर्माता कंपनी)
- Livox (एआई कम्यूनिकेशन ऐप निर्माता)
- Lifespan (हेल्थ टेक कंपनी)
OpenAI Voice Cloning Engine Working Steps
इन कंपनियों द्वारा तैयार कुछ एआई वॉयस क्लोनिंग नमूने पोस्ट किए गए हैं।
इसमें Age of Learning प्री-स्क्रिप्टेड वॉयस-ओवर कंटेंट जनरेशन का उदाहरण सामने आया है।
वॉयस क्लोनिंग – रिफ्रेन्स या सैंपल ऑडियो:
OpenAI Voice Engine से एआई जनरेटेड ऑडियो
Voice Engine की खासियत
OpenAI का दावा है कि इसने वर्ष 2022 के अंत से ही वॉयस इंजन बनाना शुरू कर दिया था। इस तकनीक का इस्तेमाल पहले ही ‘टेक्स्ट-टू-स्पीच API’ और ChatGPT Read Aloud फीचर के लिए किया जा चुका है। टेक्स्ट-टू-ऑडियो जनरेटिव एआई मॉडल लागतार विकसित हो रहा है। लेकिन एआई वॉयस क्लोनिंग के अपने खतरे भी है, शायद इसलिए इसे ‘डरावने रूप से अच्छी तकनीक’ के तौर पर परिभाषित किया जाता है।