PORTAL BONTANG – OpenAI telah meluncurkan fitur baru pada ChatGPT yang disebut Advanced Voice Mode.
Fitur ini memungkinkan pengguna untuk mendapatkan pengalaman mendengarkan audio yang hampir menyerupai suara manusia.
Versi alpha dari fitur ini diluncurkan pada hari Selasa untuk sejumlah kecil pengguna ChatGPT Plus dan akan diperluas ke semua pengguna Plus pada musim gugur 2024.
Baca Juga: Update Baru iOS 17.6, iPhone 14 Kini Bisa Kirim Pesan Darurat SOS via Satelit di Jepang
Dilansir Portalbontang.com dari Tech Crunch, Rabu 31 Juli 2024, saat pertama kali diperkenalkan pada Mei lalu, suara GPT-4o menimbulkan kehebohan karena kualitasnya yang sangat menyerupai suara manusia.
Fitur ini dapat menghasilkan suara yang hampir identik dengan suara Scarlett Johansson, aktris terkenal yang berperan dalam film “Her.”
Setelah presentasi tersebut, Scarlett Johansson menyatakan bahwa dia menolak beberapa tawaran dari CEO OpenAI, Sam Altman, untuk menggunakan suaranya.
Dia juga menyewa pengacara untuk melindungi hak atas kemiripan suaranya setelah melihat demo GPT-4o.
Baca Juga: BMW Astra Used Car, Mitos Resale Value Mobil Bekas Eropa Terbantahkan
OpenAI menyangkal penggunaan suara Johansson, dan akhirnya menghapus suara tersebut dari demo.
Pada Juni, OpenAI mengumumkan penundaan peluncuran Mode Suara Lanjutan untuk memperbaiki langkah-langkah keamanan.
Sekarang, setelah penantian yang panjang, beberapa pengguna akhirnya bisa mencoba fitur ini, meskipun belum lengkap.
Baca Juga: Setyo Sukarno Bertemu Perwakilan Pengurus JPP Promedia, Pastikan Maju Calon Bupati Wonogiri
Kemampuan video dan berbagi layar yang ditampilkan dalam pembaruan musim semi OpenAI tidak termasuk dalam versi alpha ini dan akan tersedia di kemudian hari.
Namun, pengguna premium akan dapat mencoba fitur suara yang sebelumnya hanya dapat dilihat dalam demo.
Fitur Suara dan Kemampuan Mendengarkan yang Lebih Canggih di ChatGPT
Jika Anda pernah menggunakan Mode Suara di ChatGPT, Mode Suara Lanjutan ini berbeda.
Baca Juga: ES TEH. INDONESIA Buka Rekrutmen Crew di Kota Bontang
Sebelumnya, ChatGPT memerlukan tiga model berbeda untuk memproses suara: satu untuk mengubah suara menjadi teks, GPT-4 untuk memproses teks tersebut, dan satu lagi untuk mengubah teks kembali menjadi suara.
Namun, GPT-4o adalah sistem multimodal yang mampu menangani semua tugas tersebut sekaligus, sehingga menciptakan interaksi dengan latensi lebih rendah.
OpenAI juga menyebutkan bahwa GPT-4o dapat mengenali intonasi emosional dalam suara pengguna, seperti kesedihan, kegembiraan, atau bahkan nyanyian.
Pengguna ChatGPT Plus dalam program uji coba ini akan merasakan secara langsung betapa nyatanya Mode Suara Lanjutan ini.
Baca Juga: PT. Bank Perkreditan Rakyat Bepede Kaltim Sejahtera Buka Lowongan Teller di Bontang
Meskipun TechCrunch belum sempat menguji fitur ini sebelum artikel ini diterbitkan, kami berencana untuk melakukan ulasan begitu kami mendapat akses.
OpenAI mengatakan bahwa peluncuran fitur suara ini dilakukan secara bertahap untuk memantau penggunaan dengan hati-hati.
Pengguna yang termasuk dalam kelompok alpha akan menerima notifikasi di aplikasi ChatGPT, diikuti oleh email dengan petunjuk penggunaan.
Baca Juga: PT. Usaha Sukses Berdikari Membuka Posisi Mekanik di Bontang
Sejak demo awal OpenAI, lebih dari 100 penguji eksternal dari 45 bahasa berbeda telah menguji kemampuan suara GPT-4o.
OpenAI berencana merilis laporan tentang upaya keamanan ini pada awal Agustus.
Fitur Mode Suara Lanjutan ini hanya akan mendukung empat suara preset yang sudah ada: Juniper, Breeze, Cove, dan Ember.
Suara ini dibuat dengan bantuan aktor suara profesional. Suara Sky yang ditampilkan pada demo Mei sudah tidak tersedia lagi.
Menurut Lindsay McCallum, juru bicara OpenAI, “ChatGPT tidak dapat meniru suara orang lain, baik individu maupun tokoh publik, dan akan memblokir output yang berbeda dari suara preset ini.”
Baca Juga: Prabowo Terima Tantangan Presiden FIFA, Berhasil Cetak Gol
Menghindari Kontroversi Deepfake
OpenAI berusaha menghindari kontroversi terkait deepfake, seperti yang terjadi pada Januari lalu ketika teknologi cloning suara AI ElevenLabs digunakan untuk meniru Presiden Biden dan menipu pemilih di New Hampshire.
Selain itu, OpenAI telah memperkenalkan filter baru untuk mencegah permintaan pembuatan musik atau audio lain yang memiliki hak cipta.
Dalam setahun terakhir, berbagai perusahaan AI telah menghadapi masalah hukum terkait pelanggaran hak cipta, dan model audio seperti GPT-4o membuka peluang bagi lebih banyak perusahaan untuk mengajukan keluhan.
Baca Juga: Pencak Silat Ekshibisi di Paris, Prabowo Bertekad Bawa ke Olimpiade
Terutama, label rekaman yang terkenal sering melakukan litigasi dan telah menggugat pembuat lagu AI seperti Suno dan Udio. ***
Discussion about this post