Jakarta (ANTARA) - OpenAI dikabarkan menggunakan transkripsi lebih dari satu juta jam video YouTube untuk melatih model bahasa besar AI tercanggihnya saat ini yakni GPT-4.

Melansir dari laporan Neowin pada Minggu (7/4), hal tersebut diungkapkan oleh New York Times yang menyebutkan bahwa OpenAI mengembangkan model transkripsi audio bernama Whisper yang membantu perusahaan teknologi tersebut untuk mengumpulkan data dari video YouTube.

Laporan itu juga mengungkapkan bahwa OpenAI menyadari tindakan mereka berada di bawah pengawasan, akan tetapi pihaknya tetap melanjutkan praktik tersebut karena dianggap sebagai sebuah tindakan yang wajar.

Baca juga: CEO YouTube ingatkan OpenAI supaya tidak latih AI gunakan videonya

Kabar yang diungkapkan New York Times juga senada dengan laporan The Information yang menyebutkan bahwa OpenAI diduga mengumpulkan data dari video dan podcast di YouTube untuk melatih dua sistem AI mereka. Menurut laporan itu, presiden OpenAI Greg Brockman ikut terlibat dalam tim pelatihan AI itu.

Sejumlah orang di Google, selaku pemilik YouTube, dikabarkan juga mengetahui tentang praktik yang dilakukan oleh OpenAI namun memilih untuk tidak menindaknya karena Google juga menggunakan video YouTube untuk melatih model AI buatan mereka.

Baca juga: OpenAI ungkap alat baru yang dapat kloning suara

Google buka suara mengenai hal ini dengan mengatakan bahwa video yang digunakan untuk melatih AI mereka telah mengantongi izin dari kreatornya.

CEO YouTube Neal Mohan dalam sebuah wawancara dengan Bloomberg menegaskan bahwa kebijakan perusahaan telah melarang pengunduhan transkrip video atau sejenisnya karena tindakan tersebut melanggar kebijakan layanan YouTube. Akan tetapi saat ditanya mengenai data YouTube yang digunakan oleh OpenAI dia mengaku belum memiliki informasi untuk mengonfirmasinya kendati telah melihat laporan mengenai hal tersebut.

Baca juga: OpenAI kenalkan Sora, kecerdasan buatan untuk ubah teks ke video

Baca juga: OpenAI luncurkan GPT Store, pasar aplikasi AI yang dipersonalisasi

Penerjemah: Farhan Arda Nugraha
Editor: Siti Zulaikha
Copyright © ANTARA 2024