Oleh Cristos Goodrow, VP of Engineering
Saat dalam performa terbaiknya, Rekomendasi YouTube menghubungkan miliaran orang di seluruh dunia ke konten yang memberikan inspirasi, edukasi, dan hiburan secara unik. Rekomendasi mengantarkan saya pada ceramah yang membahas pertanyaan etika terkait teknologi dewasa ini atau highlight pertandingan football tim University of Southern California yang saya tonton semasa kanak-kanak. Rekomendasi memudahkan anak perempuan tertua saya mencari hiburan dan komunitas melalui Vlogbrothers. Selain itu, rekomendasi memberi anak laki-laki sulung saya pemahaman yang lebih baik tentang aljabar linear melalui animasi penjelasan di 3Blue1Brown—diselingi jeda untuk menonton video KSI.
Seperti yang terlihat di keluarga saya, setiap video memiliki penonton tersendiri, dan tugas sistem rekomendasi adalah menemukan penonton tersebut. Bayangkan betapa sulitnya menelusuri miliaran buku di sebuah perpustakaan raksasa tanpa bantuan pustakawan. Rekomendasi meningkatkan jumlah penayangan keseluruhan di YouTube secara signifikan, bahkan melampaui subscription channel atau penelusuran. Selama lebih dari sepuluh tahun terakhir, saya mengembangkan sistem rekomendasi YouTube dan saya senang melihatnya menjadi bagian tak terpisahkan dari pengalaman YouTube setiap pengguna. Namun, rekomendasi sering dipandang sebagai kotak hitam misterius. Kami ingin sistem ini dipahami secara terbuka. Oleh karena itu, izinkan saya menjelaskan cara kerjanya, perkembangannya, dan alasan kami menjadikan penayangan rekomendasi yang bertanggung jawab sebagai prioritas utama.
Apa yang dimaksud dengan sistem rekomendasi?
Sistem rekomendasi kami dibangun di atas prinsip sederhana yaitu membantu pengguna menemukan video yang ingin ditonton dan yang akan memberikan manfaat. Rekomendasi ini dapat ditemukan di dua tempat utama: halaman beranda dan panel “Berikutnya”. Halaman beranda ditampilkan saat pertama kali YouTube dibuka dan berisi perpaduan antara rekomendasi terpersonalisasi, konten dari channel yang di-subscribe, serta berita dan informasi terbaru. Panel Berikutnya muncul selagi video ditonton dan menyarankan konten lain berdasarkan video yang sedang dinikmati, serta video lain yang mungkin diminati.
Pada tahun 2008, saat kami pertama kali membangun sistem rekomendasi YouTube, pengalaman ini berbeda sepenuhnya dengan yang ada sekarang. Misalkan Anda sering menonton video memasak. Tidakkah akan menjengkelkan jika halaman beranda hanya merekomendasikan video olahraga dan musik terbaru karena konten tersebut memiliki penayangan tertinggi? Begitulah YouTube pada masa-masa awal. Sistem memeringkatkan video berdasarkan popularitas untuk menciptakan satu halaman “Trending” yang besar. Tidak banyak orang yang menonton video semacam itu dan, akibatnya, sebagian besar penayangan YouTube berasal dari penelusuran atau link yang dibagikan di luar platform, bukan dari sistem rekomendasi.
Sekarang, sistem kami memilah miliaran video untuk merekomendasikan konten yang disesuaikan dengan minat spesifik Anda. Misalnya, sistem YouTube mengenali bahwa saya menonton highlight pertandingan football USC klasik dan mencarikan highlight olahraga lainnya dari sekitar tahun-tahun tersebut. Tanpa rekomendasi, saya tidak akan tahu bahwa video-video tersebut ada di YouTube. Tidak seperti platform lain, kami tidak menghubungkan penonton ke konten melalui jaringan sosial mereka. Sebagai gantinya, keberhasilan rekomendasi YouTube bergantung pada kemampuan untuk memprediksikan secara akurat video yang ingin pengguna tonton.
Untuk mencapai hal itu, kami memulai dengan pemahaman bahwa setiap orang memiliki kebiasaan menonton yang unik. Selanjutnya, sistem kami membandingkan kebiasan menonton Anda dengan penonton lain yang serupa dengan Anda, dan menggunakan informasi tersebut untuk menyarankan konten lain yang mungkin ingin Anda tonton. Jadi, jika Anda menyukai video olahraga tenis dan sistem kami mengenali bahwa penonton yang suka menonton video olahraga tenis juga menyukai video musik jazz, maka Anda mungkin akan melihat rekomendasi video musik jazz (untuk kategori seperti berita dan informasi, cara kerjanya berbeda—dibahas lebih lanjut di bawah) meskipun Anda sama sekali belum pernah menonton video musik jazz. Beberapa tahun lalu, sistem kami merekomendasikan video Tyler Oakley ke anak perempuan tertua saya, karena pengguna yang menonton Vlogbrothers kebanyakan juga menonton video tersebut. Akhirnya, dia menjadi penggemar berat Tyler Oakley sampai-sampai kami membawanya untuk menemui idolanya itu di acara jumpa penggemar.
Namun, tentu saja kami juga memahami bahwa tidak semua orang ingin selalu membagikan informasi ini kepada kami. Karena itulah, kami menyediakan kontrol untuk membantu Anda menentukan seberapa banyak data yang ingin diberikan. Anda dapat menjeda, mengedit, atau menghapus histori penelusuran dan tontonan YouTube kapan saja.
Cara kami mempersonalisasi rekomendasi
Untuk menyediakan seleksi kustom seperti itu, sistem rekomendasi kami tidak terpaku pada “pakem” tentang apa yang harus dilakukan. Sistem ini terus berkembang dan belajar setiap hari dari 80 miliar lebih keping informasi yang dinamakan sinyal. Karena alasan tersebut, memberikan transparansi yang lebih baik tidaklah semudah menyusun daftar formula rekomendasi, tetapi memerlukan pemahaman tentang semua data yang mengalir ke dalam sistem. Sejumlah sinyal melengkapi satu sama lain untuk membantu sistem memahami apa yang menurut Anda memuaskan. Sinyal tersebut meliputi klik, waktu tonton, respons survei, berbagi, suka, dan tidak suka.
●Klik: Klik di sebuah video memberikan indikasi kuat bahwa Anda juga menganggap video tersebut memuaskan. Toh, Anda tidak akan mengklik sesuatu yang tidak ingin Anda tonton.
Namun, mulai tahun 2011, kami menyadari bahwa video yang diklik belum tentu benar-benar ditonton. Misalkan Anda menelusuri highlight pertandingan tenis Wimbledon dari tahun itu. Anda men-scroll halaman dan mengklik salah satu video yang thumbnail dan judulnya mengindikasikan bahwa video itu berisi rekaman pertandingan yang Anda cari. Namun, ternyata itu adalah video seseorang yang membahas pertandingan tersebut dari kamar tidurnya. Anda mengklik video yang direkomendasikan oleh sistem di panel Berikutnya, dan baru kemudian mendapati bahwa isinya hanyalah perbincangan penggemar tentang pertandingan itu. Anda terus mengklik video-video lain hingga akhirnya menerima rekomendasi video yang berisi rekaman pertandingan yang ingin Anda tonton. Karena itulah, pada 2012 kami menambahkan sinyal waktu tonton.
●Waktu Tonton: Waktu tonton—video mana saja yang Anda tonton dan berapa lama—memberikan sinyal terpersonalisasi ke sistem kami tentang apa yang kemungkinan besar ingin Anda tonton. Jadi, jika penggemar tenis tadi meluangkan 20 menit untuk menonton klip highlight pertandingan Wimbledon dan hanya meluangkan beberapa detik untuk menonton video analisisnya, kami dapat berasumsi bahwa penggemar tersebut menganggap menonton highlight lebih berharga.
Saat pertama kali menyertakan waktu tonton ke dalam rekomendasi, jumlah penayangan YouTube langsung turun 20%. Namun, kami yakin bahwa memberikan manfaat yang lebih besar kepada penonton itu lebih penting. Kendati begitu, tidak semua waktu tonton itu penting. Terkadang, saya menonton sembarang video hingga larut malam, padahal saya bisa menggunakan waktu tersebut untuk belajar bahasa baru di YouTube atau mengasah kemampuan memasak bersama seorang kreator. Kami tidak ingin penonton menyesal telah meluangkan waktunya untuk menonton video. Kami juga menyadari bahwa kami perlu melangkah lebih jauh lagi untuk mengukur seberapa besar manfaat yang diperoleh penonton dari waktu yang mereka luangkan di YouTube.
●Respons Survei: Untuk benar-benar memastikan bahwa penonton puas dengan konten yang mereka tonton, kami mengukur “waktu tonton berharga”, yakni waktu yang diluangkan untuk menonton video yang dianggap berharga. Kami mengukur waktu tonton berharga melalui survei pengguna yang meminta Anda memberikan rating satu sampai lima bintang untuk video yang Anda tonton. Dengan begitu, kami mendapatkan metrik untuk menentukan kepuasan Anda terhadap konten tersebut. Jika Anda memberikan rating satu sampai dua bintang, kami akan bertanya mengapa Anda memberikan rating serendah itu. Begitu juga, jika Anda memberikan empat sampai lima bintang, kami akan menanyakan alasannya—yakni, apakah video tersebut inspiratif atau bermakna? Hanya video yang mendapatkan rating empat atau lima bintang yang dihitung sebagai waktu tonton berharga.
Tentu saja, tidak semua orang mengisi survei tentang setiap video yang mereka tonton. Berdasarkan respons yang diperoleh, kami melatih suatu model machine learning untuk memprediksi respons survei potensial dari setiap pengguna. Untuk menguji akurasi prediksi, kami sengaja menahan sebagian respons survei dari pelatihan. Dengan begitu, kami bisa selalu memantau seberapa akurat sistem kami dalam melacak respons yang sebenarnya.
●Berbagi, Suka, Tidak Suka: Rata-rata, orang cenderung lebih puas dengan video yang mereka bagikan atau sukai. Sistem kami menggunakan informasi ini untuk mencoba memprediksi seberapa mungkin Anda akan membagikan atau menyukai video lainnya. Jika Anda tidak menyukai sebuah video, maka itu adalah sinyal bahwa Anda kemungkinan tidak puas dengan video tersebut.
Namun, seperti halnya rekomendasi, bobot setiap sinyal di atas bergantung pada Anda. Jika Anda tipe orang yang suka membagikan video apa pun yang ditonton, termasuk yang rating-nya satu atau dua bintang, sistem kami tidak akan memberikan bobot terlalu besar pada penilaian Anda saat merekomendasikan konten. Kesemuanya ini adalah alasan mengapa sistem kami tidak mengikuti sebuah formula baku, melainkan berkembang dinamis seiring perubahan kebiasaan Anda menonton.
Fokus pada rekomendasi yang bertanggung jawab
Klik, penayangan, waktu tonton, survei pengguna, berbagi, suka, dan tidak suka sangat membantu dalam memunculkan rekomendasi untuk topik-topik seperti musik dan hiburan—yang ditonton sebagian besar pengunjung YouTube. Namun, seiring waktu, makin banyak penonton yang mengakses YouTube untuk menonton konten berita dan informasi. Entah itu berita terbaru atau kajian ilmiah yang kompleks, topik-topik tersebut sangat mementingkan kualitas informasi dan konteks. Seseorang mungkin mengatakan dia sangat puas dengan video yang mengklaim “Bumi itu datar”, tetapi itu bukan berarti kami dapat merekomendasikan konten berkualitas rendah semacam ini.
Karena itulah rekomendasi berperan sangat penting dalam upaya kami memelihara platform yang bertanggung jawab. Rekomendasi menghubungkan penonton ke informasi berkualitas tinggi dan meminimalkan peluang ditampilkannya konten bermasalah. Rekomendasi juga menunjang Pedoman Komunitas kami yang andal, yang menentukan konten yang diperbolehkan dan dilarang di YouTube.
Kami telah menggunakan rekomendasi untuk membatasi ditampilkannya konten berkualitas rendah sejak 2011. Saat itu, kami membuat pengklasifikasi untuk mengidentifikasi video yang tidak pantas atau bermuatan kekerasan dan mencegah video semacam itu direkomendasikan. Kemudian, pada tahun 2015, saat konten yang vulgar dan sensasional bermunculan di halaman beranda, kami bertindak untuk mendemosinya. Setahun kemudian, kami mulai memprediksi kemungkinan video menampilkan anak di bawah umur dalam situasi berisiko dan menghapusnya dari rekomendasi. Pada tahun 2017, untuk memastikan bahwa sistem rekomendasi kami adil terhadap komunitas yang terpinggirkan, kami mulai mempertimbangkan machine learning untuk menggerakkan sistem guna memberikan ruang berekspresi yang adil bagi kelompok-kelompok yang dilindungi—seperti komunitas LGTBQ+.
Maraknya misinformasi dalam beberapa tahun terakhir mendorong kami untuk makin memperluas penggunaan sistem rekomendasi guna mencakup misinformasi bermasalah dan konten berisiko—yakni konten yang nyaris (tetapi tidak sampai) melanggar Pedoman Komunitas. Termasuk dalam kategori ini adalah video teori konspirasi (“pendaratan di bulan telah dipalsukan”) atau konten lainnya yang menyebarkan misinformasi (“jus jeruk dapat menyembuhkan kanker”).
Kami dapat melakukan upaya tersebut dengan menggunakan pengklasifikasi untuk mengidentifikasi apakah sebuah video tergolong “kredibel” atau “berisiko”. Pengelompokan ini mengandalkan evaluator manual yang menilai kualitas informasi di setiap channel atau video. Evaluator berasal dari seluruh dunia dan terlatih dalam menggunakan seperangkat panduan rating mendetail yang tersedia untuk publik. Kami juga mengandalkan pakar tersertifikasi, misalnya dokter jika konten berkenaan dengan informasi kesehatan.
Untuk menentukan kredibilitas konten, evaluator menjawab beberapa pertanyaan penting. Apakah konten memenuhi janjinya atau mencapai sasarannya? Keahlian apa yang diperlukan untuk mencapai sasaran video? Bagaimana reputasi pembicara dalam video dan channel yang menayangkannya? Apa topik utama video (misalnya Berita, Olahraga, Sejarah, Sains, dll.)? Apakah konten ditujukan terutama sebagai satire? Jawaban atas pertanyaan tersebut dan pertanyaan lainnya menentukan kredibilitas sebuah video. Semakin tinggi skor, semakin besar peluang video untuk direkomendasikan, jika itu menyangkut konten berita dan informasi. Untuk menentukan apakah konten tergolong berisiko, evaluator menilai sejumlah faktor yang meliputi, tetapi tidak terbatas pada, apakah konten tidak akurat, menyesatkan atau menipu; tidak sensitif atau intoleran; dan membahayakan atau berpotensi menimbulkan bahaya. Hasil penilaian ini digabung untuk memperoleh skor yang mengindikasikan seberapa mungkin video berisi misinformasi berbahaya atau berisiko. Video yang dikelompokkan sebagai berisiko akan didemosi dalam rekomendasi.
Selanjutnya, evaluator manual melatih sistem kami agar mampu menirukan keputusan mereka. Sekarang, kami bisa menskalakan penilaian mereka ke semua video yang ada di YouTube.
Menjawab pertanyaan umum terkait rekomendasi
Rekomendasi berperan penting di seluruh komunitas kami. Rekomendasi memperkenalkan penonton pada konten yang mereka sukai dan membantu kreator terhubung dengan penonton baru. Bagi masyarakat secara keseluruhan, rekomendasi berguna dalam membantu menghentikan tersebarnya misinformasi berbahaya. Karena, meskipun klik, waktu tonton, survei pengguna, berbagi, suka, dan tidak suka merupakan sinyal penting yang memandu sistem, sinyal tersebut dapat dikesampingkan oleh komitmen kami untuk memenuhi tanggung jawab terhadap komunitas YouTube dan masyarakat.
["BOSS TALK" WITH CRISTOS]
Ada beberapa pertanyaan lain tentang sistem rekomendasi YouTube yang biasanya diajukan kepada saya dan yang saya rasa penting untuk dibahas:
Apakah konten berisiko memperoleh interaksi tertinggi?
Sebenarnya, melalui survei dan masukan, kami menemukan bahwa sebagian besar penonton tidak ingin menerima rekomendasi konten berisiko. Banyak dari mereka yang menganggap konten semacam itu meresahkan dan menjengkelkan. Faktanya, ketika kami mendemosi konten yang tidak pantas atau vulgar, waktu tonton meningkat 0,5% dalam waktu 2,5 bulan dibandingkan dengan saat kami tidak menerapkan batasan apa pun.
Selain itu, kami tidak menemukan bukti bahwa konten berisiko rata-rata lebih memikat interaksi dibanding jenis konten lainnya. Pikirkan konten dari penganut aliran bumi datar. Meskipun jumlah video yang mengatakan Bumi datar jauh lebih banyak dibanding video yang mengatakan Bumi bulat, video bumi datar rata-rata mendapatkan penayangan jauh lebih sedikit. Survei menunjukkan bahwa konten berisiko hanya memuaskan sebagian kecil penonton di YouTube. Kami telah mencurahkan waktu dan biaya yang signifikan untuk memastikan bahwa konten berisiko tidak sampai pada audiens yang lebih luas melalui sistem rekomendasi kami. Saat ini, konten berisiko mendapatkan sebagian besar penayangannya dari platform lain yang ditautkan ke YouTube.
Apakah konten berisiko meningkatkan waktu tonton YouTube?
Bagi sebagian besar orang, konten berisiko tidak memenuhi kriteria pemanfaatan waktu yang baik di YouTube. Karena itulah, pada tahun 2019 kami mulai mendemosi konten berisiko dalam rekomendasi. Sejak saat itu, kami melihat waktu tonton konten berisiko yang direkomendasikan dan tidak di-subscribe turun 70% di Amerika Serikat. Saat ini, konsumsi konten berisiko yang berasal dari rekomendasi kami jauh di bawah 1%.
Apakah rekomendasi mengarahkan penonton ke konten yang makin ekstrem?
Seperti yang sudah saya jelaskan, kami aktif mendemosi informasi berkualitas rendah dalam rekomendasi. Namun, kami juga mengambil langkah tambahan dengan menunjukkan kepada penonton video kredibel tentang topik-topik yang mungkin mereka minati. Misalkan saya menonton video tentang vaksin COVID-19. Di panel Berikutnya, saya akan melihat video dari sumber tepercaya seperti Vox dan Bloomberg Quicktake, serta tidak akan menemukan video yang berisi informasi menyesatkan tentang vaksin (sejauh yang bisa dideteksi oleh sistem kami).
Selain berita tentang COVID-19 dan video penjelasan tersebut, saya juga akan menerima rekomendasi terpersonalisasi dari topik lain berdasarkan histori tontonan saya—sketsa dari Saturday Night Live atau TEDx Talk tentang Super Mario Effect. Keragaman terpersonalisasi ini memudahkan penonton mengakses subjek dan format baru, bukan video dengan jenis yang sama secara berulang-ulang.
Makin banyak peneliti independen yang mengkaji bagaimana platform teknologi memengaruhi konsumsi konten berisiko. Kendati kajian masih terus berjalan, sejumlah laporan yang diterbitkan akhir-akhir ini menyimpulkan bahwa rekomendasi YouTube tidak mengarahkan penonton ke konten ekstrem. Sebaliknya, konsumsi konten berita dan politik di YouTube secara umum mencerminkan preferensi pribadi yang dapat dilihat di seluruh kebiasaan online penonton.
Apakah konten berisiko menghasilkan uang?
Sebagai awalan, kami memiliki pedoman konten yang cocok untuk pengiklan yang melarang monetisasi banyak jenis konten berisiko. Banyak pengiklan menyampaikan bahwa mereka tidak ingin dikaitkan dengan konten semacam itu di YouTube. Sering kali, mereka juga memilih tidak mengaktifkan iklan pada konten jenis ini. Artinya, setiap video berisiko yang ditonton adalah peluang monetisasi yang dilewatkan, yang berakibat pada hilangnya pendapatan sebenarnya bagi YouTube. Selain itu, konten jenis ini menyemai ketidakpercayaan dan memunculkan keprihatinan tidak hanya bagi partner pengiklan, tetapi juga publik, pers, dan pembuat kebijakan. Kenyataannya adalah upaya kami untuk membangun rekomendasi yang bertanggung jawab telah berkembang, begitu juga perusahaan kami dan kondisi ekonomi komunitas kreator. Tanggung jawab itu baik untuk bisnis.
Dengan semua pertimbangan di atas, mengapa kami tidak langsung saja menghapus konten berisiko? Misinformasi cenderung berubah dan berkembang dengan pesat. Selain itu, berbeda dengan konten seperti terorisme atau keselamatan anak, misinformasi sering tidak memiliki konsensus yang jelas. Misinformasi juga dapat bervariasi sesuai dengan perspektif dan latar belakang pribadi. Terkadang, hal itu berarti kami terpaksa membiarkan konten yang kontroversial atau bahkan menyinggung. Karenanya, kami terus berfokus untuk membangun rekomendasi yang bertanggung jawab dan mengambil langkah bermakna untuk mencegah sistem kami merekomendasikan konten jenis ini secara luas.
Secara keseluruhan, upaya kami dalam membangun rekomendasi yang bertanggung jawab telah menunjukkan dampak nyata. Waktu tonton berita kredibel meningkat drastis dan konsumsi konten berisiko menurun. Bukan berarti kami telah memecahkan masalah; kami harus terus berinvestasi dan mempertajam sistem ini agar makin meningkat kualitasnya. Target kami adalah penayangan konten berisiko dari rekomendasi berada di bawah 0,5% dari keseluruhan penayangan di YouTube.
Misi YouTube adalah memberikan ruang berekspresi dan menunjukkan dunia kepada semua orang. YouTube membuat perbedaan besar dalam kehidupan keluarga saya. Video yang mengajarkan toleransi dan empati meninggalkan bekas yang mendalam dan positif pada karakter anak perempuan tertua saya. Anak laki-laki saya berhasil melalui banyak momen sulit di kelas aljabar linearnya. Saya mempelajari beragam konteks dan nuansa dari ceramah yang disampaikan para tokoh etika teknologi. Komitmen kami pada keterbukaan telah melahirkan perspektif dan gagasan baru yang, tanpa YouTube, mungkin tidak akan memiliki ruang ekspresi. Kreator seperti Marques Brownlee, MostlySane, atau NikkieTutorials telah menginspirasi jutaan orang dengan keahlian, dukungan, dan kejujuran mereka.
Kualitas sistem rekomendasi kami terus meningkat seiring waktu berkat masukan Anda, tetapi kami yakin sistem ini bisa lebih baik lagi. Saya bersama tim bertekad untuk terus mengupayakan hal itu, dan menghadirkan pengalaman yang benar-benar bermanfaat dan bermakna.